Boolean Retrieval

Boolean Retrieval Model (BRM) adalah salah satu contoh Information Retrieval yang merupakan model proses pencarian informasi dari query yang menggunakan ekspresi boolean. Dengan ekspresi boolean dengan menggunakan operator logika AND, OR dan NOT.  Sedangkan dalam menentukan hasil perhitungannya hanya berupa nilai binary (1 atau 0). Dengan hal itu, Boolean Retrieval Model (BRM) yang ada hanya dokumen relevan atau tidak sama sekali. Sehingga keunggulan dari Boolean Retrieval Model (BRM) tidak menghasilkan dokumen yang  mirip.

Dalam pengerjaan operator boolean (AND, NOT, OR) ada urutan pengerjaannya (Operator precedence). Dalam implementasinya akan memprioritaskan yang berada dalam kurung (), baru selanjutnya NOT, AND, dan OR. Boolean Retrival Model (BRM) melakukan perbaikan karena datanya terlalu besar bila tersimpan dalam komputer, seperti ini kita perlu memenuhi peraturannya diantaranya kecepatan dalam pemrosesan dokumen yang sangat banyak, fleksibilitas dan perangkingan. Berikut adalah penjelasan dari operator pada model boolean retrieval antara lain:

  • Logical AND

Memperbolehkan penelusur untuk menggunakan pernyataan query ke dalam suatu lebih konsep sehingga hasil penelusuran menjadi lebih terbatas. Formula pernyataan sederhana A AND B. Contoh untuk menelusur marketing and library, kita memformulasikan pernyataan dengan marketing AND library. Dengan query tersebut maka kita akan menemukan dokumen yang mengandung unsur marketing dan perpustakaan saja, dan tidak mendapatkan dokumen yang hanya mengandung unsur marketing atau perpustakaan saja.

  • Logical OR

Memperbolehkan untuk secara spesifik menggunakan alternative term (atau konsep) yang mengindikasikan dua konsep sesuai dengan tujuan penelusuran menjadi lebih luas, karena adanya alternative dalam pernyataan query. Formulasi pernyataan sederhana A OR B. Contoh marketing OR library. Dengan query tersebut maka kita akan mendapatkan dokumen yang mengandung unsur marketing saja, perpustakaan saja atau yang mengandung unsur marketing dan perpustakaan.

  • Logical NOT

Dapat mengecualikan item-item dari seperangkat term penelusur. Pernyataan formulasi sederhana A NOT B, contoh markeing NOT library. Ini artinya kita hanya menginginkan dokumen yang unsur marketing di dalamnya tidak ada unsur perpustakaannya.

  • Kombinasi Logical AND, OR, NOT

Dapat mengkombinasikan satu pernyataan ke dalam penelusur yang kompleks. Contoh marketing AND library OR information centre NOT profit organization. Artinya kita ingin mendapatkan dokumen yang mengandung unsur marketing dan perpustakaan tanpa unsur pusat informasi bukan untuk organisasi non profit.

Didalam struktur data, Boolean merupakan sebuah tipe data yang bernilai “True” atau “False” (benar atau salah). Sehingga didalam IR, logika boolean berarti bahwa data yang di crawler sesuai atau tidak antara variable – variablenya.

Kelebihan Model Boolean yaitu :

  • Mudah Untuk di Implementasikan
  • Konsep Yang Terstruktur

Kekurangan Model Boolean yaitu :

  • Pencocokan yang tepat dapat mengambil dokumen terlalu sedikit atau terlalu banyak.
  • Sulit untuk pengindexkan, beberapa dokumen yang lebih penting dari pada yang lain kadang berada dibawah dokumen yang tidak penting.
  • Sulit untuk menerjemahkan query ke dalam ekspresi Boolean
  • Semua istilah sama-sama berbobot
  • Lebih seperti pengambilan data dari pencarian informasi

Struktur Data dan Algoritmanya

Jika dilihat dari sudut pandang matematika atau sudut pandang praktis, BIR (boolean Information Retrieval) adalah logika yang paling mudah.  Namun secara logika dan struktur data tidak semudah hal yang diutarakan diatas. Algoritma BIR diantaranya adalah Hash Table, Steeming dan lain lain.

Contoh dari Boolean Information Retrieval

Apabila terdapat dokumen:

1.  Fahri menghampiri apartemen Maria untuk minta bantuan karena komputer yang digunakan untuk
menyusun tesis mengalami error. Maria menuju apartemen tempat tinggal Fahri dan menemukan komputer Fahri kena virus.
2.  Selama membantu menyusun tesis, timbul perasaan cinta Maria kepada Fahri.
3.  …..
4.  …..
5.  …..
Kemudian setelah dibentuk tabel berdasarkan frekuensi kemunculan kata/term sebagai berikut:

Capture1

dan dibentuk Boolean model menjadi:

 Capture3

Dan query nya adalah Aisyah dan Noura, bukan Fahri. Dokumen manakah yang relevan untuk query tersebut.
Langkah awal, bentuk tabel Boolean dari tabel frekuensi kemunculan kata tersebut. Kemudian hitung bentuk vektor Boolean dari kueri.

Query (q) = Aisyah dan Noura, bukan Fahri
= (Aisyah AND Noura) NOT Fahri
= (00011 AND 00111) NOT (11010)
= (00011) AND (00101)
= 00001
Dengan demikian dokumen yang relevan dengan query adalah dokumen 5.

Iklan

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout /  Ubah )

Foto Google+

You are commenting using your Google+ account. Logout /  Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout /  Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout /  Ubah )

Connecting to %s