MENERAPKAN TEKNIK PENELUSURAN SEARCH ENGINE

 MENERAPKAN TEKNIK PENELUSURAN SEARCH ENGINE


Mesin Pencari Web

Mesin pencari web atau mesin telusur web (bahasa Inggris: web search engine) adalah program komputer yang dirancang untuk melakukan pencarian atas berkas-berkas yang tersimpan dalam layanan www, ftp, publikasi milis, ataupun news group dalam sebuah ataupun sejumlah komputer peladen dalam suatu jaringan. Mesin pencari merupakan perangkat penelusur informasi dari dokumen-dokumen yang tersedia. Hasil pencarian umumnya ditampilkan dalam bentuk daftar yang seringkali diurutkan menurut tingkat akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits. Informasi yang menjadi target pencarian bisa terdapat dalam berbagai macam jenis berkas seperti halaman situs web, gambar, ataupun jenis-jenis berkas lainnya. Beberapa mesin pencari juga diketahui melakukan pengumpulan informasi atas data yang tersimpan dalam suatu basis data ataupun direktori web. Sebagian besar mesin pencari dijalankan oleh perusahaan swasta yang menggunakan algoritma kepemilikan dan basis data tertutup, di antaranya yang paling populer adalah safari Google (MSN Search dan Yahoo!). Telah ada beberapa upaya menciptakan mesin pencari dengan sumber terbuka (open source), contohnya adalah Htdig, Nutch, Egothor dan OpenFTS.

Sejarah

Saat awal perkembangan internet, Tim Berners-Lee membuat sebuah situs web yang berisikan daftar situs web yang ada di internet melalui peladen web CERN. Sejarah yang mencatat sejak tahun 1992 masih ada hingga kini. Dengan semakin banyaknya situs web yang aktif membuat daftar ini tidak lagi memungkinkan untuk dikelola oleh manusia. Utilitas pencari yang pertama kali digunakan untuk melakukan pencarian di internet adalah Archie yang berasal dari kata “archive” tanpa menggunakan huruf “v”. Archie dibuat tahun 1990 oleh Alan Emtage,

Bill Heelan dan J. Peter Deutsch, saat itu adalah mahasiswa ilmu komputer Universitas McGill, Amerika Serikat. Cara kerja program tersebut adalah mengunduh daftar direktori serta berkas yang terdapat pada layanan ftp publik (anonim) kemudian memuatnya ke dalam basisdata yang memungkinkan pencarian.

Mesin pencari lainnya seperti Aliweb, muncul di 1993 dan masih berjalan hingga saat ini. Salah satu mesin pencari pertama yang sekarang berkembang menjadi usaha komersial yang cukup besar adalah Lycos, yang dimulai di Carnegie Mellon University sebagai proyek riset pada tahun 1994.

Segera setelah itu, banyak mesin pencari yang bermunculan dan bersaing memperebutkan popularitas. Termasuk di antaranya adalah safari web browsing yang aman dan untuk publik. Masing-masing bersaing dengan menambahkan layakan-layanan tambahan seperti yang dilakukan oleh Yahoo.

Tahun 2002 Yahoo! mengakuisisi Inktomi, setahun kemudian mengakuisisi AlltheWeb dan Altavista kemudian meluncurkan mesin pencari sendiri yang didasarkan pada teknologi gabungan dari mesin-mesin pencari yang telah diakuisisinya serta memberikan layanan yang mengutamakan pencarian Web daripada layanan-layanan lainnya.

Di bulan desember 2003, Orase menerbitkan versi pertama dari teknologi pencari waktu-riilnya. Mesin ini memiliki banyak fungsi baru dan tingkat unjuk kerja yang jauh lebih baik.

Mesin pencari juga dikenal sebagai target investasi internet yang terjadi pada akhir tahun 1990-an. Beberapa perusahaan mesin pencari yang masuk ke dalam pasar saham diketahui mencatat keuntungan besar. Sebagian lagi sama sekali menonaktifkan layanan mesin pencari, dan hanya memasarkannya pada edisi-edisi enterprise saja, contoh Northern Light sebelumnya diketahui merupakan salah satu perintis layanan mesin pencari di internet.

Buku Osmar R. Zaïane From Resource Discovery to Knowledge Discovery on the Internet menjelaskan secara rinci sejarah teknologi mesin pencari sebelum munculnya Google. Mesin-mesin pencari lainnya mencakup a9.com, AlltheWeb, Ask Jeeves, Clusty, Gigablast, Teoma, Wisenut, GoHook, Kartoo, dan Vivisimo.

Google

Google muncul pada akhir tahun 1997, di mana Google memasuki pasar yang telah diisi oleh para pesaing lain dalam penyediaan layanan mesin pencari, seperti Yahoo, Altavista, HotBot, Excite, InfoSeek dan Lycos, di mana perusahaan-perusahaan tersebut mengklaim sebagian perusahaan yang bergerak dalam bidang layanan pencarian di internet. Hingga akhirnya Google mampu menjadi sebagai penyedia mesin pencari yang cukup diperhitungkan di dunia.

Saat tingginya persaingan antar mesin pencari yang ada, namun mesin pencari lain tidak mampu menghentikan kesuksesan Google. Setelah Yahoo mampu pada posisi puncak di sekitar tahun 2000, Google mampu menerobos liga besar tersebut. sehingga Google dipandang sebagai mesin pencari yang utama seperti yang kita ketahui pada hari ini.

Yahoo!

Yahoo! raja direktori di internet, di samping para pengguna internet melihat DMOZ serta LookSmart berusaha menurunkan nya dari posisi puncak tersebut. Akhir-akhir ini, telah tumbuh secara cepat dalam ukurannya, mereka pun sudah memiliki harga sehingga mudah untuk memasukinya, dengan demikian, mendapatkan sebuah daftar pada direktori Yahoo memang memiliki nilai yang tinggi.

Pada tahun 2001, mesin pencari Google berkembang besar. Keberhasilan ini didasarkan pada bagian konsep dasar dari link popularity dan PageRank. Setiap halaman diurutkan berdasarkan seberapa banyak situs yang terkait, dari sebuah premis bahwa situs yang diinginkan pasti lebih banyak terhubung daripada yang lain. Rangking situs (The PageRank)dari sebuah link halaman dan jumlah link dari halaman-halaman tersebut merupakan masukan bagi Rangking situs yang bersangkutan. Hal ini memungkinkan bagi Google untuk mengurutkan hasilnya berdasarkan seberapa banyak halaman situs yang menuju ke halaman yang ditemukannya. User interface Google sangat disukai oleh pengguna, dan hal ini berkembang ke para pesaingnya.

Cara Kerja Search Engine
Program Search Engine dalam menjalankan fungsinya sebenarnya bekerja bersamaan dengan Browser. Ketika kita mengetikkan sesuatu lalu Enter,  Search Engine-lah yang bekerja melakukan pencarian di database. Hasil yang didapat diberikan kembali ke Browser, lalu Browser menampilkannya untuk kita dalam format yang mudah kita mengerti. Sebenarnya Search Engine tidak tampak, ia bekerja di balik layar. Search Engine juga sebenarnya bekerja dengan teman-temannya yaitu crawler atau indexer atau robot atau bot.
Sederhananya, proses yang berlangsung adalah: saat user membuka Browser, dan memerintahkan pencarian, maka browser minta tolong Search Engine untuk mencarikan. Jika sudah didapat, hasilnya dikembalikan ke Browser dan Browser menampilkannya untuk user. Semuanya berlangsung sangat cepat sehingga kita tidak mengetahui proses sesungguhnya yang terjadi.
Mesin pencari web bekerja dengan cara menyimpan informasi tentang banyak halaman web, yang diambil secara langsung dari www. Halaman ini di ambil dengan web crawler-browser web yang otomatis mengikuti setiap pranala yang dilihatnya. Isi setiap halaman lalu dianalisis untuk menentukan cara mengindeksnya (misalnya kata-kata di ambil dari judul, subjudul, atau field khusus yang di sebut meta tag). Data tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya.
Sebagian mesin pencari seperti Google, menyimpan seluruh atau sebagian halaman sumber (yang disebut cache) maupun informasi tentang halaman web itu sendiri. Ketika seorang pengguna menggunakan mesin pencari dan memasukan query, biasanya dengan memasukan kata kunci, mesin mencari akan mengindeks dan memberikan daftar halaman web yang paling sesuai dengan kriterianya. Daftar ini biasanya disertai ringkasan singkat menggenai judul dokumen dan terkadang sebagian teks dari hasil pencarian yang kita cari.
Kelebihan:
1.      Kecepatan dan kemudahan dalam mencari
2.      lebih canggih dengan fitur yang dimilikinya
3.      Tampilan yang sederhana
Google merupakan satu-satunya mesin pencari yang memilki cache. Dengan adanya cache ini, si pencari dapat menghemat waktu pencarian, karena hasil pencarian yang akan ditampilkan.
Kekurangan:
Dengan kelebihan yang dimilikinya, ternyata mesin pencari ini jadi bidikan para spamer untuk menampilkan iklan-iklan yang tidak diperlukan. Mereka memanfaatkan setiap celah yang ada pada sistem algoritma Google untuk memaksa iklan mereka tampil pada halaman terdepan. Maka, pencarian pun terasa tergangggu

Komponen Search Engine
Search engine terdiri atas lima komponen, yaitu:
1. Query interface
Query interface adalah komponen penting pertama yang merupakan bentuk tampilan atau format situs yang menyediakan fasilitas searching engine. Bentuk yang paling sederhana adalah tersedianya sebuah kotak kosong di situs dimana user dapat menuliskan data atau informasi yang ingin dicari (lihat situs Yahoo.com atau Altavista.com). Yang harus diketahui oleh user adalah bahwa tidak semua situs memiliki kemampuan yang sama dalam membantu user untuk mengekspresikan jenis data atau informasi yang ingin dicari. Dalam bahasa komputer cara mengekspresikan ini disebut sebagai query. Contohnya adalah seseorang yang ingin mencari data atau informasi mengenai hal-hal yang berkaitan dengan kesehatan ibu dan anak, dapat menggunakan query semacam: “kesehatan” and “ibu” and “anak”.
2. Query Engine
Komponen kedua adalah Query Engine, merupakan sebuah program yang bertugas untuk menterjemahkan keinginan user ke dalam bahasa yang dimengerti oleh mesin komputer. Secara teknis, perusahaan-perusahaan penyedia searching engine berlomba-lomba membuat query engine yang baik sehingga selain tepat dalam mengekspresikan keinginan user, dapat pula melakukan tugas pencarian secara cepat.
3. Database
Database pada dasarnya merupakan kumpulan atau daftar dari dokumen maupun arsip dari seluruh situs yang ada di internet. Semakin besar skala internet, akan semakin besar pula kapasitas penyimpan yang dibutuhkan.
4. Spider
Spider merupakan komponen terpenting dalam sebuah searching engine. Secara berkala dan kontinyu, spider akan mendata setiap situs yang ada di internet, baik yang baru maupun yang lama. Terhadap masing-masing situs, selain alamatnya, akan diambil kata-kata kunci dari arsip maupun dokumen yang ditemukan. Katakanlah dari situs Bidanku.com akan diambil setiap kata pada kalimat judul artikel, disinilah sebenarnya persaingan antara situs terjadi, yaitu strategi dan teknik apa yang dipergunakan dalam melakukan sampling terhadap kata-kata yang akan menjadi kunci dalam pencarian arsip dan dokumen.
5. Indexer
Indexer merupakan sebuah program untuk mempercepat proses pencarian. Filosofi yang dipergunakan mirip dengan prinsip penggunaan indeks pada kamus atau buku-buku. Perang antar situs pun terjadi di sini, karena teknik melakukan indeks akan sangat berpengaruh terhadap kecepatan pencarian data atau informasi. Biasanya yang terjadi di sini adalah adu algoritma (alur logika sebuah program) antar para programmer yang direkrut oleh masing-masing perusahaan.
Jenis Search Engine
Berdasarkan cara mengumpulkan data halaman-halaman web, mesin pencari dapat di kelompokkan menjadi 4 kategori :
1.      Human Organized Search Engine
Mesin pencari yang dikelola sepenuhnya oleh tangan manusia. Mesin pencari ini menggunakan metode dengan memilah-milih informasi yang relevan dan dikelompokan sedemikian rupa sehingga lebih bermakna dan bermanfaaat bagi penggunannya. Situs ini dalam prakteknya memperkerjakan para pakar dalam bidang-bidang tertentu, kemudian para pakar tersebut dapat mengkelompokan situs-situs tertentu sesuai dengan bidangnnya atau kategori situs itu sendiri.
2.      Computer Created Search Engine
Search engine kategori ini banyak memiliki kelebihan karena banyak menyajikan inforrmasi walaupun kadang-kadang ada beberapa informasi yang tidak relevan tidak seperti yang kita inginkan. Search engine ini telah menggunakan software laba-laba atau spider software yang berfungsi menyusup pada situs-situs tertentu, kemudian mengumpulkan data serta mengelompokan dengan sedikit bantuan tangan manusia.
 3.      Hybrid Seacrh Engine
Merupakan gabungan antara tangan manusia dengan computer, sehingga menghasilkan hasil pencarian yang relative akurat. Peran manusia dalam hal ini adalah sebagai penelaah dalam proses pengkoleksian database halaman web. Sebenarnya tipe ini lah yang paling mudah pembuatannya karena dapat didesain sesuai dengan keinginan kita.
4.      MetaCrawler/Metasearch
Merupakan perantara dari mesin pencari yang sebenarnya. Mesin ini hanya akan mengirimkan permintaan pencarian ke berbagai mesin pencari serta menampilkan hasilnya satu di layer browser sehingga akan menampilkan banyak sekali hasil dari ber bagai mesin pencari yang ada.

Komentar

Postingan populer dari blog ini

MENYUSUN KEMBALI FORMAT DOKUMEN PENGOLAH KATA

Mengoperasikan Perangkat Lunak Pengolah Angka