Setiap kali kita mengakses internet tidak pernah lepas
dari situs Google ataupun Yahoo. Dari kedua situs tersebut kita “berselancar” untuk menemukan berbagai
informasi yang kita butuhkan. Tanpa kita sadari, sebenarnya kita telah
akrab menggunakan search engine.
Berikut ini merupakan kumpulan dari petikan tulisan
mengenai Search Engine, bagaimana mekanisme kerjanya dan tips-tips penggunaan
Search Engine, dan semoga dapat menambah wawasan kita bersama.
Mekanisme pencarian dalam
Search Engine
Search Engines adalah mesin pembuat indeks kata per kata yang terdapat di web tersebut. Secara otomatis mesin ini akan menghampiri satu per satu halaman web dan mengambil seluruh kata dan menaruhnya ke dalam suatu indeks yang besar, biasanya informasi yang ditemukan jauh lebih banyak dan sporadis sifatnya. Kadang-kadang informasi yang tidak berhubungan tetapi mempunyai keyword yang tidak ada hubungannya dengan isi web dapat menipu mesin indeks ini. Contoh search engine yang terkenal adalah Google, Webcrawler, Altavista dan masih banyak lainnya.
Cara Bekerja Search Engine
Crawler-Based
Sebenarnya, bagaimana cara bekerja crawler-based search
engines sehingga dapat menyeleksi halaman situs yang ada? Ada aturannya yang
disebut algoritma. Bagaimana cara bekerjanya secara pasti merupakan hal yang
rahasia bagi perusahaan. Tapi, beberapa search engine besar menggunakan hal
yang seperti di bawah ini.
Salah
satu peraturan yang utama adalah urutan algoritme mengikuti lokasi dan frekuensi dari kata kunci pada halaman situs, disebut metode
lokasi/frekuensi. Bila kita mencari buku di perpustakaan, misalnya buku dengan judul 'travel', maka secara pasti
yang dicari adalah buku dengan judul 'travel'. Begitu halnya dengan mencari di
search engine.
Frekuensi juga merupakan faktor penting lain dalam menjelaskan keterkaitan search engine. Sebuah search engine akan menganalisa berapa kali sebuah kata kunci muncul dan hubungannya dengan kata lain. Dengan frekuensi yang tinggi kemudian dapat dianggap lebih relevan dengan halaman situs.
Direktori adalah kumpulan situs-situs yang dikategorikan ke dalam kelompok
informasi seperti hiburan, berita, olah raga, dan lainnya. Hampir seluruh
direktori web mempunyai editor untuk mengkategorikan setiap situs yang didapat
ke dalam direktori tersebut. Sehingga direktori web biasanya mempunyai isi yang
lebih berkualitas karena satu per satu di periksa isinya. Kekurangannya, sangat
susah mencari informasi yang lebih spesifik dan tidak trend, selain itu sering
sekali informasi yang diberikan tidak aktual karena direktori tidak dapat
langsung menginformasikan perkembangan yang ada di website, hal ini dikarenakan
kelengkapan informasinya bergantung pada si editor. Contoh direktori web adalah
Yahoo, Catcha, dan Search Indonesia.
Hybrid Search Engines adalah search engine yang menggunakan kedua teknik diatas, Crawler-based Search Engine dan Human-powered Directory.
Bagian-bagian dari sebuah
search engine
Search engines memiliki tiga komponen penting. Pertama
elemen yang disebut laba-laba (spider) juga disebut crawler. Elemen spider
mengerjakan akses (kunjungan) ke situs-situs web, membaca isinya, dan kemudian
mengikuti link-link yang ada pada situs. Elemen ini mengakses situs-situs web
secara periodik satu atau dua bulan untuk melihat apakah ada perubahan dari
situs-situs tersebut.
Tiap-tiap yang dijumpai elemen spider selalu akan dituliskan dalam sebuah index. Index merupakan elemen kedua dari search engine. Index sering pula disebut katalog yang mirip sebuah buku raksasa, berisikan copy dari setiap situs yang dikunjungi elemen spider. Jika elemen spider menemukan perubahan dari sebuah situs web, maka informasi dari situs web yang ada dalam katalog ini segera diperbaiki (up date).
Kadang-kadang diperlukan sebuah penulisan halaman baru
sesuai dari temuan elemen spider pada situs web. Sehingga ada kemungkinan
informasi baru dari sebuah situs web yang telah diakses oleh elemen spider
tidak tertulis dalam index katalog.
Software search engine adalah elemen ketiga. Program
inilah yang memilah ribuan data dalam katalog yang berisi copy halaman-halaman
situs web tadi, dan mencocokannya sesuai permintaan user internet, dan
menampilkan datanya ke layar monitor dan menyusunnya dalam daftar sesuai dengan
ranking-nya.
Search Engines Umum: ini serupa tapi tak sama.
Setiap search engine memiliki komponen-komponen seperti
disebut diatas. Namun ada perbedaan dalam pengaturannya. Karena itulah hasil
pencarian dari sebuah search engine sering berbeda. Perbedaan yang signifikan
dari search engine umum secara ringkas bisa dilihat dalam situs Search Engine
Features Page.
Pencarian dengan menggunakan salah satu situs search
engine crawler-based mempunyai proses pencarian yang ringkas, berdasarkan
sortiran dari berjuta-juta halaman situs yang sesuai dengan kata kunci
diskripsi. Kecocokan akan diurutkan berdasarkan halaman situs yang paling
relevan dengan kata kunci diskripsi yang diminta. Bagaimanapun, search engine
tidak selalu benar. Halaman situs yang tidak relevan terkadang terlampir juga
dan terkadang memerlukan waktu yang lama untuk mencari yang sesuai dengan
keinginan. Tapi, secara keseluruhan, search engine mengerjakan hal yang luar
biasa. Seperti kata penemu WebCrawler, Brian Pinkerton, "Imagine walking up to a librarian and saying, 'travel.' They're
going to look at you with a blank face."
0 comments:
Post a Comment