Search Engine ~ Teknologi Layanan Jaringan

Setiap kali kita mengakses internet tidak pernah lepas dari situs Google ataupun Yahoo. Dari kedua situs tersebut kita “berselancar” untuk menemukan berbagai informasi yang kita butuhkan. Tanpa kita sadari, sebenarnya kita telah akrab menggunakan search engine.

Berikut ini merupakan kumpulan dari petikan tulisan mengenai Search Engine, bagaimana mekanisme kerjanya dan tips-tips penggunaan Search Engine, dan semoga dapat menambah wawasan kita bersama.

Gambar dari hestanto.wed.id

Mekanisme pencarian dalam Search Engine

Search Engines adalah mesin pembuat indeks kata per kata yang terdapat di web tersebut. Secara otomatis mesin ini akan menghampiri satu per satu halaman web dan mengambil seluruh kata dan menaruhnya ke dalam suatu indeks yang besar, biasanya informasi yang ditemukan jauh lebih banyak dan sporadis sifatnya. Kadang-kadang informasi yang tidak berhubungan tetapi mempunyai keyword yang tidak ada hubungannya dengan isi web dapat menipu mesin indeks ini. Contoh search engine yang terkenal adalah Google, Webcrawler, Altavista dan masih banyak lainnya.

Cara Bekerja Search Engine Crawler-Based

Sebenarnya, bagaimana cara bekerja crawler-based search engines sehingga dapat menyeleksi halaman situs yang ada? Ada aturannya yang disebut algoritma. Bagaimana cara bekerjanya secara pasti merupakan hal yang rahasia bagi perusahaan. Tapi, beberapa search engine besar menggunakan hal yang seperti di bawah ini.

Salah satu peraturan yang utama adalah urutan algoritme mengikuti lokasi dan frekuensi dari kata kunci pada halaman situs, disebut metode lokasi/frekuensi. Bila kita mencari buku di perpustakaan, misalnya buku dengan judul 'travel', maka secara pasti yang dicari adalah buku dengan judul 'travel'. Begitu halnya dengan mencari di search engine.

Frekuensi juga merupakan faktor penting lain dalam menjelaskan keterkaitan search engine. Sebuah search engine akan menganalisa berapa kali sebuah kata kunci muncul dan hubungannya dengan kata lain. Dengan frekuensi yang tinggi kemudian dapat dianggap lebih relevan dengan halaman situs.

Direktori adalah kumpulan situs-situs yang dikategorikan ke dalam kelompok informasi seperti hiburan, berita, olah raga, dan lainnya. Hampir seluruh direktori web mempunyai editor untuk mengkategorikan setiap situs yang didapat ke dalam direktori tersebut. Sehingga direktori web biasanya mempunyai isi yang lebih berkualitas karena satu per satu di periksa isinya. Kekurangannya, sangat susah mencari informasi yang lebih spesifik dan tidak trend, selain itu sering sekali informasi yang diberikan tidak aktual karena direktori tidak dapat langsung menginformasikan perkembangan yang ada di website, hal ini dikarenakan kelengkapan informasinya bergantung pada si editor. Contoh direktori web adalah Yahoo, Catcha, dan Search Indonesia.

Hybrid Search Engines adalah search engine yang menggunakan kedua teknik diatas, Crawler-based Search Engine dan Human-powered Directory.

Bagian-bagian dari sebuah search engine

Search engines memiliki tiga komponen penting. Pertama elemen yang disebut laba-laba (spider) juga disebut crawler. Elemen spider mengerjakan akses (kunjungan) ke situs-situs web, membaca isinya, dan kemudian mengikuti link-link yang ada pada situs. Elemen ini mengakses situs-situs web secara periodik satu atau dua bulan untuk melihat apakah ada perubahan dari situs-situs tersebut.

Tiap-tiap yang dijumpai elemen spider selalu akan dituliskan dalam sebuah index. Index merupakan elemen kedua dari search engine. Index sering pula disebut katalog yang mirip sebuah buku raksasa, berisikan copy dari setiap situs yang dikunjungi elemen spider. Jika elemen spider menemukan perubahan dari sebuah situs web, maka informasi dari situs web yang ada dalam katalog ini segera diperbaiki (up date).

Kadang-kadang diperlukan sebuah penulisan halaman baru sesuai dari temuan elemen spider pada situs web. Sehingga ada kemungkinan informasi baru dari sebuah situs web yang telah diakses oleh elemen spider tidak tertulis dalam index katalog.

Software search engine adalah elemen ketiga. Program inilah yang memilah ribuan data dalam katalog yang berisi copy halaman-halaman situs web tadi, dan mencocokannya sesuai permintaan user internet, dan menampilkan datanya ke layar monitor dan menyusunnya dalam daftar sesuai dengan ranking-nya.

Search Engines Umum: ini serupa tapi tak sama.

Setiap search engine memiliki komponen-komponen seperti disebut diatas. Namun ada perbedaan dalam pengaturannya. Karena itulah hasil pencarian dari sebuah search engine sering berbeda. Perbedaan yang signifikan dari search engine umum secara ringkas bisa dilihat dalam situs Search Engine Features Page.

Bagaimana Search Engine mengurutkan situs ?

Pencarian dengan menggunakan salah satu situs search engine crawler-based mempunyai proses pencarian yang ringkas, berdasarkan sortiran dari berjuta-juta halaman situs yang sesuai dengan kata kunci diskripsi. Kecocokan akan diurutkan berdasarkan halaman situs yang paling relevan dengan kata kunci diskripsi yang diminta. Bagaimanapun, search engine tidak selalu benar. Halaman situs yang tidak relevan terkadang terlampir juga dan terkadang memerlukan waktu yang lama untuk mencari yang sesuai dengan keinginan. Tapi, secara keseluruhan, search engine mengerjakan hal yang luar biasa. Seperti kata penemu WebCrawler, Brian Pinkerton, "Imagine walking up to a librarian and saying, 'travel.' They're going to look at you with a blank face."

Teknologi Layanan Jaringan

Sunday, May 17, 2020

Search Engine

0 comments:

Post a Comment