Google dalam melakukan pencarian akan melakukan 3 langkah yang Anda kenal dengan istilah CIS (Crawling, Indexing, Serving). Saya akan menjelaskan secara lebih detail tentang ketiga langkah tersebut.
Crawling
Crawling adalah sebuah proses dimana Googlebot menemukan situs baru atau situs yang telah diupdate dan ditambahkan pada indeks Google.
Google menggunakan seperangkat besar komputer dalam melakukan crawling terhadap milyaran halaman situs. Program yang dibuat untuk melakukan tugas ini disebut Googlebot ( kadang ada yang menyebutnya robot, bot atau spider). Saat Googlebot mengunjungi sebuah situs, Googlebot akan mengunjungi setiap link yang terdapat pada situs tersebut (hal ini akan berhubungan dengan sitemap-topik yang akan saya bahas pada kesempatan yang lain) dan menempatkan tiap halaman pada daftar halaman yang akan di-Crawl. Menambahkan situs baru, mengganti situs yang terdahulu dan broken link akan dicatat pada langkah ini.
Google tidak menerima pembayaran untuk melakukan Crawling situs, dan Google secara profesional akan memisahkan hasil pencarian dengan iklan yang ada pada AdWord.
Indexing
Googlebot akan memproses setiap halaman yang telah di Crawl untuk disusun menjadi satu indeks yang sangat besar menurut kata kunci yang ditemukannya dan berdasarkan lokasi dari tiap halaman. Sebagai tambahan, Google memproses informasi kata kunci yang terkandung pada meta tags, title tags, dan atribut ALT yang terdapat pada img tags. Googlebot dapat memproses banyak, tapi tidak semua, jenis content. Sebagai contoh, Google tidak dapat memproses file media (*.flv,*.mp3,*.ogg dan lainnya) dan juga halaman dinamis (menggunakan bahasa pemrograman php,asp,java dan lainnya). Jadi, kata kunci pada media tersebut tidak dapat di proses oleh Google.
Serving
ketika user memasukkan kata kunci, mesin Google akan mencari halaman yang tepat pada databasenya sesuai dengan permintaan user dan akan menyajikan hasil yang paling relevan kepada user. Tingkat relevansi ini ditentukan oleh lebih dari 200 faktor, yang salah satunya adalah PageRank. PageRank adalah alat ukur seberapa baik halaman website Anda dengan berdasarkan pada link dari situs lain. Mudahnya, setiap link dari situs lain yang terhubung pada halaman situs Anda akan menambah PageRank situs Anda. Tidak semua link bernilai sama, Google sampai sekarang masih bekerja keras untuk memperbaiki penilaiannya dengan cara mengidentifikasi link spam dan tindakan negatif lain yang berdampak pada hasil pencarian. Jenis link yang paling baik adalah yang memeberikan link berdasarkan kualitas dari situs Anda.
Hmmm,, kalau begitu, apakah Anda telah memudahkan Search Engine dalam melakukan tugas-tugasnya diatas?