Ranking Berbasis Algoritma: Crawling, Indexing, dan Ranking

Ranking Berbasis Algoritma: Crawling, Indexing, dan Ranking

Sistem ranking berbasis algoritma adalah sistem yang digunakan oleh mesin pencari seperti Google untuk menentukan urutan kemunculan hasil pencarian berdasarkan pertimbangan yang ditetapkan oleh algoritma yang digunakan. Proses ini terdiri dari tiga tahap utama: crawling, indexing, dan ranking.

  1. Crawling adalah proses dimana mesin pencari menjelajahi internet menggunakan software khusus yang disebut "crawler" atau "spider". Crawler ini mengikuti tautan dari satu halaman web ke halaman web lainnya, mengumpulkan informasi tentang setiap halaman yang ditemukannya.
  2. Indexing adalah proses dimana informasi yang dikumpulkan oleh crawler disimpan dalam database yang disebut "indeks". Indeks ini kemudian digunakan oleh mesin pencari untuk mencari dan menampilkan hasil pencarian yang sesuai dengan permintaan pengguna.
  3. Ranking adalah proses dimana mesin pencari menentukan urutan kemunculan hasil pencarian berdasarkan pertimbangan yang ditetapkan oleh algoritma yang digunakan. Algoritma ini menggunakan berbagai faktor seperti relevansi, kepopuleran, dan keandalan untuk menentukan posisi suatu halaman dalam hasil pencarian.

Memahami cara kerja mesin pencari Google dalam perayapan (crawling), pengindeksan (indexing), dan pemeringkatan (rangking) berguna bagi Anda yang ingin belajar SEO, karena membantu Anda menentukan tindakan apa yang harus diambil untuk mencapai tujuan Anda. Bagian ini terutama mencakup cara Google dan Bing bekerja, namun tidak selalu berlaku untuk search engine lain yang populer di negara lain, seperti Yandex (Rusia), Baidu (Tiongkok), Seznam (Republik Ceko), dan Naver (Korea) .

Search engine harus menjalankan banyak tugas dengan sangat baik untuk memberikan hasil pencarian yang relevan. Sederhananya, Anda dapat menganggap ini sebagai:

  • Merayapi (crawling) dan mengindeks (indexing) triliunan dokumen (halaman dan file) di Web (sebagai catatan bahwa mereka mengabaikan halaman yang mereka anggap "tidak penting", mungkin karena halaman tersebut dianggap tidak menambahkan nilai baru atau tidak direferensikan sama sekali di Web).
  • Menanggapi permintaan pengguna dengan memberikan daftar halaman yang relevan.

Di bagian ini, kita akan menelusuri dasar-dasar fungsi ini dari perspektif nonteknis. Bagian ini akan dimulai dengan membahas bagaimana mesin pencari mencari dan menemukan konten.

Crawling (Perayapan) dan Indexing (Pengindeksan)

Untuk memberikan hasil terbaik, mesin pencari seperti search engine google harus berupaya menemukan semua laman publik di World Wide Web dan kemudian menampilkan halaman yang paling sesuai dengan kueri penelusuran pengguna. Langkah pertama dalam proses ini adalah merayapi (crawling) Web. Search Engine memulai dengan kumpulan situs unggulan yang dikenal berkualitas sangat tinggi, lalu mengunjungi tautan di setiap halaman situs tersebut untuk menemukan halaman web lain.

Struktur tautan web berfungsi untuk menyatukan semua halaman yang dipublikasikan sebagai hasil dari seseorang yang menautkannya. Melalui tautan, robot otomatis dari search engine, yang disebut crawler atau spider, dapat menjangkau triliunan dokumen yang saling berhubungan.

Crawling

Crawling adalah proses dimana mesin pencari menjelajahi internet menggunakan software khusus yang disebut "crawler" atau "spider". Crawler ini mengikuti tautan dari satu halaman web ke halaman web lainnya, mengumpulkan informasi tentang setiap halaman yang ditemukannya. Informasi yang dikumpulkan ini kemudian disimpan dalam database yang disebut "indeks" dan digunakan oleh mesin pencari untuk menampilkan hasil pencarian yang sesuai dengan permintaan pengguna.

Crawler dapat menemukan halaman web baru dengan mengikuti tautan yang terdapat pada halaman yang sudah dikunjungi, atau dengan mengikuti tautan yang disediakan oleh situs web lain. Jika crawler menemukan halaman baru, ia akan mengindeks informasi yang terdapat pada halaman tersebut, sehingga halaman tersebut dapat ditemukan oleh mesin pencari ketika seseorang melakukan pencarian.

Crawling merupakan proses utama dalam sistem ranking berbasis algoritma yang digunakan oleh mesin pencari, karena tanpa proses crawling, mesin pencari tidak akan tahu apa yang ada di internet dan tidak dapat menampilkan hasil pencarian yang relevan bagi pengguna.

Pada proses crawling, search engine merayapi suatu halaman tertentu dengan dimulai terlebih dahulu dengan memuat halaman, lalu menganalisis konten, dan kemudian melihat halaman mana saja yang ditautkan pada satu laman tersebut.

Mesin pencari kemudian akan memuat halaman-halaman lain itu dan menganalisis konten itu juga. Proses ini berulang-ulang hingga proses crawling selesai. Proses ini sangat kompleks, karena Web adalah tempat yang besar dan kompleks.

Catatan; Search engine tidak mencoba meng-crawling seluruh web setiap hari. Bahkan, mereka mungkin mengetahui halaman yang mereka pilih untuk tidak crawling karena halaman tersebut kemungkinan tidak cukup penting untuk ditampilkan di hasil penelusuran. Kita akan membahas peran penting ini dalam “Retrieval and Ranking”.

Indexing

Langkah pertama dalam proses ini adalah membuat indeks atau istilahnya indexing. Ini adalah basis data besar-besaran yang mencatat semua istilah penting di setiap halaman yang dirayapi oleh mesin pencari.

Banyak data lain juga dicatat, seperti peta semua halaman yang ditautkan ke setiap halaman, teks yang dapat diklik dari tautan tersebut (dikenal sebagai anchor teks), apakah text tersebut dianggap sebagai iklan atau tidak, dan banyak lagi.

Untuk menyelesaikan tugas besar menyimpan data di ratusan triliun halaman yang dapat diakses dalam sepersekian detik, mesin pencari telah membangun pusat data besar-besaran untuk menangani semua data ini dengan proses indexing.

Salah satu konsep kunci indexing dalam membangun mesin telusur adalah memutuskan dari mana harus memulai perayapan Web. Meskipun secara teoritis Anda dapat memulai dari banyak tempat berbeda di Web, idealnya Anda memulai penjelajahan Anda dengan sekumpulan situs web yang tepercaya.

Dimulai dengan sekumpulan situs web yang dikenal dan tepercaya memungkinkan mesin telusur mengukur seberapa besar kepercayaan mereka terhadap situs web lain yang mereka temukan melalui proses perayapan.

Pengambilan (Retrieval) dan Pemeringkatan (Ranking)

Retrieval adalah proses dimana mesin pencari mencari di dalam indeks yang telah dibuatnya untuk menemukan halaman yang sesuai dengan permintaan pengguna. Setelah mesin pencari menemukan halaman yang sesuai, ia akan menampilkan hasil pencarian kepada pengguna.

Ranking adalah proses dimana mesin pencari menentukan urutan kemunculan hasil pencarian berdasarkan pertimbangan yang ditetapkan oleh algoritma yang digunakan. Algoritma ini menggunakan berbagai faktor seperti relevansi, kepopuleran, dan keandalan untuk menentukan posisi suatu halaman dalam hasil pencarian. Halaman yang dinilai lebih relevan, populer, dan andal akan muncul lebih tinggi dalam hasil pencarian dibandingkan dengan halaman yang dinilai kurang relevan, tidak populer, atau kurang andal.

Retrieval dan ranking merupakan dua proses utama dalam sistem ranking berbasis algoritma yang digunakan oleh mesin pencari. Proses retrieval memastikan bahwa mesin pencari dapat menemukan halaman yang sesuai dengan permintaan pengguna, sedangkan proses ranking memastikan bahwa hasil pencarian yang ditampilkan kepada pengguna merupakan hasil yang paling relevan dan bermanfaat.

Bagi sebagian besar pengguna search engine, pencarian jawaban dimulai seperti yang ditunjukkan pada gambar di bawah ini

proses crawling, indexing dan ranking search engine google atau mesin pencari
Gambar hanya ilustrasi

Langkah selanjutnya dalam pencarian ini terjadi ketika mesin pencari Google mengembalikan daftar halaman yang relevan di Web dalam urutan yang diyakini paling mungkin memuaskan pengguna. Proses ini mengharuskan mesin telusur untuk meng crawling kumpulan ratusan miliar dokumen mereka dan melakukan dua hal: pertama, hanya menampilkan hasil yang terkait dengan kueri penelusur; dan kedua, beri peringkat hasil dalam urutan kepentingan yang dirasakan (dengan mempertimbangkan kepercayaan dan otoritas yang terkait dengan situs). Ini adalah relevansi dan pentingnya bahwa proses SEO dimaksudkan untuk mempengaruhi.

Relevansi adalah sejauh mana konten dokumen yang dikembalikan dalam pencarian cocok dengan maksud dan istilah permintaan pengguna. Relevansi dokumen meningkat jika halaman berisi istilah yang relevan dengan frasa yang ditanyakan oleh pengguna, atau jika tautan ke halaman berasal dari halaman yang relevan dan menggunakan anchor text yang relevan.

Anda dapat menganggap relevansi sebagai langkah pertama untuk "berada dalam permainan ini". Jika Anda tidak relevan dengan kueri mesin pencari, maka mesin pencari tidak menganggap Anda disertakan dalam hasil penelusuran untuk kueri tersebut. Kita membahas bagaimana relevansi ditentukan secara lebih rinci dalam “Menentukan Niat Pencari dan Menyampaikan Konten yang Relevan dan Segar”.

Kepentingan mengacu pada kepentingan relatif, diukur melalui kutipan (tindakan satu karya mereferensikan karya lain, seperti yang sering terjadi dalam dokumen akademik dan bisnis), dari dokumen tertentu yang cocok dengan permintaan pengguna. Pentingnya suatu dokumen tertentu meningkat dengan setiap dokumen lain yang mereferensikannya. Dalam lingkungan online saat ini, kutipan dapat datang dalam bentuk tautan ke dokumen atau referensi ke situs media sosial. Menentukan bagaimana menimbang sinyal-sinyal ini dikenal sebagai analisis kutipan.

Anda dapat memikirkan pentingnya sebagai cara untuk menentukan halaman mana, dari grup halaman yang sama-sama relevan, muncul pertama di hasil pencarian, yang kedua, dan seterusnya. Otoritas relatif situs, dan kepercayaan yang dimiliki mesin telusur di dalamnya, merupakan bagian penting dari penentuan ini. Tentu saja, persamaannya sedikit lebih rumit dari ini, dan tidak semua halaman memiliki relevansi yang sama. Pada akhirnya, kombinasi relevansi dan kepentinganlah yang menentukan urutan peringkat.

Kepentingan dan relevansi tidak ditentukan secara manual (itu akan membutuhkan trilyunan jam kerja dengan seluruh populasi Bumi sebagai tenaga kerja). Alih-alih, mesin membuat persamaan matematika yang hati-hati—algoritma—untuk menyortir gandum dari sekam dan kemudian mengurutkan gandum berdasarkan kualitas. Algoritma ini sering terdiri dari ratusan komponen. Di bidang search engine marketing, hal ini sering disebut sebagai faktor peringkat atau kriteria peringkat algoritmik.

Kita membahas faktor atau sinyal peringkat (sinyal adalah istilah yang disukai Google) secara lebih mendetail pada tulisan “Menganalisis Faktor Peringkat”.

Mengevaluasi Konten di Halaman Web

Mesin pencari menempatkan banyak bobot pada konten setiap halaman web saat proses crawling. Lagi pula, konten inilah yang menentukan tentang apa halaman itu, dan mesin pencari melakukan analisis terperinci dari setiap halaman web yang mereka temukan selama perayapan untuk membantu membuat keputusan itu.

Anda dapat menganggap ini sebagai mesin pencari yang melakukan analisis mendetail terhadap semua kata dan frasa yang muncul di halaman web, lalu membuat peta data tersebut untuk dipertimbangkan menampilkan halaman Anda di hasil saat pengguna memasukkan permintaan pencarian terkait. Peta ini, sering disebut sebagai peta semantik, berusaha untuk mendefinisikan hubungan antara konsep-konsep tersebut, sehingga mesin telusur dapat lebih memahami cara mencocokkan halaman web yang tepat dengan kueri penelusuran pengguna.

Jika tidak ada kecocokan semantik dari konten halaman web dengan kueri, kemungkinan halaman tersebut muncul jauh lebih rendah. Oleh karena itu, kata-kata yang Anda tempatkan di halaman, dan “tema” halaman itu, memainkan peran besar dalam menentukan peringkat.

Dalam beberapa kasus proses crawling, mesin pencari Google akan memecah halaman saat melihatnya dan mencari sesuatu konten yang unik pada halaman tersebut. Elemen navigasi pada halaman web kemungkinan besar serupa di banyak halaman situs. Elemen navigasi ini tidak diabaikan, dan mereka memainkan peran penting, tetapi mereka tidak membantu mesin pencari menentukan konten unik apa yang ada di halaman. Untuk melakukannya, mesin pencari berfokus pada bagian “Konten Halaman Yang Unik”.

Menentukan konten unik pada halaman adalah bagian penting dari apa yang dilakukan mesin pencari seperti Google saat proses crawling. Mesin pencari menggunakan pemahamannya tentang konten unik untuk menentukan jenis permintaan pencarian yang mungkin relevan dengan halaman web. Karena navigasi situs umumnya tidak unik untuk satu halaman web, itu tidak membantu mesin pencari dengan tugas itu. Hal ini tidak berarti tautan navigasi tidak penting—tentu saja tidak; namun, tautan pada navigasi tidak dihitung saat mesin telusur mencoba menentukan konten unik halaman web, karena bagian navigasi cenderung banyak di gunakanan dan dibagikan di banyak halaman web.

Satu tugas yang dihadapi mesin pencari seperti Google adalah menilai nilai konten. Meskipun mengevaluasi bagaimana komunitas merespons suatu konten menggunakan analisis tautan adalah bagian dari proses, mesin pencari juga dapat menarik beberapa kesimpulan berdasarkan apa yang mereka lihat di halaman tersebut pada saat crawling.

Misalnya, apakah konten yang sama persis tersedia di situs web lain? Apakah konten unik mesin pencari dapat melihat panjang dua kalimat atau panjang 500 kata? Apakah konten mengulangi kata kunci yang sama secara berlebihan? Ini adalah beberapa contoh faktor yang dapat dievaluasi oleh mesin telusur saat mencoba menentukan nilai suatu konten.

https://iyansupriyadi.com/ranking-berbasis-algoritma-crawling-indexing-dan-ranking/?feed_id=627&_unique_id=63cf8ab227f17 #BelajarSEO #BelajarSEOUntukPemula #Crawling #Google #Indexing #Ranking #SearchEngine #belajarseo #crawling #Google #indexing #ranking #SearchEngine #seo

Komentar

Postingan populer dari blog ini

Optimasi On-Page dalam konteks SEO