Kako delujejo iskalniki?

Iskalniki so v bistvu računalniški algoritmi, ki uporabnikom pomagajo najti določene informacije, ki jih iščejo. Različni delujejo na različne specifične načine, vendar vsi uporabljajo enaka osnovna načela.

Prva stvar, ki jo morajo iskalniki narediti, da lahko delujejo, je ustvariti lokalno bazo podatkov, v bistvu interneta. Zgodnje različice so samo indeksirale ključne besede in naslove strani, sodobne pa indeksirajo celotno besedilo na vsaki strani, pa tudi veliko drugih podatkov o odnosu te strani do drugih strani, v nekaterih primerih pa celoten ali del medijev na voljo tudi na strani. Iskalniki morajo vse te informacije indeksirati, da lahko po njih učinkovito izvajajo iskanja, namesto da bi morali teči po internetu vsakič, ko je poslana iskalna poizvedba.

Iskalniki ustvarjajo te baze podatkov z občasnim iskanjem po internetu. Zgodnje različice so pogosto zahtevale, da jim je treba predložiti strani, da bi jih pajkali, zdaj pa je večina strani najdena po povezavah z drugih strani. Tako imenovani roboti ali pajki, računalniški programi, izdelani za indeksiranje strani, preletavanje s strani na stran, beleženje vseh podatkov na strani in sledenje vsaki povezavi do novih strani. Različni iskalniki osvežujejo svoje indekse v različnih intervalih, odvisno od tega, koliko pajkov nenehno plazijo in kako hitro se ti pajki plazijo, pri čemer se nekateri prebijajo po internetu vsak dan ali dva, drugi pa le občasno osvežujejo vsak teden oz. mesec.

Ko pajek gre skozi te strani, beleži besede, ki jih najde na straneh. Zabeleži, kolikokrat se pojavi posamezna beseda, ali so besede tehtane na določene načine, morda na podlagi velikosti, lokacije ali oznake HTML, in odloči, kako pomembne so besede na podlagi povezav, ki pridejo na stran, in v splošnem kontekstu strani.

Iskalniki morajo nato tehtati vrednost vsake strani in vrednost vsake strani za besede, ki se na njej pojavljajo. To je najzahtevnejši del, a tudi najpomembnejši. Na najbolj preprosti ravni bi lahko preprosto spremljal vsako besedo na strani in to stran zabeležil kot ustrezno za iskanja s to ključno besedo. Vendar pa to ne bi prineslo veliko koristi večini uporabnikov, saj je za njihovo iskalno poizvedbo želena najustreznejša stran. Različni motorji si torej predstavljajo različne načine tehtanja pomembnosti.

Algoritmi, ki jih uporabljajo različni iskalniki, so dobro zaščiteni, da preprečijo ljudem, da bi posebej ustvarili strani za boljše uvrstitve ali vsaj omejili stopnjo, do katere lahko to storijo. Ta razlika je razlog, zakaj različni motorji dajejo različne rezultate za iste izraze. Google bi lahko ugotovil, da je ena stran najboljši rezultat za iskalni izraz, Ask pa lahko ugotovi, da ista stran ni niti med najboljših 50. Vse to temelji samo na tem, kako cenijo vhodne in odhodne povezave, gostoti ključnih besed, ki jih ugotovijo pomembno, kako cenijo različno umestitev besed in poljubno število manjših dejavnikov.
Najnovejši trend v iskalnikih in verjetno prihodnost iskanja na splošno je odmik od iskanja, ki temelji na ključnih besedah, na iskanja, ki temeljijo na konceptu. V tej novi obliki iskanja namesto omejevanja iskanja na ključne besede, ki jih iskalec vnese, poskuša program ugotoviti, kaj te ključne besede pomenijo, tako da lahko predlaga strani, ki morda ne vključujejo natančne besede, a so kljub temu aktualne za Iskanje. To je še vedno razvijajoče se področje, vendar se zdi, da ima zaenkrat veliko potenciala za bolj relevantno iskanje, zaradi česar je splet še enostavnejši za iskanje točno tistega, kar iščete.