Kaj je stop beseda?

V računalniških in spletnih aplikacijah je stop beseda beseda, ki se izloči med obdelavo določene vrste besedila, na primer med začetkom iskanja po spletu. Poznan kot ena komponenta obdelave naravnega jezika ali NLP, je ideja te vrste filtriranja pomagati pospešiti iskanje z izpuščanjem običajnih členov govora iz zahteve. Namesto tega iskalnik uporablja preprost označevalec, da opazi prisotnost besede v besedilnem nizu, vendar ne prepreči, da bi prisotnost te oznake vključila to stran v rezultate iskanja.

Eden od načinov za razumevanje, kako lahko zaustavitvene besede zapletejo delovanje iskalnikov, je, da upoštevamo dejstvo, da bo pri izvajanju iskanja motor upošteval vsako besedo, ki je vključena v iskalno zahtevo, ki jo je predložil uporabnik. Kot del tega premisleka motor išče strani, ki vsebujejo vsako besedo. To pomeni, da če iskalna zahteva vsebuje tri besede, motor trikrat poišče po internetu in na koncu da prednost stranem, ki vključujejo vse tri besede.

Na primer, iskanje, kot je »hiša na hribu«, bi od motorja zahtevalo iskanje po vsaki besedi v zaporedju, pri čemer bi nekateri celo dvakrat izvedli iskanje po zaustavilni besedi »the«. To vzame čas in vire, ki bi jih lahko preusmerili v pomoč pri drugih iskanjih po ključnih besedah, ki jih trenutno izvajajo drugi končni uporabniki. Z uporabo oznak za zamenjavo »the« in »on« med iskanjem lahko motor nameni manj virov in še vedno vrne rezultate, ki bodo zelo verjetno zadovoljili končnega uporabnika.

Medtem ko se stopnja beseda včasih imenuje strupena beseda, v resnici ni nič posebej narobe, če v besedilo, ki se uporablja za izvajanje iskanja, vključi členke govora. Uporaba zaustavitvene besede ali besed kot del iskalne zahteve lahko zaplete postopek indeksiranja iskalnika pri poskusu pridobivanja podatkov, ki ustrezajo iskalnim kriterijem. Kljub temu končni uporabnik verjetno ne bo opazil velike razlike v pridobivanju informacij, ki se na koncu vrne.

Ni trdega in hitrega seznama besed, ki bi ga univerzalno uporabljali vsi iskalniki. Pravzaprav nekateri iskalniki sploh ne uporabljajo nobene vrste seznama zaustavitvenih besed kot del naloge obdelave naravnega jezika. Drugi motorji pa bodo v veliki meri uporabljali seznam zaustavitvenih besed kot sredstvo za učinkovitejše dodeljevanje virov, hkrati pa bodo še vedno vračali rezultate iskalnikov, ki so točni in verjetno zelo primerni za iskalne zahteve, ki jih pošlje kdorkoli, ki uporablja določeno motor.