Kaj so statistično neverjetne fraze?

Statistično neverjetne fraze ali SIP je tehnologija iskanja, ki jo je razvil Amazon.com za iskanje po vsebini knjig po besednih zvezah, ki jih vsebujejo, ki so verjetno edinstveni ali se pogosto pojavljajo. To je del Amazonovega patentiranega tehnološkega programa Search Inside!®. V bistvu Search Inside® omogoča Amazonu dostop do delnega ali celotnega besedila knjige, tako da se lahko uporabijo določene fraze za identifikacijo te knjige, če se pri iskanju uporabljajo statistično neverjetne fraze.

Ime te tehnologije je nekoliko zmedeno. Ko izvajate iskanje, želite, da se to, kar iščete, tesno ujema. Če v knjigi prepoznate edinstveno besedno zvezo, je malo verjetno, da bo vaše iskanje navedlo nekaj, česar ne želite, če uporabite to frazo za iskanje. Če iščete določeno knjigo in se ne spomnite naslova, vendar se lahko spomnite citata iz nje, lahko uporabite citat za iskanje knjige.

Druga možnost je, da boste morda želeli poiskati določeno temo v okviru večje teme. Na primer, če ste želeli poiskati knjigo s poklicnimi nasveti, vendar ste resnično želeli prebrati, kako vzpostaviti mreže za delovna mesta, bi lahko namesto »kariernega nasveta« poiskali »omrežje«. Takoj se na strani z rezultati iskanja v Amazonu prikažejo nekatera najbolj relevantna iskanja, vključno s knjigami, kot je Dig Your Well Before You’re Thirsty: Edina knjiga o mreženju, ki jo boste kdaj potrebovali.

Če ste iskali s temi vrstami statistično neverjetnih besednih zvez, boste morda opazili, da lahko dobite rezultate, ki se ne ujemajo ravno dobro. Na primer, prvi rezultat iskanja za mreženje ni za poklicno mreženje, temveč za informacije o računalniških in tehnoloških omrežjih. Če ste bolj natančni, lahko naredite boljše statistično neverjetne fraze. Na primer, boljše rezultate dobite z iskanjem pod poklicno mreženje ali zaposlitveno mreženje.

Statistično neverjetne besedne zveze so pravzaprav verjetne besedne zveze, saj je verjetno besedna zveza, edinstvena za knjigo Search Inside!®, vodilna na seznamu stvari, ki jih iščete. Lahko bi na primer vnesli vrstico Shakespeara iz Shakespearovega soneta, da bi prikazali knjige o Shakespearu. To ne deluje vedno dobro, saj so nekateri zelo znani citati uporabljeni v številnih drugih knjigah kot naslovi. Hamleta ne boste našli, če boste iskali »Biti ali ne biti«. Prav tako ne boste našli Macbetha s statistično neverjetnimi stavki, kot je »Ven! Prekleto mesto.” Pravzaprav je pod tem zadnjim izrazom prva knjiga, ki jo boste našli, knjiga o odstranjevanju madežev.

Uporaba statistično neverjetnih fraz je tudi način iskanja spletne vsebine, spletni pajki pa lahko uporabljajo podobno tehnologijo, da lahko ljudje najbolj učinkovito iščejo določene edinstvene vrstice. To ni popolna tehnologija, saj spletni pajek ne oceni nujno vsebine. Morda išče ponavljanje ključnih besed, ki ljudem omogoča, da najdejo kose z večjim številom ponovitev ključnih besed. Vse knjige na Amazonu nimajo tehnologije Search Inside!®, vendar se zdi, da je to trend. Konec koncev, tudi če je sistem nekoliko nepopoln, bi lahko skrajšal čas iskanja.