Kaj je Fuzzy Matching?

Mehko ujemanje je metoda, ki se uporablja v nekaterih računalniških programih, predvsem tistih, ki so zasnovani za samodejno prevajanje besedila med različnimi jeziki. Deluje v primerih, ko se zbirka podatkov, ki jo uporablja programska oprema, ne ujema natančno z delom besedila. Namesto tega baza podatkov išče tesna ujemanja, pri čemer človeška revizija običajno preveri, ali je to ujemanje sprejemljivo natančno.

Večina avtomatiziranih prevajalskih programov preprosto primerja besedilo z bazo podatkov o prejšnjih prevodih. Ta baza podatkov je običajno znana kot prevodni pomnilnik (TM). Vsak nov in potrjen prevod se doda v bazo podatkov, kar pomeni, da so prihodnji prevodi običajno natančnejši in hitrejši.

Običajno prevod, ki temelji na TM, deluje s celimi stavki. Na primer, če je uporabnik predhodno odobril določen stavek v francoščini kot točen prevod: »Trgovina je odprta med 9. in 5. uro ob delavnikih, vendar se v sredo zapre ob 2. uri«, potem naslednjič programska oprema je pozvan, da prevede ta stavek, bo samodejno uporabil isto francosko besedilo kot prej.

Orodje za mehko ujemanje deluje v situacijah, ko se določena fraza še ni pojavila v dokumentih, ki jih je sistem prevedel. Orodje vključuje bodisi ustvarjalca programske opreme bodisi končnega uporabnika, ki nastavi sprejemljivo raven mehkega ujemanja v obliki odstotnega ujemanja. Če je besedna zveza dovolj blizu tistemu, ki je bil predhodno preveden, da ustreza temu odstotnemu ujemanju, bo programska oprema uporabnika obvestila o ujemanju, dala prejšnji prevod in od uporabnika zahtevala, da potrdi ali uredi predlagani prevod.

Za nadaljevanje prejšnjega primera, če je bil prag mehkega ujemanja nastavljen na 90 % in je novi angleški dokument vseboval stavek: »Trgovina se ob delavnikih odpre med 9. in 5. uro, v sredo pa se zapre ob 2. uri«, programska oprema predlagal prej uporabljen prevod in uporabnik bi verjetno kliknil, da ga odobri. Če bi novi dokument vseboval stavek: »Trgovina je ob delavnikih odprta med 9. in 5. uro, v četrtek pa se zapre ob 2. uri«, bi programska oprema predlagala prej uporabljen prevod in uporabnik bi ta prevod popravil tako, da bi zaključil z Francoska beseda za četrtek. Če bi novi dokument vseboval stavek: »Trgovina je odprta od 9. do 5. ure vsak delovnik razen srede, ko se zapre ob 2. uri«, programska oprema tega ne bi štela za mehko ujemanje, čeprav je pomen enak, in tako ne bi ponudil samodejnega prevoda za stavek, tako da bi ga uporabnik lahko prevedel ročno.