Kaj je OCR (Optično prepoznavanje znakov)?

Optično prepoznavanje znakov (OCR) je proces pretvorbe tiskanega gradiva v datoteke za obdelavo besedila ali besedila, ki jih je mogoče enostavno urejati in shraniti. Tehnologija je omogočila shranjevanje takšnih materialov z veliko manj prostora za shranjevanje kot materiali na papirju. OCR tehnologija je močno vplivala na način shranjevanja, deljenja in urejanja informacij. Pred optičnim prepoznavanjem znakov, če bi nekdo želel knjigo spremeniti v datoteko za obdelavo besedil, bi bilo treba vsako stran vtipkati besedo za besedo.

OCR tehnologija zahteva tako strojno kot programsko opremo. Poleg tega sofisticirani sistemi OCR zahtevajo dodatno vezje v samem računalniku za dokončanje postopka. Optični optični bralnik skenira besedilo na strani, nato pa pisave razčleni na vrsto pik, imenovanih bitna slika. Programska oprema lahko bere najpogostejše pisave in razlikuje, kje se vrstice začnejo in končajo. Ta bitna slika se nato prevede v računalniško besedilo.

Čeprav je optično prepoznavanje znakov v zadnjih letih naredilo velik napredek, še vedno ne deluje dobro pri prepoznavanju rokopisa ali pisav, ki so videti podobne rokopisu. V bančni industriji obstajajo sistemi, ki uporabljajo tehnologijo OCR, da poskušajo prebrati zneske na ročno napisanih čekih, da bi se ujemali z zmožnostjo računalnika, da prebere številko usmerjanja in računov.

Da bi dobili predstavo o moči OCR, si lahko pomagamo s primerom iz resničnega sveta. Predstavljajte si policijsko službo, ki ima vse svoje kazenske evidence shranjene v ogromnih kartotečnih omarah. Čeprav bi bilo skeniranje milijonov strani drago in dolgotrajno podjetje, so prednosti ogromne.

Ko sistem OCR pretvori strani v računalniško berljivo besedilo, lahko detektiv na primer v nekaj sekundah preišče celotno zgodovino. Ročno iskanje določenega zapisa morda ni pretežko, vendar si predstavljajte detektiva, ki poskuša poiskati vsa kazniva dejanja, storjena na določenem križišču med 8 in 00. Ta primer je le del moči besedila, ki ga je mogoče iskati, in to je le eden od razlogov, da mnoga podjetja in ustanove porabijo milijone dolarjev za OCR svojih starih podatkov.