Kaj je prepoznavanje vzorcev?

Prepoznavanje vzorcev je sposobnost sistema, da prepozna vzorce znotraj nizov podatkov, pri čemer se zanaša na programirano in naučeno znanje. To je pomemben del računalništva, saj omogoča razvoj sistemov, ki so sposobni kompleksne analize podatkov. To lahko pomaga raziskovalcem hitro razvrstiti podatke, da bi našli pomembne informacije, saj jim ni treba ročno prebrati podatkov, da bi našli zanimivosti. Prepoznavanje vzorcev je lahko koristno tudi za odkrivanje napak, goljufij in drugih težav v nizih podatkov.

To se razlikuje od ujemanja vzorcev, pri katerem lahko sistem natančno uskladi materiale z uporabo znane baze podatkov. Jasen primer te razlike je mogoče videti v e-poštnih filtrih. Številni spletni e-poštni računi imajo mapo z vsiljeno pošto. Ponudnik e-pošte skenira dohodno pošto in s prepoznavanjem vzorcev prepozna neželeno pošto in jo spusti v to mapo. Uporabnik lahko tudi filtrira svojo e-pošto in od odjemalca zahteva, da spusti e-pošto določenega pošiljatelja ali z določeno vsebino v določeno mapo.

Dejanje preverjanja neželene pošte zahteva sposobnost prepoznavanja splošnih vzorcev, kot so prisotnost določenih besed, znani sumljivi naslovi internetnega protokola (IP) in druge rdeče zastavice, ki lahko označijo pismo kot lažno. To je naprednejše od filtra, ki preprosto zahteva, da sistem uskladi vzorce. Če sistem vidi besedo ali pošiljatelja, ki ustreza vzorcu, lahko premakne e-pošto v ustrezno mapo.

Kompleksni algoritmi podpirajo prepoznavanje vzorcev. Sistem lahko uporablja več načinov za raziskovanje dohodnih podatkov in odločitev, kako najbolje ravnati z njimi. Lahko se programira za izvajanje posebnih funkcij, kot je usmerjanje sumljivih ali poškodovanih podatkov na določeno lokacijo, razvrščanje podatkov na smiseln način in tako naprej. Sistem je sposoben učenja in to uporablja kot orodje za izboljšanje prepoznavanja vzorcev. Vsakič, ko uporabnik na primer označi e-pošto kot neželeno pošto, sistem skenira e-pošto, da bi izvedel več o njej, in sistem ne bo še naprej delal napake, ko bi podobna e-poštna sporočila vstavljala v mapo »Prejeto«.

Računalniški znanstveniki razvijajo nove tehnike prepoznavanja vzorcev v laboratorijskih in raziskovalnih okoljih. Te je mogoče uporabiti za različne naloge in zahtevajo gradnjo nevronskih mrež, ki so sposobne komunicirati s podatki in se sčasoma spreminjati. Nekateri programi so izjemno izpopolnjeni in zmožni zelo podrobnega prepoznavanja vzorcev, drugi pa so bolj poenostavljeni. Takšni programi zmanjšajo število človeških ur, potrebnih za analizo podatkov, in lahko ujamejo stvari, ki bi jih človek lahko zamudil, na primer dokaze o goljufiji v obliki nepravilnosti, ki zajemajo na tisoče zavarovalnih zahtevkov.