Kaj je optični tok?

Optični tok opisuje računalniško sledenje premikajočih se objektov z analizo vsebinskih razlik med video okvirji. V videu sta lahko v gibanju tako predmet kot opazovalec; računalnik lahko poišče znake, ki označujejo meje, robove in območja posameznih slik. Zaznavanje njihovega napredovanja omogoča računalniku, da sledi predmetu skozi čas in prostor. Tehnologija se uporablja v industriji in raziskavah, vključno z delovanjem brezpilotnih letal (UAV) in varnostnih sistemov.

Dve glavni metodi ustvarjata ta računalniški vid: zaznavanje gibanja na podlagi gradienta in zaznavanje gibanja na podlagi funkcij. Optični tok, ki temelji na gradientu, meri spremembe v intenzivnosti slike skozi prostor in čas. Skenira ravnino polja z gostim tokom. Tokovi, ki temeljijo na funkcijah, prekrivajo robove predmetov znotraj okvirjev, da označijo napredek.

Ta tehnika je podobna stabilizaciji slike kamkorderja, ki omogoča, da se izračunano vidno polje kljub tresanju fotoaparata zaklene v okvir. Algoritmi optičnega toka izračunajo ujemanja med slikami v zaporedju. Računalnik vsako sliko razdeli na kvadratne mreže. Prekrivanje dveh slik omogoča primerjave za iskanje najboljših ujemanja kvadratov. Ko računalnik poišče vžigalico, nariše črto med točkama razlike, ki se včasih imenujejo igle.

Algoritmi delujejo sistematično od grobih do finih ločljivosti. To omogoča sledenje gibanju med slikami z razlikami v ločljivosti. Računalnik ne prepozna objektov, ampak zazna in sledi le tistim značilnostim objektov, ki jih je mogoče primerjati med okvirji.

Računalniški vektorji optičnega toka lahko zaznajo in sledijo predmetom ter izluščijo prevladujočo ravnino slike. To lahko pomaga pri robotski navigaciji in vizualni odometriji ali pri orientaciji in položaju robota. Ne beleži le predmetov, ampak tudi okoliško okolico v treh dimenzijah in daje robotom bolj realistično prostorsko zavest. Vektorji, izračunani v ravnini, omogočajo procesorju sklepanje in odzivanje na premike, izvlečene iz okvirjev.

Nekatere slabosti tehnike optičnega toka vključujejo izgubo podatkov, ki je posledica kvadratov, ki jih računalnik ne more primerjati med slikami. Ta neporavnana območja ostajajo prazna in ustvarjajo ravninske praznine, kar zmanjšuje natančnost. Jasni robovi ali stabilni elementi, kot so vogali, prispevajo k analizi pretoka.
Podrobni dejavniki so lahko prikriti, če je tudi opazovalec v gibanju, saj ne more razlikovati določenih elementov od okvirja do kadra. Analiza deli gibanje na navidezni globalni tok in lokalizirano gibanje predmeta ali egomocijo. Prostorsko-časovne spremembe robov ali intenzivnosti slike se izgubijo v gibanju kamere in globalnem toku premikajočega se okolja. Analiza je izboljšana, če lahko računalnik odpravi učinek globalnega toka.