Kaj je rudarjenje podatkovnega toka?

Rudarjenje podatkovnega toka je strategija, ki vključuje prepoznavanje in ekstrakcijo informacij iz aktivnega podatkovnega toka. S tem pristopom je ideja pridobiti podatke, ne da bi ustvarili kakršno koli prekinitev v samem toku, kar omogoča tudi drugim, da uporabljajo podatke, tudi ko poteka ekstrakcija. Ta vrsta rudarjenja podatkovnih tokov lahko vključuje vse vrste podatkov, od prenosa glasu do videa prek interneta in celo do vsakodnevnih opravil, kot je dvig denarja z bančnega računa z uporabo bankomata ali vodenje telefonskega pogovora.

Ena od značilnosti rudarjenja podatkovnih tokov je zmožnost natančnega projiciranja ali napovedovanja, kako najti želene informacije in kakšna orodja za odkrivanje znanja bodo pomagala pri iskanju in uspešnem pridobivanju želenih informacij. Na primer, ko stranka sproži transakcijo z uporabo bankomata, programiranje za avtomat sproži iskanje ustreznih informacij o računu, poišče podatke in nato ugotovi, ali bo znesek transakcije znižal stanje na računu pod dovoljeno vsoto, glede na način strukture računa. Od tam lahko programiranje uporabniku vrne ustrezne podatke, kot je dokumentiranje uspešnega zaključka zahtevane transakcije in zagotovitev stanja na računu, ki ostane po evidentiranju dobroimetja ali bremenitve, povezane s transakcijo.

Drug pogost primer rudarjenja podatkovnega toka je osnovno spletno iskanje z uporabo brskalnika. S to aplikacijo končni uporabnik vnese vrednosti iskanja v polje, programska oprema, ki poganja brskalnik, pa skuša razlagati te vrednosti in vrniti podatke, ki imajo določen pomen za iskalna merila. Odvisno od tega, kako je brskalnik konfiguriran, lahko to vključuje tudi funkcijo, ki želi predvideti namen iskanja, ki se izvaja, in ponudi dodatne besede ali besedne zveze, ki lahko pomagajo izboljšati iskanje bolj po želji uporabnika. Ko se uporabnik odloči za iskalno frazo, brskalnik vrne rezultate po razvrščanju z uporabo algoritmov, ki so pomembni za konfiguracijo samega brskalnika.

Ena od glavnih prednosti rudarjenja podatkovnih tokov je zmožnost dostopa do podatkov in iskanja, ne da bi drugim dejansko prepovedali uporabo teh istih podatkov. Ker se tokovi podatkov nenehno posodabljajo, se lahko rezultati ekstrakcije občasno spremenijo. Na primer, izvajanje spletnega iskanja z uporabo določene iskalne fraze lahko danes prinese en niz rezultatov, jutri pa nekoliko drugačen niz rezultatov, glede na to, katere nove informacije so vnesle v podatkovni tok in kako iskalnik te podatke razvrsti.