Kaj je model podatkovnega rudarjenja?

Podatkovno rudarjenje opisuje proces pridobivanja podatkov iz velikih naborov informacij in njihove predstavitve na edinstven način. Ta proces pogosto najdemo v študijah poslovne inteligence, v katerih strokovnjaki izkopljejo velike nabore podatkov o trgu ali poslovanju podjetja in poskušajo odkriti prej neprepoznana razmerja in trende. Model podatkovnega rudarjenja se nanaša na tehnike, ki jih strokovnjaki uporabljajo za združevanje in predstavitev informacij, pa tudi na načine, na katere lahko informacije uporabijo za določena vprašanja in težave.

Mnogi strokovnjaki menijo, da je regresija podatkovnega rudarjenja najbolj osnovni in pogosto uporabljen model podatkovnega rudarjenja. V tem procesu strokovnjak analizira niz podatkov in ustvari formulo, ki jih opisuje. Mnogi finančni analitiki uporabljajo to tehniko za napovedovanje cen in tržnih trendov. Ta model najbolje deluje v scenarijih, v katerih se pričakuje, da bodo podatki ostali dosledni.

Drug priljubljen model podatkovnega rudarjenja temelji na povezovanju. Strokovnjak lahko analizira nize podatkov, da ugotovi, katere komponente se pogosto pojavljajo skupaj. Ko sta dve komponenti vedno znova seznanjeni, lahko raziskovalec domneva, da med njima obstaja neka povezava. Na primer, raziskovalec, ki uporablja podatkovno rudarjenje, da se seznani z uspešnostjo maloprodajne trgovine, lahko ugotovi, da potrošniki pogosto kupujejo pisala in svinčnike hkrati z nakupom papirja. Upravitelj lahko uporabi informacije, pridobljene iz modela rudarjenja podatkov, za povečanje prodaje s prikazovanjem vseh povezanih elementov v enem prostoru.

Faktorska analiza je še en pogost model rudarjenja podatkov. V tem procesu raziskovalec zbere številne različne spremenljivke in poskuša locirati dejavnike, ki določajo nihanja vrednosti. Tržni raziskovalec se lahko na primer iz baze strank nauči, kako ocenjuje lastnosti podobnih izdelkov. Raziskovalec lahko nato organizira te informacije, da ponazori dejavnike, ki določajo potrošnikovo vrednotenje lastnosti. Medtem ko zagovorniki tega modela verjamejo, da lahko poudari skupnost med navidez različnimi spremenljivkami, nekateri kritiki menijo, da lahko ta model nekatere tolmače pripelje do tega, da domnevajo vzročnost določenih pojavov, ko morda niso na voljo vse informacije, potrebne za ugotavljanje vzročne zveze.

Raziskovalci lahko za preprostejše probleme uporabijo model rudarjenja podatkov, ki temelji na kategorizaciji. S to tehniko strokovnjaki organizirajo podatke po svojih klasifikacijah in jih nagibajo k temu, da jih organizirajo v vizualni obliki, na primer v drevesu ali grafikonu. Tovrsten model je še posebej koristen v scenarijih, v katerih mora posameznik izbirati med več možnostmi v vsaki kategoriji. Oblikovalcu se lahko zdi ta model uporaben, če lahko v vsakem koraku procesa izbira med več materiali.