Katere so različne vrste analize podatkovnega rudarjenja?

Analiza rudarjenja podatkov je lahko koristen proces, ki zagotavlja različne rezultate, odvisno od specifičnega algoritma, uporabljenega za vrednotenje podatkov. Pogoste vrste analize podatkovnega rudarjenja vključujejo raziskovalno analizo podatkov (EDA), opisno modeliranje, napovedno modeliranje ter odkrivanje vzorcev in pravil. Uporaba vsakega od teh orodij za rudarjenje podatkov zagotavlja drugačen pogled na zbrane informacije. Strokovnjaki, ki uporabljajo te tehnike, lahko pridobijo dodaten vpogled v težavo ali težavo, ki je zaskrbljena na podlagi posebnega uporabljenega orodja za analizo.

Zaradi različnih rezultatov, ki jih zagotavljajo orodja za analizo podatkovnega rudarjenja, ko se uporabljajo, je primerno razmisliti o osnovnem pregledu vsakega od njih. Raziskovalna analiza podatkov ali EDA vključuje pregled nabora podatkov brez jasnih ciljev rezultatov za pregled. Spremenljivke, ki definirajo podatke, se uporabljajo kot podlaga za zagotavljanje vizualnih predstavitev raziskovalcu. Ker se število spremenljivk povečuje, lahko to orodje za analizo postane manj učinkovito za vizualizacijo podatkov.

Opisno modeliranje je orodje za analizo podatkovnega rudarjenja, ki se uporablja za skupinski opis vseh podatkov v danem nizu podatkov. Natančneje, ta pristop sintetizira vse podatke, da zagotovi informacije o trendih, segmentih in grozdih, ki so prisotni v iskanih informacijah. Opisna analiza rudarjenja podatkov se običajno uporablja v oglaševanju. En primer tega je segmentacija trga, pri kateri tržniki vzamejo večje skupine strank in jih segmentirajo po homogenih značilnostih.

Druga orodja vključujejo tudi napovedno modeliranje. Prediktivno modeliranje vključuje razvoj modela na podlagi obstoječih podatkov. Model se nato uporabi kot osnova za napovedovanje druge spremenljivke, ki je pomembna za pregledane podatke. Izraz “predvidljivo” označuje, da lahko to orodje za rudarjenje podatkov uporabniku omogoči predvidevanje določene vrednosti na podlagi tega, kar je znano v naboru podatkov. Tržniki lahko uporabijo napovedno analizo, da ugotovijo, katere izdelke kupci iščejo. Na podlagi trenutnih nakupnih trendov lahko tržniki predvidevajo, kateri novi izdelki bodo morda priljubljeni v prihodnosti.

Odkrivanje vzorcev in pravil se razlikuje od orodij za deskriptivno in napovedno rudarjenje podatkov. Medtem ko opisna in napovedna orodja uporabljajo gradnjo modelov kot osnovo za analizo, se odkrivanje vzorcev in pravil osredotoča na identifikacijo vzorcev v podatkih. Tržniki, ki delajo za trgovine z živili, na primer, pogosto uporabljajo to orodje za analizo podatkovnega rudarjenja kot sredstvo za določanje vzorcev nakupov. Z določitvijo, katere izdelke stranke dosledno kupujejo v istem vrstnem redu, je mogoče razviti ciljno usmerjene promocije za izdelke.