Kakšna je razlika med Data Mining in Data Warehousing?

Tako poslovno kot tehnično osebje pogosto zamenjujeta izraza podatkovno rudarjenje in podatkovno skladišče. Celotno področje upravljanja s podatki je doživelo fenomenalen rast z implementacijo programov za zbiranje podatkov in znižanjem stroškov računalniškega pomnilnika. Glavni namen obeh funkcij je zagotoviti orodja in metodologije za raziskovanje vzorcev in pomena velike količine podatkov.

Primarne razlike med rudarjenjem podatkov in skladiščenjem podatkov so zasnova sistema, uporabljena metodologija in namen. Podatkovno rudarjenje je uporaba logike prepoznavanja vzorcev za identifikacijo trendov v vzorčnem naboru podatkov in ekstrapolacijo teh informacij glede na večji bazen podatkov. Skladiščenje podatkov je proces pridobivanja in shranjevanja podatkov za lažje poročanje.

Podatkovno rudarjenje je splošen izraz, ki se uporablja za opis vrste poslovnih procesov, ki izhajajo iz podatkov. Običajno se programski paket za statistično analizo uporablja za identifikacijo posebnih vzorcev na podlagi nabora podatkov in poizvedb, ki jih ustvari končni uporabnik. Tipična uporaba podatkovnega rudarjenja je ustvarjanje ciljno usmerjenih marketinških programov, prepoznavanje finančnih goljufij in označevanje nenavadnih vzorcev vedenja kot del varnostnega pregleda.

Odličen primer podatkovnega rudarjenja je postopek, ki ga telefonska podjetja uporabljajo za trženje izdelkov obstoječim strankam. Telefonsko podjetje uporablja programsko opremo za rudarjenje podatkov za dostop do svoje baze podatkov o strankah. Poizvedba je napisana za identifikacijo strank, ki so se v določenem časovnem obdobju naročile na osnovni telefonski paket in internetno storitev. Ko je ta nabor podatkov izbran, se napiše druga poizvedba, da se ugotovi, koliko od teh strank je izkoristilo brezplačne dodatne funkcije telefona med poskusno promocijo. Rezultati te vaje rudarjenja podatkov razkrivajo vzorce vedenja, ki lahko spodbudijo ali pomagajo izboljšati marketinški načrt za povečanje uporabe dodatnih telefonskih storitev.

Pomembno je omeniti, da je primarni namen rudarjenja podatkov odkriti vzorce v podatkih. Specifikacije, uporabljene za opredelitev nabora vzorcev, imajo velik vpliv na ustreznost rezultata in natančnost analize. Če se vrnemo k zgornjemu primeru, če je nabor podatkov omejen na stranke na določenem geografskem območju, se bodo rezultati in vzorci razlikovali od širšega nabora podatkov. Čeprav tako rudarjenje podatkov kot tudi shranjevanje podatkov delujeta z velikimi količinami informacij, so uporabljeni procesi precej različni.
Podatkovno skladišče je programski izdelek, ki se uporablja za shranjevanje velikih količin podatkov in izvajanje posebej oblikovanih poizvedb in poročil. Poslovna inteligenca je rastoče področje študija, ki se osredotoča na shranjevanje podatkov in s tem povezane funkcionalnosti. Ta orodja so zasnovana tako, da ekstrahirajo podatke in jih shranijo na način, ki je zasnovan za izboljšano delovanje sistema. Večina terminologije pri rudarjenju podatkov in skladiščenju podatkov je enaka, kar vodi v večjo zmedo.