Podatkovno rudarjenje se na splošno nanaša na metodo, ki se uporablja za analizo podatkov iz ciljnega vira in sestavljanje teh povratnih informacij v koristne informacije. Te informacije se običajno uporabljajo za pomoč organizaciji pri znižanju stroškov na določenem področju, povečanju prihodka ali obojem. Njen primarni cilj je pogosto olajšana aplikacija za rudarjenje podatkov, da prepozna in izvleče vzorce, ki jih vsebuje dani nabor podatkov.
Najpomembneje je, da je cilj tehnik rudarjenja podatkov zagotoviti vpogled, ki omogoča boljše razumevanje podatkov in njihovih bistvenih značilnosti. Podjetja in organizacije lahko uporabljajo veliko različnih metod rudarjenja podatkov. Čeprav imajo lahko podoben pristop, si vsi običajno prizadevajo doseči različne cilje.
Namen prediktivnih tehnik rudarjenja podatkov je skoraj vedno identificirati statistične modele ali vzorce, ki jih je mogoče uporabiti za napovedovanje zanimanja. Na primer, finančna institucija ga lahko uporabi za ugotavljanje, pri katerih transakcijah je največja verjetnost goljufije. To je najpogostejša metoda rudarjenja podatkov in je postala učinkovito orodje za odločanje za srednja in velika podjetja. Izkazalo se je tudi za učinkovito pri napovedovanju vedenja strank, kategorizaciji segmentov strank in napovedovanju različnih dogodkov.
Povzetki modeli se zanašajo na tehnike rudarjenja podatkov, ki se ustrezno odzivajo na povzete podatke. Na primer, organizacija lahko razdeli letalske potnike ali transakcije s kreditnimi karticami v različne skupine na podlagi njihovih značilnosti, pridobljenih iz analitičnega procesa. Ta model lahko pomaga tudi podjetjem, da pridobijo globlje razumevanje svoje baze strank.
Modeli povezovanja upoštevajo, da se lahko določeni dogodki redno pojavljajo skupaj. To je lahko hkratni nakup predmetov, kot sta miška in tipkovnica, ali zaporedje dogodkov, ki so privedli do okvare določene strojne naprave. Asociacijski modeli predstavljajo tehnike rudarjenja podatkov, ki se uporabljajo za identifikacijo in karakterizacijo teh povezanih pojavov.
Omrežni modeli uporabljajo podatkovno rudarjenje za razkrivanje podatkovnih struktur, ki so v obliki vozlišč in povezav. Na primer, organiziran obroč goljufij lahko sestavi seznam ukradenih številk kreditnih kartic, nato pa se obrne in jih uporabi za nakup predmetov na spletu. Na tej ilustraciji kreditne kartice in spletni trgovci predstavljajo vozlišča, medtem ko dejanske transakcije delujejo kot povezave.
Podatkovno rudarjenje ima številne namene in se lahko uporablja tako za pozitivne kot zlonamerne koristi. Vse več organizacij prihaja, da odkrijejo prednosti združevanja tehnik rudarjenja podatkov za oblikovanje hibridnih modelov. Te močne kombinacije pogosto povzročijo aplikacije z vrhunsko zmogljivostjo. Z integracijo ključnih značilnosti različnih metod v enotne hibridne rešitve lahko organizacije običajno premagajo omejitve posameznih strateških sistemov.