Podatkovno rudarjenje za upravljanje odnosov s strankami (CRM) se nanaša na proces iskanja po zbirkah podatkov o odnosih s strankami in analiziranje zbranih podatkov o vedenju strank. Ti podatki pomagajo tržnikom, da bolje osredotočijo svoje kampanje, kar vodi do povečanega zadrževanja strank in prodaje. Podatkovno rudarjenje CRM je znano tudi kot raziskovanje podatkov in odkrivanje znanja. Z rudarjenjem podatkov sta povezani dve glavni kategoriji: deskriptivna analiza in napovedno modeliranje.
Deskriptivna analiza uporablja segmentacijo in združevanje v skupine za boljšo analizo določenega vzorca vedenja med določeno skupino strank. Stranke je mogoče razvrstiti v skupine glede na spol, starost, raso in druge kategorije. Glavni cilj segmenta je tržniku zagotoviti skupino podobnih strank, da bi učinkoviteje pridobil podatke za koristne vpoglede.
Združevanje agregatov segmentnih skupin. Vsaka skupina se med seboj izključuje in je značilna po nizu vnaprej določenih značilnosti. Grozd bi lahko na primer vključeval ženske, stare od 18 do 25 let, ki so kupile določen lak za nohte v zadnjih dveh tednih decembra 2010. To je primer kvalitativne metode CRM podatkovnega rudarjenja.
V ne-izključujočih segmentih, drugi obliki deskriptivne analize, določen nabor vedenja strank vodi do popolnoma novega nabora vedenj. Skupina strank bi lahko na primer porabila veliko denarja za storitve zdravilišča, ne pa veliko denarja za sorodne storitve, kot sta frizerska in salonska nega. Ta vrsta rudarjenja podatkov CRM zahteva naprednejšo statistično analizo kot osnovno segmentacijo.
Predvidljivo modeliranje je bolj priljubljeno od dveh kategorij rudarjenja podatkov CRM. Meri stopnjo korelacije med dvema dejavnikoma vedenja strank in statistično zanesljivost te korelacije. Napovedni model je zgrajen z uporabo aplikacije za rudarjenje podatkov, ki vsaki stranki dodeli ocene, kar kaže na verjetnost, da se bo stranka v prihodnosti obnašala na enak način. Model lahko na primer tržniku pomaga določiti verjetnost, da bo poročen moški kupec med 31. in 42. letom z otroki v naslednjih šestih mesecih kupil določeno znamko kosilnice.
Specifičnost je zelo pomembna pri rudarjenju podatkov CRM z uporabo napovednih modelov. V ta namen se uporablja več vrst metod. Enovariantni model primerja eno spremenljivko z več drugimi spremenljivkami, da bi ugotovil razmerje z najvišjo korelacijo. Modeli avtomatske analize zaznavanja interakcij hi-kvadrat (CHAID) ter drevesa klasifikacije in regresije (CART) prikazujejo drevesa odločitev, kjer ena spremenljivka povzroči primer ene ali več spremenljivk. Multivariatni regresijski model testira več spremenljivk med seboj, da oceni možne korelacije.