Odprtokodno podatkovno rudarjenje se lahko nanaša na nekaj različnih stvari, čeprav običajno označuje bodisi uporabo odprtokodne programske opreme pri rudarjenju podatkov bodisi uporabo podatkovnega rudarjenja za boljše razumevanje odprtokodnih programov. Uporaba odprtokodne programske opreme za rudarjenje podatkov ni nič nenavadnega, saj obstaja vrsta zmogljivih in zanesljivih odprtokodnih programov, ki jih je mogoče uporabiti za ekstrakcijo in organiziranje informacij iz velikih količin neobdelanih podatkov. Odprtokodno rudarjenje podatkov lahko vključuje tudi uporabo programske opreme za rudarjenje podatkov v odprtokodnih programih, da bi bolje razumeli kodo, ki se uporablja za izdelavo teh programov.
Izraz »odprta koda« v odprtokodnem rudarjenju podatkov se nanaša na programsko opremo, ki je razvita in izdana pod neko obliko splošne uporabe ali javne licence. Te licence se lahko razlikujejo glede na način razvoja programske opreme in želje razvijalcev. Na splošno pa takšne licence drugim omogočajo uporabo, spreminjanje in distribucijo programske opreme, izdane pod licenco, na kakršen koli način, ki se jim zdi primeren.
Odprtokodno rudarjenje podatkov zato lahko vključuje uporabo odprtokodne programske opreme pri doseganju različnih ciljev in praks rudarjenja podatkov. Podatkovno rudarjenje se lahko nanaša na številne različne metode, na splošno pa se nanaša na uporabo programske opreme za “presejanje” velikih količin podatkov za ustrezne ali uporabne informacije. Podjetje lahko uporabi metode rudarjenja podatkov o podatkih, ki jih podjetje ustvari v zvezi s podatki o prodaji v določenem časovnem obdobju, da te neobdelane podatke izpopolni v informacije, ki so bolj uporabne in lažje razumljive.
Uporaba odprtokodne programske opreme za rudarjenje podatkov je dokaj pogosta zaradi številnih odprtokodnih programov, ki so precej učinkoviti za rudarjenje podatkov. Vendar je treba te programe uporabljati odgovorno, saj lahko na nekaterih področjih obstajajo zakoni, ki urejajo način pridobivanja in uporabe podatkov. Eno podjetje bi lahko uporabljalo odprtokodne programe za rudarjenje podatkov za pridobivanje informacij iz podatkov, ki pripadajo drugemu podjetju. To lahko krši pravice lastništva podatkov in poslovne skrivnosti, ki so na mnogih področjih pravno zaščitene.
Odprtokodno podatkovno rudarjenje se lahko nanaša tudi na uporabo programske opreme za rudarjenje podatkov za pridobivanje informacij o drugem programu. Metode rudarjenja podatkov se lahko uporabljajo za iskanje izvorne kode in drugih informacij o programu, kar lahko povzroči pravne kršitve, če se izvaja na komercialni programski opremi. Ker so odprtokodni programi običajno ustvarjeni pod splošno javno licenco, je podatkovno rudarjenje na takšni programski opremi mogoče zakonito. Tako pridobljene podatke in informacije lahko nato programerji uporabijo za učenje pri razvoju odprtokodne programske opreme in reševanje težav z drugimi programi.