Umazani podatki so izraz, ki se uporablja za opis katere koli vrste elektronskih podatkov, ki so zastareli, nepopolni ali kako drugače netočni. Podatki te vrste lahko nastanejo zaradi napak pri vnosu podatkov, nerednega posodabljanja podatkov ali celo večkratnega vnosa istih podatkov. Včasih napačni podatki niso nič drugega kot napake v ločilih v besedilu elektronskih dokumentov. V drugih primerih so lahko umazani podatki informacije, ki so namerno zavajajoče, kot so poskusi spreminjanja računovodskih evidenc, da bi vlagateljem in drugim predstavili posebno podobo.
Večinoma je kopičenje umazanih podatkov v kateri koli vrsti podatkovne baze nenamerno. Posamezniki, ki vnašajo nove informacije v zbirko podatkov, lahko napačno črkovajo besede, izpustijo ločila, ki so pomembna za razumevanje namena besedila, ali ne upoštevajo posebne strategije oblikovanja. V takšnih situacijah je popravljanje napačnih informacij razmeroma preprost postopek, ki ne zahteva nič drugega kot spreminjanje napačnega besedila in shranjevanje sprememb. Podjetja včasih upravljajo ta postopek tako, da po vnosu lektorirajo podatke in izvedejo potrebne posodobitve.
Umazani podatki se lahko pojavijo tudi zaradi neuspeha pri posodobitvi obstoječih zapisov, ko se informacije spremenijo. Na primer, če prodajalci ne posodobijo datotek strank, ko pride do kadrovskih sprememb pri določeni stranki, te datoteke niso več točne in se štejejo za umazane. Tako kot pri popravljanju pravopisnih in ločilnih napak, vzeti čas za odstranitev zastarelih informacij in njihovo zamenjavo s trenutnimi podatki pomaga povečati splošno uporabnost baze podatkov.
Obstajajo situacije, ko je ustvarjanje umazanih podatkov namerno. Podjetja se lahko odločijo, da iz baze podatkov izpustijo določene podatke, da ustvarijo posebno zaznavo glede financ, na primer izpostavijo znesek ustvarjenih prihodkov za dano obdobje, vendar se odločijo, da ne bodo vnesli podatkov, ki se nanašajo na znesek zbranih prihodkov za isto obdobje. obdobje. Pri tej vrsti umazanih podatkov so predstavljene informacije točne, kolikor segajo, vendar se štejejo za nepopolne.
Pri nekaterih vrstah umazanih podatkov je morda odločitev, da si ne boste vzeli časa in truda za popravke. To je običajno, če napačni podatki nimajo nobenega vpliva na sposobnost podjetja za pravilno delovanje ali ne predstavljajo možnosti za povzročanje velike stiske. To pomeni, da ima skoraj vsak subjekt, ki vzdržuje neko vrsto baze podatkov, verjetno vsaj malo umazanih podatkov, ki so prepleteni z drugimi informacijami, ki so aktualne in točne.