Integracija podatkov je združitev več virov podatkov v en sam vir podatkov. Ta praksa je pogosto zelo zamudna in zapletena, saj so različni viri podatkov med seboj verjetno nezdružljivi. Tako preproste stvari, kot so različna imena stolpcev v preglednici, so dovolj, da je potrebno preoblikovati datum. Ta proces je najpogostejši v situacijah, ko sta dve skupini začeli brez povezave, a sta združeni, potem ko sta delali samostojno. Integracija podatkov je postala pomembnejša tema zaradi razširjenosti brezplačnih virov podatkov in spletnih baz podatkov.
Podatkovni del integracije podatkov je lahko skoraj karkoli, če je shranjen v računalniškem sistemu. Dejanska vsebina podatkov je redkokdaj tako pomembna kot način, na katerega so podatki shranjeni. Večino časa se podatki hranijo v bazah podatkov, organiziranih informacijskih sistemih. Ti sistemi vsebujejo edinstvene vnose in polja, ki uporabnikom omogočajo hitro iskanje informacij.
Največja ovira pri vsakem procesu integracije podatkov so podatki sami. V mnogih primerih, ko so bili podatki prvič nastavljeni, ni bilo namena kdaj združiti nabora podatkov z drugim. To pomeni, da čeprav se lahko dva nabora podatkov nanašata na isto stvar, sta popolnoma nezdružljiva.
Skoraj vse bo naredilo baze podatkov nezdružljive. Nekaj tako preprostega, kot je razlika v predstavitvi, kot je vrstni red polj ali širina stolpca, je lahko dovolj, da prepreči enostavno združitev. Kadar se podatki bistveno razlikujejo, na primer ena baza podatkov, ki vsebuje več ali manj informacij, je združevanje veliko težje.
Dve situaciji, ki bolj kot katera koli druga zahtevata integracijo podatkov, sta na poslovnem in raziskovalnem področju. V poslovnem svetu združevanje oddelkov ali podjetij zahteva združevanje predhodno ločenih informacij v eno samo strukturo. Ta oblika integracije je na splošno zelo težka, razen če so prvotne skupine uporabljale podobno programsko opremo in so imele podobne informacijske cilje.
Ko se integracija podatkov izvaja za raziskovalne namene, gre na splošno veliko bolj gladko. Ko en raziskovalec omogoči dostop do svojih informacij drugemu, obe strani na splošno preučujeta isti proces. To pomeni, da bodo uporabljali podobne metode za katalogiziranje in shranjevanje svojih podatkov.
V preteklosti je bila integracija podatkov sorazmerno manjše področje študij podatkov, vendar se je to spremenilo od začetka 21. stoletja. Ker so brezplačne spletne baze podatkov vse bolj priljubljene in natančne, se podjetja trudijo pridobiti svoje podatke v obliki, ki jo je mogoče deliti. To jim omogoča, da svoje podatke objavijo v javni obliki in da v svoje sisteme vključijo zasebne različice dobro znanih javnih vmesnikov.