»Širjenje podatkov« je krovni izraz, ki se nanaša na veliko število datotek in količino podatkov, ki jih hranijo subjekti, kot so vlade in podjetja. Ogromna količina podatkov, ki prihajajo dnevno, pomeni, da ti subjekti potrebujejo več prostora in strojne opreme, vendar se širjenje podatkov od leta 2011 odvija hitreje kot napredek računalnikov. Ni pomembno, kakšna vrsta informacij je shranjena – ali so strukturirane ali nestrukturirane; pomembno je le, da se računalniški pomnilnik zasede. Shranjevanje vseh teh podatkov je lahko težavno, kar vodi do dodatnih stroškov. Druga težava pri širjenju podatkov je, da se omrežje, v katerem so shranjeni podatki, in vsi povezani programi upočasnjujejo.
Problem širjenja podatkov ne zadeva potrošnikov in povprečnih uporabnikov računalnikov. Medtem ko so povprečni uporabniki računalnikov sčasoma potrebovali več pomnilnika, so lahko računalniki napredovali s hitrostjo, da bi zadovoljili te potrebe. Ko gre za podjetja, vlade in druge subjekte, ki dnevno zbirajo ogromne podatke, se lahko pojavi problem širjenja podatkov.
Če povprečen uporabnik računalnika potrebuje več računalniškega pomnilnika, običajno dobi večji trdi disk. Ko velika entiteta potrebuje več pomnilnika, mora običajno dobiti več strežnikov. Ob običajni hitrosti to ne bi smelo predstavljati težav, vendar številni veliki subjekti v letu 2011 shranjujejo vedno večje količine podatkov s hitrostmi, ki presegajo tehnologijo, in morda bo potrebno ogromno število strežnikov za shranjevanje vsega, kar mora subjekt shraniti. To je zato, ker računalniška tehnologija še ni sposobna narediti naprave, ki bi lahko hranila vse informacije, kar pomeni, da mora velik subjekt še naprej kupovati in uporabljati vedno več strojne opreme.
Nekateri podatki ali težave se nanašajo samo na eno vrsto informacij. Ko gre za širjenje podatkov, pa ni pomembno, za kakšno vrsto podatkov gre. Dokler se računalniški pomnilnik hitro zasede, širjenje podatkov postane problem.
Ena od mnogih težav s širjenjem podatkov so stroški. Poleg stroškov dodatne strojne opreme za shranjevanje obstajajo tudi stroški za fizično shranjevanje in človeške vire. Strežnike je treba nekje postaviti in zaposliti ljudi, ki bodo upravljali strežnike, kar ima za posledico stroške, ki bi teoretično lahko postali preveliki, da bi jih lahko vzdrževal subjekt, in vodili do močno zmanjšanega dobička. Druga težava se nanaša na hitrost omrežja, saj lahko zamašitev podatkov povzroči, da se programi premikajo veliko počasneje, kar pomeni, da lahko zaposleni med delovnim dnevom opravijo manj dela.