Kaj je odpravljanje podvajanja podatkov?

Odstranjevanje podvojenosti podatkov je tehnika stiskanja podatkov, pri kateri se podvojeni podatki izbrišejo, pri čemer se v sistemu ohrani ena kopija vsake informacijske enote, namesto da se omogoči uspevanje večkratnikov. Ohranjene kopije imajo reference, ki omogočajo sistemu, da jih pridobi. Ta tehnika zmanjša potrebo po prostoru za shranjevanje in omogoča hitrejše delovanje sistemov, poleg tega pa omeji stroške, povezane s shranjevanjem podatkov. Deluje lahko na več načinov in se uporablja v številnih vrstah računalniških sistemov.

Pri razvajanju podatkov na ravni datoteke sistem poišče vse podvojene datoteke in izbriše dodatke. Odpravljanje podvajanja na ravni blokov pregleda bloke podatkov v datotekah, da prepozna tuje podatke. Ljudje lahko na koncu dobijo podvojene podatke iz najrazličnejših razlogov, uporaba odprave podvajanja podatkov pa lahko poenostavi sistem in ga olajša uporabo. Sistem lahko občasno pregleda podatke, da preveri dvojnike, odstrani dodatke in ustvari reference za datoteke, ki ostanejo.

Takšni sistemi se včasih imenujejo inteligentni kompresijski sistemi ali sistemi za shranjevanje z enim primerkom. Oba izraza se sklicujeta na idejo, da sistem deluje inteligentno za shranjevanje in arhiviranje podatkov, da bi zmanjšali obremenitev sistema. Odpravljanje podvajanja podatkov je lahko še posebej dragoceno pri velikih sistemih, kjer so shranjeni podatki iz številnih virov, stroški shranjevanja pa nenehno naraščajo, saj je treba sistem sčasoma razširiti.

Ti sistemi so zasnovani kot del večjega sistema za stiskanje in upravljanje podatkov. Odstranjevanje podvajanja podatkov ne more zaščititi sistemov pred virusi in napakami, zato je pomembno, da uporabite ustrezno protivirusno zaščito, da ohranite sistem varen in omejite virusno kontaminacijo datotek, hkrati pa varnostno kopirate na ločeni lokaciji za obravnavo skrbi glede izgube podatkov zaradi izpadov, poškodb opremo in tako naprej. Če imate podatke stisnjene pred varnostnim kopiranjem, boste prihranili čas in denar.

Sistemi, ki v svojem shranjevanju uporabljajo odpravljanje podvajanja podatkov, lahko delujejo hitreje in učinkoviteje. Še vedno bodo potrebovali občasno širitev za sprejem novih podatkov in za obravnavo pomislekov glede varnosti, vendar bi morali biti manj nagnjeni k hitremu polnjenju s podvojenimi podatki. To je še posebej pogosta skrb pri e-poštnih strežnikih, kjer lahko strežnik shranjuje velike količine podatkov za uporabnike in znatne kose le-teh bi lahko sestavljali dvojniki, kot so iste priloge, ki se ponavljajo znova in znova; na primer, mnogi ljudje, ki pošiljajo e-pošto iz službe, imajo priložene noge z izjavo o zavrnitvi odgovornosti e-pošte in logotipom podjetij, ki lahko hitro zasedejo prostor na strežniku.