Kaj je integriteta baze podatkov?

Celovitost baze podatkov je praksa zagotavljanja, da so podatki, shranjeni v bazi podatkov, točni, dosledni in brez napak. Najmanjša črkovalna napaka ali ponavljanje informacij lahko povzroči velike težave za bazo podatkov, zato se celovitost baze podatkov jemlje resno. Trije zagovorniki integritete so integriteta entitete, integriteta domene in referenčna integriteta. Skupaj s temi tremi se za nadaljnje zagotavljanje celovitosti uporabljata normalizacija in preverjanje napak. Večina teh procesov je avtomatiziranih, vendar skrbniki pogosto preverjajo tudi ročno, da zagotovijo, da v bazi podatkov ne pride do napak.

Ko želi skrbnik dodati, spremeniti ali izbrisati podatke iz baze podatkov, mora najprej preveriti celovitost baze podatkov. Vključitev ali sprememba kakršnih koli informacij je lahko katastrofalna, ker imajo lahko podatki daljnosežne učinke na druge tabele in odseke baze podatkov. Da bi zmanjšali možnost tega in ohranili točnost informacij, ki so že v bazi podatkov, se celovitost vedno preveri, preden se lahko izvedejo kakršne koli spremembe.

Celovitost entitete je prva omejitev za celovitost baze podatkov. To preveri tabelo, s katero želi skrbnik delati, in pogleda imena vrstic. Če imajo vrstice v isti tabeli isto ime, to ustvari odvečne informacije, kar je za bazo podatkov zmedeno.

Sledi integriteta domene. S tem se preveri vrsta podatkov, ki so dosledno dodani v tabelo ali razdelek, in zagotovi, da so novi podatki skladni s tem tipom podatkov. Na primer, če je tabela določena tako, da vsebuje samo datume in nekdo poskuša vnesti besedo, bo postopek celovitosti domene opozoril skrbnika na napako doslednosti. To je zato, ker je tabela namenjena samo obdelavi datumov, zato bo beseda pokvarila redno obdelavo in lahko v prihodnosti povzroči napake.

Tretja omejitev celovitosti baze podatkov je referenčna celovitost. Tabele v bazi podatkov so redko same – druge tabele se pogosto sklicujejo nanje in se sklicujejo na druge tabele. Če skrbnik ukaže eni tabeli, naj se sklicuje na drugo, vendar je druga tabela napačno črkovana ali ne obstaja, to povzroči napake pri obdelavi. Preverjanje celovitosti referenc, da se zagotovi, da so vse reference veljavne.

Poleg teh treh vprašanj integritete se za resnično integriteto baze podatkov uporabljajo tudi pravila normalizacije in preverjanja napak. Normalizacija išče odvečne informacije in nepotrebno dolge tabele, odpravlja odvečnost in pretvori dolge tabele v več kratkih tabel. Preverjanje napak analizira zbirko podatkov za morebitne druge morebitne napake in zagotovi, da so vsi podatki veljavni.