Kaj je model podatkovnega skladišča?

Model podatkovnega skladišča je uporabna oblika podatkovnega modela računalniškega sistema. V računalniških sistemih se pretok podatkov modelira na podlagi teoretičnih informacij, da se preizkusijo zmožnosti in omejitve sistema. Ko je prišlo do skladiščenja podatkov, so ti isti modeli začeli iskati dejanske fizične aplikacije pri gradnji podatkov. To bi bilo podobno kot oseba, ki preprosto dela matematične probleme, nato pa te enačbe uporabi za izdelavo nove vrste motorja.

Za modelom podatkovnega skladišča je več različnih idej. Vsak od njih ima svoje prednosti in slabosti ter vrste podatkov, za katere je bolj primeren. Ni nenavadno, da v istem sistemu obstaja več različnih modelov podatkovnega skladišča ali hibridni sistemi, ki izkoriščajo prednosti več vrst.

Flat sistem je tip modela podatkovnega skladišča, ki bi ga mnogi uporabniki prepoznali kot najlažjega. Ta način shranjevanja podatkov vključuje med seboj povezane vrstice in stolpce informacij, podobno kot preglednica. Čeprav je ta metoda za ljudi enostavna za branje, je za računalnike težja in počasna za povezovanje.

Hierarhični model podatkovnega skladišča shranjuje informacije v neprekinjenem nizu ravni. Vsaka raven vsebuje informacije, ki so odvisne od generacije zgoraj. To je zelo podobno omrežnemu modelu, ki vsebuje tudi vrsto odvisnih ravni. Razlika je v njihovih odvisnostih – v hierarhičnem sistemu ima lahko vsak blok podatkov samo eno višjo stopnjo odvisnosti, v omrežnem modelu pa jih ima lahko toliko, kolikor jih potrebuje. V obeh primerih se lahko en blok informacij poveže z več spodnjimi bloki.

Model relacijskega podatkovnega skladišča je različica sistema Flat. Podatki so shranjeni v tabelah, podobnih tistim v sistemu Flat, in vsakemu temeljnemu podatku je dodeljen edinstven identifikator. Ta identifikator potuje skupaj s podatki, kar zagotavlja edinstvenost. Na primer, če ima delodajalec dva zaposlena z enakim imenom, bi ju njihov identifikator še vedno ločil v sistemu. Ta identifikator je povezan skozi celoten sistem – če vse deluje pravilno, bi vsakič, ko kar koli, kar je povezano z edinstvenimi informacijami, prišlo v sistem, korelira z že obstoječimi informacijami, ki temeljijo samo na identifikatorju.

Dimenzionalni model temelji na hierarhičnem. Kot izhodišče se uporabi eno samo dejstvo, nato pa iz njega izhajajo dodatne informacije v zvezi s tem dejstvom. Postavka, kot je številka zaposlenega, bi bila začetno dejstvo; potem bi se datumi v zvezi s tem delavcem, pa tudi plača ali čas dopusta, povezali z njim, ko vstopijo v sistem.
Modela relacijskega in dimenzijskega podatkovnega skladišča sta dva najpogostejša sloga. Obstajajo tudi druge vrste podatkovnega skladišča, vendar so v primerjavi s temi manjše. Na splošno so novi modeli zgrajeni iz ravnih, hierarhičnih ali omrežnih sistemov; pogosto so le preproste izboljšave njihovega osnovnega načina organiziranja.