Kaj je arhitektura podatkovnega skladišča?

Arhitektura podatkovnega skladišča je zasnova, ki zajema vse vidike podatkovnega skladišča za poslovno okolje. Skladiščenje podatkov je ustvarjanje osrednje domene za shranjevanje kompleksnih, decentraliziranih podatkov podjetja v logično enoto, ki omogoča rudarjenje podatkov, poslovno inteligenco in splošen dostop do vseh pomembnih podatkov znotraj organizacije. Arhitektura podatkovnega skladišča vključuje vse zahteve za poročanje, upravljanje podatkov, varnostne zahteve, zahteve po pasovni širini in zahteve za shranjevanje.

Pri ustvarjanju arhitekture podatkovnega skladišča je pomembno, da arhitekturo razdelimo na specifične domene, ki se združujejo v celostno končno zasnovo. To zasnovo je treba šteti za načrt za arhitekturo podatkov podjetja. Zlasti je treba razviti več primarnih področij, ko razmišljamo o arhitekturi podatkovnega skladišča. Ta področja so dostop do izvornega sistema, proces uprizoritvenega območja, proces obogatitve podatkov, arhitektura podatkov, proces poslovne inteligence in zahteve za shranjevanje.

Shranjevanje podatkov zahteva, da se izvorni podatki prenesejo iz transakcijske evidence ali baze podatkov v podatkovno skladišče. Ta postopek je poenostavljen v izraz Extract Transform and Load (ETL), ki v bistvu zajema področja dostopa do izvornega sistema, obogatitve podatkov in podatkovne arhitekture. Zaradi jasnosti je bolje, da ta arhitekturna območja podrobno zasnujemo, kar opisuje, kako bo dosežen proces ETL. Medtem ko so nekateri podatki potrebni iz izvornih sistemov, vsi podatki niso zaželeni, saj bi preobremenili skladišče podjetja. Pri obravnavi nivoja izvornega sistema so glavna področja, ki vas skrbijo, metodologije dostopa do podatkov, zahtevani podatki iz izvornega sistema in zahteve za osvežitev.

Naslednja arhitekturna plast skladiščenja podatkov, ki jo je treba upoštevati, je proces uprizoritvenega območja. Ker bo večina podatkov iz izvornih sistemov zahtevala potrditev in čiščenje podatkov, je pomembno, da ustvarite pristajalno območje za izvorne podatke, preden se naložijo v plast poslovnih pravil skladišča podatkov. Uprizoritveno območje ohranja vire neobdelanih podatkov iz izvornih sistemov, ki so običajno časovno označeni, da se zagotovi nedavnost podatkov.

Proces obogatitve podatkov ali poslovnih pravil je tam, kjer se podatki očistijo, da bi dosegli želeni rezultat podatkovnega skladišča. Dober primer tega pristopa čiščenja je uporaba orodij za čiščenje naslovov; v primeru, da ima izvorni sistem napačne podatke, bo postopek obogatitve podatkov zagnal naslov iz nabora neobdelanih podatkov v sistem poslovnih pravil, ki bi popravil neveljavne naslove. To je tudi čas, ko se netočni podatki izbrišejo ali spremenijo, da se zagotovi popolnost v podatkovnem skladišču.
Naslednja plast, ki jo je treba upoštevati, je sloj podatkovne arhitekture. Na tem področju je dokončana prava zasnova ali shema podatkovnega skladišča podjetja. Podatkovno skladišče ni kombinacija vseh podatkovnih nizov v podjetju, temveč je na novo definirana baza podatkov, ki omogoča pregled nad vsemi poslovnimi subjekti v podjetju.
To zahteva, da podatkovna arhitektura odgovori na vprašanja, ki si jih bo zastavilo podjetje na področju poslovnega obveščanja in rudarjenja podatkov. Z ustvarjanjem podatkovne arhitekture na ta način se bodo neobdelani nabori podatkov pretvorili v tabele dejstev, ki bodo uporabnikom omogočile izvajanje ad hoc poročanja o celotnem pogledu podjetja in ne o določeni zbirki podatkov. To je tudi področje, ki bo vzdrževalo metapodatke o podatkih iz neobdelanega sistema, ki lahko vključujejo ime izvornega sistema ali primarne ključe.
Naslednje področje, ki ga je treba upoštevati, so zahteve glede poslovnega obveščanja in poročanja. To plast je mogoče obravnavati kot zahtevo, ki se obrne na uporabnika za shranjevanje podatkov. Običajno to področje vsebuje pripravljena poročila, možnost ad-hoc poročanja in nadzorne plošče ali opozorila podjetja. Plasti poslovne inteligence običajno dobijo največ pozornosti, saj je to edina komponenta v podatkovnem skladišču, ki je obrnjena navzven.
Zadnja plast, ki jo je treba upoštevati, so splošne zahteve za shranjevanje in vzdrževanje podatkov. Ker podatkovno skladišče še naprej raste in se širi, je treba shranjevanje podatkov baze uporabnikov strogo upravljati in vzdrževati. Poleg tega mora načrt med ustvarjanjem arhitekture podatkovnega skladišča narediti realne ocene glede tega, kaj bo potrebno za zmogljivost shranjevanja podatkov, pa tudi za pas z zmogljivostjo dostopa do podatkov. Te zahteve bodo kritične, saj bo podatkovno skladišče postalo široko uporabljeno v celotnem podjetju.