Kaj je ETL?

Pomislite na to kot na čiščenje vaših podatkov. ETL pomeni ekstrakcijo, pretvorbo in nalaganje. ETL je programska oprema, ki podjetjem omogoča, da konsolidirajo svoje različne podatke, medtem ko jih premikajo iz kraja v kraj, in v resnici ni pomembno, da so ti podatki v različnih oblikah ali formatih. Podatki lahko prihajajo iz katerega koli vira. ETL je dovolj zmogljiv za obvladovanje takšnih razlik v podatkih.

Finančna institucija ima lahko na primer informacije o stranki v več oddelkih in vsak oddelek ima lahko podatke te stranke navedene na drugačen način. Oddelek za članstvo lahko stranko navede po imenu, računovodski oddelek pa stranko po številki. ETL lahko združi vse te podatke in jih združi v enotno predstavitev, na primer za shranjevanje v bazo podatkov ali podatkovno skladišče.

Drug način, kako podjetja uporabljajo ETL, je trajno premikanje informacij v drugo aplikacijo. Podatke za obdelavo besedil bi lahko na primer prevedli v številke in črke, ki jim je lažje slediti v programu za preglednico ali bazo podatkov. To je še posebej uporabno pri varnostnem kopiranju informacij, ko podjetja v celoti prehajajo na novo programsko opremo.

Ena pomembna funkcija ETL je “čiščenje” podatkov. Protokoli za konsolidacijo ETL vključujejo tudi odpravo podvojenih ali fragmentarnih podatkov, tako da je tisto, kar prehaja iz E dela procesa v del L, lažje asimilirati in/ali shraniti. Takšne operacije čiščenja lahko vključujejo tudi odstranitev nekaterih vrst podatkov iz procesa. Če ne želite vključiti določenih informacij, lahko prilagodite svoj ETL, da odstranite te vrste informacij iz vaše transformacije.

T del enačbe je seveda najmočnejši. ETL lahko pretvori ne samo podatke iz različnih oddelkov, ampak tudi podatke iz različnih virov v celoti. Na primer, podatke v e-poštnem programu, kot je Microsoft Outlook, je mogoče preoblikovati skupaj s podatki iz proizvodne aplikacije SAP, pri čemer so na koncu podatki skupne niti. Microsoft seveda izdeluje paket ETL, tako kot Oracle in IBM.