Obsah:
- Definice - Co znamená extrakční transformační zátěž (ETL)?
- Techopedia vysvětluje extrakční transformační zatížení (ETL)
Definice - Co znamená extrakční transformační zátěž (ETL)?
Extrakční transformační zátěž (ETL) je proces extrakce, transformace a načítání během používání databáze, ale zejména během používání datových úložišť. Zahrnuje následující dílčí procesy:
- Načítání dat z externích datových úložišť nebo zdrojů přenosu
- Transformace dat do srozumitelného formátu, kde se data obvykle ukládají spolu s kódem pro detekci a opravu chyb, aby vyhovovaly provozním potřebám
- Přenos a načítání dat na přijímací konec
Techopedia vysvětluje extrakční transformační zatížení (ETL)
První fáze procesu ETL se zaměřuje na získávání dat ze zdroje úložiště. Většina projektů ukládání dat integruje data přijatá z různých zdrojových systémů. Každý jednotlivý systém může využívat samostatnou organizaci nebo formát dat. Běžné struktury zdroje dat jsou relační databáze a čistě datové soubory. Mohou také zahrnovat nerelační databázové vzorce, jako jsou systémy správy informací nebo jiné datové struktury, jako je metoda přístupu k virtuální paměti (VSAM) nebo metoda indexovaného sekvenčního přístupu (ISAM). Zdroje dat mohou zahrnovat i externí zdroje, jako jsou data přicházející z Internetu nebo ze skenovacího systému.
Transformační fáze používá řadu pravidel nebo operací k získání čistých dat ze zdroje k dodání dat v konečné podobě pro manipulaci na přijímajícím konci. Některé zdroje dat vyžadují velmi malé nebo dokonce žádné zpracování dat. Někdy může být jedna nebo více transformací kritické, aby odpovídaly obchodním a technickým požadavkům cílové databáze.
Fáze načítání nebo přenosu se zaměřuje na odesílání dat na přijímací konec, což je pravděpodobně ukládání dat. Podle potřeb aplikace může být tento proces velmi jednoduchý nebo velmi komplikovaný. Některé metody ukládání dat mohou nahradit stará data kumulativními daty. Aktualizace extrahovaných dat se obvykle provádí pravidelně.
