Obsah:
Definice - Co znamená Data Wrangling?
Data wrangling je specifický typ správy dat, který vychází z nových softwarových možností a přináší velké, chaotické a rozmanité datové soubory, které je třeba přejít do architektury orientované na služby (SOA) za účelem analýzy a použití. Wrangling dat obecně zahrnuje mnoho různých sofistikovaných technik pro zpracování nepravidelných nebo různorodých dat a manipulaci s nimi pro obchodní použití.
Techopedia vysvětluje Data Wrangling
Může to znít jako neformální termín, ale wrangling dat ve skutečnosti zabírá určitý prostor ve správě dat. Jedním z užitečných způsobů, jak porozumět wranglingu dat, je porovnat je s často formálnější metodikou extrakce, transformace a načítání (ETL). Wrangling dat má různé aspekty a případy použití než ETL. Často je prováděno zkušenými vědci v oblasti dat nebo jinými blízkými ropovody. V některých ohledech by mohlo být nazírání dat nazýváno typem „open source“ ETL v tom, že ti inženýři zabývající se údaji mohou být více „praktičtí“ nebo použít více manuálních metod extrakce.
Pro ty, kteří skutečně rozumí rafinovaným procesům, kterými se různá data utracují, třídí a vkládají do podnikových architektur, je wrangling dat ve skutečnosti velmi důležité téma. Odborníci v oblasti IT se zaměřují na širokou škálu nástrojů, zdrojů a technik, které přinášejí hodnotu z chaotických, nezpracovaných nebo nestrukturovaných dat.
