Kombinování zdrojů dat v Hadoopu je složitá záležitost. Důvody pro to zahrnují:
- Vlastní skripty specifické pro zdroj, které kombinují zdroje dat, jsou problematické.
- Použití nástrojů pro integraci dat nebo nástrojů pro vědu o údajích přináší přílišnou nejistotu.
- Přidání dat z externích zdrojů je téměř nemožné.
Dnes se chystám diskutovat o tom, jak je analytika Hadoop vylepšena pomocí zdrojově agnostických technologií, které usnadňují kombinování interních a externích zdrojů dat. Kromě popisu toho, jak fungují analytické metody založené na zdrojích, se budu také zabývat tím, proč analytici Hadoop potřebují vestavěné schopnosti přenosu inteligence a znalostí, porozumění vztahům a datovým charakteristikám a škálovatelnou a vysoce výkonnou architekturu.
Webinář: Matice významů: Spojování teček uvnitř Hadoopu - Zaregistrujte se zde |