Obsah:
- Definice - Co znamená Open-Source Big Data Analytics?
- Techopedia vysvětluje open-source analýzu velkých dat
Definice - Co znamená Open-Source Big Data Analytics?
Open-source analýza velkých dat se týká použití open-source softwaru a nástrojů pro analýzu obrovského množství dat s cílem shromáždit relevantní a použitelné informace, které může organizace použít k dosažení svých obchodních cílů. Největším hráčem v open-source analytice velkých dat je Apache's Hadoop - je to nejpoužívanější softwarová knihovna pro zpracování obrovských datových souborů v klastru počítačů pomocí distribuovaného procesu pro paralelismus.
Techopedia vysvětluje open-source analýzu velkých dat
Open-source analýza velkých dat využívá open-source software a nástroje k provádění analýzy velkých dat pomocí celé softwarové platformy nebo různých open-source nástrojů pro různé úkoly v procesu analýzy dat. Apache Hadoop je nejznámější systém pro analýzu velkých dat, ale před sestavením skutečného analytického systému jsou nutné další komponenty.
Hadoop je open-source implementace algoritmu MapReduce propagovaného společností Google a Yahoo, takže je základem většiny analytických systémů dnes. Mnoho velkých datových analytických nástrojů využívá otevřený zdroj, včetně robustních databázových systémů, jako je open-source MongoDB, sofistikovaná a škálovatelná databáze NoSQL, která je velmi vhodná pro aplikace velkých dat, stejně jako další.
Služby open-source analýzy velkých dat zahrnují:
- Systém sběru dat
- Řídicí středisko pro správu a monitorování klastrů
- Knihovna strojového učení a těžby dat
- Služba koordinace aplikací
- Vypočítejte motor
- Rámec provádění