Domov Zvuk Co je open-source analýza velkých dat? - definice z techopedie

Co je open-source analýza velkých dat? - definice z techopedie

Obsah:

Anonim

Definice - Co znamená Open-Source Big Data Analytics?

Open-source analýza velkých dat se týká použití open-source softwaru a nástrojů pro analýzu obrovského množství dat s cílem shromáždit relevantní a použitelné informace, které může organizace použít k dosažení svých obchodních cílů. Největším hráčem v open-source analytice velkých dat je Apache's Hadoop - je to nejpoužívanější softwarová knihovna pro zpracování obrovských datových souborů v klastru počítačů pomocí distribuovaného procesu pro paralelismus.

Techopedia vysvětluje open-source analýzu velkých dat

Open-source analýza velkých dat využívá open-source software a nástroje k provádění analýzy velkých dat pomocí celé softwarové platformy nebo různých open-source nástrojů pro různé úkoly v procesu analýzy dat. Apache Hadoop je nejznámější systém pro analýzu velkých dat, ale před sestavením skutečného analytického systému jsou nutné další komponenty.

Hadoop je open-source implementace algoritmu MapReduce propagovaného společností Google a Yahoo, takže je základem většiny analytických systémů dnes. Mnoho velkých datových analytických nástrojů využívá otevřený zdroj, včetně robustních databázových systémů, jako je open-source MongoDB, sofistikovaná a škálovatelná databáze NoSQL, která je velmi vhodná pro aplikace velkých dat, stejně jako další.

Služby open-source analýzy velkých dat zahrnují:

  • Systém sběru dat
  • Řídicí středisko pro správu a monitorování klastrů
  • Knihovna strojového učení a těžby dat
  • Služba koordinace aplikací
  • Vypočítejte motor
  • Rámec provádění
Co je open-source analýza velkých dat? - definice z techopedie