Domov Zvuk Co je hadoopový ekosystém? - definice z techopedie

Co je hadoopový ekosystém? - definice z techopedie

Obsah:

Anonim

Definice - Co znamená ekosystém Hadoop?

Ekosystém Hadoop odkazuje na různé součásti softwarové knihovny Hacheop Apache, jakož i na příslušenství a nástroje poskytované Apache Software Foundation pro tyto typy softwarových projektů a na způsoby, jak spolupracují.

Hadoop je Java-based framework, který je velmi populární pro zpracování a analýzu velkých souborů dat.

Techopedia vysvětluje Hadoop Ecosystem

Jak základní balíček Hadoop, tak jeho příslušenství, jsou většinou projekty s otevřeným zdrojovým kódem licencované společností Apache. Myšlenka ekosystému Hadoop zahrnuje použití různých částí základní sady Hadoop, jako je MapReduce, rámec pro zpracování obrovského množství dat, a sofistikovaný systém zpracování souborů Hadoop Distributed File System (HDFS). Existuje také YARN, správce prostředků Hadoop.

Kromě těchto základních prvků společnosti Hadoop dodala společnost Apache také vývojářům další druhy doplňků nebo doplňkových nástrojů. Patří mezi ně Apache Hive, nástroj pro analýzu dat; Apache Spark, obecný motor pro zpracování velkých dat; Apache Pig, jazyk toku dat; HBase, databázový nástroj; a také Ambarl, který lze považovat za manažera ekosystému Hadoop, protože pomáhá společně spravovat používání těchto různých zdrojů Apache. Díky tomu, že se Hadoop stal de facto standardem pro sběr dat a stal se všudypřítomným v mnoha organizacích, se manažeři a vývojoví vedoucí učí vše o ekosystému Hadoop a o tom, jaké věci se podílejí na obecném nastavení Hadoopu.

Co je hadoopový ekosystém? - definice z techopedie