Domov Zvuk Co je to apache kudu? - definice z techopedie

Co je to apache kudu? - definice z techopedie

Obsah:

Anonim

Definice - Co znamená Apache Kudu?

Apache Kudu je členem ekosystému Apache Hadoop s otevřeným zdrojovým kódem. Jde o open-source storage engine určený pro strukturovaná data, který podporuje náhodný přístup s nízkou latencí a efektivní analytické přístupové vzorce. Byl navržen a implementován tak, aby překlenul propast mezi široce používaným systémem Hadoop Distributed File System (HDFS) a databází HBase NoSQL. Přestože se tyto systémy mohou ukázat jako výhodné, Apache Kudu dokáže zvládnout mnoho běžných pracovních zátěží, protože může výrazně zjednodušit jejich architekturu.

Techopedia vysvětluje Apache Kudu

Apache Kudu byl primárně vyvinut jako projekt ve společnosti Cloudera. Většina dosud přispěných příspěvků byla od vývojářů zaměstnaných společností Cloudera. Během jeho vydání byly do úložišť Cloudera zahrnuty pouze binární soubory, ale po připojení k inkubátoru přijal proces uvolňování zdroje Apache Software Foundation (ASF). Je speciálně navržen pro případy použití, které vyžadují rychlou analýzu rychlých dat. Byl zkonstruován tak, aby využíval výhody příští generace hardwaru a zpracování v paměti. Výrazně snižuje latenci dotazu pro Apache Impala a Apache Spark. Distribuuje data pomocí sloupcového úložiště nebo pomocí horizontálního dělení na oddíly a poté replikuje každý oddíl pomocí konsensu Raft, čímž poskytuje nízkou střední dobu do zotavení a nízké latence konce.

Přestože je Kudu produkt navržený v kontextu ekosystému Apache Hadoop, podporuje také integraci s dalšími projekty analýzy dat v ASF i mimo ASF.

Apache Kudu se osvědčil jako efektivní, protože dokáže zpracovat analytická pracovní zatížení v reálném čase napříč jednou úložnou vrstvou, což architektům poskytuje flexibilitu při řešení širší škály případů použití bez exotických řešení.

Co je to apache kudu? - definice z techopedie