Domov Trendy Co je to apache avro? - definice z techopedie

Co je to apache avro? - definice z techopedie

Obsah:

Anonim

Definice - Co znamená Apache Avro?

Apache Avro je platforma pro serializaci dat a vzdálené volání procedur, která je vyvinuta v projektu Apache Hadoop, kde poskytuje jak serializační formát pro získání trvalých dat, tak drátový formát pro poskytování komunikace mezi uzly Hadoop, jakož i připojení klientských programů k Hadoop služeb.

Avro používá formát JSON pro definování protokolů a datových typů a také serializuje data do kompaktního binárního formátu.

Techopedia vysvětluje Apache Avro

Apache Avro je velký rámec pro serializaci dat, který produkuje data v kompaktním binárním formátu, který nevyžaduje generování kódu ani objekty proxy.

Používá se jako komponenta pro serializaci dat pro Apache Hadoop. Avro pracuje na konceptu schémat. Při čtení dat Avro je vždy k dispozici schéma, které bylo použito při psaní konkrétních dat.

To umožňuje každý soubor dat bez režijních nákladů na hodnotu, což umožňuje rychlou a relativně malou velikost serializace. A protože data a jejich schéma jsou plně samy popisující, usnadňuje použití s ​​dynamickými skriptovacími jazyky.

Když jsou data Avro uložena v konkrétním souboru, je schéma také uloženo spolu s nimi, aby bylo možné je později zpracovat jiným programem. Pokud tedy program, který čte data, očekává další schéma, lze to snadno vyřešit, protože jsou k dispozici obě schémata.

Avro poskytuje:

    Kompaktní a rychlý formát binárních dat

    Struktury bohatých dat

    Soubor kontejneru pro ukládání trvalých dat

    Vzdálené volání procedur (RPC)

    Integrace s dynamickými jazyky

Generování kódu není vyžadováno pro čtení nebo zápis datových souborů nebo pro použití nebo implementaci RPC protokolů.

Co je to apache avro? - definice z techopedie