Obsah:
Definice - Co znamená Apache Avro?
Apache Avro je platforma pro serializaci dat a vzdálené volání procedur, která je vyvinuta v projektu Apache Hadoop, kde poskytuje jak serializační formát pro získání trvalých dat, tak drátový formát pro poskytování komunikace mezi uzly Hadoop, jakož i připojení klientských programů k Hadoop služeb.
Avro používá formát JSON pro definování protokolů a datových typů a také serializuje data do kompaktního binárního formátu.
Techopedia vysvětluje Apache Avro
Apache Avro je velký rámec pro serializaci dat, který produkuje data v kompaktním binárním formátu, který nevyžaduje generování kódu ani objekty proxy.
Používá se jako komponenta pro serializaci dat pro Apache Hadoop. Avro pracuje na konceptu schémat. Při čtení dat Avro je vždy k dispozici schéma, které bylo použito při psaní konkrétních dat.
To umožňuje každý soubor dat bez režijních nákladů na hodnotu, což umožňuje rychlou a relativně malou velikost serializace. A protože data a jejich schéma jsou plně samy popisující, usnadňuje použití s dynamickými skriptovacími jazyky.
Když jsou data Avro uložena v konkrétním souboru, je schéma také uloženo spolu s nimi, aby bylo možné je později zpracovat jiným programem. Pokud tedy program, který čte data, očekává další schéma, lze to snadno vyřešit, protože jsou k dispozici obě schémata.
Avro poskytuje:
Kompaktní a rychlý formát binárních dat
Struktury bohatých dat
Soubor kontejneru pro ukládání trvalých dat
Vzdálené volání procedur (RPC)
Integrace s dynamickými jazyky
Generování kódu není vyžadováno pro čtení nebo zápis datových souborů nebo pro použití nebo implementaci RPC protokolů.