Domov Ve zprávách Co je to apache kafka? - definice z techopedie

Co je to apache kafka? - definice z techopedie

Obsah:

Anonim

Definice - Co znamená Apache Kafka?

Apache Kafka je open-source systém publikování a odběru zpráv navržený tak, aby poskytoval rychlé, škálovatelné a odolné vůči chybám zpracování datových toků v reálném čase. Na rozdíl od tradičního softwaru pro podnikové zasílání zpráv je společnost Kafka schopna zpracovat všechna data protékající společností a provádět je téměř v reálném čase.

Kafka je napsána v Scale a byla původně vyvinuta společností LinkedIn. Od té doby ji řada společností používá k vytváření platforem v reálném čase.

Techopedia vysvětluje Apache Kafku

Kafka má mnoho podobností s protokoly transakcí a udržuje zdroje zpráv v tématech. Producenti zapisují data do témat a spotřebitelé čtou z těchto témat, která jsou rozdělena a replikována na více uzlech v distribuovaném systémovém formátu. Kafka je jedinečná v tom, že zachází s každým tématickým oddílem jako s protokolem a každé zprávě v oddílu je přiřazen jedinečný offset. Zachovává všechny zprávy po určitou dobu a spotřebitelé jsou zodpovědní za sledování jejich umístění v každém protokolu. To se liší od předchozích systémů, kde za toto sledování odpovídali makléři, což vážně omezilo schopnost systému škálovat se zvyšujícím se počtem zákazníků. Tato struktura umožňuje společnosti Kafka podporovat mnoho zákazníků a uchovávat velké množství dat s velmi nízkými režijními náklady.

Kafka lze použít:

  • Jako tradiční zprostředkovatel zpráv
  • Pro sledování aktivity na webu
  • Pro agregaci protokolu
  • Pro zpracování velkých datových toků

Kafka lze použít spolu s Apache Storm, Apache HBase a Apache Spark pro analýzu v reálném čase a vykreslování datových proudů.

Co je to apache kafka? - definice z techopedie