Obsah:
Definice - Co znamená JobTracker?
JobTracker je démon, který běží na motoru MapReduce společnosti Apache Hadoop. JobTracker je základní služba, která obdělává všechny úlohy MapReduce do různých uzlů v klastru, ideálně k uzlům, které již obsahují data, nebo přinejmenším jsou umístěny ve stejném stojanu jako uzly, které data obsahují.
Techopedia vysvětluje JobTracker
JobTracker je služba v rámci společnosti Hadoop, která je zodpovědná za přijímání požadavků klientů. Přiřadí je TaskTrackers na DataNodes, kde jsou požadovaná data lokálně přítomna. Pokud to není možné, JobTracker se pokusí přiřadit úkoly TaskTrackersům ve stejném stojanu, kde jsou data lokálně přítomna. Pokud z nějakého důvodu selže, JobTracker přiřadí úlohu TaskTracker, kde existuje replika dat. V Hadoopu jsou datové bloky replikovány napříč DataNodes, aby byla zajištěna redundance, takže pokud selže jeden uzel v klastru, úloha také selže.
Proces JobTracker:
- JobTracker přijímá žádosti o zaměstnání z klientských aplikací,
- JobTracker konzultuje NameNode, aby určil umístění požadovaných dat.
- JobTracker vyhledá uzly TaskTracker, které obsahují data nebo jsou alespoň blízko dat.
- Úloha je odeslána do vybrané TaskTracker.
- TaskTracker plní své úkoly, zatímco je JobTracker pečlivě sledován. Pokud úloha selže, JobTracker jednoduše úlohu znovu odešle na jiný TaskTracker. Samotný JobTracker je však jediným bodem selhání, což znamená, že pokud selže, celý systém spadne.
- JobTracker aktualizuje svůj stav po dokončení úlohy.
- Klientský žadatel nyní může dotazovat informace z JobTracker.
