Domov Zvuk Proč odborníci na strojové učení mluví o inicializaci xavierů?

Proč odborníci na strojové učení mluví o inicializaci xavierů?

Anonim

Q:

Proč odborníci na strojové učení mluví o inicializaci Xavieru?

A:

Inicializace Xavieru je důležitou myšlenkou v inženýrství a školení neuronových sítí. Odborníci hovoří o použití inicializace Xavier za účelem řízení rozptylu a způsobů, jak se signály objevují prostřednictvím vrstev neuronové sítě.

Inicializace Xavier je v podstatě způsob, jak třídit počáteční váhy pro jednotlivé vstupy v modelu neuronů. Čistý vstup pro neuron se skládá z každého jednotlivého vstupu vynásobeného jeho hmotností, což vede k přenosové funkci a přidružené aktivační funkci. Myšlenka je taková, že inženýři chtějí tyto počáteční hmotnosti sítě proaktivně spravovat, aby se ujistili, že síť konverguje správně s příslušnou odchylkou na každé úrovni.

Zdarma ke stažení: Strojové učení a proč to záleží

Odborníci poukazují na to, že inženýři mohou do jisté míry použít sestup stochastického gradientu k úpravě hmotností vstupů v tréninku, ale pokud začnou s nesprávným vážením, nemusí se správně sblížit, protože neurony se mohou saturovat. Jiným způsobem, jak to někteří odborníci uvádějí, je to, že signály mohou „růst“ nebo „zmenšovat se“ příliš s nesprávnými váhami, a proto lidé používají inicializaci Xavier v souladu s různými aktivačními funkcemi.

Část této myšlenky souvisí s omezením při práci se systémy, které ještě nebyly vyvinuty: Před tréninkem inženýři nějakým způsobem pracují ve tmě. Neznají data, tak jak vědí, jak zvážit počáteční vstupy?

Z tohoto důvodu je inicializace Xavieru populárním tématem konverzace v programovacích blogech a fórech, protože se profesionálové ptají, jak je aplikovat na různé platformy, například TensorFlow. Tyto typy technik jsou součástí zdokonalování návrhů strojového učení a umělé inteligence, které mají velký dopad na pokrok na spotřebitelských trzích a jinde.

Proč odborníci na strojové učení mluví o inicializaci xavierů?