Domov Zvuk Proč je informační překážka důležitou teorií v hlubokém učení?

Proč je informační překážka důležitou teorií v hlubokém učení?

Anonim

Q:

Proč je „informační překážka“ důležitou teorií v hlubokém učení?

A:

Myšlenka „informační překážky“ v umělých neuronových sítích (ANNs) funguje na zvláštním principu souvisejícím s šířením různých druhů signalizace. Je považováno za praktický nástroj pro zkoumání kompromisů, díky nimž jsou tyto systémy umělé inteligence samooptimalizovány. Kabelový článek popisující koncept úzkého hrdla informací předložený Tishby et. al. hovoří o „zbavení hlučných vstupních údajů o cizích detailech, jako by se vymáčknutím informací zúžením“ a „zachováním pouze funkcí, které jsou pro obecné koncepty nejdůležitější“.

Jako relativně nový koncept může myšlenka úzkého profilu informací pomoci zlepšit a změnit způsob, jakým používáme ANNs a související systémy k modelování kognitivní funkce. Jedním ze způsobů, jak tato teorie může pomoci, je tím, že nám pomůžeme lépe porozumět paradigmatům podporujícím funkce neuronových sítí. Pokud například princip ukazuje, jak systém zachovává pouze určitou sadu funkcí, začneme vidět, jak tato „diskriminace dat“ způsobuje, že síť „lidoopem“ lidský mozek, a inženýři ji mohou přidat do modelů neuronových sítí. Zde je myšlenka, že technologie neuronových sítí se nakonec stane spíše „univerzálním“ konceptem, nejen provincií privilegovaných málo. V současné době společnosti hledají vzácný talent AI; teorie, jako je teorie úzkých profilů, mohou pomoci rozšířit znalosti o neuronových sítích pro laiky a „prostřední uživatele“ - ty, kteří nemusí být „experti“, ale mohou pomoci při vzniku a šíření technologií neuronových sítí.

Další důležitou hodnotou informační překážky je to, že inženýři mohou začít trénovat systémy tak, aby pracovaly přesněji. Mít několik pokynů na nejvyšší úrovni pro systémovou architekturu může zefektivnit vývoj těchto typů technologií, a mít více definovanou představu o zásadách hlubokého učení je proto ve světě IT cenné.

Obecně se předvoj pracující na umělé inteligenci bude i nadále zabývat konkrétně tím, jak fungují neuronové sítě, včetně myšlenky „relevantních informací“ a toho, jak systémy rozlišují při výkonu funkcí. Jedním příkladem je zpracování obrazu nebo řeči, kde se systémy musejí naučit identifikovat mnoho variací jako „objekty“. Obecně informační úzký profil ukazuje konkrétní pohled na to, jak by neuronová síť s těmito objekty pracovala, a konkrétně jak tyto datové modely zpracovávat informace.

Proč je informační překážka důležitou teorií v hlubokém učení?