Q:
Jak může koncept rovnováhy informovat o projektech strojového učení?
A:Rovnováha bude obecně informovat strojové učení snahou o stabilizaci prostředí strojového učení a vytvoření výsledků s kompatibilní směsí deterministických a pravděpodobnostních složek.
Experti popisují „rovnováhu“ jako situaci, kdy racionální aktéři v systému strojového učení dosáhnou konsensu o strategické akci - zejména Nashova rovnováha v teorii her zahrnuje dva nebo více z těchto racionálních aktérů konsolidujících strategií tím, že uznává, že žádný hráč nemá prospěch změna konkrétní strategie, pokud ostatní hráči nezmění své.
Zdarma ke stažení: Strojové učení a proč to záleží |
Obzvláště populární a jednoduchá demonstrace Nashovy rovnováhy zahrnuje jednoduchou matici, kde si dva hráči vyberou binární výsledek.
Výše uvedené je docela technický způsob, jak popsat rovnováhu a jak to funguje. Mnohem neformálnějším způsobem, jak ilustrovat koncept rovnováhy, zejména výše uvedený příklad dvou racionálních herců, z nichž každý má binární volbu, je přemýšlet o tom, co byste mohli nazvat scénářem „chůze k sobě v chodbě vysoké školy“.
Předpokládejme, že dva lidé chodí v různých směrech dolů chodbou střední školy (nebo jakýmkoli jiným typem oblasti), která má pouze prostor pro dvě osoby na šířku. Dvě otevřené cesty jsou binární výstupy. Pokud si oba racionální herci vyberou různé binární výstupy, které nejsou v konfliktu, vzájemně projdou a pozdraví se. Pokud si vyberou dva protichůdné binární výstupy - chodí ve stejném prostoru a jeden z nich se bude muset vzdát.
Ve výše uvedeném příkladu, pokud si dva racionální aktéři zvolí dva kompatibilní a nekonfliktní výsledky, obecně se shoduje, že ani jeden nezíská zisk změnou své strategie - v tomto případě jejich směrů chůze - pokud druhá osoba nezmění své.
Výše uvedené představuje rovnováhu, kterou lze modelovat v jakémkoli daném konstruktu strojového učení. Na základě tohoto jednoduchého příkladu budou výsledkem vždy dva racionální aktéři, kteří spolupracují, nebo jinými slovy, dva lidé, kteří kráčejí kolem sebe.
Opak by mohl být nazýván „nerovnováhou“ - pokud si dva racionální aktéři zvolí protichůdné výsledky, jak bylo uvedeno, jeden z nich bude muset přinést. Modelování ML by to však mohlo být vrženo do nekonečné smyčky, pokud se oba rozhodnou vzdát - podobně jako dva lidé se pohybují, aby se pokusili vyhovět sobě navzájem a stále pokračovat v chůzi směrem ke srážce.
Rovnováhy, jako je výše uvedená, se obvykle používají ve strojovém učení k vytvoření konsensu a stabilizaci modelů. Inženýři a vývojáři budou hledat ty scénáře a situace, z nichž plynou rovnováhy, a budou se snažit o změnu nebo řešení těch, které tak neučiní. Při pohledu na příklady z reálného světa, které odpovídají ML rovnováhám, je snadné pochopit, jak je tento druh analýzy v systému strojového učení jedinečně poučný pro vymýšlení, jak modelovat lidské chování vytvářením racionálních aktérů a agentů. To je jen jeden vynikající příklad toho, jak lze rovnováhu využít k pokrokům v aplikaci systémů strojového učení.