Domov Rozvoj Co je to posilovací učení? - definice z techopedie

Co je to posilovací učení? - definice z techopedie

Obsah:

Anonim

Definice - Co znamená Výztužné učení?

Učení zesílení v kontextu umělé inteligence je typem dynamického programování, které školí algoritmy pomocí systému odměňování a trestů.

Algoritmus posilování učení nebo agent se učí interakcí se svým prostředím. Agent dostává odměny správným provedením a pokuty za nesprávné provedení. Agent se učí bez zásahu člověka tím, že maximalizuje jeho odměnu a minimalizuje jeho trest.

Techopedia vysvětluje posilování učení

Učení zesílení je přístup ke strojovému učení, který je inspirován behavioristickou psychologií. Je to podobné tomu, jak se dítě učí provádět nový úkol. Výuka zesílení kontrastuje s jinými přístupy strojového učení v tom, že algoritmu není výslovně řečeno, jak provést úkol, ale problém sám řeší.

Jako agent, kterým může být vůz s vlastním řízením nebo program hrající šachy, komunikuje se svým prostředím, dostává stav odměny v závislosti na tom, jak se chová, jako je bezpečná jízda do cíle nebo vyhrání hry. Naopak agent dostane pokutu za nesprávné provedení, jako je např. Vyjet z cesty nebo být zkontrolován.

Agent v průběhu času se rozhoduje maximalizovat svou odměnu a minimalizovat svůj trest pomocí dynamického programování. Výhodou tohoto přístupu k umělé inteligenci je to, že umožňuje programu AI se učit, aniž by programátor upřesnil, jak by agent měl úkol plnit.

Co je to posilovací učení? - definice z techopedie