Obsah:
Definice - Co znamená Q-learning?
Q-learning je termín pro strukturu algoritmu představující učení bez vyztužení bez modelu. Vyhodnocení politiky a použití stochastického modelování najde Q-learning nejlepší cestu vpřed v Markovově rozhodovacím procesu.
Techopedia vysvětluje Q-learning
Technické složení algoritmu Q-learning zahrnuje agenta, sadu stavů a sadu akcí na stav.
Funkce Q používá váhy pro různé kroky ve spojení s diskontním faktorem, aby ocenil odměny.
I když se to může zdát jako jednoduchý nápad, Q-učení má zásadní význam v mnoha typech modelů posilování učení a hlubokého učení. Jeden z nejlepších příkladů je tam, kde se používá hluboké Q-učení, aby pomohlo strojovým učebním programům naučit se strategie hraní her v různých typech videoher, například ve hrách Atari z 80. let. Zde konvoluční neuronová síť odebírá vzorky hraní her, aby vytvořila stochastický model, který pomůže počítači vědět, jak hrát hru v průběhu času lépe.
Q-learning má velký potenciál pro pomoc v rozvoji umělé inteligence a strojového učení.
