Domov Zvuk Co je částečně pozorovatelný markovský rozhodovací proces (pomdp)? - definice z techopedie

Co je částečně pozorovatelný markovský rozhodovací proces (pomdp)? - definice z techopedie

Obsah:

Anonim

Definice - Co znamená částečně pozorovatelný Markovův rozhodovací proces (POMDP)?

Částečně pozorovatelný Markovův rozhodovací proces (POMPD) je Markovův rozhodovací proces, ve kterém agent nemůže přímo pozorovat základní stavy v modelu. Markovův rozhodovací proces (MDP) je matematický rámec pro modelování rozhodnutí ukazující systém s řadou stavů a ​​poskytující akce tvůrci rozhodnutí na základě těchto stavů.

POMPD staví na této koncepci a ukazuje, jak systém dokáže čelit problémům omezeného pozorování.

Techopedia vysvětluje částečně pozorovatelný Markovův rozhodovací proces (POMDP)

V částečně pozorovatelném Markovově rozhodovacím procesu, protože základní stavy nejsou pro agenta transparentní, je užitečný koncept nazývaný „stav víry“. Stav víry poskytuje způsob, jak se vypořádat s nejednoznačností obsaženou v modelu.

POMPD je užitečný v posilování učení, kde systém může projít MPD nebo POMPD model využívající to, co je známo, že vytváří jasnější obrázek o pravděpodobnostních výsledcích.

Co je částečně pozorovatelný markovský rozhodovací proces (pomdp)? - definice z techopedie