Obsah:
Definice - Co znamenají neoznačená data?
Neoznačená data jsou označení pro části dat, které nebyly označeny štítky identifikujícími vlastnosti, vlastnosti nebo klasifikace. Neoznačená data se obvykle používají v různých formách strojového učení.
Techopedia vysvětluje neoznačená data
V typech strojového učení nazývaného strojové učení bez dozoru pracuje program strojového učení vyhodnocováním sad neznačených dat. Protože data nemají popisky, musí strojový učební program identifikovat každý datový kus podle jeho vlastností a charakteristik.
Jedním z nejlepších způsobů, jak to vysvětlit, je použití metafory ovocné mísy. Předpokládejme, že program strojového učení se učí identifikovat tři různé druhy ovoce - banány, hrozny a jablka. Pokud jsou data v počáteční tréninkové sadě označena, program strojového učení pracuje z této perspektivy - přiřazování následných obrazů k jedné z těchto tří kategorií.
Pokud však žádný z datových kusů není označen třemi názvy ovoce - banány, hrozny a jablka - program strojového učení bude muset fungovat tak, že vyhodnotí každý obrázek a podívá se na vlastnosti, jako jsou barvy - žluté, červené nebo fialové - dlouhé a tenké, kulaté nebo seskupené - a další vlastnosti.
Z tohoto příkladu je snadno vidět, jak označená data poskytují mnohem jednodušší příležitosti k použití algoritmů strojového učení pro výsledky rozhodnutí. Sofistikované programy strojového učení bez dozoru, které se zabývají neznačenými daty, však mohou přinést i neuvěřitelně přesné a přesné výsledky.