Q:
Proč je v některých projektech strojového učení důležitá anotace dat?
A:Anotace dat je důležitá ve strojovém učení, protože v mnoha případech je práce programu strojového učení mnohem snazší.
To souvisí s rozdílem mezi strojovým učením pod dohledem a bez dozoru. S dohledem strojového učení jsou data školení již označena, takže stroj může lépe porozumět požadovaným výsledkům. Pokud je například cílem programu identifikovat kočky v obrazech, systém již obsahuje velké množství fotografií označených jako kočky nebo ne. Tyto příklady pak použije k porovnání nových dat, aby dosáhla svých výsledků.
Zdarma ke stažení: Strojové učení a proč to záleží |
U strojového učení bez dozoru neexistují žádné štítky, takže systém musí k identifikaci koček používat atributy a další techniky. Inženýři mohou program trénovat v rozpoznávání vizuálních rysů koček, jako jsou vousy nebo ocasy, ale tento proces není nikdy tak přímočarý, jako by byl v strojním učení pod dohledem, kde tyto štítky hrají velmi důležitou roli.
Anotace dat je proces připojování štítků k souborům údajů o školení. Lze je použít mnoha různými způsoby - výše jsme hovořili o anotaci binárních dat - kočky nebo ne - kočky - ale důležité jsou i jiné druhy anotací dat. Například v lékařské oblasti může anotace dat zahrnovat značení specifických biologických obrázků značkami identifikujícími patologii nebo markery nemoci pro jiné lékařské vlastnosti.
Anotace dat vyžaduje práci - a často ji provádějí týmy lidí -, ale je to základní součást toho, jak mnoho projektů strojového učení funguje správně. Poskytuje počáteční nastavení pro výuku programu, co se musí naučit a jak rozlišit různé vstupy, aby přišlo s přesnými výstupy.