Domov Trendy Proč je v některých projektech strojového učení důležitá anotace dat?

Proč je v některých projektech strojového učení důležitá anotace dat?

Anonim

Q:

Proč je v některých projektech strojového učení důležitá anotace dat?

A:

Anotace dat je důležitá ve strojovém učení, protože v mnoha případech je práce programu strojového učení mnohem snazší.

To souvisí s rozdílem mezi strojovým učením pod dohledem a bez dozoru. S dohledem strojového učení jsou data školení již označena, takže stroj může lépe porozumět požadovaným výsledkům. Pokud je například cílem programu identifikovat kočky v obrazech, systém již obsahuje velké množství fotografií označených jako kočky nebo ne. Tyto příklady pak použije k porovnání nových dat, aby dosáhla svých výsledků.

Zdarma ke stažení: Strojové učení a proč to záleží

U strojového učení bez dozoru neexistují žádné štítky, takže systém musí k identifikaci koček používat atributy a další techniky. Inženýři mohou program trénovat v rozpoznávání vizuálních rysů koček, jako jsou vousy nebo ocasy, ale tento proces není nikdy tak přímočarý, jako by byl v strojním učení pod dohledem, kde tyto štítky hrají velmi důležitou roli.

Anotace dat je proces připojování štítků k souborům údajů o školení. Lze je použít mnoha různými způsoby - výše jsme hovořili o anotaci binárních dat - kočky nebo ne - kočky - ale důležité jsou i jiné druhy anotací dat. Například v lékařské oblasti může anotace dat zahrnovat značení specifických biologických obrázků značkami identifikujícími patologii nebo markery nemoci pro jiné lékařské vlastnosti.

Anotace dat vyžaduje práci - a často ji provádějí týmy lidí -, ale je to základní součást toho, jak mnoho projektů strojového učení funguje správně. Poskytuje počáteční nastavení pro výuku programu, co se musí naučit a jak rozlišit různé vstupy, aby přišlo s přesnými výstupy.

Proč je v některých projektech strojového učení důležitá anotace dat?