Q:
Proč je výběr funkcí tak důležitý ve strojovém učení?
A:Výběr funkcí je v strojovém učení nesmírně důležitý především proto, že slouží jako základní technika k nasměrování použití proměnných na to, co je pro daný strojový systém učení nejefektivnější a nejúčinnější.
Odborníci hovoří o tom, jak výběr a extrakce prvků fungují tak, aby minimalizovaly prokletí rozměrnosti nebo pomohly vyrovnat se s přeplněním - to jsou různé způsoby, jak oslovit myšlenku příliš složitého modelování.
Zdarma ke stažení: Strojové učení a proč to záleží |
Dalším způsobem, jak to říci, je, že výběr funkcí pomáhá vývojářům poskytnout nástroje k použití pouze nejrelevantnějších a nejužitečnějších dat v sadách strojového učení, což dramaticky snižuje náklady a objem dat.
Jedním příkladem je myšlenka měření komplexního tvaru v měřítku. Jak se program mění, identifikuje větší počet datových bodů a systém se stává mnohem složitější. Složitý tvar však není typický soubor dat, který systém strojového učení používá. Tyto systémy mohou používat datové sady, které mají velmi rozdílné úrovně rozptylu mezi různými proměnnými. Například při třídění druhů mohou inženýři pomocí výběru funkcí použít pouze k studování proměnných, které jim poskytnou nejvíce cílené výsledky. Pokud má každé zvíře v mapě stejný počet očí nebo nohou, mohou být tato data odstraněna nebo mohou být získány další relevantní údaje.
Výběr funkcí je diskriminační proces, kterým technici směřují systémy strojového učení k cíli. Kromě myšlenky odstranění složitosti ze systémů v měřítku může být výběr funkcí užitečný také při optimalizaci aspektů toho, co odborníci nazývají „kompromisní odchylka zkreslení“ ve strojovém učení.
Důvody, proč výběr funkcí pomáhá s analýzou zkreslení a rozptylu, jsou složitější. Studie z Cornell University o výběru prvků, rozptylu vychýlení a pytlování slouží k ilustraci toho, jak výběr prvků pomáhá projektům.
Podle autorů článek „zkoumá mechanismus, kterým výběr funkcí zlepšuje přesnost učení pod dohledem“.
Studie dále uvádí:
Empirická analýza zkreslení / rozptylu v průběhu postupu výběru prvků naznačuje, že nejpřesnější sada prvků odpovídá nejlepšímu kompromisnímu bodu zkreslení pro variační algoritmus.
Při diskusi o použití silné nebo slabé relevance autoři hovoří o výběru funkce jako o „metodě redukce rozptylu“ - to dává smysl, když si myslíte, že rozptyl je v podstatě rozsah variace v dané proměnné. Pokud nedochází k odchylkám, může být datový bod nebo pole v podstatě zbytečné. Pokud existuje extrémně vysoká rozptyl, může se vyvinout to, co mohou inženýři považovat za „hluk“ nebo irelevantní, svévolné výsledky, které jsou pro systém strojového učení obtížné zvládnout.
S ohledem na to je výběr prvků základní součástí designu ve strojovém učení.