Q:
Proč je vizualizace dat užitečná pro algoritmy strojového učení?
A:Disciplína vizualizace dat nám dává prakticky nekonečné způsoby, jak předvést, co se děje s algoritmy strojového učení. Stojí za to přemýšlet o tom, proč je vizualizace dat tak důležitá a proč uvolňuje tolik tvůrčí síly pro tolik lidí, kteří se zapojují do procesů strojového učení.
Chcete-li pochopit hodnotu vizualizace dat pro strojové učení, prostudujte si některý z algoritmů, které se používají k vytvoření těchto průkopnických a inovativních programů.
Jedním z nejjednodušších je strom rozhodování. Aniž bychom se dostali do aktivačních funkcí nebo skrytých vrstev nebo takového, strom rozhodování je jednoduše množinou binárních uzlů. Ale i jednoduchý strom rozhodování je pro lidi velmi obtížný popsat nebo napsat. Je to mnohem jednodušší, když je vizualizováno na obrazovce nebo na stránce. Když vidíte každý uzel a jeho spojení s jinými uzly, celá věc se stane zjevnou.
Nyní pojďme vzít jeden z nejvíce byzantských a propracovaných typů algoritmů strojového učení - neuronovou síť.
V některých ohledech jsou neuronové sítě skutečně souborem algoritmů strojového učení. Základní nastavení se skládá ze vstupní vrstvy, skrytých vrstev a výstupní vrstvy. Aktivační funkce pomáhají jednotlivým digitálním neuronům zpracovávat vážené vstupy.
Všechny tyto položky a všechny tyto procesy lze mnohem snadněji vysvětlit vizualizací dat, než prostřednictvím verbálních nebo písemných popisů. Dá se říci, že neuronová síť má vážené vstupy plynoucí do vstupní vrstvy a že se spojí v nějaké skryté vrstvě a sloučí se do daného výstupu, ale když použijete vizuální postavu, abyste ukázali, jak to funguje, lidské oko a lidské mozek se k tomu přidává mnohem přímějším a užitečnějším způsobem.
V jistém smyslu můžete vidět sílu vizualizace dat i bez zohlednění strojového učení. V dobách lineárního programování by kompilátoři a ateliéry počítačového jazyka dávali programátorům možnost nastavit postupný testovací program, kde by mohli kontrolovat hodnoty proměnných v malých vizuálních polích. To opět pomohlo ukázat, co se stane při provádění, mnohem lépe než jen čtení prostřednictvím kódové základny.
Strojové učení je programování s vysokou intenzitou - je to pravděpodobnostní programování, a proto nám vizualizace dat skutečně pomáhá získat hlavu kolem toho, co se děje s daným algoritmem nebo procesem.