Domov Zvuk Proč mohou některé projekty strojového učení vyžadovat obrovské množství herců?

Proč mohou některé projekty strojového učení vyžadovat obrovské množství herců?

Anonim

Q:

Proč mohou některé projekty strojového učení vyžadovat obrovské množství herců?

A:

Když přemýšlíte o strojovém učení, máte sklon myslet na kvalifikované vědce, kteří pracují na klávesnici v počítačových místnostech. Extrémní důraz je kladen na kvantitativní analýzu a algoritmy. Mnoho těchto programů nemá bezprostřední kontext skutečného světa - alespoň to si mnozí myslí.

Některé z dnešních nejvíce průkopnických programů strojového učení však využívají opravdové armády lidských herců na ulici, v obchodech a kdekoli, kde mohou modelovat základní lidské činnosti, jako je chůze, práce nebo nakupování.

Zdarma ke stažení: Strojové učení a proč to záleží

Kabelový článek Toma Simoniteho to velmi dobře ilustruje s výstižným názvem „Aby AI chytřejší, lidé provádějí Oddball nízké placené úkoly“.

Simonite na příkladu krátkých videí pořízených v obchodě s potravinami Whole Foods vyzdvihuje druhy práce, které pomohou vybudovat část další fáze strojového učení.

To vede k otázce, proč se všichni tito lidé zabývají natáčením krátkých a jednoduchých videí dokumentujících akce tak základní, jako pohybující se paží nebo nohou.

Odpověď vrhá nějaké světlo na to, kde je strojové učení a kam směřuje.

"Vědci a podnikatelé chtějí, aby umělá inteligence pochopila a chovala se ve fyzickém světě, " píše Simonite a vysvětluje, proč on a ostatní se pohybují s kamerami. "Proto je třeba, aby pracovníci hráli scény v supermarketech a domácnostech." Vytvářejí výukový materiál, který učí algoritmy o světě a lidech v něm. “

Jak uvádí mnoho odborníků, některé z největších hranic strojového učení zahrnují zpracování obrazu a zpracování přirozeného jazyka. Jedná se o extrémně kvantitativní postupy - jinými slovy, neexistuje široké spektrum vstupů, jaké existují v „výkonných“ prostředích v reálném světě. Místo toho programy strojového učení používají vizuální a zvuková data velmi specifickým způsobem k vytváření modelů. Při zpracování obrazu vybírá funkce z (konečného) zorného pole. Pro NLP se jedná o sestavení fonémů.

Překročení těchto specifických kategorií vstupů zahrnuje něco, čemu by se dalo říkat „obrazová a řečová mezera“ - překračováním věcí, jako je zpracování obrazu a rozpoznávání řeči, se pohybujete do oblastí, kde počítače musí být analyzovány různými způsoby. Tréninkové sady se budou zásadně lišit.

Vstupte do armády videografů. V některých z těchto nových projektů strojového učení jsou nejmenšími představami o lidských činnostech výcvikové sady. Místo toho, aby byli školeni hledat funkce a hrany a pixely, které se skládají do klasifikačních úkolů, používají počítače místo toho školení videa k posouzení toho, jak vypadají různé typy akcí.

Klíčové je, co mohou inženýři s těmito daty dělat, když jsou agregována a načtena a když je na nich počítač vyškolen. Brzy uvidíte výsledky v různých oblastech - například díky tomu bude dohled mimořádně účinný. Počítače budou moci „vidět“ ve vizuální oblasti, co lidé dělají, a aplikovat je na oblasti, jako je marketing a prodej, případně v některých případech práce vládních agentur nebo trestní soudnictví.

Důsledky také objasňují debatu mezi otázkami maximálního přínosu a soukromí. Většina použití těchto videí vytvoří modely strojového učení, které fungují pro dohled - ale co lidé, kteří nechtějí být sledováni? Když jsou tyto nové programy strojového učení rozmístěny ve veřejném prostoru, jaká jsou práva jednotlivce a kde je tato čára nakreslena?

V každém případě společnosti využívají tyto druhy lidských a obrazových zdrojů, aby skutečně vykopávaly některá další kola pokroku strojového učení, která ve skutečnosti umožní počítačům rozpoznat, co se kolem nich děje, spíše než jen klasifikovat obrázky nebo pracovat s fonémy mluvený projev. Jedná se o nesmírně zajímavý a kontroverzní vývoj v oblasti umělé inteligence, který si zaslouží svůj podíl pozornosti v technologických médiích i mimo ně.

Proč mohou některé projekty strojového učení vyžadovat obrovské množství herců?