Domov Rozvoj Proč je předpojatost stroje problémem ve strojovém učení?

Proč je předpojatost stroje problémem ve strojovém učení?

Anonim

Q:

Proč je předpojatost stroje problémem ve strojovém učení?

A:

Na tuto otázku lze odpovědět dvěma různými způsoby. Zaprvé, proč je problém s zaujatím stroje, jako v tom, proč existuje v procesech strojového učení?

Strojové učení, i když je sofistikované a složité, je do jisté míry omezeno na základě datových sad, které používá. Konstrukce datových souborů zahrnuje vlastní předpojatost. Stejně jako v médiích, kde opomenutí a úmyslné volby inkluze mohou ukazovat na konkrétní předpojatost, v strojovém učení musí být použité datové soubory prozkoumány, aby se určilo, jaký druh předpojatosti existuje.

Zdarma ke stažení: Strojové učení a proč to záleží

Je například běžným problémem při testování technologií a procesech návrhu, aby se ukázalo, že preferuje jeden typ uživatele před jiným. Velkým příkladem je genderová nerovnost ve světě techniky.

Proč to dělá rozdíl a proč to platí pro strojové učení?

Protože nedostatek existujících žen v testovacím prostředí může vést k produkované technologii, která je méně uživatelsky přívětivá pro ženské publikum. Někteří odborníci to popisují tak, že bez existujících ženských testů nemusí konečný produkt rozpoznat vstup ženských uživatelů - nemusí mít nástroje pro rozpoznávání ženských identit nebo pro odpovídající řešení vstupů žen.

Totéž platí pro různé etnikum, lidi různých náboženství nebo jakýkoli jiný typ demografie. Bez správných dat nebudou algoritmy strojového učení pracovat pro danou uživatelskou sadu, takže data inkluze musí být do technologie záměrně přidána. Namísto pouhé primární sady dat a posílení vlastní předpojatosti se musí obsluhující pracovníci na tento problém skutečně dívat.

Dalším příkladem je strojový stroj, který přijímá informace o práci a platu a vyplivuje výsledky. Pokud tato vlastní sada dat není analyzována, stroj posílí předpojatost. Pokud si uvědomí, že muži zastávají naprostou většinu výkonných funkcí a proces strojového učení zahrnuje filtrování prostřednictvím sady prvotních dat a vracení odpovídajících výsledků, vrátí výsledky, které ukazují mužskou zaujatost.

Druhá část otázky zahrnuje, proč je toto zkreslení tak škodlivé. Bez adekvátního dohledu a testování mohou nové technologie poškodit náš smysl pro začlenění a rovnost, a ne pomoci. Pokud je zaveden nový technologický produkt, který rozpoznává tváře se světlejší pletí, ale nikoli s tmavší pletí, může to vést k eskalovanému etnickému napětí a pocitu, že dotyčná společnost není citlivá na rozmanitost. Pokud algoritmus strojového učení reprodukuje a zvyšuje předpojatost v souborech dat, bude tato umělá inteligence přidávat svůj hlas k lidským hlasům a lidským tendencím, které již existují v sociálním systému a upřednostňují jednu skupinu lidí před druhou.

Nejlepší způsob, jak se s tím vypořádat, je důkladně se podívat na základní datové soubory, použít výběr funkcí, přidat variabilní vstup a manipulovat se samotnými datovými sadami a rozšířit skutečnou sílu strojového učení pomocí úmyslného lidského vytváření dat, abyste získali výsledek, který poskytuje skvělou analytickou sílu, ale také některé z těch lidských vhledů, které počítače nemohou replikovat.

Proč je předpojatost stroje problémem ve strojovém učení?