Domov Zvuk Jaký je rozdíl mezi strojovým učením a těžbou dat?

Jaký je rozdíl mezi strojovým učením a těžbou dat?

Anonim

Q:

Jaký je rozdíl mezi strojovým učením a těžbou dat?

A:

Dolování dat a strojové učení jsou dva velmi odlišné pojmy - často se však používají ve stejném kontextu, což je schopnost stran upřesnit a třídit data, aby vycházely z poznatků a závěrů. Kombinace podobností a rozdílů mohou vést k tomu, že mluví o těchto dvou velmi odlišných procesech, které jsou matoucí pro méně technicky zdatné publikum.

Dolování dat je proces agregace dat a extrahování užitečných dat z této větší sady dat. Je to typ objevu znalostí, který se děje od té doby, co jsme byli schopni agregovat velké množství dat. Dolování dat můžete provádět pomocí poměrně primitivního systému: Program bude naprogramován tak, aby hledal konkrétní vzorce a trendy dat, a technické informace budou „vytěženy“ z této nezpracované hmoty dat v jakékoli formě, ve které mohou být.

Strojové učení je něco novějšího a sofistikovanějšího. Strojové učení používá sady dat, ale na rozdíl od těžby dat, strojové učení používá komplikované algoritmy a nastavení, jako jsou neuronové sítě, aby skutečně umožnilo stroji učit se ze vstupních dat. Strojové učení je tedy o něco hlouběji než operace dolování dat. Například v neuronové síti umělé neurony pracují ve vrstvách, aby přijímaly vstupní data a uvolňovaly výstupní data se spoustou propracované aktivity „černé skříňky“ mezi (pojem „černá skříňka“ se vztahuje na sofistikovanější systémy, když lidé mají těžko pochopit, jak neuronové sítě nebo algoritmy skutečně vykonávají svou práci).

Dolování dat a strojové učení se také v aplikacích liší od podnikání. Těžba dat může opět pokračovat v jakékoli dané aplikaci ERP a v mnoha různých procesech.

Naproti tomu projekt strojového učení vyžaduje značné zdroje. Projektoví manažeři musí shromažďovat údaje o školení a testech, hledat problémy, jako je nadměrné vybavení, rozhodovat o výběru prvků a extrakci prvků a mnoho dalšího. Strojové učení může vyžadovat složité formy nákupu od různých zúčastněných stran, zatímco činnosti v oblasti těžby dat obvykle vyžadují pouze rychlé odhlášení.

Přes tyto rozdíly platí, že dolování dat i strojové učení se vztahují na oblast vědy o datech. Dozvědět se více o vědě o datech pomáhá zúčastněným stranám dozvědět se více o tom, jak tyto procesy fungují a jak je lze aplikovat v daném odvětví.

Jaký je rozdíl mezi strojovým učením a těžbou dat?