Q:
Jak mohou nové schopnosti strojového učení umožnit těžbu skladových dokumentů pro finanční údaje?
A:Jednou z vzrušujících nových hranic strojového učení a umělé inteligence je to, že vědci a inženýři se pustí do různých způsobů, jak využít zcela nové typy zdrojů k předpovídání pohybu akcií a investičních výsledků. Jedná se o obrovský měnič her ve finančním světě a velmi zásadním způsobem revolucionizuje investiční strategie.
Jednou ze základních myšlenek pro rozšíření tohoto typu výzkumu zásob je výpočetní lingvistika, která zahrnuje modelování přirozeného jazyka. Odborníci zkoumají, jak používat textové dokumenty, od podání SEC po akcionářské dopisy k jiným periferním textovým zdrojům, za účelem rozšíření nebo doladění analýzy zásob nebo vytvoření zcela nových analýz.
Zdarma ke stažení: Strojové učení a proč to záleží |
Důležitým zřeknutím se odpovědnosti je, že to vše je možné pouze díky zcela novým pokrokům v neuronových sítích, strojovém učení a analýze přirozeného jazyka. Před příchodem ML / AI používaly výpočetní technologie většinou „lineární programování“ pro čtení vstupů. Textové dokumenty byly příliš nestrukturované, než aby byly užitečné. Ale s pokrokem dosaženým v analýze přirozeného jazyka v posledních několika letech vědci zjistili, že je možné „těžit“ přirozený jazyk pro kvantifikovatelné výsledky, jinými slovy výsledky, které lze nějakým způsobem spočítat.
Některé z nejlepších důkazů a nejužitečnějších příkladů jsou z různých dizertačních prací a doktorských prací dostupných na webu. V příspěvku „Aplikace strojového učení a výpočetní lingvistiky ve finanční ekonomii“, publikovaném v dubnu 2016, Lili Gao vysvětluje relevantní procesy specifické pro těžbu firemních podání SEC, výzev akcionářům a zpráv sociálních médií.
„Získávání smysluplných signálů z nestrukturovaných a vysokorozměrných textových dat není snadný úkol, “ píše Gao. „S vývojem strojového učení a výpočetních lingvistických technik lze však zpracovat a statisticky analyzovat úkoly textových dokumentů a mnoho aplikací statistické analýzy textu v sociálních vědách se ukázalo jako úspěšné.“ Z Gaoovy diskuse o modelování a kalibraci abstraktem ukazuje celý vyvinutý dokument, jak některé z těchto typů analýz fungují podrobně.
Mezi další zdroje aktivních projektů patří stránky jako je tento krátký projekt GitHub a tento zdroj IEEE hovoří konkrétně o získávání cenných finančních informací z „analýzy sentimentu Twitter“.
Pointa je, že použití těchto nových modelů NLP je hnací silou inovací při používání nejrůznějších textových dokumentů, a to nejen pro finanční analýzu, ale i pro jiné druhy špičkových objevů, které rozmazávají tradičně zavedenou hranici mezi „jazykem“ a "data."