Domov Zvuk Vložte analytiku všude: umožněte vědci s údaji o občanech

Vložte analytiku všude: umožněte vědci s údaji o občanech

Anonim

Od zaměstnanců Techopedia, 25. srpna 2016

Take away : Host Rebecca Jozwiak diskutuje s fenoménem vložených analytiků a vědců z oblasti občanských dat s Dr. Robinem Bloorem, Dezem Blanchfieldem a Davidem Sweenorem.

Chcete-li si prohlédnout toto video, musíte se zaregistrovat do této události. Chcete-li zobrazit video, zaregistrujte se.

Rebecca Jozwiak: Dámy a pánové, ahoj a vítejte v Hot Technologies. Dnes je naším tématem „Vložit všude: Umožnit zpracování údajů o občanech“. Vyplňuji váš obvyklý hostitel, tohle Rebecca Jozwiak vyplňuje Erica Kavanagha. Ano, tento rok je horký. Zejména termín „datový vědec“ si získal velkou pozornost, i když jsme je nazývali nudnými jmény jako „statistik“ nebo „analytický expert“, do značné míry se zabývají stejným typem činností, ale má sexy nové jméno a je to sbírat velkou pozornost. Jsou velmi žádoucí mít na pracovišti, prospěšné pro organizaci a každý to chce. Ale jsou: 1) drahé, 2) obtížné je najít. Víte, je to všude ve zprávách o nedostatku dovedností vědců v oboru dat, ano, ale přesto nabízejí organizaci nesmírnou hodnotu a lidé se trochu dožadují, aby zjistili, jak tuto hodnotu získat, aniž by museli klesat desetník, takže mluvit.

Dobrou zprávou však je, že vidíme nástroje a software, které tento nedostatek kompenzují. Máme automatizaci, strojové učení, vestavěnou analytiku, o čem se dnes budeme učit, a je to takový druh nového pojmu „občanský datový vědec“, a co to znamená? Ne, není to váš školený datový vědec, může to být váš obchodní uživatel, váš odborník na BI, někdo z IT, někdo, kdo má zázemí, ale nemusí to nutně být odborník. Ale to, co dělá, tyto nástroje a software, je to, že poskytuje více lidem přístup k těmto inteligentním řešením, i když nemusí znát hluboké kódování. Ale celkově to pomůže zlepšit výkon, když každému dáte trochu lepší přístup k analytickému myšlení. Nemusíte mít školení nutně mít typ zvědavosti, která může vést k dobrým vhledům pro vaši společnost.

Diskutujeme o tom, že s námi je dnes náš vlastní Robin Bloor, hlavní analytik skupiny Bloor Group, jeden ze nepolapitelných vědců v oblasti dat, který zavolal Dez Blanchfield, a poté máme Davida Sweenora ze společnosti Dell Statistica. A s tím to předám Robin Bloorovi.

Robin Boor: Dobře, díky za úvod. Přemýšlel jsem o tom v historickém kontextu. To, na co se vlastně díváme, je jeden z návrhů Leonarda da Vinciho pro nějaký kluzák, který by si muž mohl dát na záda. Nemám ponětí, zda by to ve skutečnosti fungovalo. Nemohl bych se do toho dostat, musím říct. Da Vinci, kdykoli ale přemýšlím o da Vinci, považuji ho za jednoho z nejvíce zvídavých a analytických lidí, jaký kdy existoval. A je zcela jasné, když se jen podíváte na ten kluzák, který je navržen na základě ptačího křídla, a on nějakým způsobem studoval lety ptáků, aby jej postavil.

Pokud vezmeme historický pohled - vlastně jsem to vzhlédl - analytika je možná nejstarší aplikací matematiky. Existují sčítání lidu, která sahají alespoň do babylonských dob. Víme o tom, protože v podstatě existují klínové tablety, které obsahují podobné údaje. Není známo, jestli se něco vrátilo dříve. Je zřejmé, že máte civilizaci s velkou populací lidí, ve skutečnosti to vyžaduje plánování a stojí za to vědět, co plánujete a jaké jsou požadavky těchto lidí.

A to je místo, kde to začalo a je to také místo, kde začalo pracovat na počítačích, protože první počítače, rané mechanické počítače, byly vlastně, myslím, že první bylo sčítání lidu vytvořené Hollerithem, které se podle mě stalo IBM. To vše se posunulo kupředu. Mezi 70. a současností došlo k určitému meziproduktu, kdy existuje velké množství dalších aplikací a analytiků, jak byste řekli, na zadním sedadle. Ano, probíhala analytika - děje se to ve velkých organizacích, zejména v bankách a pojišťovnách, a ve skutečnosti General Electric a telco a podobných věcech - ale nebyla obecně používána v podnikání a nyní se začíná běžně používat v celém podnikání. A to opravdu změnilo hru. První věc, o které jsem si myslel, že bych vás chtěl upozornit, je datová pyramida, která se mi obzvláště líbí. Tohle je, myslím, jeden z těchto 20 let - alespoň před 20 lety - abych se pokusil porozumět, opravdu, v té době jsem se snažil porozumět BI a některým dřívějším dolování dat, které se dělo. Zde jsem definoval myšlenku dat a příklady jsou signály, měření, záznamy, události, transakce, výpočty, agregace, jednotlivá informační místa. Možná je považujete za molekuly informací, ale jsou to individuální body. Jakmile se dostane do kontextu, stává se informací. Propojená data, strukturovaná data, databáze, vizualizace dat, plotry, schémata a ontologie - všechny se podle mého názoru považují za informace, protože to, co jste udělali, je shromáždit spoustu různých dohromady a vytvořit něco mnohem více než datový bod, něco, co má ve skutečnosti tvar, matematický tvar.

Nad tím máme znalosti. Můžeme se na základě prozkoumání informací naučit, že existují různé vzorce, a můžeme je využít pomocí formulací pravidel, zásad, pokynů, postupů a poté to má podobu znalostí. A téměř všechny počítačové programy, ať už dělají cokoli, jsou znalostmi druhu, protože pracují proti datům a uplatňují na ně pravidla. Máme tyto tři vrstvy a mezi vrstvami stále roste upřesnění. A na levé straně tohoto diagramu se zobrazují nová data zadávající, takže mnoho z těchto věcí je statických. Data se hromadí, hromadí se informace a potenciálně rostou znalosti. Nahoře máme „Porozumění“ a já bych tvrdil, i když je to filozofický argument, že porozumění spočívá pouze v lidských bytostech. Pokud se v tom mýlím, v určitém okamžiku budeme všichni nahrazeni počítači. Ale místo debaty půjdu na další snímek.

Když jsem se na to podíval, zajímavá věc, to je něco nového, bylo zajímavé zkusit zjistit, co vlastně analytika byla. Nakonec jsem nakreslil různé diagramy a skončil takovým, který vypadal takto: Ve skutečnosti jsem dospěl k závěru, že analytický vývoj je ve skutečnosti jen softwarový vývoj s velkým množstvím matematických vzorců. Analytické zkoumání se trochu liší od vývoje softwaru v tom smyslu, že byste skutečně vzali mnoho různých modelů a prozkoumali je, abyste získali nové znalosti o datech. Ale jakmile to vygenerujete, implementuje se to buď v tom, co považuji za podporu pasivního rozhodování, což jsou informace, které se uživateli právě dostávají; interaktivní podpora rozhodování, což jsou věci jako OLAP, kde je uživateli poskytnuta strukturovaná sada dat, která si mohou pomocí různých dostupných nástrojů prošetřit a odvodit věci pro sebe. Spousta vizualizace je taková. A pak máme automatizaci, pokud můžete změnit analytický pohled, který jste shromáždili, na soubor pravidel, která lze implementovat, nemusíte nutně potřebovat lidskou bytost, aby se zapojila. To je způsob, jakým jsem se na to díval, když jsem to všechno udělal. A začaly se mi objevovat různé věci. Jakmile se jedná o oblast činnosti, řekneme, že jakmile je doména dat skutečně těžena, důkladně těžena, důkladně prozkoumána všemi možnými směry, nakonec se stává pouze krystalizovanou BI. Znalosti, které jsou vynalezeny, se stávají znalostmi, které různými způsoby informují různé uživatele, a doufejme, že zvyšují jejich schopnost skutečně vykonávat práci, kterou vykonávají.

Jedna z věcí, které jsem si všiml, a já jsem se díval na prediktivní analytiku asi pět let, ale prediktivní analytika se stává BI, v tom smyslu, že se to jen proměňuje v užitečné informace, které se živí lidmi, a jak jsem již zdůraznil, existuje automatizované hlášení BI, BI explorativní, BI, velmi rozdílné gradace a prediktivní analytika skutečně probíhá ve všech třech směrech. A analytický proces, jak jsem zdůraznil, se neliší od vývoje softwaru, jen od různých lidí s mírně odlišnými dovednostmi. Předpokládám, že bych měl zdůraznit, že dovednosti potřebné k tomu, aby se vědec s opravdu dobrými údaji naučil, trvá roky. Nejsou snadno získatelní a neumí to mnoho lidí, ale je to proto, že zahrnuje porozumění matematice na velmi sofistikované úrovni, aby bylo možné vědět, co je platné a co není platné. Vývoj analytiků, objev nových poznatků, implantace analytiků, je to o tom, aby byly znalosti funkční. To je ten druh pozadí, které vidím v celé analytice. Je to obrovská oblast a je v ní mnoho, mnoho dimenzí, ale myslím si, že zobecnění platí pro všechno.

Pak dochází k narušení podnikání, jak jsem již zmínil, existuje řada organizací, farmaceutické společnosti jsou další, které mají ve své DNA analytiku. Ale existuje mnoho organizací, které to ve své DNA opravdu nemají, a nyní mají schopnost, nyní je software a hardware mnohem levnější, než tomu bylo dříve, nyní mají možnost ho využít. Řekl bych několik věcí. První věc je, že analytika je, v mnoha případech, výzkum a vývoj. Možná jen aplikujete analytiku na konkrétní oblast organizace a může se zdát obyčejné, že nějakým způsobem analyzujete zákaznické objednávky z různých perspektiv a spojujete je s jinými daty. Analytika však ve skutečnosti vytváří možnost podívat se na organizaci jako celek a do značné míry analyzovat každou konkrétní činnost, která se děje v rámci organizace a celé řetězce aktivit. Ale jakmile se do této oblasti skutečně přestěhujete, tvrdím, že je to výzkum a vývoj. A je tu otázka, na kterou jsem se několikrát zeptal: „Kolik by měla společnost utratit za analytiku?“ A myslím, že nejlepším způsobem, jak přemýšlet o poskytnutí odpovědi, je přemýšlet o analytice jako o výzkumu a vývoji. a zeptejte se: „Kolik byste utratili za výzkum a vývoj v oblasti efektivity podnikání?“

A podniky, které nejsou s analytiky, je spousta věcí, které nevědí. Nejprve neví, jak to udělat. Normálně, pokud vlastně jedou tak či onak přijmou analytiku v rámci organizace - nemají doopravdy jinou možnost, než jít do poradny, která jim v tom pomůže, protože pro většinu by to bylo nemožné nebo pro ně velmi obtížné podniky, které skutečně najmou datového vědce, najdou ho, zaplatí za něj a skutečně jim důvěřují, aby udělali to, co od nich chcete. Velmi obtížné. Většina podniků neví, jak najmout nebo vzdělávat zaměstnance, aby tuto práci skutečně vykonávali, a důvodem je prostě to, že to ještě není v jejich DNA, takže to není součástí jejich přirozených obchodních procesů. To se posune do dalšího bodu. Nevědí, jak z něj udělat obchodní proces. Nejlepší způsob, jak to udělat, mimochodem, je kopírovat to, co farmaceutické společnosti a pojišťovny, prostě podívat, a některé společnosti ve zdravotnickém centru, jen podívat na způsob, jak používají analytiky a kopírovat to. Protože se jedná o obchodní proces. Nevíte, jak to hlídat nebo auditovat. To opravdu, zvláště nyní, když hrozná spousta softwarových společností vytvořila produkty, které automatizují strašnou analytiku. Význam auditu je důležitý, pokud máte na místě poradenskou službu nebo někoho, komu lze důvěřovat, aby pochopili, jaké jsou výsledky jakéhokoli analytického výpočtu, je to druh volby, kterou musíte udělat, ale pokud do něj vložíte opravdu výkonné analytické nástroje rukou lidí, kteří nerozumí analytice, pravděpodobně skočí k závěrům, které nemusí být správné. A jak jsem řekl, společnosti nevědí, jak na to rozpočet.

To jsou příchutě analytiků, jen jimi projdu. Statistická analytika a statistické modelování se výrazně liší od prediktivní analýzy, z nichž většina mimochodem vyhovuje křivce. Strojové učení se liší od těch věcí, analytika cest a časové řady, které se v zásadě provádí na stavových proudech, se opět liší. Grafická analýza je opět jiná a textová a sémantická analýza se opět liší. To jen poukazuje na to, že se jedná o velmi multižánrovou věc. Není to tak, že nezačnete dělat analytiku, začnete se dívat na problémy, které máte, a hledat různé nástroje a různé chutě analytik, které jim budou vyhovovat. A konečně síť. Podle vývoje hardwaru a softwaru je podle mého názoru analytika v plenkách. Je toho ještě mnohem, mnohem více a v nadcházejících letech to uvidíme. Myslím, že teď můžu předat míč Dezovi.

Dez Blanchfield: Jo, promluvte o těžkém jednání, Robine. Chystám se navštívit toto téma krátce z jednoho z mých oblíbených úhlů, což je úhel člověka. V našem každodenním životě dochází k tolika změnám. Jedním z největších narušení v našem každodenním životě, podle mého názoru, je jen každodenní práce. Přišel jsem do práce a snažil jsem se dělat práci, kterou jsi najal, a rostoucí očekávání, že půjdeš od běžného člověka k superhrdině a množství informací, které tečou kolem organizací a vydávají velmi, velmi rychle, je to významná výzva a stále více musíme lidem poskytovat lepší a lepší nástroje, aby se dokázali vypořádat s tokem znalostí a informací, a tak jsem si myslel, že se k tomu pokusím z trochu zábavného úhlu . Ale vždy mi připadá, jak máme tuto vysokou mysl nebo flash moby a tak dále, které nás vedou k tomu, o čem mluvíme jako o analytice, ale o čem mluvíme, je zpřístupňování informací lidem a umožnit jim s tím komunikovat a dělat to tak, že je to přirozené a je to normální.

A ve skutečnosti mi to připomíná video YouTube o malém dítěti, malém dítěti, sedícím na podlaze a sedí tam, hraje se s iPadem a mává kolem, svírá a mačká a pohybuje se z obrázků a hraje s obrazovkou, data tam. A potom rodič odejme iPad a dá dětskému klínu časopis, tištěný časopis. A toto dítě pravděpodobně není starší dvou let. Dítě se začne snažit přejet prstem po obrazovce časopisu a štípnout a stlačit a časopis neodpovídá. Dítě zvedne svůj prst a dívá se na něj a myslí si: „Hmm, nemyslím si, že můj prst pracuje, “ a vrazí se do paží a myslí si: „Ne, můj prst pracuje, cítím paži a to vypadá dobře, “a kroutí prstem, prst se kroutí a reaguje. Ano. Potom se snaží znovu komunikovat s časopisem, a nízko a hle, neškrabává a nestlačuje a neposouvá. Pak si časopis odnesou a položí iPad zpět do klína a najednou to bude fungovat. A tak tady je dítě, které přišlo a bylo vyškoleno k používání analytického nástroje nebo nástroje pro živé streamování pro zábavu, a nemůže zjistit, jak by měl časopis fungovat a jak převrátit stránky.

A to je samo o sobě zajímavý koncept. Ale když přemýšlím o znalostech pohybujících se po organizacích a o tom, jak se data pohybují a jak se lidé chovají, často přemýšlím o tomto pojetí toho, co se lidé naučili být flash mob, což je událost, kde a které sociální média vytvářejí to je ještě snazší udělat, nápad jako takový, který jde na toto místo v tuto dobu a datum a akci, nebo video a naučit se tyto tance, nebo nosit tento barevný klobouk a směřovat na sever v jednu hodinu. A vystrčíte to z vaší sítě a vždy celá spousta lidí, stovky z nich, se objeví na stejném místě ve stejnou dobu a udělají totéž, a je tu tento faktor wow, jako například: „Svatá kráva, to bylo opravdu působivé! “Ale ve skutečnosti je to opravdu jednoduchý nápad a jednoduchý koncept, který se právě tlačí skrz naše sítě, a dostaneme tento výsledek, který je vizuálně ohromující a slyšitelně působivá věc. A když přemýšlíte o organizaci, o tom, jak chceme, aby se lidé chovali a jak chceme, aby jednali s informačními systémy a zákazníky, je to často tak jednoduché, je to myšlenka nebo koncept nebo kulturní nebo behaviorální rys, který se snažíme projít prostřednictvím a zmocněním pomocí nástrojů a informací.

A oporou všeho je tato mantra, kterou jsem měl po více než dvě a půl desetiletí, a pokud vaši zaměstnanci nemohou najít to, co potřebují pro svou práci, ať už jsou to nástroje nebo informace, vždy znovu vynalézou kolo. A teď je to stále se zvyšující výzva, kde máme spoustu znalostí a spoustu informací a věcí, které se pohybují velmi rychle, že chceme zastavit lidi, aby znovu objevovali kolo. A když přemýšlíme o našem pracovním prostředí, vracet se k lidskému úhlu, což je jeden z mých oblíbených, byl jsem ohromen, když jsme byli překvapeni, že kóje nebyly příznivým prostředím pro dobré výsledky, nebo jsme seřadili věci takhle strašlivé obrázky zde, a to se moc nezměnilo, jen spustil zdi a nazval je otevřené pracovní prostory. Uprostřed se žlutou smyčkou kolem nich si však dva lidé vyměňují znalosti. A přesto, když se podíváte na zbytek místnosti, všichni tam seděli poslušně a bili se tam, dávali informace na obrazovku. A častěji než ne, ve skutečnosti si nevyměňují znalosti a data, a existuje řada důvodů. Ale interakce uprostřed podlahy vlevo tam ve žlutém kruhu, jsou tam dva lidé, kteří tam chatují, vyměňují si znalosti a pravděpodobně se snaží něco najít a snaží se říct: „Víte, kde je tato zpráva, kde jsem dokáže tato data najít, jaký nástroj používám k tomu? “A pravděpodobně to nefungovalo, takže nemají nic a putovali napříč podlahou, porušili pravidlo kancelářských prostor skříně a dělali to osobně.

A v kanceláři jsme měli podobná prostředí, do kterých jsme si vtipně strkali zábavu, ale realita je taková, že jsou docela silní a efektivní. A jednou z mých oblíbených je mobilní nebo pevná analytická platforma zvaná vodní chladič, kde se tam lidé dostanou, chatují a vyměňují si znalosti, porovnávají nápady a provádějí analytiku, když stojí u vodního chladiče, vyměňují si nápady. Jsou to velmi silné koncepty, když o nich přemýšlíte. A pokud je můžete přeložit do svých systémů a nástrojů, získáte úžasný výsledek. A máme tu nejoblíbenější oblíbenou položku, což je v podstatě nejsilnější rozbočovač pro distribuci dat v kanceláři, jinak známý jako recepce. A pokud něco nenajdete, kam jdete? Dobře chodíte do přední části kanceláře a chodíte na recepci a říkáte: „Víte, kde x, y, z je?“ A dovoluji si někomu říct, že to neudělali alespoň jednou v novém práci nebo v určitém okamžiku, když prostě nemohou něco najít. A musíte se ptát sami sebe, proč tomu tak je? Mělo by to být někde na intranetu nebo nějakém nástroji nebo cokoli. To by mělo být snadné najít.

A pokud jde o data a analytiku a nástroje, které jsme našim zaměstnancům poskytli, aby vykonávali svou práci a způsob, jakým lidé interagují s úlohami, mám názor, že před nedávným vznikem analytických nástrojů a velkých datových platforem nebo „zpracování dat“ také nazýváme ve staré škole, vykazování a sdílení znalostí nebylo ani zdaleka dynamické nebo spolupracující či otevřené, a když přemýšlíte o typu systémů, od kterých očekáváme, že lidé budou dělat svou práci, měli jsme klasiku, co lidé nyní nazývají dědictví, ale realita je taková, že je to jen dědictví, které se stalo, a je to stále tady dnes, a proto to není opravdu dědictví. Ale tradiční HR systémy a ERP systémy - řízení lidských zdrojů, plánování podnikových zdrojů, správa podnikových dat a systémy, které používáme ke správě informací pro vedení společnosti. Je to vždy ticho. A od začátku, jednoduché platformy, jako jsou intranety oddělení, snaží se komunikovat, kde jsou věci a jak je získat a jak interagovat se znalostmi po celém místě. Vyskočili jsme to na náš intranet. Je to jen tak dobré, jako lidé, kteří se na to snaží dát čas a úsilí, jinak vám to prostě zůstane v hlavě. Nebo máte data, která sedí celou cestu na dně potravinového řetězce, v podnikových sítích SAN a vše mezi tím, takže sítě úložiště jsou plné souborů a dat, ale kdo ví, kde je najít.

Častěji než ne jsme vytvořili tyto uzavřené datové platformy nebo uzavřené systémy, a tak se lidé vrátili k podobným tabulkám a PowerPoints, aby předávali informace všude. Podle mého názoru se však nedávno odehrála zajímavá věc, a to, že mobilní zařízení a internet obecně fungují tak, že myšlenka, že by věci mohly být ve skutečnosti lepší. A hlavně ve spotřebitelském prostoru. A je zajímavé, že v každodenním životě jsme začali mít věci jako internetové bankovnictví. Nemuseli jsme fyzicky chodit do skutečné banky, abychom s nimi mohli komunikovat, mohli jsme to udělat telefonicky. Původně to bylo neohrabané, ale pak se objevil internet a my jsme měli web. Víte, a kolikrát jste v poslední době vlastně byli ve své bance? Vlastně to nemůžu, o tom jsem mluvil druhý den a vlastně si nepamatuji, kdy jsem naposledy šel do své banky, což mě docela šokovalo, myslel jsem si, že si to musím vybavit, ale bylo to tak dlouho Předtím si vlastně nemohu vzpomenout, když jsem tam šel. A nyní máme tyto gadgety v ruce ve formě mobilů a telefonů, tabletů a notebooků, máme sítě a přístup k nástrojům a systémům a ke spotřebitelskému prostoru jsme se dozvěděli, že věci mohou být lepší, ale protože o rychlé změně ve spotřebitelském prostoru, která byla letargičtější a ledovější změnou uvnitř podniku a prostředí, jsme tuto změnu nebrali vždy do běžného pracovního života.

A ráda se bavím tím, že nemůžete žít datové proudy v tištěné podobě. Na tomto obrázku je tu osoba sedící při pohledu na nějakou analytiku, která byla provedena, a je tu krásný graf, který vytvořil někdo, komu je pravděpodobně vypláceno hodně peněz jako statistik nebo pojistný matematik, a sedí tam a snaží se dělat analytika v tištěné podobě a strkající na to. Ale tady je pro mě děsivá věc: Například tito lidé v této zasedací místnosti, a já to použiju jako příklad, reagují na data, která jsou nyní historická. A je to tak staré, od kdy byla ta věc vyrobena a poté vytištěna, takže možná je to týdenní zpráva. Nyní rozhodují o ne tolika špatných datech, ale o starých datech, což mohou být vždy špatná data. Dnes se rozhodují na základě něčeho historického, což je opravdu špatné místo. Podařilo se nám tuto tištěnou kopii nahradit tabletem a telefonem, protože jsme ve spotřebitelském prostoru pracovali velmi rychle a nyní jsme pracovali v podnikovém prostoru, že reálný čas je vhled, je hodnota v reálném čase.

A v tom se zlepšujeme. A to mě přivádí k bodu, který Robin uvedl dříve, to byl koncept vědce s údaji o občanech a hnací silou tohoto pojmu. Podle mě je občanský datový vědec obyčejný člověk se správnými nástroji a informacemi o iPadu. Nemusejí dělat matematiku, nemusí znát algoritmy, nemusí vědět, jak aplikovat algoritmy a data pravidel, prostě musí vědět, jak používat rozhraní. A to mě přivádí zpět k mému úvodu a konceptu batole, který tam sedí s iPadem versus časopisem, versus iPadem. Batole se může velmi rychle, intuitivně naučit, jak používat rozhraní iPadu k ponoření do informací a interakci s nimi, i když možná hra nebo streamování médií nebo videa. Stejnou odezvu nebo interakci však nemohl získat z lišty časopisů a jednoduše blikající stránka za stránkou, což není příliš poutavé, zejména pokud jste batole vyrostlé s iPady. Lidské bytosti se vždy mohou velmi rychle dívat a učit se, jak řídit nástroje a věci, které jim poskytneme, a pokud jim poskytneme rozhraní, jako jsou mobilní zařízení a zejména tablety a smartphony, s dostatečně velkými obrazovkami, a zejména pokud můžete komunikovat je v kontaktu, s pohyby prstů, najednou získáte tento koncept vědce z oblasti občanských dat.

Někdo, kdo dokáže aplikovat vědu o údajích se správnými nástroji, ale aniž by musel vědět, jak to udělat. A podle mého názoru bylo mnoho z toho, jak jsem řekl, ovlivněno spotřebitelským vlivem, který se přeměnil a proměnil v poptávku a podnikání. Několik opravdu rychlých příkladů. My, mnozí z nás, bychom začali dělat věci s našimi blogy a weby, jako je například vkládání malých reklam nebo sledování sledování a pohybu, použili jsme nástroje jako Google Analytics a probudili jsme se, že v našich blogech a malých webech, mohli bychom tam dát malé kousky kódu a Google by nám poskytl v reálném čase informace o tom, kdo navštěvuje web, kdy a kde a jak. A v reálném čase jsme mohli vidět, jak lidé na web narazili, procházeli stránkami a poté zmizeli. A bylo to docela úžasné. Rád to dělám i nadále, když se snažím vysvětlit analytikům v reálném čase lidem, kteří to hloupě sleduji, abych jim ukázal web s připojeným Google Analytics a skutečně viděl živou interakci s lidmi, kteří web zasáhnou, a zeptal se jich: „Představte si, že měli jste v reálném čase takovéto poznatky o své firmě. “

Vezměme si příklad z oblasti maloobchodu a možná i farmaceutické, myslím, že tomu říkáte obchod s drogami v Americe, lékárna, kam chodíte a kupujete všechno od tabletů hlavy až po krém na slunci a klobouky. Pokus o spuštění této organizace bez informací v reálném čase je děsivý koncept, nyní víme, co víme. Můžete například měřit pěší provoz, můžete umístit zařízení kolem obchodu se smajlíkem na jedné straně obrazovky, protože jste šťastní, a nešťastnou červenou na pravé straně a některými různými odstíny uprostřed. A v dnešní době existuje platforma s názvem „Happy or Not“, ve které chodíš do obchodu a můžeš riskovat šťastnou tvář nebo smutnou tvář v závislosti na tvé zpětné vazbě od zákazníků. A to může být interaktivní v reálném čase. Můžete získat živé ceny na základě poptávky. Pokud je tam spousta lidí, můžete ceny trochu posunout nahoru a můžete udělat dostupnost akcií a například lidem říci - například letecké společnosti řeknou lidem, kolik míst je nyní na webu k dispozici, když "Zarezervujete si let, nemusíte se náhodně vytočit a doufáte, že se můžete obrátit a získat let." Živá data o lidských zdrojích vám umožní zjistit, kdy se lidé zapínají a vypínají. Obstarávání, pokud jste v zadávání veřejných zakázek a máte živá data, můžete dělat věci, jako je čekání na hodinu a zajištění proti ceně amerického dolaru, abyste si koupili své další zásoby a nechali se vytáhnout náklad věcí.

Když lidem Google Analytics ukážu a předávám tento druh anekdoty, tento okamžik eureka, tento okamžik „a-ha!“, Tato žárovka zmizí v jejich mysli jako: „Hmm, vidím spoustu míst, kde bych to mohl udělat . Kdybych měl nástroje a kdybych měl přístup k těmto znalostem. “A nyní to vidíme v sociálních médiích. Každý, kdo je důvtipným uživatelem sociálních médií, jen že jen ukazuje své snídaně, má tendenci se dívat na to, kolik lidí se jim líbí a kolik provozu získávají a kolik přátel získávají, a dělají to s pomocí líbí se, řekněme, Twitter jako analytický nástroj. Chcete-li tento nástroj použít, můžete jít na Twitter.com, ale píšete do dotykového combou Twitteru Google Analytics nebo kliknete na pravé horní tlačítko a rozbalíte nabídku a uděláte to. Dostanete tyto pěkné živé grafy, které vám řeknou, kolik tweety, které děláte sami a kolik interakcí s nimi. A analytiku v reálném čase jen na vašich osobních sociálních médiích. Představte si, že jsme měli rádi Google Analytics a Facebook a LinkedIn a Twitter, statistiky eBay přicházely na vás, ale ve vašem pracovním prostředí.

Nyní máme na dosah ruky živý druh webu a mobilu, stává se konceptem moci. A to mě přitahuje k mému závěru, a to je to, že jsem vždy zjistil, že organizace, které využívají nástroje a technologie brzy, získají tak významnou výhodu oproti svým konkurentům, že konkurenti ve skutečnosti nikdy dohoní. A nyní to vidíme v konfliktu s vědcem občanských dat. Dokážeme-li vzít lidi s dovednostmi, znalostmi, pro které jsme je najali, a můžeme jim dát ty správné nástroje, zejména schopnost vidět data v reálném čase a objevovat data a vědět, kde je, aniž by museli chodit po kóji a zeptejte se nahlas, musíte jít a postavit se na vodní chladič, abyste provedli nějakou srovnávací analýzu s lidmi, nebo jít a zeptejte se recepce, kde je index. Pokud to dokážou na dosah ruky a mohou si je vzít na schůzku s nimi a sedět v zasedací místnosti a pohybovat se obrazovkami v reálném čase namísto tištěné kopie, najednou jsme zmocnili naše zaměstnance, kteří nepotřebují být skuteční vědci s údaji, ale ve skutečnosti používat vědu s údaji a vést úžasné výsledky pro organizace. A myslím si, že tento bod zvratu, který jsme vlastně prošli nyní, když je spotřebitel tlačen do podnikání, je výzvou, jak tento podnik poskytneme, a to je téma, o kterém myslím, že dnešní diskuse. A s tím se chystám zabalit svůj kus a předat, abych uslyšel, jak bychom to mohli vyřešit. Davide, k tobě.

David Sweenor: Dobře, moc vám děkuji kluci a děkuji Robinovi. Víš, Robine, souhlasím s tvým původním hodnocením. Analytický proces se neliší od vývoje softwaru. Myslím, že výzva v organizaci je opravdu, víte, možná věci nejsou tak dobře definované, možná je v nich explorativní komponenta a kreativní komponenta. A Dezi, víš, souhlasím s tebou, je tu hodně znovuobjevování volantu, a víš, není tu organizace, do které dneska chodím, ptáš se, dobře, proč to děláš takhle? Proč podnik běží tímto způsobem? A je snadné se ptát a mnohokrát, když jste v organizaci, je těžké se změnit. Miluji analogii, konzumaci věcí. A tak už ne, když jdu na letiště a chci změnit své místo - dělám to na svém mobilu. Nemusím jít nahoru k agentovi u stánku a sledovat, jak tento agent něco zadává na monochromatickém monitoru po dobu 15 minut, abych změnil přiřazení svého místa. Raději to dělám na mém telefonu, takže je to zajímavý vývoj.

Dnes budeme mluvit trochu o kolektivní inteligenci. Pro ty, kteří si to neuvědomují, je Statistica špičkovou analytickou platformou, která funguje již více než 30 let. Pokud se podíváte na některou z publikací v analytickém průmyslu, vždy vychází na špičce jako jeden z nejintuitivnějších a snadno použitelných softwarových balíčků pro analytické účely. Posledních několik let jsme tedy strávili prací na koncepci nazvané kolektivní inteligence a posunuli jsme ji na další úroveň. Chtěl jsem zahájit tuto konverzaci: jak se ve vaší organizaci provádí práce?

A tady jsou dva obrázky. Ten vlevo je obrázek z šedesátých let a svou kariéru jsem nezačal v šedesátých letech, ale obrázek vpravo je - v polovodičové továrně jsem začal pracovat. A pracoval jsem v té černé budově, černá střecha v levém horním rohu. Ale oni dělali polovodičové věci. Toto je nedávný obrázek ze služby Obrázky Google. Ale když se vrátíte k obrázku šedesátých let vlevo, je to velmi zajímavé. Tyhle lidi sedí v řadě a oni dělají, víte, integrované obvody a polovodiče. Existuje však standardizace, existuje standardní způsob, jak věci dělat, a byl zde dobře definovaný proces. Víte, možná protože tito lidé sedí v otevřeném prostředí, možná došlo k nějaké spolupráci. Myslím, že jsme to trochu ztratili ve znalostní pracovní síle.

Když jsem v té budově vlevo nahoře seděl, když jsem s někým chtěl spolupracovat, nebylo to otevřené. Byly tam tyto kanceláře, možná někteří z týmu byli vzdálení, nebo možná jsem musel trekat přes tento školní areál; bylo to 25 minut chůze a musel bych si promluvit s někým v budově na pravé straně. Myslím, že jsme na cestě něco ztratili. A tak, víte, měl jsem stejnou myšlenku, proč lidé - kolik lidí stále znovu objevuje kolo ve vaší organizaci? Myslím, že víte, organizace jako celek odvedly dobrou práci v 90. a 2000. letech s CRM a skladováním dat a do určité míry BI. Z nějakého důvodu analytika trochu zaostávala. Do skladování dat a do standardizace a normalizace vašich dat, a to vše a do CRM, došlo k významným investicím, ale analytika z nějakého důvodu zaostávala. A já přemýšlím proč. Možná existuje kreativita - možná váš proces není dobře definován, možná nevíte, jaké rozhodnutí nebo páku se snažíte ve svém podnikání změnit, víte, ve věci změnit. Když dnes chodíme do organizací, existuje mnoho lidí, kteří dělají věci velmi ručně v tabulkách.

A víte, dnes ráno jsem se podíval na stat, myslím, že to říká, že 80, 90 procent tabulek má chyby, a některé z nich mohou být velmi významné. Stejně jako ten ve Whale, kde JPMorgan Chase ztratil miliardy a miliardy dolarů kvůli chybám v tabulkách. Takže mám předpoklad, že musí existovat lepší způsob, jak věci udělat. A jak jsme se zmínili, máme tyto vědce. Tito kluci jsou drahé a těžko je najdou. A někdy jsou trochu zvláštní kachna. Ale myslím, že víte, kdybych měl shrnout, co je vědec údajů, je to pravděpodobně někdo, kdo chápe data. Myslím, že je to někdo, kdo rozumí matematice, někdo, kdo chápe problém. A opravdu, někdo, kdo dokáže sdělit výsledky. A pokud jste vědec v oblasti dat, máte v současné době velké štěstí, protože váš plat se v posledních letech pravděpodobně zdvojnásobil.

Ale pravdou je, že mnoho organizací nemá tyto vědce, ale vaše organizace má chytré lidi. Máte organizaci, máte spoustu chytrých lidí a používají tabulky. Víte, statistika a matematika nejsou jejich primární úlohou, ale používají data k tomu, aby podnikali vpřed. Opravdu, výzvou, kterou se zabýváme, je, jak se máte, pokud máte štěstí, že máte datového vědce nebo statistika nebo dva, jak je můžete vzít a jak můžete zlepšit spolupráci mezi těmito lidmi a další jednotlivci ve vaší organizaci? Pokud se podíváme na strukturu naší organizace, začnu a půjdu zprava doleva. A vím, že je to pozpátku, ale máme tu řadu firemních uživatelů.

Toto je většina vaší populace znalostních pracovníků a pro tyto lidi musíte vložit analytiku do svých obchodních aplikací. Možná vidí analytický výstup na obrazovce call centra nebo tak něco a říká jim další nejlepší nabídku, kterou zákazníkovi dá. Možná je to spotřebitel nebo dodavatel na webovém portálu a okamžitě jim dává úvěr nebo podobné věci. Ale myšlenka je, že spotřebovávají analytiku. Pokud půjdeme doprostřed, jedná se o tyto znalostní pracovníky. Toto jsou lidé, kteří dnes dělají věci s tabulkami, ale tabulky jsou náchylné k chybám a v určitém okamžiku jim dojde plyn. Tito vědci s údaji o občanech, jak jim říkáme, víte, to, co se jim snažíme udělat, je skutečně zvýšit úroveň automatizace.

A s analytikou uslyšíte, že 80 až 90 procent práce je v přípravě dat a nejde o skutečnou matematiku, ale o přípravu dat. Snažíme se to zautomatizovat, ať už to děláte, a máme čaroděje a šablony a opakovaně použitelné věci a opravdu nemusíte znát základní infrastrukturu ve vašem prostředí. A když se podíváme na zcela vlevo, máme tyto vědce. A jak jsem zmínil, jsou v nedostatku. A to, co se snažíme udělat, aby byly produktivnější, je umožnit jim vytvářet věci, které mohou tito vědci v oblasti občanských dat dělat. Přemýšlejte o tom jako o bloku Lego, takže tito vědci mohou vytvořit opakovaně použitelné aktivum, které může občanský vědec použít. Postavte to jednou, takže nemusíme neustále objevovat kolo.

A pak se také tito kluci mohou obávat, jestli dokážeme dělat věci v databázi a využívat stávající investice do technologií, které vaše společnost provedla. Víš, v dnešní době nemá smysl zamíchat data do celého světa. Když se podíváme na Statistiku, jak jsem se zmínil, jedná se o platformu, která byla už docela dlouho. A je to velmi inovativní produkt. Míchání dat, neexistuje zdroj dat, ke kterému nemáme přístup. Máme vše, co byste očekávali od zjišťování a vizualizace dat; můžeme to udělat v reálném čase. A pravděpodobně to má - myslím, že v softwarovém nástroji existuje více než 16 000 analytických funkcí, takže je to více matematické, než jsem kdy dokázal použít nebo porozumět, ale je to tam, pokud to potřebujete.

Máme schopnost kombinovat jak obchodní pravidla, tak analytické pracovní postupy, abychom skutečně učinili obchodní rozhodnutí. Jdeš za pouhý, tady je algoritmus, tady je pracovní postup, ale máš obchodní pravidla, se kterými se vždy musíš vypořádat. Jsme velmi bezpeční ve správě věcí veřejných. Jsme zvyklí na mnoho farmaceutických klientů, v nichž nám FDA důvěřuje. Víš, jen důkaz v pudinku, že máme kontroly a schopnost auditu, aby jimi byli akceptováni. A konečně, víte, jsme otevřeni, flexibilní a rozšiřitelní, takže musíte vytvořit platformu, která znamená, že chcete, aby vaši vědci v oblasti dat byli produktivní, chcete, aby vaši vědci v oblasti datových dat byli produktivní, chcete být schopni nasadit tyto analytické výstupy pracovníkům ve vaší organizaci.

Když se na to podíváme, zde je příklad některých vizualizací. Ale být schopen distribuovat svůj analytický výstup podnikovým uživatelům, takže prvním příkladem vlevo je síťový analytický diagram. A možná jste vyšetřovatelem podvodů a nevíte, jak jsou tato propojení vytvořena, a to mohou být lidé, mohou to být entity, mohou to být smlouvy, cokoli opravdu. Ale můžete to s myší manipulovat a komunikovat s ní tak, abyste to opravdu pochopili - pokud jste vyšetřovatel podvodů, abyste pochopili seznam priorit, kdo se má vyšetřovat, správně, protože nemůžete s každým mluvit, takže máte upřednostňovat.

Podíváme-li se na obrázek na pravé straně, je to pro prediktivní panel údržby velmi zajímavý problém. Možná jste vlastníkem letiště a máte tam tyto tělové skenery. Tyto skenery těla, pokud jdete na letiště, tam jsou některé komponenty, které mají asi devítiměsíční trvanlivost. A tyto věci jsou opravdu, opravdu drahé. Pokud mám na svém letišti více vstupních bodů, více skenerů, číslo jedna, chci se ujistit, že jsem na každém z bran správně osazen, a u částí, které jsou ve skenerech, nechci je také objednávat brzy, a já je chci mít, než se zhroutí. Máme schopnost, možná pokud vlastníte letiště, být schopni předvídat, kdy se tyto věci rozbijí, a předvídat personální úroveň.

Podíváme-li se na pravou dolní část, je to tak, pokud jste ve výrobním prostředí, jedná se pouze o grafické znázornění výrobního toku. A je to trochu těžké vidět, ale v těchto různých procesních sektorech jsou červená a zelená semafory, takže pokud jsem inženýr, jde tam velmi sofistikovaná matematika, ale v tomto konkrétním procesním sektoru mohu vrtat a podívat se na parametry a vstup, který může způsobit, že to bude mimo kontrolu. Podíváme-li se na našeho vědce s údaji o občanech, naším cílem je ve skutečnosti usnadnit vědci s údaji o občanech. Máme průvodce a šablony a jednu věc, která je podle mě opravdu zajímavá, je, že máme tento automatizovaný uzel kontroly stavu dat. A opravdu, co to dělá, má vestavěné chytré telefony.

Zmínil jsem se o přípravě dat - zabere to značné množství času, a to jak v agregaci, tak v přípravě. Předpokládejme však, že mám svá data, dokážu je projít tímto uzlem kontroly stavu dat a zkontroluje stálost a rozptýlení a odlehlé hodnoty a všechny tyto věci vyplní chybějící hodnoty a udělá spoustu matematiky, kterou nemám Nerozumím, takže mohu buď přijmout výchozí nastavení, nebo pokud jsem trochu chytřejší, mohu je změnit. Jde ale o to, že chceme tento proces automatizovat. Tato věc provádí asi 15 různých kontrol a výstupů na očištěné datové sadě. Děláme to proto, abychom lidem usnadnili vytváření těchto pracovních postupů.

To je místo, kde mluvíme o spolupráci mezi vědci údajů a vědci občanských dat. Pokud se podíváme na tyto obrázky vpravo, vidíme tento pracovní postup přípravy dat. A možná je to velmi sofistikované, možná je to tajná omáčka vaší společnosti, nevím, ale víme, že někdo ve vaší organizaci má přístup k jednomu nebo více z těchto datových sil, které máme. Potřebujeme způsob, jak to udělat, číslo jedna, chytit je a spojit je dohromady, a číslo dva, možná existuje speciální zpracování, které chceme udělat, že je to mimo naši kontrolu stavu dat, a to je tajná omáčka vaší společnosti. Tento pracovní postup mohu vytvořit v naší organizaci a zhroutí se jako uzel. Vidíte šipku směřující dolů, je to jen uzel a v organizaci můžeme mít sto těchto věcí. Myšlenka je, že máme lidi, kteří něco vědí o určitém prostoru, mohou vytvořit pracovní postup a někdo jiný to může znovu použít. Snažíme se minimalizovat obnovu kola.

A to samé můžeme udělat s analytickými pracovními postupy. V tomto případě napravo, v tomto pracovním postupu, možná existuje 15 různých algoritmů a já chci vybrat ten nejlepší pro daný úkol. A nemusím jako občanský vědec s údaji rozumět tomu, co se děje v tom pavučině, ale prostě se zhroutí do uzlu a možná ten uzel jednoduše řekne: „vypočítat skóre úvěrového rizika.“ „Vypočítat šanci infekce chirurgického místa, “co máte. "Vypočítejte pravděpodobnost, že se jedná o podvodnou transakci." Jako vědec v oblasti občanských dat mohu použít tuto velmi sofistikovanou matematiku, kterou vytvořil někdo jiný, možná jeden z těchto vědců v databázi vytvořil v mé organizaci.

Z pohledu datové vědy, víte, mluvil jsem s vědci, kteří milují psaní kódu, a mluvil jsem s vědci, kteří nenávidí psaní kódu. A to je v pořádku, takže máme velmi vizuální grafické uživatelské rozhraní. Můžeme chytit naše data, můžeme provést automatickou kontrolu stavu dat a možná chci napsat kód. Líbí se mi Python, líbí se mi R, ale myšlenka je, že tito vědci mají nedostatek a kód se jim líbí v určitém jazyce. Nemáme zvlášť přednost v tom, v jakém jazyce chcete kódovat, takže pokud chcete dělat R, do R; pokud chcete udělat Python, udělejte Python. To je skvělé. Pokud chcete roztrhnout svou analytiku na Azure, roztrhněte svou analytiku do cloudu. Cílem tedy je opravdu nabídnout flexibilitu a možnosti, aby vaši vědci s údaji byli co nejproduktivnější.

Nyní vědci v oblasti dat, jsou to docela chytrí lidé, ale možná nejsou odborníky na všechno a možná existují určité mezery v tom, co mohou dělat. A pokud se podíváte ven z oboru, existuje tam spousta různých analytických tržišť, která tam existují. Toto je příklad, možná musím udělat rozpoznávání obrázků a nemám tu dovednost, dobře možná chodím do Algoritmie a získám algoritmus rozpoznávání obrázků. Možná chodím do Apervity a získám velmi speciální algoritmus zdravotní péče. Možná bych chtěl něco použít v knihovně Azure machine learning. Možná chci něco použít v nativní platformě Statistica.

Opět platí, že zde chceme využít globální analytickou komunitu. Protože ve svých čtyřech stěnách nebudete mít všechny dovednosti, tak jak můžeme vytvořit software - a to je to, co děláme -, které umožňuje vašim vědcům dat používat algoritmy z různých trhů. Dělali jsme to dlouho s R a Pythonem, ale to se rozšiřuje i na tyto trhy aplikací, které tam venku existují. A to samé, co zde vidíte nahoře, používáme na Spark H2O, takže tam je spousta analytických algoritmů. Nemusíte se soustředit na jejich vytváření od nuly, využijme je znovu, co žijí v komunitě open source, a chceme, aby tito lidé byli co nejproduktivnější.

Dalším krokem poté, co budeme mít naše občany a vědce s údaji, je to, jak propagujete a distribuujete tyto osvědčené postupy? V našem softwaru máme technologii, která vám umožňuje distribuovat analytiku kdekoli. A to je spíš pohled na správu modelů, ale už nejsem vázán čtyřmi stěnami nebo konkrétní instalací v Tulse nebo na Tchaj-wanu či v Kalifornii, nebo co máte. Jedná se o celosvětovou platformu a máme mnoho, mnoho zákazníků, které jsou nasazeny při používání několika webů.

A tak opravdu jsou klíčové věci, pokud děláte něco na Tchaj-wanu a chcete ho replikovat v Brazílii, to je skvělé. Jděte tam, uchopte opakovaně použitelné šablony, uchopte požadované pracovní postupy. To se pokouší vytvořit tyto standardy a běžný způsob, jak dělat věci, takže neděláme věci úplně jinak. A další klíčovou součástí tohoto je, že opravdu chceme vzít matematiku tam, kde data žijí. Nemusíte zamíchat data mezi, víte, mezi Kalifornie a Tulsou a Tchaj-wanem a Brazílií. Máme technologii, která nám umožňuje vzít matematiku k datům, a budeme mít další webové vysílání Hot Technology na toto téma.

Ale nazýváme tuto architekturu a tady je plíživý pohled, nativní architektura distribuované analýzy. Klíčovou myšlenkou je, že máme platformu Statistica a já mohu exportovat analytický pracovní postup jako atom. A mohl bych udělat model nebo celý pracovní postup, takže na tom nezáleží. Ale mohu to vytvořit a exportovat do jazyka vhodného pro cílovou platformu. Na levé straně toho mnoho lidí dělá, ale dělají bodování ve zdrojovém systému. To je v pořádku, můžeme udělat bodování a můžeme udělat modelování v databázi, takže je to zajímavé.

A na pravé straně máme Boomi. To je doprovodná technologie, se všemi z nich pracujeme. Můžeme však také vzít tyto pracovní postupy a v podstatě je přepravit kamkoli na světě. Cokoli, co má IP adresu. A nemusím mít nainstalovanou Statistiku ve veřejném nebo soukromém cloudu. Cokoli, co může spustit JVM, můžeme tyto analytické pracovní postupy, pracovní postupy přípravy dat nebo jen modely spustit na kterékoli z těchto cílových platforem. Ať už je to v mém veřejném nebo soukromém cloudu, ať už je to v mém traktoru, mém autě, mém domě, mé žárovce, mém internetu věcí, máme technologii, která vám umožní přepravit tyto pracovní postupy kdekoli na světě.

Pojďme si to zopakovat. Víte, máme řadu firemních uživatelů, takže tito lidé, máme technologii, která jim umožňuje spotřebovat výstup ve formátu, který jim vyhovuje. Máme vědce s údaji o občanech a to, co se snažíme udělat, je zlepšit spolupráci, učinit je součástí týmu, že? A tak chceme, aby lidé přestali znovuobjevovat kolo. A máme tyto datové vědce, může tam být mezera v dovednostech, ale mohou kódovat v jazyce, který chtějí, mohou jít na analytická tržiště a používat tam algoritmy. A tak s tím, jak si nemůžete myslet, že s tím je všechno úžasné? To je perfektní, to je to, co děláme. Vytváříme opakovaně použitelné pracovní postupy, dáváme lidem pokyny, dáváme jim bloky Lego, aby mohli stavět tyto mocné hrady a cokoli chtějí. Abychom to shrnuli, máme platformu, která posiluje řadu podnikových uživatelů, vědců z oblasti občanských dat, vědců z programátorských dat, máme - můžeme se zabývat jakýmkoli případem použití analytických hran IoT a umožňujeme tento pojem kolektivní inteligence. S tím si myslím, že to pravděpodobně otevřeme pro otázky.

Robin Bloor: No dobře. Myslím, že první - mám na mysli, abych byl upřímný, myslím tím, že jsem byl dříve informován společností Dell Statistica, a abych byl upřímný, jsem vlastně docela překvapen věcmi, které jsem nevěděl, že jsi vyvedl v prezentaci . A musím říci, že jedna věc, to je něco, co pro mě bylo v rámci adopce analytiky bugbear, je to, že víte, jak získat nástroje, že? Tam je strašně mnoho nástrojů, jsou tam open source nástroje, a tak dále a tak dále, a tam jsou různé, co bych volal, semi-platformy. Ale myslím, že rozdíl, který máte, byl jsem ohromen některými z pracovního postupu.

Rozdíl je v tom, že se zdá, že poskytujete jeden od druhého. Je to jako analytika je sofistikovaný obchodní proces, který začíná získáváním dat, a poté prochází celou řadou kroků, v závislosti na tom, jak jsou data šupinatá, a pak se může rozvětvovat v celé řadě různých matematických útoků na data. A pak se výsledky objeví tak či onak a ty musí být činy. Existuje obrovské množství analytik, na které jsem narazil, kde bylo provedeno mnoho skvělých prací, ale nedá se to nijak uvést do činnosti. A zdá se, že máte strašně mnoho toho, co je potřeba. Nevím, jak komplexní je, ale je to mnohem komplexnější, než jsem čekal. Jsem na to neuvěřitelně ohromen.

Chtěl bych, abys komentoval tabulky. Už jste něco řekli, ale jedna z věcí, které jsem si všiml, a kterou jsem si všiml v průběhu let, ale je to stále více zřejmé, je to, že existuje strašně mnoho tabulek, které jsou stínovými systémy, a opravdu si myslím, tabulky, myslím, že to byl skvělý nástroj, když byl představen a od té doby to bylo úžasné mnoha různými způsoby, ale je to zobecněný nástroj, není to opravdu vhodné pro daný účel. V kontextu BI to rozhodně není dobré a myslím si, že v analytickém kontextu je to hrozné. A já jsem přemýšlel, jestli máte nějaký komentář, řekněme, příklady, kde, jak víte, Statistica vypláchla, nadměrné použití tabulky nebo jakýkoli komentář, který byste k tomu chtěli napsat?

David Sweenor: Jo, myslím, že, víte, můžete se podívat na slavné tabulkové chyby. Google nebo jakýkoli vyhledávač, který používáte, se vrátí s litanií výsledků. Nemyslím si, že víte, někdy nahradíme tabulky. To není náš záměr, ale spousta organizací, ke kterým chodím, existuje několik těchto tabulkových průvodců nebo ninjů nebo cokoli, čemu chcete říkat, ale mají tyto velmi sofistikované tabulky a musíte si myslet, co se stane, když tyto lidé vyhrají loto a nevrátí se? A tak se snažíme dělat, že víme, že budou existovat tabulky, abychom je mohli přijímat, ale myslím, že to, co se snažíme udělat, je vytvořit vizuální reprezentaci vašeho pracovního postupu, aby ji bylo možné pochopit a sdílet s ostatními lidmi. . Tabulky jsou docela těžké, docela těžké je sdílet. A jakmile mi předáte svou tabulku, změnil jsem ji a nyní jsme mimo synchronizaci a dostáváme různé odpovědi. To, co se snažíme udělat, je dát nějaké zábradlí kolem a učinit věci trochu efektivnější. A tabulky opravdu hrozné kombinují více datových sad dohromady, víte? Tam padají. Ale nebudeme je nahrazovat, přijímáme je a máme lidi, kteří se začínají posouvat, protože pokud máme uzel, který říká „vypočítat riziko“, to se snaží osoba používající tabulku. Takže ty jsou pryč.

Robin Bloor: Ano, řekl bych, že víte, z jednoho pohledu, který se dívám na věci, řekl bych, že tabulky jsou skvělé pro vytváření informací. Jsou dokonce skvělé pro vytváření ostrovů znalostí, ale jsou opravdu špatné pro sdílení znalostí. Nemají k tomu žádný mechanismus a pokud někomu předáte tabulku, není to jako byste si ji mohli přečíst, jako by to byl článek, který přesně vysvětlil, co dělají. To prostě není. Myslím, že víte, na věc, která mě na prezentaci a statistické schopnosti nejvíc zaujala, se zdá být neuvěřitelně agnostická. Ale toto vlákno běží skrz pracovní postup. Mám pravdu v předpokladu, že byste se mohli podívat na end-to-end workflow přímo naproti, od sběru dat až po vkládání výsledků do konkrétních BI aplikací nebo dokonce spouštění aplikací?

David Sweenor: Ano, absolutně. A má takovou schopnost end-to-end a některé organizace to využívají zcela a já jsem v žádné iluzi, že žádná společnost v těchto dnech nekoupí všechno od jednoho dodavatele. Máme mix. Někteří lidé používají statistiku pro všechno a někteří ji používají pro pracovní postupy modelování, jiní ji používají pro pracovní postupy přípravy dat. Někteří lidé jej používají k distribuci stovek technických zpráv pro inženýry. A tak mezi tím máme všechno. A je to opravdu end-to-end a je to, víš, agnostická platforma, v tom, že pokud existují algoritmy, které chcete použít v R nebo Pythonu, Azure, Apervitě, ať už je používáte, cokoli, jak víte. To je skvělé, buďte produktivní, používejte to, co víte, používejte to, co vám vyhovuje, a máme mechanismy, abychom zajistili, že jsou kontrolovány a auditovatelné a všechny takové věci.

Robin Bloor: Obzvláště se mi tento aspekt líbí. Chci říct, že nevím, jestli můžete mluvit nad rámec toho, co jste řekl bohatství toho, co je tam venku. Myslím, že jsem se na to podíval, ale na to jsem se komplexně nedíval a určitě je v našich knihovnách obrovské množství Pythonových knihoven, ale existuje něco, co můžete k tomuto obrázku přidat? Protože si myslím, že je to velmi zajímavá věc, víte, že byste měli komponenty, které byly důvěryhodné, protože jste znali různé lidi, kteří je vytvořili, a různé lidi, kteří je používali, které byste si mohli stáhnout. Víte, můžete obohatit to, co jste o tom už řekli?

David Sweenor: Jo, myslím, že některá tržiště s aplikacemi, víš, tržiště s algoritmy jsou tam. Například, víte, Dr. John Cromwell na University of Iowa, vyvinul model, který bude předpovídat, který se používá v reálném čase, zatímco my jsme operováni, vám dá skóre, pokud se chystáte získat infekce chirurgického místa. A pokud je toto skóre dost vysoké, podniknou zásah přímo v operačním sále. To je velmi zajímavé. Takže možná existuje další nemocnice, která není tak velká. Apervita je analytický trh se zdravotními aplikacemi. Jeden můžete najít na mnoha těchto trzích s aplikacemi, můžete najít jeden a znovu je použít, a transakce je mezi vámi a kýmkoli, kdo vlastní, ale můžete buď najít jednoho, nebo můžete říct: „Tady je to, co potřebuji. “Myslím, že využívá tuto globální komunitu, protože v těchto dnech je každý odborník a vy nemůžete vědět všechno. Myslím, že R a Python jsou jedna věc, ale tato myšlenka: „Chci vykonávat tuto funkci, dát tam nějakou specializaci na jedno z těchto míst na trhu s aplikacemi a nechat někoho, aby to pro vás vyvinul.“ A oni to mohou zpeněžit, myslím si to je velmi zajímavé a velmi odlišné od čistě open source modelu.

Robin Bloor: Dobře. Každopádně předám míč Dezovi. Chtěli byste se ponořit, Dez?

Dez Blanchfield: Rozhodně a ráda bych zůstala v tabulce jen na okamžik, protože si myslím, že zachytila ​​pravou podstatu toho, o čem tu mluvíme. A udělal jsi poznámku, Robine, s ohledem na přechod od jakési staré tabulky v jejich fyzické podobě k elektronické formě. Udělali jsme zajímavou věc, kde, jak víte, když tabulky byly původně věc, byly to jen listy papíru s řádky a sloupci a ty byste ručně psali věci, pak byste je mohli projít a spočítat je, buď provedením je to z hlavy nebo s jiným zařízením. Stále však máme příležitost nechat chyby zasáhnout chybami rukopisu nebo dyslexií a nyní jsme je nahradili překlepy. Riziko je, že u tabulek je rizikový profil rychlejší a větší, ale myslím si, že nástroje jako Statistica invertují pyramidu rizika.

Tento obrázek často kreslím na tabuli postavy lidské bytosti nahoře nahoře, jako jedna osoba, a poté je jejich sbírka dole, řekněme, představte si jich deset na dně této tabule a nakreslím pyramida kde bod pyramidy je u jediné osoby a úpatí pyramidy je sbírka lidí. Používám to k vizualizaci myšlenky, že pokud jedna osoba nahoře udělá tabulku, udělá chybu a sdílí ji s deseti lidmi, a nyní máme deset kopií chyby. Buďte velmi opatrní s makry a buďte velmi opatrní s Visual Basic, pokud se chystáte přejít na to. Protože když vytváříme elektronické nástroje, jako jsou tabulky, je to velmi silné, ale také dobré a špatné.

Myslím, že nástroje jako Statistica přinášejí schopnost invertovat tento rizikový profil, a to je to, že se nyní můžete dostat do bodu, kdy máte spoustu nástrojů, které jsou jednotlivci k dispozici, a jak vycházejí z mnoha nástrojů v horní části pyramida a potom až na dno, kde bod pyramidy, která je nyní obrácena, je skutečným nástrojem, pokud máme tým lidí, kteří tyto nástroje a tyto algoritmy vytvářejí. A datový vědec nemusí být specialistou na regresní analýzu svých dat. Mohli by být schopni tento nástroj použít, ale možná byste měli mít pět nebo šest statistiků a pojistného matematika a datového vědce a několik matematiků pracujících na tomto nástroji, modulu, algoritmu, plug-inu a podobně v tabulkovém procesoru, takže Představte si, že každá publikovaná tabulka, kterou byste mohli použít, byla ve skutečnosti napsána odborníky, kteří testovali makra, testovali Visual Basic, zajistili, aby algoritmy fungovaly, takže když jste to dostali, mohli byste do nich pouze vložit data, ale nemohli jste je vlastně rozbít a proto bylo lepší kontrolovat.

Myslím, že to dělá hodně analytických nástrojů. Hádám, že až k tomu dojde, vidíte, že nyní v terénu vidíte přechod od tabulek, které by potenciálně mohly tlačit chyby a chyby a rizika, do bodu, kdy nástroje, které stavíte s vašimi Platformy nyní, kdy je vyhledávání dat přesné v reálném čase a lidé, kteří vytvářejí moduly a algoritmy, odstraňují nebo snižují tento rizikový profil? Vidí to zákaznický servis ve skutečném smyslu, nebo si myslíte, že se to děje a že si to neuvědomují?

David Sweenor: Víš, myslím, že existuje několik způsobů, jak na to odpovědět. Ale to, co vidíme, je, v jakékoli organizaci, a zmínil jsem se, že analytika si myslím, že možná zaostávala z pohledu podnikových investic, jaké jsme udělali s datovým skladováním a CRM. Ale to, co vidíme, tak to vyžaduje hodně změnit organizaci, překonat tu organizační setrvačnost. Ale to, co vidíme, jsou lidé, kteří berou své tabulky, berou své pracovní postupy, a zmínil jsem se o bezpečnosti a správě: „No, možná mám tabulku, “ „No, můžu to zamknout a mohu to ovládat verzí.“ A vidíme mnoho organizací, možná tam prostě začnou. A pokud se to změní, je tu pracovní postup a já skončím, ale číslo jedna, kdo to změnil? Proč to změnili. Když to změnili. A mohu také nastavit pracovní postup tak, že nebudu uvádět tuto novou tabulku do výroby, dokud nebude ověřena a ověřena jednou, dvěma, třemi, avšak mnoha stranami, které chcete definovat ve svém pracovním postupu. Myslím, že lidé začínají podnikat a organizace tam začínají podnikat kroky, ale pravděpodobně bych navrhl, že máme dlouhou cestu.

Dez Blanchfield: Opravdu a myslím, že vzhledem k tomu, že stavíte na jak bezpečnostních kontrolách, tak i správě, může pracovní vytížení to automaticky zmapovat a to vše až po hlavního rizikového důstojníka, což je nyní věc. Můžete začít ovládat, jak se k těmto nástrojům a systémům přistupuje a kdo s nimi dělá, co je s nimi, takže je to velmi silné. Myslím, že další věci, které z toho plynou, jsou, že typy nástrojů, které pro mě poskytujete, půjčují lidskému chování více než tradičním tabulkám, o nichž mluvíme, v tom, že pokud mám místnost plnou lidí se stejným dashboardem a přístupem ke stejným datům, že mohou ve skutečnosti získat jiný pohled, a v důsledku toho získat poněkud odlišné pohledy na stejné informace, které vyhovují jejich potřebám, aby mohli spolupracovat. Poté máme lidštější pohled a interakci s obchodem a rozhodovacím procesem, na rozdíl od toho, že všichni chodí na stejné setkání se stejným PowerPointem a vytištěny stejné tabulky, všechna stejná pevná data.

Vidíte přechod v chování a kultuře v organizacích, které si nyní vezmou své nástroje tam, kde vidí, že se to děje, kde to není jako pět lidí v místnosti, kteří se dívají na stejnou tabulku a snaží se ji pouze verbalizovat a dělat si poznámky, ale nyní vlastně interagují s dashboardy a nástroji v reálném čase, s vizualizací a analytikou na dosah ruky a získávají zcela jiný tok konverzace a interakce, nejen při jednáních, ale pouze při obecné spolupráci v rámci organizace? Protože to dokážou v reálném čase, protože mohou klást otázky a získat skutečnou odpověď. Je to trend, který právě vidíte, nebo se to ještě nestalo?

David Sweenor: Ne, myslím, že to určitě začalo touto cestou a myslím, že velmi zajímavá věc je, víte, pokud vezmeme například příklad továrny. Možná někdo, kdo vlastní konkrétní procesní proces v této továrně, chce vypadat a určitým způsobem s těmito daty pracovat. A možná i já, s výhledem na všechny procesy, možná tenhle dole, možná se na to chci podívat přes všechno. Myslím, že to, co vidíme, je číslo jedna, lidé začínají používat společnou sadu vizualizací nebo standardních vizualizací v rámci svých organizací, ale je to také přizpůsobeno roli, v níž jsou. Pokud jsem procesní inženýr, možná to je velmi odlišný pohled než někdo, kdo se na to dívá z pohledu dodavatelského řetězce, a myslím si, že je skvělý, protože musí být přizpůsoben a musí se na něj podívat objektivem, který potřebujete, abyste svou práci dokončili.

Dez Blanchfield: Myslím, že rozhodovací proces sestupuje, je časově a rychlejší, aby se také rychle a rychle zvýšila inteligentní a přesná rozhodnutí, že? Protože pokud máte analytiku v reálném čase, dashboardy v reálném čase, pokud máte nástroje Statistica na dosah ruky, nemusíte běžet napříč podlahou, abyste odešli a někoho požádat o něco, máte to v tištěné podobě. Můžete tak trochu spolupracovat, interagovat a skutečně se rozhodovat za běhu a okamžitě dosáhnout tohoto výsledku. Což si myslím, že některé společnosti doopravdy ještě nepochopily, ale když to udělají, bude to tento okamžik eureka, že ano, stále můžeme zůstat v našich kabinách a pracovat doma, ale můžeme interagovat a spolupracovat a tato rozhodnutí děláme, když spolupracujeme, okamžitě se proměňte ve výsledky. Podívej, myslím, že bylo fantastické slyšet, co musíš říct, a opravdu se těším, až uvidím, kam to jde. A vím, že v otázkách a odpovědích máme spoustu otázek, takže běžím zpět do Rebeccy, kde projdu některé z nich, abychom se k nim dostali tak rychle, jak jen můžete. Děkuji mnohokrát.

Rebecca Jozwiak: Díky Dezovi a jo Dave, máme od publika celkem pár otázek. A děkuji také Dezovi a Robinovi za vaše postřehy. Vím, že tento konkrétní účastník musel upustit hned v horní části hodiny, ale ona se ptá, vidíte, že oddělení informačních systémů spíše upřednostňují sofistikované kontroly dat, než aby byla pohodlná při poskytování nástrojů pro znalostní pracovníci? Myslím, je to - do toho.

David Sweenor: Jo, myslím, že to záleží na organizaci. Myslím, že banka, pojišťovací společnost, možná mají různé priority a způsoby, jak dělat věci, versus marketingová organizace. Myslím, že bych musel říct, že to záleží pouze na oboru a funkci, na kterou se díváte. Různá průmyslová odvětví mají různá zaměření a důraz.

Rebecca Jozwiak: Dobře, to dává smysl. A pak další účastník chtěl vědět, co je motor za Statistikou? Je to C ++ nebo vaše vlastní věci?

David Sweenor: No, nevím, jestli s tím dokážu být konkrétní, že to bylo asi 30 let a bylo vyvinuto před mým časem, ale existuje základní knihovna analytických algoritmů, které jsou spuštěny Statistica algoritmy. A vy jste zde viděli, že můžeme také provozovat R, můžeme provozovat Python, můžeme prasknout do Azure, můžeme běžet na Spark na H2O, takže myslím, že bych musel odpovědět na tuto otázku, pokud jde o, je to řada motorů. A v závislosti na tom, který algoritmus vyberete, pokud jde o statistiku, která běží takto, pokud vyberete jeden na H2O a Spark, použije to, a tak je to celá řada.

Rebecca Jozwiak: Dobře dobře. Jiný druh účastníka se zeptal konkrétně na tento snímek a chtěl vědět, jak, jak ví občanský datový vědec, jaké opakovaně použitelné šablony použít? A myslím, že z toho udělám širší otázku. Co vidíte, když přicházejí uživatelé firemních analytiků nebo obchodní analytici a chtějí tyto nástroje používat, jak je pro ně snadné vyzvednout se a běžet?

David Sweenor: Myslím, že bych na to odpověděl, a pokud můžete použít, pokud jste obeznámeni s Windows, jedná se o platformu se systémem Windows, takže jsem odřízl horní část těchto snímků obrazovky, ale má tu stuhu Windows. Jak ale mohou vědět, jaký pracovní postup použít? Vypadá to jako Průzkumník Windows, takže existuje stromová struktura a můžete ji nakonfigurovat a nastavit, avšak organizace ji chce nastavit. Mohlo by to však být, měli byste jen tyto složky a do těchto složek byste vložili tyto opakovaně použitelné šablony. A myslím, že existuje pravděpodobně nomenklatura, kterou by vaše společnost mohla přijmout, řekněme, že je zde „vypočítat rizikový profil“, zde je „získejte data z těchto zdrojů“ a pojmenujte je, co chcete. Je to pouze bezplatná složka, stačí si poznámky přetáhnout přímo na plátno. Takže, docela snadné.

Rebecca Jozwiak: Dobře dobře. Možná příště demo. Pak se objeví jiný druh účastníka, a to je to, o čem jste vy, Robin a Dez mluvili, pokud jde o nepřesnosti, zejména na tabulkovém procesoru, ale odpadky / odpadky ven a on to považuje za ještě kritičtější, když přijde do analytiky. Nezapomeňte, že, jak víte, zneužití dat může skutečně vést k nešťastným rozhodnutím. A přemýšlí o tom, jaké jsou vaše názory na vývoj dalších neúspěšných algoritmů, myslím, že používá slovo „nadměrné“ použití analytiky. Víte, někdo přichází, jsou opravdu nadšení, chtějí tyto pokročilé analytiky, chtějí tyto pokročilé algoritmy provozovat, ale možná si nejsou úplně jistí. Co tedy děláte, abyste se proti tomu nějakým způsobem chránili?

David Sweenor: Jo, takže myslím, že na to odpovím, jak nejlépe umím, ale myslím, že všechno přijde na lidi, proces a technologii. Máme technologii, která pomáhá lidem a pomáhá umožnit jakýkoli proces, který chcete uvést ve vaší organizaci. V příkladu odeslání kuponu někomu, možná to není tak kritické, a pokud je to digitální, není to opravdu žádná cena, možná je tu jedna úroveň bezpečnostních kontrol a možná nám to nebude záležet. Pokud předpovídám chirurgické infekce v místě chirurgického zákroku, možná chci být trochu opatrnější. Nebo pokud předpovídám kvalitu a bezpečnost léků a podobné věci, možná bych si na to měl být trochu opatrnější. Máte pravdu, odpadky / odpadky ven, takže to, co se snažíme udělat, je poskytnout platformu, která vám umožní přizpůsobit ji jakémukoli procesu, který vaše organizace chce přijmout.

Rebecca Jozwiak: Dobře dobře. Mám ještě pár otázek, ale vím, že jsme za hodinu prošli docela dost a chci našim moderátorům jen říct, to bylo úžasné. A chceme moc poděkovat Dave Sweenorovi ze společnosti Dell Statistica. Robin Bloor a Dez Blanchfield, samozřejmě, děkuji, že jste dnes analytici. Příští měsíc budeme mít další webové vysílání se společností Dell Statistica. Vím, že Dave trochu naznačil toto téma. Bude to o analytice na okraji, dalším fascinujícím tématu, a vím, že v tomto webcastu budou diskutovány některé velmi přesvědčivé případy použití. Pokud se vám líbilo to, co jste dnes viděli, vraťte se na další měsíc. A s tím, lidi, se sbohem rozloučím. Díky moc. Ahoj.

Vložte analytiku všude: umožněte vědci s údaji o občanech