Od zaměstnanců Techopedia, 22. září 2016
S sebou: Host Rebecca Jozwiak diskutuje o analytice hran s Dr. Robinem Bloorem, Dezem Blanchfieldem a Shawnem Rogersem ze společnosti Dell Statistica.
Momentálně nejste přihlášeni. Chcete-li zobrazit video, přihlaste se nebo se zaregistrujte.
Rebecca Jozwiak: Dámy a pánové, ahoj, vítejte v Hot Technologies roku 2016. Dnes máme „Edge Analytics: konečně IoT Economy“. Jmenuji se Rebecca Jozwiak. Budu vaším moderátorem dnešního webového vysílání. Pokud se chcete připojit ke konverzaci na Twitteru, provádíme tweet s hashtagem # HOTTECH16.
IoT, letos rozhodně žhavé téma a internet věcí, je to opravdu o strojních datech, senzorových datech, logovacích datech, datech zařízení. Žádný z nich není nový, měli jsme tento typ dat navždy, ale je to tak, že jsme je opravdu nemohli použít a nyní vidíme jen spoustu nových způsobů, jak tyto údaje používat. Zejména ve zdravotnickém průmyslu, na finančních trzích, s ropou a plynem, komoditami, je to jen nepřeberné množství informací. A ne mnoho lidí opravdu pochopilo, jak to udělat dobře. Mluvíme o spoustě malých dat, ale je to spousta dat a jak víte, jsou zde problémy se sítí, hardware, nebo je třeba ho zpracovat, a jak to děláte, aniž byste systém upchali? O tom se dnes budeme učit.
Tady je naše sestava odborníků. Máme Dr. Robina Bloora, našeho hlavního analytika The Bloor Group. Máme také Dez Blanchfielda, našeho datového vědce ve skupině The Bloor Group. Jsme rádi, že máme Shawn Rogers, ředitele globálního marketingu a kanálů společnosti Dell Statistica. A s tím přejdu míč Robinovi.
Dr. Robin Bloor: Dobře, děkuji vám za to. Stisknu tlačítko a vyhodím skluzavku. Nevím, proč jsem vytvořil tento apokalyptický obrázek pro internet věcí. Možná proto, že si myslím, že to nakonec nakonec bude chaotické. Pojedu rovnou. To je stejné jako u kurzu v jakékoli prezentaci IoT. Musíte tak či onak říct něco poburujícího o tom, kam všechno jde. A ve skutečnosti je většina z toho pravděpodobně pravda. Pokud se skutečně podíváte na to, jak se tyto křivky postupně rozšiřují. Víš, osobní počítače, chytré telefony a tablety pravděpodobně porostou. Chytré televizory pravděpodobně porostou. Nositelné, pravděpodobně explodují právě teď, ve srovnání s tím, co byli před několika lety. Propojená auta, nevyhnutelná, že téměř všechna auta budou spojena důkladně široká a důkladně přenášející data po celou dobu. A všechno ostatní. A tento konkrétní graf od BI Intelligence ukazuje, že všechno ostatní převáží zjevné věci velmi, velmi rychle.
Co tedy říci o internetu věcí? První věc je jen architektonický bod. Víte, když máte data a zpracováváte vás, tak či onak, musíte je dát dohromady. A s daty ve svazcích, které jsou nyní, a shromažďováním na různých místech, tyto dva už přirozeně nejsou spolu. Myslím, že bývali ve starých sálových dnech. Takže si můžete myslet, že existuje vrstva zpracování, transportní vrstva a vrstva dat. A tak či onak, transportní vrstva se dnes přesouvá na zpracování nebo přesouvá data kolem sítí. Zde jsou možnosti: Můžete přesunout data ke zpracování, můžete přesunout zpracování k datům, můžete přesunout zpracování a data do pohodlného bodu provedení, nebo můžete zpracovat a shardovat data. A pokud jde o internet věcí, data jsou při narození do značné míry již zastřižena a je pravděpodobné, že hrozná spousta zpracování bude shromážděna, aby mohly probíhat aplikace, které je třeba spouštět.
Takže jsem namaloval obrázek. Zajímavé pro mě je internet věcí, v tomto diagramu mluvím o agregační doméně a poukazuji na to, že existují subdomény. Takže si dokážete představit, že doména IoT 1 je autem nějakého druhu a doména 2 a doména 3 a doména 4 jsou auta nějakého druhu a místně agregujete data, na těchto datech budete spouštět místní aplikace a uvedete do činnosti různé věci. Abychom ale měli analytiku o všech vozech, budete muset přenášet data do centra, ne nutně všechna data, ale budete muset agregovat v centru. A pokud o tom přemýšlíte, možná budete chtít mít mnoho, mnoho různých agregačních domén se stejnou sadou věcí internetu věcí. A samotné domény se mohou dále agregovat. Takže byste mohli mít tuto opakující se hierarchii. A v podstatě to, co máme, je neuvěřitelně složitá síť. Mnohem složitější než cokoli předtím jsme museli mít.
Tady dole mám poznámku. Všechny síťové uzly, včetně listových uzlů, mohou být tvůrci dat, úložiště dat a body zpracování. A to vám dává možnost distribuce, jakou jsme dosud neviděli. Dez o tom bude mluvit trochu více, takže se budu k tomuto konkrétnímu bodu přesunout. Jakmile jsme na internetu věcí a všechna data se ve skutečnosti vyřešila jako události, je na tomto snímku pouze naznačeno, že budeme muset standardizovat události. Budeme to muset přinejmenším mít. Budeme mít čas, kdy k události došlo, její geografické umístění, virtuální nebo logické umístění procesu, který ji vytvořil, zdrojové zařízení, které ji vytvořilo, ID zařízení, takže přesně víte, které zdrojové zařízení je vytvořilo, vlastnictví dat a herců, těch lidí, kteří mají právo používat data nějakým způsobem nebo jiným způsobem, musí s sebou nést svá svolení, což znamená, že to opravdu bude muset nést bezpečnost, a pak je tu samotná data. A když se na to podíváte, uvědomíte si, že víte, i když máte senzor, který nedělá nic jiného než ohlašování teploty něčeho vteřiny, takže ve skutečnosti existuje spousta dat, aby bylo možné přesně určit, kde jsou data a co to vlastně je. Mimochodem, toto není vyčerpávající seznam.
Takže pokud jde o budoucí IT prostředí, způsob, jakým to vidím, je tento: že nejde jen o internet věcí, je zde také skutečnost, že se budeme ve světě činností zaměřených na události, a proto bude muset mít architektury založené na událostech a tyto architektury budou muset pokrývat velké sítě. A druhá věc je všechno v reálném čase, nutně pro nás není real-time, ale je tu něco, co nazývám business-time, což je čas, ve kterém je třeba data skutečně doručit a připravit ke zpracování. To nemusí být, víte, milisekundu po jejím vytvoření. Ale vždy existuje takový čas pro každý kus dat a jakmile máte architekturu řízenou událostmi, začne být rozumnější myslet z hlediska přístupu v reálném čase ke způsobu, jakým svět funguje.
Takže vroucí to, protože to, o čem skutečně mluvíme, je analytika na internetu věcí. Navzdory tomu všemu je stále ještě čas na nahlédnutí a není to jen čas na nahlédnutí, na nahlédnutí musí následovat akce. Takže čas na nahlédnutí a čas na akci je to, k čemu bych to vařil. Poté, co jsem to řekl, předám míč zpět Dezovi.
Dez Blanchfield: Děkuji, Robine. Insightful jako vždy. Miluji skutečnost, že je těžké jednat v každém případě, ale udělám, co bude v mých silách.
Jedna z věcí, které vidím, a často mě to baví, abych byl upřímný, a ne v nemotorné a negativní sklonené formě, ale je zde velké znepokojení a panika ohledně internetu věcí, které přebírají svět a sloting nás a začnete ztrácet data, takže se chci trochu podívat zpět na některé z věcí, které jsme udělali předtím v posledních dvou až třech dekádách, které byly blízkým faxem k internetu věcí, ale možná ne úplně ve stejném měřítku. A jen abychom si ukázali, že jsme tu vlastně byli a vyřešili jsme některé problémy, ne na této úrovni a ne touto rychlostí. Protože to znamená, že můžeme problém skutečně vyřešit a že víme, jaké jsou některé odpovědi; právě jsme se museli schovávat a znovu použít některá učení, která jsme měli předtím. A vím, že toto je celá konverzace, kterou se chystáme vést, a já mám celou řadu zábavných věcí, které si jen povídám v sekci Otázky a odpovědi.
Ale když přemýšlíme o internetu věcí v kruhu, v současné době existuje značná centralizace na úrovni designu, která byla napsána v prvních dnech. Například Fitbit zařízení mají tendenci chodit na jedno centrální místo a je pravděpodobné, že budou někde hostováni v cloudové platformě a všechna ta data ze všech těchto zařízení zasáhnou stejné, řekněme, přední konec zásobníku, včetně webu a aplikace a datové služby. V průběhu času však bude toto měřítko vyžadovat přepracování, aby se vypořádalo s množstvím dat, která na ně přicházejí, a přepracovají tak, že existuje více frontendů a více kopií zásobníku na více místech a regionech. A vidíme to a existuje řada příkladů, které vám dám, abychom mohli diskutovat.
Klíčovým bodem je to, že i když jsme viděli některá z těchto řešení, která se chystám pokrýt, rozsah a objem dat a síťový provoz, který internet věcí vytvoří, nutně vyžaduje přechod od centrálního distribuované architektury podle mého názoru, a my to víme, ale nemuseli jsme nutně pochopit, jaké řešení je. Když přemýšlíme o pojmu internet věcí, jedná se o rozsáhlý síťový model. Je to spousta věcí, které nyní vydávají hluk. Věci, které až donedávna nezaznamenaly hluk. A ve skutečnosti si myslím, že to bylo včera, vtipně jsem mluvil o zásobníku, ale šel jsem si koupit nový toustovač a přišel jsem s možností, která by mi mohla říct různé věci, včetně toho, kdy je třeba vyčistit. A nová mikrovlnná trouba s velmi podobnou funkcí a mohla dokonce ve skutečnosti pingovat aplikaci na mém telefonu a říci, že to, co jsem ohříval, bylo nyní hotovo. A velmi si myslím, že pokud se mnou pár věcí nechce mluvit, je to moje lednička, mikrovlnná trouba a toustovače. Jsem docela v pohodě, když jsou hloupá zařízení. Ale nedávno jsem dostal nové auto, trochu Audi, a to se mnou mluví a jsem z toho docela potěšen, protože věci, o kterých mluví, jsou zajímavé. Stejně jako aktualizace map v reálném čase, aby mi řekl, kde je lepší cesta, jak se dostat z bodu A do bodu B, protože je detekován provoz prostřednictvím různých mechanismů s daty, které dostane.
Mám tento snímek. Už jsme viděli, že velké síťové modely vyžadují přechod od centrálního k distribuovanému zachycování a doručování modelů zpracování a analýzy dat. Viděli jsme, jak se věci pohybují od tří malých grafových diagramů na pravém okraji, kde jsme se dostali, ten na levé straně ze tří, existuje centralizovaný model se všemi malými zařízeními přicházejícími do centrálního umístění a shromažďovat data a měřítko není tak skvělé, zvládnou se tam dobře. Uprostřed máme poněkud decentralizovanější model a rozbočovač a mluvili, což je myslím, že budeme potřebovat s internetem věcí v další generaci. A na pravé straně máme tuto plně distribuovanou a síťovanou síť, kde bude internet věcí a strojů mezi stroji v budoucnu jít velmi brzy, ale nejsme úplně tam z různých důvodů. A hlavně proto, že pro většinu komunikací zatím používáme internetové platformy a ve skutečnosti jsme nestavěli druhou síť, která by přenášela mnoho těchto dat.
Existují druhé sítě, které již existují, například síť Batelco. Mnoho lidí nemyslí na skutečnost, že telekomunikační sítě nejsou internet. Internet je v mnoha ohledech velmi samostatnou věcí. Směrují data ze smartphonů přes telefonní sítě a poté přes telefonní sítě a do internetu obecně, kde je vlastně vrstvují ve dvou sítích. Je však zcela možné a pravděpodobné, že internet věcí bude potřebovat jinou síť. O průmyslovém internetu mluvíme obecně jako o tématu, které nyní nebudeme podrobně rozebírat, ale v podstatě mluvíme o jiné síti, která je speciálně navržena pro typy přepravy dat nebo internetu věcí a stroj-stroj sdělení.
Ale některé z příkladů, které jsem chtěl sdílet, kde jsme viděli, jak velkoobjemové sítě a distribuovaná data fungují velmi dobře, jsou věci jako internet. Internet byl od prvního dne navržen a navržen tak, aby byl schopen přežít jadernou válku. Pokud jsou části USA vybuchnuty, byl internet navržen tak, aby se data mohla pohybovat po internetu bez ztráty paketů z důvodů, že jsme stále připojeni. A to stále existuje v celosvětovém měřítku. Internet má několik možností kolem redundance a směrování paketů. A ve skutečnosti je internet ovládán věcí zvanou BGP, Border Gateway Protocol a Border Gateway Protocol, BGP, je speciálně navržen tak, aby se vypořádal s vypnutým routerem nebo přepínačem nebo serverem. Pokud odesíláte nebo přijímáte e-maily, pokud posíláte tři e-maily v řadě, není zaručeno, že každý z těchto e-mailů bude sledovat stejnou cestu ke stejnému cílovému cíli. Mohou se pohybovat různými částmi internetu z různých důvodů. Mohlo by dojít k výpadku, mohly by existovat okna údržby, kde by se věci aktualizovaly offline, mohlo by dojít pouze k přetížení v síti, a vidíme, že s věcmi, jako jsou dopravní sítě s automobily a veřejnou dopravou a lodě a letadla. Obsah získáváme do našich zařízení, jako jsou naše notebooky a tablety a počítače, prostřednictvím prohlížečů atd. Každý den prostřednictvím sítí pro doručování obsahu. Sítě pro doručování obsahu jsou o pořizování kopií obsahu z vaší primární obslužné platformy, jako je webový server, a jeho přesunutí a mezipaměti v malém množství na okraj sítě a doručování pouze z nejbližší části okraje.
Anti-spam a kybernetická bezpečnost - pokud se v Kanadě odehraje spamová událost a Microsoft to zjistí a zjistí, že je spousta kopií stejného e-mailu zasílána skupině náhodných lidí, kontroluje se kontrolní součet, podpis této zprávy je vytvořen a vložen do sítě a okamžitě distribuován. A tak se e-mail nikdy nedostane do mé schránky, nebo pokud ano, okamžitě se označí jako spam, protože byl detekován někde jinde na okraji sítě. A tak se o tomto podpisu spamových zpráv vyprávějí další části okraje sítě, které se vkládají do indexu databáze a pokud se tyto zprávy začnou objevovat na druhé straně planety, detekujeme je a víme, že se jedná o spam. Totéž platí pro kybernetickou bezpečnost. Hack, který se odehrává na jedné straně planety, je detekován a registrován a mapován a najednou na druhé straně sítě můžeme bojovat a podat pravidla a zásady a změnit, abychom zjistili, zda ji můžeme zablokovat. Zejména s novým dopadem věcí jako je odmítnutí služby nebo distribuované odmítnutí služby, kde se tisíce strojů používají k útoku na centrální web.
Bitcoin a blockchain jsou ve výchozím nastavení ve své podstatě distribuovaná kniha, blockchain a vyrovná se s jakýmkoli výpadkem nebo zlomem v síti. Detekce a prevence podvodů, energetické a vodní rozvody - vidíme, znáte energetickou síť, pokud jedna část této sítě dostane stromovou půdu a vytáhne pól a drát, můj dům stále dostane energii. Ani o tom nevím, často to ve zprávách ani nevidím. A všichni jsme zvyklí na dopravní sítě, kde původně existoval centralizovaný model „Všechny silnice vedly do Říma“, jak se říká, a nakonec jsme museli jít k decentralizovanému modelu s rozbočovači a paprsky, a pak jsme šli do síťové sítě, kde se můžete dostat z jedné strany města na druhou prostřednictvím různých síťových tras a různých křižovatek. A tady vidíme, že tento centralizovaný model toho, co děláme nyní s internetem věcí, se bude muset tlačit na okraj sítě. A to platí pro analytiku více než kdy jindy, a proto musíme analytiku vytlačit ven do sítě. A to podle mého názoru vyžaduje zcela nový přístup k tomu, jak přistupujeme k těmto datům a jejich datovým tokům a zpracováváme je. Nyní mluvíme o scénáři, kdy se domnívám, že na zařízeních připojených k internetu je na hranici sítě vytlačena omezená inteligence, ale brzy uvidíme, jak tato zařízení zvyšují inteligenci a zvyšují úroveň analytiků, které chtějí dělat. A v důsledku toho budeme muset tyto inteligentní jednotky tlačit dále a dále přes síť.
Například inteligentní aplikace a sociální média - pokud uvažujeme o sociálních médiích a některých inteligentních aplikacích, jsou stále velmi ústřední. Víte, existují jen dvě nebo tři datová centra pro lidi jako Facebook. Google se stal mnohem decentralizovanější, ale stále existuje omezený počet datových center po celém světě. Když přemýšlíme o personalizaci obsahu, musíte přemýšlet na velmi místní úrovni. Hodně toho se děje v prohlížeči nebo na místní síťové vrstvě pro doručování obsahu. A přemýšlíme o zdravotních a kondičních sledovačech - spousta dat, která se od nich shromažďují, se místně analyzuje, a tak se nové verze zařízení Garmin a Fitbit, které si dáte na zápěstí, stávají inteligentnějšími a chytřejšími v zařízení . Nyní neposílají všechna data o vaší srdeční frekvenci zpět na centralizovaný server, aby se pokusili provést analýzu; staví tuto inteligenci přímo do zařízení. V automobilové navigaci bývalo, že auto by neustále získávalo aktualizace a mapy z centrálního místa, nyní jsou inteligentní vozy v autě a rozhodování o autě samo o sobě a nakonec se vozy zapíší. Vozy budou spolu mluvit prostřednictvím bezdrátových sítí nějaké podoby, která mohou být v příští generaci přes bezdrátovou síť 3G nebo 4G, ale nakonec to bude zařízení od zařízení. A jediný způsob, jak se s tímto objemem vyrovnat, je vylepšit zařízení.
Již máme nouzové varovné systémy, které budou shromažďovat informace lokálně a posílat je centrálně nebo do sítě a rozhodovat o tom, co se děje lokálně. Například v Japonsku existují aplikace, které lidé používají na svých smartphonech s akcelerometry v smartphonu. Akcelerometry v chytrém telefonu detekují vibrace a pohyb a mohou určit rozdíl mezi běžným každodenním pohybem a třesem a otřesy zemětřesení. A ten telefon vás začne varovat okamžitě, místně. Skutečná aplikace ví, že detekuje zemětřesení. Ale také sdílí tato data prostřednictvím sítě v distribuovaném rozbočovači a mluvila modelem, aby lidé ve vašem okolí byli varováni okamžitě nebo co nejdříve, jak data protékají sítí. A nakonec, když se dostane do centrálního umístění nebo do distribuované kopie centrálního umístění, tlačí se zpět k lidem, kteří nejsou v bezprostřední blízkosti, nezjistili pohyb planety, ale musí být o ní varováni, protože možná přichází tsunami.
A inteligentní městská infrastruktura - koncept inteligentní infrastruktury, již intelekt budujeme do inteligentních budov a inteligentní infrastruktury. Ve skutečnosti jsem včera zaparkoval své auto ve městě v nové oblasti, kde byla část města renovována a přestavěna. A znovu provedli všechny ulice, a v ulicích jsou senzory a skutečný parkovací automat ví, že když jsem vjel autem, ví to, že když se chystám osvěžit o dvouhodinový limit, auto se nepohybovalo a ve skutečnosti by mě to nedovolilo doplnit a zůstat další dvě hodiny. Musel jsem nastoupit do auta, vytáhnout z prostoru a pak zatáhnout zpět, abych ho podváděl, abych tam mohl zůstat další dvě hodiny. Ale zajímavé je, že nakonec jdeme do bodu, kdy nejde jen o detekci automobilu vstupujícího do oblasti jako lokalizovaného senzoru, ale o věci, jako jsou optické vlastnosti, kde bude rozpoznávání aplikováno u kamer při pohledu na mojí poznávací značku, a bude to vědět že jsem vlastně jen vytáhl a zatáhl dovnitř a oklamal to, a to mě prostě nedovolí obnovit a já půjdu dál. A pak bude distribuovat tato data a ujistit se, že to nemůžu dělat nikde jinde a trikovat síť průběžně také. Protože to musí, ze své podstaty, být chytřejší, jinak to všichni budeme bláznit.
Příkladem toho je, že jsem vlastně osobně žil tam, kde v technologii brány firewall, na konci 80. a na začátku 90. let, produkt s názvem Check Point FireWall-1. Velmi jednoduchá technologie brány firewall, kterou jsme používali k vytváření pravidel a vytváření zásad a pravidel týkajících se určitých věcí, které říkají, že typy provozu prostřednictvím určitých portů a IP adres a sítí, aby se dostaly k sobě a od sebe, webový provoz z jednoho místa na druhé od prohlížeče a klienta ke konci našeho serveru. Tento problém jsme vyřešili tak, že jsme logicky vyjmuli samotné brány firewall a skutečně je přesunuli do integrovaného obvodu specifického pro aplikaci ASIC. Bylo to ovládání portů v ethernetových přepínačích. Zjistili jsme, že serverové počítače, počítače, které jsme vlastně používali jako servery pro rozhodování jako firewally, nebyly dostatečně výkonné, aby zvládly objem provozu, který jimi prochází, pro každou malou kontrolu paketů. Tento problém jsme vyřešili přesunutím logiky potřebné k provedení kontroly paketů a detekce internetu do síťových přepínačů, které byly distribuovány a byly schopné zpracovat objem dat procházejících síťovou úrovní. S centralizovanými úrovněmi s firewally jsme si nedělali starosti, přesunuli jsme to k přepínačům.
A tak jsme měli výrobci, aby pro nás vytvořili schopnost tlačit cesty a pravidla a zásady do ethernetového přepínače tak, aby na skutečné úrovni ethernetového portu, a možná mnoho lidí v bazénu, toto nebylo obeznámeno, protože jsme všichni žijí nyní v bezdrátovém světě, ale jednou za čas se všechno muselo připojit přes Ethernet. Nyní na úrovni ethernetového portu jsme prováděli kontrolu paketů, abychom zjistili, zda se pakety dokonce mohly přesunout do přepínače a do sítě. Něco z toho je to, co nyní řešíme tuto výzvu, která spočívá v zachycování dat v síti, konkrétně ze zařízení IRT, jejich inspekci a analýze a pravděpodobně analýze v reálném čase, aby se o tom rozhodlo. A něco z toho je získat informace o obchodní inteligenci a informací o tom, jak lidé dělají lepší rozhodnutí a další analýzy a výkon pro věci na úrovni stroje, kde zařízení mluví se zařízeními a rozhodují se.
A to bude trend, který se musíme zabývat řešením v nejbližší budoucnosti, protože pokud to neuděláme, tak skončíme s touto záplavou hluku. A viděli jsme ve světě velkých dat, viděli jsme věci, jako se datová jezera proměňují v datové bažiny, které jsme nakonec skončili s hlukem, který jsme nezjistili, jak vyřešit analytiku zpracování v centralizovaném móda. Pokud nevyřešíme tento problém, podle mého názoru, s IoT okamžitě a získáme řešení platformy velmi rychle, skončíme na velmi, velmi špatném místě.
A v této souvislosti se budu blížit svému bodu, a to, že věřím, že jednou z největších změn ve velkém datovém a analytickém prostoru je nyní poháněna okamžitá potřeba reagovat na dopad internetu. věcí ve velkoobjemové a real-time analytice, v tom, že musíme přesunout analytiku ven do sítě a pak nakonec k okraji sítě, abychom se vypořádali s pouhým objemem, jen abychom ji zpracovali. A nakonec, doufejme, dáme inteligenci do sítě a na okraj sítě do rozbočovače a mluveného modelu, který můžeme skutečně spravovat a získat poznatky v reálném čase a získat z toho hodnotu. A s tím přejdu k našemu hostovi a uvidím, kam nás ta konverzace zavede.
Shawn Rogers: Děkuji vám. Tohle je Shawn Rogers ze společnosti Dell Statistica a chlapče, jen na začátek, naprosto souhlasím se všemi hlavními tématy, kterých se zde dotýkáme. A Rebecca, vyrazili jste s myšlenkou, že tato data nejsou nová, a je pro mě pozoruhodné, kolik času a energie je věnováno diskuzi o datech, datech, datech IoT. A je to rozhodně důležité, víte, Robin udělal dobrý bod, i když děláte něco opravdu jednoduchého a poklepáváte do termostatu jednou za sekundu, víte, děláte to 24 hodin denně a skutečně máte, víte, některé zajímavé datové výzvy. Ale nakonec víte - a myslím si, že mnoho lidí v tomto odvětví mluví o datech tímto způsobem - že to není opravdu všechno tak zajímavé a, podle Rebeccy, je to kolem dobrého, dlouhého času, ale v minulosti jsme to nedokázali dobře využít. A myslím si, že průmysl pokročilých analytiků a průmysl BI obecně začínají opravdu směřovat k IoT. A Dez, do vaší poslední věci, myslím, že je to část nebo jeden z náročných bodů velké oblasti dat, která je velmi pravdivá. Myslím, že všichni jsou velmi nadšeni z toho, co s tímto typem dat můžeme dělat, ale zároveň, pokud nedokážeme přijít na to, jak aplikovat vhled, podniknout kroky a, jak víte, získat analytiku tam, kde jsou data, myslím budeme mít výzvy, které lidé nevidí, jak se opravdu dostanou do cesty.
S tím bylo řečeno, že v pokročilém analytickém prostoru jsme velkými fanoušky toho, co si myslíme, že se může stát s daty IoT, zejména pokud na něj aplikujeme analytiku. A na tomto snímku je spousta informací a nechám každého, aby se jen honil a kloval kolem, ale pokud se podíváte na různá odvětví, jako je maloobchod mimo krajní pravici, vidí jejich příležitosti vznikající kolem toho, že mohou být více inovativní nebo mít nějaké Úspora nákladů nebo optimalizace nebo vylepšení procesů je velmi důležitá a vidí v tom mnoho případů použití. Pokud se podíváte, víte, zleva doprava přes snímek, uvidíte, jak si každé z těchto jednotlivých odvětví nárokuje nové schopnosti a nové možnosti rozlišování, když aplikují analytiku na internet věcí. A myslím si, že konečný výsledek je, že pokud se budete snažit jít touto cestou, musíte se nejen starat o data, jak jsme diskutovali, a architekturu, ale také se musíte podívat, jak nejlépe aplikovat na něj analytiku a tam, kde je třeba provést analýzu.
Pro mnoho z nás na dnešním hovoru, víte, Robin a já jsme se znali velmi dlouho a měli jsme nespočet rozhovorů o tradičních architekturách v minulosti, těch kolem centralizovaných databází nebo podnikových datových skladů atd., A jak Našli jsme v posledním desetiletí, takže děláme docela dobrou práci, když překračujeme omezení těchto infrastruktur. A nejsou tak vytrvalí nebo tak silní, jak bychom si přáli, aby dnes byli, aby podporovali všechny skvělé analytické údaje, které aplikujeme na informace a samozřejmě informace narušují také architekturu, víte, rychlost dat, objem dat atd. rozhodně napíná omezení některých našich tradičních přístupů a strategií k tomuto typu práce. A tak si myslím, že to začíná být výzvou k tomu, aby společnosti zaujaly agilnější a snad flexibilnější pohled na to, a to je část, myslím, rád bych o tom trochu mluvil kolem IoT.
Než to udělám, udělám chvilku, abych všechny nechal na telefonu, abych vám dal trochu pozadí o tom, co je Statistica a co děláme. Jak můžete vidět na názvu tohoto snímku, Statistica je prediktivní analytika, velká data a vizualizace pro platformu IoT. Samotný produkt je starší 30 let a my konkurujeme ostatním lídrům na trhu, se kterými jste pravděpodobně obeznámeni v tom smyslu, že dokážete aplikovat prediktivní analytiku, pokročilou analytiku na data. Viděli jsme příležitost rozšířit náš dosah tam, kde jsme vkládali naši analytiku, a chvíli jsme začali pracovat na některých technologiích, které nás poměrně dobře využily, abychom využili toho, o čem dnes mluvili Dez i Robin, což je tento nový přístup a kam hodláte dát analytiku a jak to spojíte s daty. Po této stránce přicházejí další věci, které musíte být schopni řešit s platformou, a jak jsem již zmínil, Statistica byla na trhu už dlouho. Jsme velmi dobří na straně prolnutí dat a myslím, že víte, dnes jsme příliš nemluvili o přístupu k datům, ale jsme schopni oslovit tyto rozmanité sítě a dostat vaše ruce na správná data na správný čas je pro koncového uživatele stále zajímavější a důležitější.
Nakonec zde přidám ještě jednu poznámku, protože Dez udělal dobrý přehled o samotných sítích, měl určitou úroveň kontroly a zabezpečení nad analytickými modely ve vašem prostředí a jak se připojují k datům, které se stávají velmi důležitými. Když jsem se dostal do tohoto odvětví před několika lety - myslím si téměř 20 - v tomto bodě - když jsme hovořili o pokročilé analytice, bylo to velmi kurátorské. Ruku na tom měla jen pár lidí v organizaci, nasadili ji a dali lidem odpověď podle potřeby nebo poskytli potřebné informace. To se opravdu mění a my vidíme mnoho lidí, kteří pracovali s jedním nebo více různorodými a flexibilnějšími způsoby, jak získat data, aplikovat na ně zabezpečení a správu a poté na nich spolupracovat. To jsou některé z důležitých věcí, na které se společnost Dell Statistica dívá.
Chci se však ponořit do tématu, které je o něco blíže k dnešnímu názvu, kterým je, jak bychom měli řešit data, která pocházejí z internetu, a co byste mohli chtít hledat, když hledáte jiná řešení. Snímek, který jsem teď před tebou vstal, je trochu tradičním pohledem a Dez i Robin se toho nějak dotkli, víš, tato myšlenka mluvit se senzorem, ať už jde o automobil, topinkovač nebo větrnou turbínu nebo co máte, a pak přesunete tato data ze zdroje dat napříč vaší sítí zpět do centralizované konfigurace, jak zmiňoval Dez. A to sítě docela dobře a mnoho společností se dostat do prostoru IoT původně začínají dělat s tímto modelem.
Druhou věcí, která přišla, když se podíváte na spodní část snímku, je tato myšlenka vzít jiné tradiční zdroje dat, rozšířit vaše data IoT a pak na tento druh jádra, ať už se vaše jádro stane datovým centrem nebo je může být v cloudu, nezáleží na tom, vzali byste produkt, jako je Statistica, a poté na něj aplikujte analytiku a poté poskytněte tyto informace spotřebitelům napravo. A myslím si, že v tomto bodě jsou sázky na stůl. To je něco, co musíte udělat, a musíte mít dostatečně otevřenou architekturu pro pokročilé analytické platformy a hovořit se všemi těmito, druhem, rozmanitými zdroji dat, všemi těmito senzory a všemi těmito různými cíli, kde máte data. A myslím si, že je to něco, co musíte udělat, a myslím si, že zjistíte, že je pravda, že mnoho lídrů na trhu je schopno dělat tyto věci. Tady ve Statistice o tom mluvíme jako o základní analytice. Jděte získat data, přenést data zpět do jádra, zpracovat je, přidat další data, pokud je to nutné nebo pokud je to výhodné, a provést svou analýzu a pak sdílet tyto informace pro akci nebo pro nahlédnutí.
A tak si myslím, že to určitě pochází z funkčního hlediska, pravděpodobně bychom všichni souhlasili s tím, že, víte, je to holá nutnost a každý to musí udělat. Tam, kde to začíná být zajímavé, je to, kde máte obrovské množství dat, víte, pocházející z různých zdrojů dat, jako jsou IoT senzory, jak jsem zmínil, ať už jde o auto nebo bezpečnostní kameru nebo výrobní proces, začíná se stát Výhoda spočívající v tom, že dokážeme provádět analytické analýzy tam, kde jsou data skutečně vytvářena. A výhodou pro většinu lidí, myslím, že když začneme přesouvat analytiku od jádra k hraně, je tato schopnost rozptýlit některé z datových problémů, které se dějí, a Dez a Robin se k tomu pravděpodobně vyjádří na konci dnes, ale myslím si, že musíte být schopni sledovat a podnikat kroky v oblasti dat na okraji, aby nebylo vždy nutné přesunout všechna tato data napříč vaší sítí. Robin o tom mluvil ve svých, jakousi, architektonických obrázcích, které vypracoval, kde máte všechny tyto různé zdroje, ale obvykle existuje nějaký agregační bod. Agregační bod, který často vidíme, je buď na úrovni senzoru, ale ještě častěji na úrovni brány. A tyto brány existují jako druh prostředníka v toku dat ze zdrojů dat, než se vrátíte do jádra.
Jednou z příležitostí, které společnost Dell Statistica využila, je to, že naše schopnost exportovat model z naší centralizované pokročilé analytické platformy, aby byla schopna vzít model a poté jej provést na okraji na jiné platformě, jako je brána nebo uvnitř databáze nebo co máte. A myslím si, že flexibilita, která nám dává, je tím, co je v dnešní konverzaci opravdu zajímavé, máte to dnes ve své infrastruktuře? Dokážete přesunout analytiku tam, kde data žijí, a prostě jen přesouvat data tam, kde žije vaše analytika? A to je něco, na co se Statistica dlouhodobě zaměřuje, a když se podíváte blíže na snímky, uvidíte, že tam je nějaká jiná technologie od naší sesterské společnosti, Dell Boomi. Dell Boomi je platforma pro integraci dat a integraci aplikací v cloudu a my vlastně využíváme Dell Boomi jako zařízení pro obchodování s lidmi k přesunu našich modelů z Dell Statistica, přes Boomi a off to edge equipment. A myslíme si, že se jedná o agilní přístup, který budou společnosti vyžadovat, stejně jako se jim líbí verze, kterou jsem vám ukázal před minutou, což je druh základní myšlenky přesunutí dat ze senzorů až zpět k centrum, zároveň budou společnosti chtít být schopny to udělat takovým způsobem, jak to zde naznačuji. A výhoda pro to je v některých bodech, které Robin a Dez učinili, což znamená, že se můžete rozhodnout a jednat rychlostí vašeho podnikání? Dokážete přesunout analytiku z jednoho místa na druhé a být schopni ušetřit čas, peníze a energii a složitost neustálého přesunu okrajových dat zpět do jádra.
Nyní jsem první, kdo řekl, že některá data na hraně budou mít vždy dostatečně vysokou hodnotu, kde by mělo smysl ukládat tato data a uchovávat je a přenést je zpět do vaší sítě, ale jaká analýza hran vám umožní je schopnost rozhodovat rychlostí, ke které se data skutečně dostávají, že? Že jste schopni aplikovat vhled a akci rychlostí, kde je nejvyšší možná hodnota. A myslím si, že to je něco, co budeme všichni hledat, pokud jde o využití pokročilých analytických a IoT dat, je tato příležitost k pohybu rychlostí podnikání nebo rychlostí, kterou zákazník požaduje. Myslím, že naše pozice je, že si myslím, že musíte být schopni dělat obojí. A myslím si, že velmi brzy a velmi rychle, protože více společností se dívá na rozmanitější soubory dat, zejména ty ze strany IoT, začnou se dívat na prodejní prostor a požadovat, co Statistica dokáže. Což je nasazení modelu v jádru, jak jsme již tradičně dělali mnoho let, nebo jeho nasazení na platformách, které jsou možná netradiční, jako je brána IoT, a aby skutečně dokázaly vyhodnocovat a aplikovat analytiku na data na okraji, jak se vytvářejí data. A myslím si, že právě tam přichází vzrušující část této konverzace. Protože díky tomu, že jsme schopni aplikovat analytiku na okraji v době, kdy data přicházejí ze senzoru, nám umožňuje jednat tak rychle, jak potřebujeme, ale také nám umožňuje rozhodnout se, musí tato data okamžitě jít zpět do jádra? Můžeme to dávkovat sem a poté poslat zpět na kousky a části a provést další analýzu později? A to je to, co vidíme mnoho našich předních zákazníků.
To, jak to dělá společnost Dell Statistica, je, že máme schopnost využívat, řekněme například například, že si v rámci Statistiky vybudujete neuronovou síť a chtěli byste neuronovou síť umístit někde jinde v datovém prostředí. Máme schopnost vydávat tyto modely a všechny jazyky, které jste si všimli v pravém rohu - Java, PPML, C a SQL atd., Zahrnujeme také Python a jsme schopni exportovat i naše skripty - a když přesunete tuto centralizovanou platformu z naší platformy, můžete tento model nebo algoritmus nasadit, kdekoli to budete potřebovat. A jak jsem již zmínil, používáme Dell Boomi, abychom jej umístili a zaparkovali tam, kde je potřebujeme spustit, a pak můžeme přinést výsledky zpět, nebo můžeme pomoci přivést data zpět, nebo vyhodnotit skóre a podniknout kroky pomocí našeho modulu pravidel . Všechny tyto věci se stávají jakousi důležitými, když se začneme dívat na tento typ dat a přemýšlíme znovu.
To je něco, co většina z vás v telefonu bude muset udělat, protože to bude velmi nákladné a zdanění ve vaší síti, jak zmínil Dez, přesouvat data zleva z těchto diagramů vpravo od těchto diagramů čas. Nezní to moc, ale viděli jsme výrobních zákazníků s deseti tisíci senzory v jejich továrnách. A pokud máte ve vaší továrně deset tisíc senzorů, i když právě děláte jeden druhýkrát druh testů nebo signálů, mluvíte o osmdesáti čtyřech tisících řádků dat z každého z těchto jednotlivých senzorů denně. A tak se data určitě hromadí a Robin to zmínil. Předem jsem zmínil několik odvětví, ve kterých vidíme lidi, jak se pomocí našeho softwaru a dat IoT dělají docela zajímavé věci: automatizace budov, energie, nástroje jsou opravdu důležitým prostorem. Vidíme hodně práce na optimalizaci systému, dokonce na zákaznickém servisu a samozřejmě na celkových provozech a údržbě, v energetických zařízeních a v budově pro automatizaci. A to jsou některé případy použití, které vidíme, jsou velmi silné.
Hádáme, že jsme už dříve prováděli okrajovou analytiku, tento termín byl vytvořen. Jak jsem zmínil, ve Statistice máme hluboké kořeny. Společnost byla založena téměř před 30 lety, takže jsme se zákazníci vrátili docela dlouho, kteří integrují data IoT s jejich analytikou a již nějakou dobu jsou. A Alliant Energy je jedním z našich případů použití nebo referenčních zákazníků. A dokážete si představit problém energetické společnosti s fyzickou rostlinou. Měřítko za cihlovými zdmi fyzického závodu je obtížné, a tak energetické společnosti jako Alliant hledají způsoby, jak optimalizovat svůj energetický výkon, v zásadě zlepšit svůj výrobní proces a optimalizovat jej na nejvyšší úroveň. A používají Statistiku k řízení pecí v jejich závodech. A pro všechny z nás, kteří se vracejí do našich raných dnů ve vědecké třídě, všichni víme, že pece vytvářejí teplo, teplo vytváří páru, turbíny se točí, dostáváme elektřinu. Problémem pro společnosti, jako je Alliant, je vlastně optimalizace toho, jak se věci zahřívají a hoří v těchto velkých cyklonových pecích. A optimalizace výstupu, aby se zabránilo dodatečným nákladům na znečištění, vytěsňování uhlíku atd. A tak musíte být schopni monitorovat vnitřek jedné z těchto cyklónových pecí se všemi těmito zařízeními, senzory a poté vzít všechna ta data senzorů a průběžně provádět změny energetického procesu. A to je přesně to, co Statistica dělá pro Alliant od roku 2007, ještě předtím, než byl termín IoT super populární.
Pokud jde o Rebeccovu věc brzy, data rozhodně nejsou nová. Schopnost jej zpracovat a správně používat je opravdu místem, kde se dějí vzrušující věci. Dnes jsme v předvolání trochu hovořili o zdravotní péči a my vidíme všechny druhy aplikací pro lidi, kteří dělají věci, jako je lepší péče o pacienty, preventivní údržba, řízení dodavatelského řetězce a provozní efektivita ve zdravotnictví. A to docela probíhá a existuje mnoho různých případů použití. Ten, na který jsme ve Statistice velmi hrdí, je u našeho zákazníka Shire Biopharmaceuticals. A Shire vyrábí speciální léky pro opravdu obtížně léčitelné nemoci. A když pro své zákazníky vytvoří dávku svého léku, je to nesmírně nákladný proces a tento velmi drahý proces také vyžaduje čas. Když přemýšlíte o výrobním procesu, jak vidíte, výzvy se sjednocují na všech datech, jsou dostatečně flexibilní napříč různými způsoby vkládání dat do systému, ověřují informace a pak jsou schopni předpovídat, jak pomáháme tomuto zákazníkovi. A procesy, které stahovaly většinu informací z našich výrobních systémů a samozřejmě zařízení a senzorů, které řídí tyto výrobní systémy. A je to skvělý případ využití toho, jak se společnosti vyhýbají ztrátám a optimalizují své výrobní procesy pomocí kombinace dat senzorů, dat IoT a pravidelných dat ze svých procesů.
Takže víte, dobrý příklad toho, kde výroba a zejména high-tech výroba prospívá zdravotnickému průmyslu kolem tohoto druhu práce a dat. Myslím, že mám jen pár dalších bodů, které bych chtěl udělat, než to zabalím a vrátím zpět Dezovi a Robinovi. Ale víte, myslím si, že tato myšlenka, že dokážete posunout analytiku kdekoli ve vašem prostředí, je pro většinu společností nesmírně důležitá. Být připoután k tradičnímu formátu dat ETL-ing ze zdrojů zpět do centrálních umístění bude mít vždy místo ve vaší strategii, ale neměl by to být vaše jediná strategie. Dnes musíte mnohem flexibilněji přistupovat k věcem. Abychom mohli použít zabezpečení, které jsem zmínil, vyhněte se zdanění vaší sítě, abyste mohli spravovat a filtrovat data tak, jak přicházejí od okraje, a určit, která data je třeba dlouhodobě uchovávat, jaká data stojí za přesun do naší sítě nebo jaká data je třeba analyzovat v době, kdy byla vytvořena, abychom mohli učinit co nejlepší rozhodnutí. Tento analytický přístup všude a kdekoli je něco, čemu se ve Statistice dostáváme k srdci, a je to něco, v čem jsme velmi zdatní. A to se vrací k jednomu z těch snímků, které jsem zmínil dříve, schopnosti exportovat vaše modely do různých jazyků, aby se mohly přizpůsobit a zarovnat s platformami, na nichž jsou data vytvářena. A pak samozřejmě mít distribuční zařízení pro tyto modely, což je také něco, co přinášíme ke stolu a že jsme velmi nadšení. Myslím, že dnešní rozhovor je, pokud opravdu budeme brát vážná data, která byla v našich systémech dlouhou dobu a rádi bychom našli konkurenční výhodu a inovativní úhel, abychom je mohli využívat, musíte použít některé technologie k tomu, že vám umožní dostat se od některých z těch omezujících modelů, které jsme použili v minulosti.
Opět mám na mysli, že pokud se chystáte udělat IoT, myslím, že musíte být schopni to udělat v jádru a přivést data a porovnat je s jinými daty a provést svou analýzu. Ale stejně tak důležitá nebo možná ještě důležitější je, že musíte mít tuto flexibilitu, abyste mohli dát analytikům data a přesunout analytiky z centrální strany vaší architektury na okraj pro výhody, které jsem zmínil. před. To je trochu o tom, kdo jsme a co děláme na trhu. A my jsme nadšení IoT velmi nadšení, myslíme si, že rozhodně přijde věk a všichni zde mají skvělé příležitosti ovlivnit své analytické a kritické procesy s tímto typem dat.
Rebecca Jozwiak: Shawne, díky moc, to byla opravdu fantastická prezentace. A vím, že Dez pravděpodobně chce položit pár otázek, takže Dez, nechám tě jít první.
Dez Blanchfield: Mám milion otázek, ale budu obsahovat sám sebe, protože vím, že bude mít i Robin. Jednou z věcí, které vidím široko daleko, je otázka, která vyvstává a já jsem opravdu ráda, abych získala vhled do vaší zkušenosti v této věci, protože jste přímo v srdci věcí. Organizace se s touto výzvou potýkají a vypadají, že si některé z nich právě přečetly podobnosti „Čtvrté průmyslové revoluce“ Klause Schwaba a poté došlo k panickému útoku. A ti, kteří nejsou s touto knihou obeznámeni, je to v podstatě pohled pánů, Klause Schwabe, o kterém si myslím, že je profesorem, který je z paměti zakladatelem a výkonným předsedou Světového ekonomického fóra, a kniha je v podstatě o celý tento všudypřítomný internet věcí exploze a některé dopady na svět obecně. Organizace, se kterými mluvím, si nejsou jisty, zda by měly jít a vybavit stávající prostředí nebo investovat vše do budování veškerého nového prostředí, infrastruktury a platforem. Také v nástroji Dell Statistica vidíte lidi, jak dodatečně vybavují stávající prostředí a nasazují vaši platformu do stávající infrastruktury, nebo vidíte, jak přesouvají své zaměření na budování veškeré nové infrastruktury a připravují se na tuto potopu?
Shawn Rogers: Víte, měli jsme příležitost sloužit oběma typům zákazníků a být na trhu, pokud máme, tyto příležitosti získáte tak, aby se široce rozšířily. Máme zákazníky, kteří v posledních několika letech vytvořili zcela nové závody a vybavili je daty senzorů, IoT, analytikou od začátku do konce, celým procesem. Musím však říci, že většina našich zákazníků jsou lidé, kteří tento druh práce již nějakou dobu pracují, ale byli nuceni tato data ignorovat. Víte, Rebecca udělala pravdu dopředu - toto nejsou nová data, tento typ informací byl po dlouhou dobu k dispozici v mnoha různých formátech, ale tam, kde byl problém, je připojení k němu, pohybovat to, přinést to někam, kde byste mohli udělat něco chytrého udělat s tím.
A tak bych řekl, že většina našich zákazníků se dívá na to, co mají dnes, a Dezi, už jste se zmínil o tom, že je to součást velké revoluce dat a myslím, že to, o co ve skutečnosti jde, je to o všem revoluce dat, že? Už nemusíme ignorovat určitá systémová data nebo výrobní data nebo data automatizace budov, nyní máme ty správné hračky a nástroje, abychom je dostali a pak s nimi udělali chytré věci. A myslím, že v tomto prostoru je spousta řidičů, kteří to dělají, a někteří z nich jsou technologičtí. Víte, řešení velkých datových infrastruktur, jako je Hadoop a další, pro některé z nás trochu zlevnily a trochu usnadnily přemýšlení o vytvoření datového jezera tohoto typu informací. A teď se rozhlížíme po podniku, aby šel: „Hej, máme ve výrobním procesu analytiku, ale mohli by být vylepšeni, kdybychom mohli z těchto procesů přidat nějaký náhled?“ A to je, myslím, co většina z naši zákazníci to dělají. Není to tolik vytváření od základů, ale rozšiřování a optimalizace analytiky, kterou již mají, s daty, která jsou pro ně nová.
Dez Blanchfield: Jo, v některých největších průmyslových odvětvích, které jsme viděli, přicházejí některé vzrušující věci, o kterých jste se zmínili, a energie a veřejné služby. Letectví právě prochází tímto rozmachem, kde jedno z mých nejoblíbenějších zařízení, o kterých pravidelně mluvím, Boeing 787 Dreamliner a určitě ekvivalent Airbusu, A330 šel stejnou cestou. Když bylo poprvé vydáno, bylo v 787 jako šest tisíc senzorů a myslím, že nyní mluví o patnácti tisících senzorech v nové verzi. A podivné na rozhovoru s některými lidmi, kteří jsou v tomto světě, bylo to, že myšlenka umístit senzory do křídel a tak dále, a úžasná věc kolem 787 v konstrukční platformě je, že víte, že objevili všechno v letadlo. Například jako křídla, když se letoun vzlétne, křídla se ohýbají až na dvanáct a půl metru. Ale v extrémech se křídla mohou ohýbat na špičce až 25 metrů. Tato věc vypadá jako mávání ptáků. Ale neměli čas se napravit, bylo inženýrství analytiky všech těchto dat, takže mají senzory, díky nimž LED diody blikají zeleně a červeně, pokud se stane něco špatného, ale ve skutečnosti neskončí hlubokým nahlédnutím do reálný čas. A také nevyřešili problém, jak posunout objem dat kolem, protože v domácím vzdušném prostoru v USA je denně 87 400 letů. Když každý letoun dohání svými odkupy 787 Dreamlinerů, jedná se o 43 petabajtů denně, protože tato letadla v současné době vytvářejí každý asi půl terabajtu dat. A když vynásobíte, že 87 400 letů denně na domácím trhu v USA bodem pět nebo půl terabajtu, skončíte s 43, 5 petabajtů dat. Fyzicky to nemůžeme pohnout. Takže podle návrhu musíme analytiku vytlačit do zařízení.
Ale jedna z věcí, která je zajímavá, když se podívám na tuto celou architekturu - a ráda vidím, co si o tom myslíte - je, že jsme se posunuli směrem ke správě kmenových dat, tak nějak, k prvním principům správy dat, tahání všechno do centrálního umístění. Máme datová jezera a poté vytvoříme malý datový rybník, pokud chcete, výpisy, z nichž děláme analytiku, ale distribucí na okraj, jedné z věcí, která neustále přichází, zejména od lidí databáze a správců dat nebo lidé v oblasti správy informací, co se stane, když mám spoustu distribuovaných malých miniaturních datových jezer? Jaké věci byly na toto myšlení aplikovány s ohledem na analytiku hran ve vašem řešení, v tom, že tradičně by všechno přicházelo centrálně s datovým jezerem, nyní končíme s těmito malými loužemi dat všude, i když můžeme provádějte na nich analýzy na místní úrovni, abyste získali místní informace, jaké jsou výzvy, kterým jste čelili a jak jste to vyřešili, když máte distribuovanou sadu dat, a zejména když získáte mikrokosmy datových jezer a distribuovaných oblastí?
Shawn Rogers: No, myslím, že to je jedna z výzev, že? Když odcházíme od, víte, přepravujete všechna data zpět do centra nebo do základního analytického příkladu, který jsem dal, a pak uděláme distribuovanou verzi, že skončíte se všemi těmito malými silami, že? Přesně tak, jak jsi viděl, že? Dělají trochu práce, některé analytiky běží, ale jak je přivedete zpět dohromady? A myslím si, že klíčem bude v tom vše orchestrace a myslím, že vy se mnou budete souhlasit, ale jsem šťastný, pokud ne, že si myslím, že tento vývoj sledujeme docela nějakou dobu.
Vrátíme se do dob našich přátel, pana Inmona a pana Kimball, kteří pomáhali všem s architekturou jejich dřívějších investic do datového skladu, s tím, že jsme se od tohoto centralizovaného modelu po dlouhou dobu vzdali. Přijali jsme tuto novou myšlenku umožnit datům prokázat jejich závažnost, kde by se nejlépe mělo nacházet ve vašem ekosystému, a sladit data s nejlepší možnou platformou pro dosažení nejlepšího možného výsledku. A my jsme začali trochu utrácet, myslím, více organizovaný přístup k našemu ekosystému jako zastřešující druh způsobu, jak dělat věci, jako je to, kde se snažíme sladit všechny tyto kousky najednou. Jaký typ analytiky nebo práce budu dělat s daty, jaký typ dat to je, to pomůže diktovat, kde by měla žít. Kde se vyrábí a jaký typ gravitace mají data?
Víte, vidíme mnoho těchto velkých datových příkladů, kde lidé mluví o tom, že mají datová jezera s 10 a 15 petabyty. Pokud máte datové jezero, které je tak velké, je pro vás velmi nepraktické ho přesunout, takže k němu musíte být schopni přivést analytiku. Ale když to uděláte, k jádru vaší otázky si myslím, že to přináší všem novým výzvu pro všechny, aby řídili prostředí a uplatňovali správu a bezpečnost, a pochopili, co je třeba s těmito daty udělat, aby je mohli spravovat a získejte z toho nejvyšší hodnotu. A abych byl upřímný k vám - rád bych slyšel váš názor zde - myslím, že jsme tam první dny a myslím, že je ještě třeba udělat spoustu dobré práce. Myslím, že programy jako Statistica se zaměřují na to, aby více lidí mělo přístup k datům. Rozhodně jsme se zaměřili na tyto nové persony, jako je občanský datový vědec, který chce nasměrovat prediktivní analýzu na místa v organizaci, která by předtím nebyla. A myslím, že to jsou některé z prvních dnů kolem, ale myslím, že zralostní oblouk bude muset prokázat vysokou úroveň nebo orchestraci a sladění mezi těmito platformami a pochopení toho, co je na nich a proč. A to je věk problém pro nás všechny lidi s údaji.
Dez Blanchfield: Opravdu to tak je a já s tím naprosto souhlasím a myslím si, že skvělá věc, kterou tady dnes slyšíme, je přinejmenším přední konec problému skutečného zachycení dat, myslím, na úrovni brány na okraji sítě a schopnost provádět analýzu v tomto bodě je nyní v zásadě vyřešena. A nyní nás to osvobozuje, abychom začali přemýšlet o další výzvě, kterou jsou distribuovaná datová jezera. Děkuji vám za to, byla to fantastická prezentace. Opravdu oceňuji šanci s vámi o tom chatovat.
Teď půjdu do Robina, protože vím, že má, a Rebecca také po Robinovi dostala dlouhý seznam skvělých otázek od publika. Červenka?
Dr. Robin Bloor: Dobře. Shawne, chtěl bych, abys řekl něco více a nesnažím se ti dát šanci na reklamu, ale ve skutečnosti je to velmi důležité. Zajímalo by mě, v jakém okamžiku Statistica ve skutečnosti vygenerovala exportní schopnost modelu. Ale také bych chtěl, abys něco řekl o Boomi, protože vše, co jsi o Boomi zatím řekl, je to, že je to ETL a je to opravdu ETL. Ale ve skutečnosti je to docela schopné ETL a pro druh načasování, o kterém mluvíme, a pro některé situace, o kterých zde hovoříme, to je velmi důležitá věc. Mohl byste mi promluvit o těchto dvou věcech?
Shawn Rogers: Jasně, jo, rozhodně můžu. Víš, náš pohyb tímto směrem byl určitě opakující se a byl to druh postupného procesu. Právě se chystáme tento příští týden na spuštění verze 13.2 Statistica. A má nejnovější aktualizace všech funkcí, o kterých dnes mluvíme. Ale zpět k verzi 13, před rokem v říjnu, jsme oznámili naši schopnost exportovat modely z naší platformy a v té době jsme to nazvali NDAA. Zkratka znamená Native Distributed Analytics Architecture. Udělali jsme spoustu času, energie a soustředili jsme se na otevření naší platformy s možností použít ji jako centrální příkazové centrum pro vaši pokročilé analytiky, ale také ji odtamtud nasadit. A první místa, Robine, kterou jsme nasadili, jsme udělali opravdu, opravdu skvělý doplněk platformy kolem strojového učení. A tak jsme měli možnost nasadit ze Statistiky do Azure Cloud společnosti Microsoft a využít sílu Azure k učení strojového zařízení, jak víte, je velmi intenzivní a je to skvělý způsob, jak využívat cloudové technologie. A tak to byl první kousek.
Nyní jsme exportovali naše modely do Azure a pomocí Azure jsme je spouštěli a poté jsme odesílali data nebo výsledky zpět na platformu Statistica. A pak jsme se přesunuli do jiných jazyků, ze kterých jsme chtěli být schopni exportovat, a samozřejmě jedním z nich je Java otevírá dveře, abychom mohli začít exportovat naše modely do jiných umístění, jako je Hadoop, takže to dalo hrajeme tam také.
A nakonec jsme se zaměřili na to, abychom mohli naše modely s tímto vydáním vydávat do databází. A tak to byla první iterace a abych byl upřímný, konečná hra byla IoT, ale loni v říjnu jsme tam ještě nebyli s verzí 13. Od té doby jsme se tam dostali a to souvisí se schopností dělat všechno, co jsem právě zmínil, ale pak mít nějaký druh transportního zařízení. A vraťme se k Dezově otázce, víte, co je výzvou a jak to uděláme, když všechny tyto analytiky pobíhají? Používáme Boomi jako druh distribučního uzlu a proto, protože je v cloudu a protože je tak silný, jak jsem již zmínil, je to platforma pro integraci dat, ale je to také platforma pro integraci aplikací a používá JVM, aby nám to umožnila zaparkovat a pracovat kdekoli, kde můžete přistát virtuální stroj Java. To je to, co opravdu otevřelo dveře pro všechny tyto brány a okrajové výpočetní platformy a okrajové servery, protože všechny mají výpočetní a platformu, která je k dispozici pro spuštění JVM. A protože můžeme JVM provozovat kdekoli, Boomi se otočila být úžasnou distribucí a pomocí mého slova z dříve orchestrační zařízení.
A to je stále důležitější, protože jsme všichni, víte, myslím, že scénář letadla byl před minutou skvělý, a zmínil jsem se, víte, výrobci jako Shire, kteří mají v jedné ze svých továren deset tisíc senzorů, v určitém okamžiku musí začít řešit druh centrálního přístupu k pokročilé analytice. Být ad hoc o tom už vlastně nefunguje. To bylo zvyklé, když objem modelů a algoritmů, které jsme provozovali, byl minimální, ale nyní je to maximum. V organizaci jsou tisíce. Takže máme, část naší platformy je založena na serveru a když máte náš podnikový software, máte také možnost vyladit a skóre a spravovat své modely v celém prostředí. A to je také součást té orchestrační věci. Potřebovali jsme vrstvu, Robine, na místě, která vám nejen umožnila získat model tam na prvním místě, ale také vám dala vedení pro vyladění modelů a jejich průběžné nahrazování tak často, jak jste potřebovali, protože to není něco, co můžete udělat ručně. Nemůžete chodit po rafinérii s palcovou jednotkou, která se snaží nahrát modely do bran. Musíte mezi nimi mít dopravní a řídící systém, a proto kombinace Statistica a Boomi dává našim zákazníkům.
Dr. Robin Bloor: Jo. No, budu velmi stručný, ale víte, toto prohlášení, které bylo učiněno dříve o datovém jezeru a myšlence hromadění petabytů na jakémkoli daném místě a skutečnosti, že má gravitaci. Víte, když jste začali mluvit o orchestraci, začalo mě to myslet na velmi jednoduchý fakt, že víte, že datové jezero, které je velmi velké na jednom místě, pravděpodobně znamená, že ho musíte skutečně zálohovat a pravděpodobně to znamená, že přesto musíte hodně dat přesouvat. Víš, architektura skutečných dat je podle mého názoru mnohem víc, ve směru, o kterém mluvíš. Což je distribuovat na rozumná místa, to je asi to, co bych řekl. A vypadá to, že máte velmi dobrou schopnost to udělat. Myslím, že jsem dobře informován o Boomi, takže je to tak či onak téměř nespravedlivé, že to vidím a možná to publikum nemůže. Ale podle mého názoru je Boomi tak důležitá, co děláte, protože má aplikační schopnosti. A také proto, že pravdou je, že tyto analytické výpočty neděláte, aniž byste z nějakého důvodu chtěli něco udělat. A Boomi v tom hraje roli, že?
Shawn Rogers: Jo, absolutně. A jak víte z předchozích rozhovorů, Statistica má v sobě plně rozvinutý modul obchodních pravidel. A myslím si, že je to opravdu důležité, když se dostaneme k tomu, proč to děláme. Víš, žertoval jsem dopředu, že opravdu není důvod dělat IoT vůbec, pokud se chystáte analyzovat, využít data k lepšímu rozhodování nebo podniknout kroky. A tak jsme se zaměřili nejen na to, že jsme mohli model umístit tam, ale také na to, abychom s ním mohli označit, což je sada pravidel. A protože Boomi je tak robustní ve svých schopnostech přesouvat věci z jednoho místa na druhé, v atomu Boomi můžeme také vložit schopnost spouštět, varovat a jednat.
A tak začneme získávat takový sofistikovaný pohled na data internetu věcí, kde říkáme: „Dobře, tato data stojí za poslech.“ Ale opravdu, víte, protože víte, že „světlo svítí, světlo svítí, světlo svítí, světlo svítí “není tak zajímavé, jako když zhasne světlo nebo když detektor kouře zhasne nebo když se cokoli stane s naším výrobním procesem zmizí ze specifikace. Když k tomu dojde, chceme být schopni okamžitě jednat. A data se v tomto bodě stávají téměř sekundární. Protože není tak důležité, abychom všechny zachránili, „je to v pořádku, je to v pořádku, je to v pořádku“ signály, důležité je, že si všimneme „hej, je to špatné“ a okamžitě jsme jednali. Ať už se jedná o zasílání e-mailů někomu, nebo se můžeme zapojit do odborných znalostí o doméně, nebo zda jsme zahájili řadu dalších procesů, abychom podnikli okamžitá opatření, ať už jsou to nápravná opatření nebo v reakci na informace. A myslím si, že proto musíte mít na to tento organizovaný pohled. Nemůžete se jen soustředit na řešení svých algoritmů všude. Musíte být schopni je koordinovat a organizovat. Musíte být schopni vidět, jak si vedou. A co je nejdůležitější, myslím tím, proč to sakra uděláte, pokud nemůžete přidat příležitost podniknout okamžitá opatření proti datům?
Dr. Robin Bloor: Dobře, Rebecco, věřím, že máš otázky publika?
Rebecca Jozwiak: Ano . Mám spoustu otázek pro publikum. Shawne, vím, že jsi nechtěl vydržet příliš dlouho po špičce. Co myslíš?
Shawn Rogers: Jsem šťastný. Pokračuj. Můžu odpovědět na pár.
Rebecca Jozwiak: Uvidíme. Vím, že jednou z věcí, které jste zmínil, bylo to, že internet věcí je v raných dnech a že má určitý stupeň zralosti, který se bude muset uskutečnit, a je to druh rozhovoru k této otázce, kterého se jeden účastník zeptal. Pokud bude rámec IPv6 dostatečně robustní, aby vyhověl růstu internetu věcí v příštích pěti nebo deseti letech?
Shawn Rogers: Oh, já nechám Deza odrazit od mé odpovědi, protože si myslím, že je blíže k tomuto typu informací, které jsem. Ale vždycky jsem si myslel, že jsme na velmi rychlé cestě, abychom ohnuli a rozbili většinu rámců, které máme zavedeny. A i když si myslím, že přidání tohoto nového druhu specifikace nebo směru, kterým jdeme s rámci IPv6, je důležité, a otevírá nám to dveře, abychom měli mnohem více zařízení a byli schopni poskytnout vše, co jsme chci dát adresu. Myslím, že všechno, co čtu a vidím se svými zákazníky, a počet požadovaných adres, myslím, že v určitém okamžiku způsobí další posun v této krajině. Ale nejsem ve skutečnosti odborník na vytváření sítí, takže nemůžu říct sto procent, že to v určitém okamžiku zlomíme. Ale moje zkušenost mi říká, že tento model někdy narušíme.
Rebecca Jozwiak: Nebyla bych překvapená. Myslím, že rámce jsou jakousi rozbíjející se pod tíhou všeho druhu. A to je jen logické, že? Myslím, že nemůžete poslat e-mail s psacím strojem. Další účastník se ptá: „Můžete použít rámec Hadoop?“, Ale myslím, že bych to mohl změnit, abych řekl, jak byste použili rámec Hadoop pro distribuovanou analytiku?
Shawn Rogers: No, Robin mi udělal laskavost, když se mě zeptal na historickou otázku, a tak od verze 13 asi před rokem pro Statistiku jsme měli schopnost řídit modely z našeho systému a do Hadoopu. A velmi úzce spolupracujeme na všech velkých příchutích Hadoopu. Máme opravdu skvělé příběhy o úspěchu týkající se schopnosti pracovat s Clouderou jako jedné z hlavních distribucí Hadoop, se kterými pracujeme. Ale protože můžeme výstup v Javě, dává nám tuto schopnost být otevřený a umístit naši analytiku kamkoli. Jejich umístění do klastru Hadoop je pro mnohé naše zákazníky běžným a pravidelným a každodenním způsobem. Krátká odpověď zní ano, absolutně.
Rebecca Jozwiak: Výborně. A já na tebe prostě hodím ještě jednu a nechám tě jít s tvou dovolenou. Další účastník se ptá, s IoT analytics plus strojovým učením, myslíte si, že všechna data musí být uložena pro historické účely a jak to ovlivní architekturu řešení?
Shawn Rogers: Nemyslím si, že všechna data musí být uložena. Myslím si však, že je velmi zajímavé mít možnost bavit se, poslouchat jakýkoli zdroj dat, který v naší organizaci chceme, ať už je to kdekoli. A myslím si, že změny, které jsme na trhu viděli v posledních několika letech, nám umožnily zaujmout přístup založený na všech datech a zdá se, že se to opravdu vyplatí. Ale bude to pro každou společnost a každý případ použití jiné. Víte, když se podíváme na údaje o zdravotním stavu, nyní je zde spousta regulačních otázek, spousta problémů s dodržováním předpisů, a to nás vede k ukládání dat, která ostatní společnosti nemusí pochopit, proč je třeba je ukládat, správně ? Ve výrobních procesech je pro mnoho našich výrobních zákazníků skutečný vzestup, aby bylo možné vaše procesy historicky prozkoumat a mohli se ohlédnout zpět na velké množství těchto údajů, aby se z nich poučily a vytvořily z nich lepší modely.
Domnívám se, že bude třeba zachovat mnoho údajů a myslím, že máme řešení, která dnes činí ekonomičtější a škálovatelnější. Zároveň si ale myslím, že každá společnost najde v datech hodnotu, kterou nemusí udržovat na atomové úrovni, ale bude chtít analyzovat v reálném čase a rozhodovat se o ní, aby podpořila inovace uvnitř jejich společnost.
Rebecca Jozwiak: Dobře dobře. Ne, publikum, dnes jsem se nedostal ke všem otázkám, ale předám je Shawnovi, aby vás mohl přímo kontaktovat a odpovědět na tyto otázky. Ale děkuji vám všem za účast. Moc děkuji Shawn Rogersovi ze společnosti Dell Statistica a všem našim analytikům, Dezovi Blanchfieldovi a Dr. Robinovi Bloorovi. Archiv najdete zde na adrese insideanalysis.com, SlideShare. Začínáme tam znovu dávat věci zpět a my vylepšujeme naše YouTube, takže to také hledejte. Díky moc lidem. A s tím se rozloučím a uvidíme se příště.