Domov Ve zprávách Odhalující diferenciace: přichází nová éra škálovatelné infrastruktury

Odhalující diferenciace: přichází nová éra škálovatelné infrastruktury

Anonim

Od zaměstnanců Techopedia, 11. května 2016

Take away : Host Rebecca Jozwiak diskutuje o pokrokech v architektuře a ukládání databází s Dezem Blanchfieldem, Robinem Bloorem a Brianem Bulkowskim.

Momentálně nejste přihlášeni. Chcete-li zobrazit video, přihlaste se nebo se zaregistrujte.

Rebecca Jozwiak: Dámy a pánové, ahoj a vítejte v Hot Technologies roku 2016. Dnes jsme: „Odhalení diferenciace: Přijde nová éra škálovatelné infrastruktury.“ Dnes se hlásím k Ericu Kavanaghovi. Jsem Rebecca Jozwiak, váš skromný hostitel ze správní rady, když je Eric na Jamajce. Dobré pro něj.

Takže, stejně jako tomu bylo po celá desetiletí, je tento rok horký, i když se technologie pravděpodobně pohybuje rychlostí, která překonává Mooreův zákon, a co organizace dělají, aby udržely krok? Hledají cokoli, co je rychlé, a měřítko, řekl bych, je pravděpodobně jedna z nejdůležitějších věcí, když uvažujeme o databázích. A samozřejmě máme možnosti k obvyklým relačním, nyní máme naši NoSQL, máme náš sloupcový obchod, máme naše grafové databáze, naše RDF databáze, ale ve skutečnosti to, co podniky hledají, je měřítko, je paralelnost a je rychlé .

Nyní byly tradiční architektury na základě toho relačního modelu. Ale pokud se podíváte na většinu webových obchodů, které se objevily v posledních třech, pěti, deseti letech, nejsou to modely, které používají pro svou infrastrukturu. Používají jinou, paralelní architekturu, škálování a jsou rychlé, a to je to, k čemu se dnes mnoho lidí obrací.

Naše sestava, máme Dez Blanchfielda, je to vědec skupiny Bloor. Máme doktora Robina Bloora, našeho hlavního analytika skupiny Bloor, a máme Briana Bulkowského, CTO a zakladatele společnosti Aerospike. Takže kluci s tím, budu to předávat Dezovi.

Dez Blanchfield: Děkuji a děkuji, že jste mě sem dostal . Pokusím se nastavit scénu pro to, jak jsme se velmi rychle dostali tam, kde jsme, a budeme se ponořit do mnohem více technických detailů, když procházíme dnešními tématy. Jdu tady získat kontrolu nad obrazovkou.

Tak větší, lepší a rychlejší. Když přemýšlím o tom, kde jsme, obraz, který mi neustále přichází na mysl, je právě tímto obrazem, který jsem dostal na titulním snímku, což je expanze vesmíru. Technologii jsme vyvíjeli a rostli po celá desetiletí, vlastně od konce padesátých let, kdy se mainframe stalo skutečnou věcí. Technologie v mnoha případech rostla horší nebo větší než lineární křivka v závislosti na tom, na které části křivky jste, pokud jde o software nebo hardware.

Měřítko se zvětšilo, zvětšilo a zrychlilo a zrychlilo, pokud jde o to, co se snažíme dodávat, a menší a menší na úrovni výroby a polovodiče. A uprostřed je software a aplikace a systémy, které tento software podporují, a jejich povaha má tendenci se zmenšovat a zmenšovat, a my jsme viděli věci, jako jsou kontejnerové aplikace a mikro servery, je to zase věc. Udělali jsme to v minulosti, před několika desetiletími, ale v důsledku zmenšování a zmenšování se zde zvětšujeme a rozšiřujeme v rozsahu, v jakém můžeme nyní spouštět věci, jako jsou aplikace a konkrétní databáze, a logiku tyto databáze.

Mám tento názor, kde jsme se škálovali velmi vodorovně, v podstatě v ose X; zmenšili jsme se vertikálně v ose Y. Nyní jsme v bodě, kde musíme jít někam jinam, a podle mého názoru je to druh mentálně uvažovaný jako osa Z, a to je to, že musíme jít hluboko do technologie a podívat se, jak můžeme dělat věci jinak než to, co jsme dosud udělali, abychom získali další rychlost. Takže si představuji celou tuto expanzi vesmíru, kde došlo k explozi a existují některé technologie a tento lepší lineární růst a poptávka. Museli jsme najít různé způsoby, jak získat ten větší, lepší a rychlejší výsledek.

Jen abychom rychle pokryli druh místa, kde se nyní nacházíme v několika hardwarových prostředích. Viděli jsme, jak klesající náklady na gigabajt místa na disku způsobují několik poměrně velkých přechodů a technologií a přístupů k větším, lepším a rychlejším měřítkům. Jedná se o dva samostatné grafy, které pokrývají zhruba desetiletí za kus, každou dekádu klesající cena jednoho gigabajtu na pevném disku.

Je to klasická křivka J nebo hokejka, jak se na ně často zmiňujeme, když jste před časem mohli strávit doslova stovky tisíc dolarů za nákup gigabajtu místa na disku, ne zcela před dvěma desítkami let, zatímco dnes se to stává dolary a nakonec jsem si jistý, že to skončí, to, co nazýváme závod na nulu, stane se centy. To přineslo zajímavou změnu typu věcí, které by podniky mohly dělat. A odkazuji na to jako na narušení dat nebo zejména velkých dat, a tím myslím to, že jsme viděli technologie, jako se stát věcí, kde bychom mohli ukládat velmi vodorovně v úložišti, a typ výpočtu, který se může vztahovat na toto úložiště a jak otevírá zajímavou technologii, protože nám umožňuje provádět velmi velké, redundantní paralelní úložiště na nejrychlejší úrovni a části Hadoop samy o sobě, nativně je možné kopírovat data v zápisu jednou přečtené mnohokrát, a jen měřítko věc na téměř lineární třídy.

A jsou to všechny společnosti, jako je tento, které se projeví narušením pomocí velkých dat. Máme společnosti jako Uber, které jsou největší taxislužbou na světě. Ve skutečnosti nevlastní žádné taxíky a je to dlouhý seznam. Airbnb je největší poskytovatel ubytování, ve skutečnosti nemá nemovitosti. Jedním z mých oblíbených je Facebook, například v tomto seznamu, kde obsah ve skutečnosti nevytvářejí, vytváříme jej pro ně, ale ve skutečnosti jsou největším vlastníkem médií na planetě. Máme zajímavé jako nejrychleji rostoucí banky, ve skutečnosti nemáme peníze. Jedná se o platformy a banky pro vzájemné půjčky typu peer-to-peer a zejména v Austrálii existuje jedna, která zde roste sláva zvaná SocietyOne. A některé z velkých bank, které musí mít hotovost, investují do této konkrétní banky typu peer-to-peer. A my procházíme tento seznam dokonce až do Netflixu; ve skutečnosti nevlastní žádná kina a přesto jsou skutečně největším kinematografickým domem na planetě.

Dostali se tedy tam, kde byli, podle mého názoru, pomocí inteligentních technologií na datové úrovni, protože jsme mohli udělat větší a širší úložiště za nižší náklady kvůli poklesu ceny gigabajtu místa na pevném disku a mohli jsme použít inteligentní výpočet a distribuovat výpočetní model přes to. Tyto společnosti měly schopnost vytvořit konkurenční výhodu a narušit v důsledku klesajících nákladů na místo na disku.

Viděli jsme, že se něco podobného stalo v ceně paměti. Před několika desítkami let, pokud jste měli kolem sebe šest milionů dolarů, můžete si koupit gigabajt paměti RAM a my jsme měli velmi podobnou křivku J nebo hokejku, dochází ke snižování nákladů nebo k poklesu ceny RAM. A to přineslo několik zajímavých věcí a podle mého názoru je jedním z největších narušení v tomto prostoru množství paměti, které lze zabudovat do zařízení, jako jsou mobilní zařízení, jako jsou telefony a tablety, a dokonce i notebooky. Počítače v těchto dnech, množství paměti, které jde do průměrného notebooku, je v některých případech docela směšné. V některých případech má můj současný notebook více paměti než některé servery, které dříve používaly.

To přineslo významnou změnu ve svém vlastním právu, podobně jako RAM v mé mysli, to nám umožnilo rychle škálovat a škálovat. A nyní jsme vyvinuli technologii, kterou nazýváme flash, a to je technologie, která původně pochází z něčeho, co je na hardwaru v podobě EEPROM, malého čipu, který byl navržen tak, aby byl k dispozici, a zapisovat do něj, a pak, když se napájení vypne, by to, co jste do tohoto čipu zapsali, uchovalo jako trvalé úložiště. Bylo to pomalé, bylo to těžkopádné a v té době si myslím, že to bylo asi 1980–1981, něco se stalo věcí. V roce 1984 společnost Toshiba, o které věřím, že vynalezla tuto technologii, z ní učinila komerční věc, kterou bychom mohli použít.

Ale brzy, lidé zjistili, že by mohli skutečně vzít kombinaci komponent, které byly použity k vytvoření této koncepce EEPROM, paměti jen pro čtení, jakmile byla vymazána a zapsána do ní, a mohli do ní skutečně napsat. pravidelně, a používat to trochu více jako místo na disku a trochu více jako RAM. Postupem času se to vyvíjelo. Tato technologie flash úložiště je nyní spojením mezi tradičním diskovým úložištěm, ať už se jedná o rotující disk nebo v některých případech hybridní disk paměti a RAM. A klíčovou věcí je systém mezi tím, protože do něj můžete číst a psát, a poté vypnout napájení, a zachová si to, co jste do něj napsali. Takže místo na disku, samozřejmě, že na něj píšete, vypnete napájení a spřádací vřeteno a silně upravené, pro lepší popis, zachovává nuly a ty, které jste do něj zapsali.

V paměťovém prostoru s náhodným přístupem něco zapisujete do paměti RAM, vypnete počítač a vše se setře, protože už nejsou k dispozici žádné elektrony, které by ho udržovaly nabité a uchovávaly informace, které jste do něj napsali. Navíc je uprostřed a je extrémně rychlý, rychlejší než disk, o trochu pomalejší než RAM. Ale můžete do něj psát a číst z něj, a když vypnete napájení, bude to přetrvávat. To přineslo některé úžasné technologie, a zejména jsme vyvinuli mobilní zařízení a notebooky, které jsou opravdu, opravdu rychlé a schopné dělat spoustu věcí, a nyní je přesunuto do prostoru infrastruktury kolem úložiště a výpočetní techniky, a to přináší významné změny v tom, co můžeme dodat v měřítku. To je druh, kde se domnívám, že osa Z v mé mysli se nyní blíží.

V mnoha ohledech je to téměř právě včas, protože jsme nyní viděli narušení prostřednictvím toho, co nazývám poptávka, a to, že spotřebitelé mají, bez ohledu na to, co se děje v infrastruktuře a technologickém prostoru, a schopnost rychleji řídit a rychlejší výpočet a výkon na úrovni infrastruktury požadují spotřebitelé toto přerušení ve formě toho, co se nyní říká, zážitku celebrit. Každý chce, aby každý systém, každá aplikace, každá webová stránka věděla, kdo jsou a co se jim líbí, a aby jim byla schopna poskytnout osobní zkušenost. Už nestačí jít na web, kde si kupuji vstupenky do kina. Chci, aby věděl, co jsem si koupil dříve, proč jsem to koupil, a případně to, co lidé stejně jako já kupovali a doporučovali věci.

Vždy vidíme, o čem mluvím, je vedlejší společenský řád, a to je to, že chci celebritní zážitek, ale také chci socializovat tento nápad, chci se o něj podělit se všemi svými přáteli a říct jim, co Dělám a také chci vědět, co dělají moji přátelé. A to je výsledkem výbušné poptávky po dalších výpočtech a skladování a rychlého obratu věcí. Viděli jsme generaci Fitbit, to, čemu říkám neustále sledování. Všechno, co dělám, bude sledováno, zaznamenáno a někde zajato. Viděli jsme všechno v reálném čase: bankovnictví, nabízení, motory doporučení, museli být schopni vypořádat se s věcmi v reálném čase, které osobně dělám jako spotřebitel.

A pak vidíme velmi velký dopad, jako jsou bezpečnostní rizika v oblasti kybernetické bezpečnosti. Bývalo to tak, že jsme měli individuální hackery, pak jsme se na ně vztahovali zločinecké gangy, nyní máme celé národy válku přes internet, což je skutečná věc a ve skutečnosti se to stává. Dávejte pozor na to, posaďte se a podívejte se na to, protože to má skutečný dopad a někteří z našich předstartovních žertovníků se chystali diskutovat o riziku proniknutí svého vlastního počítače nebo alespoň vaší sítě.

Viděli jsme tento koncept extrakce entit. Extrakce entit je, když musíme najít věci, které nás zajímají, ve velmi rozsáhlých souborech dat a zejména kolem podvodů a nezákonné činnosti a činnosti typu hackerů. Ale častěji než ne, uvidíme, že extrakce entit se stává středem zájmu dobrých věcí a věcí, které pro nás mají hodnotu, na rozdíl od hledání věcí, které na nás útočí.

Také jsme viděli explozi, která se označuje jako geoprostorová data. To jsou data, která skutečně vědí, odkud pocházejí, nebo odkud pocházejí další podobná data. Dokážete si představit, že stojíte na ulici a chcete najít nejbližší parkovací stanici nebo nejbližší restauraci, aplikace, které mohou aplikovat geoprostorové výpočty a data, výpočet dat, který ví, kde je ve vesmíru, je velmi důležitý, protože musíte vědět, kde jsou jiné objekty a entity, a to rychle.

Viděli jsme trvale připojený mobilní telefon. I když v noci spíme, naše telefony stále tikají pryč, aktualizují naše e-maily, kontrolují naše kalendáře, dívají se na to, jaké je počasí, a přijdou na to, zda bude k dispozici to, co bychom chtěli na snídani. Tam se děje hodně hluku, a to vytvořilo masivní dopad na to, co musíme udělat na zadní straně, a jak rychle to děláme.

Celkově lze říci, že pouhý rozsah a dopad toho, co se označuje jako internet věcí, nebo častěji než ne, připojení stroj-stroj, kde zařízení mluví se zařízeními, a to jde až po motory připoutané k strana letadel, která říká samotnému letounu nebo systému řízení letounu, že ložisko na motoru číslo 4 je vystaveno nadměrnému opotřebení a teplu, a mělo by být vyměněno, když přistáváme, a poté komunikuje s jiným strojem, a proto by měl umístit a magicky se na letišti objevuje inženýr a je připraven jej během tankování vyměnit.

A měřítko, které je tak velké a tak velké, že jsme museli jít do toho, co na něj odkazuji, prostřednictvím přístupu k jakémukoli se s tím vypořádat. Protože nový svět a vítejte v novém světě, nový svět všeho, co používáme, je spojen; kdysi to byly satelity a síťová zařízení, nyní jsou to mobilní zařízení a naše notebooky a tablety a telefony, a dokonce i můj zbrusu nový Audi má v sobě zabudovanou značku, která neustále informuje o svém vlastním zdraví, ale také se aktualizuje, a ví, kde to je a jaké mapy jsou použitelné, a dokonce mi řekne, kdy se vydat na jinou trasu, pokud je na silnici před námi provoz.

Všechno, co nyní stavíme, vše, co s vámi teď mluvíme, je navrženo tak, aby se spojilo a připojilo k jiným věcem, nejen ode mě do systému, ale ze systému na systém, a aby se s tím dokázalo vyrovnat „Je třeba aplikovat velmi odlišné myšlení na vrstvě infrastruktury, a to jak na hardwaru, tak na softwaru, a zejména na databázových vrstvách, které to systémy potřebují, a v mnoha ohledech se databáze stala motorem a aplikace jsou opravdu jen malé roboty, které dělají věci.

Chystám se zde rychle zabalit tento poněkud vtipný pohled na to, kam jdeme s těmito věcmi, a na to, co nazývám „IoT pouhým stiskem tlačítka“. Byl vytvořen nový gadget nazvaný Tlačítko Amazon Dash, a to je malý gadget velikosti palce. Ve skutečnosti je to v mnoha ohledech stejné jako moje USB palcová jednotka. Když si koupíte tuto věc, je to asi 4, 99 USD v USA online od Amazonu, dostane se k vám, nakonfigurujete ji pomocí mobilního telefonu a doslova ji připojíte k jednomu ze svých zařízení, jako je lednice nebo pračka nebo cokoli jiného. V příkladu vaší pračky, pokud vám nakonec dojde prášek na praní, můžete stisknout toto tlačítko a vytočí číslo domů a automaticky si za vás objedná více a magicky se k vám dostane prostřednictvím našich dobrých přátel v Amazonu.

Pro mě to mě děsí, protože to bude exploze řady věcí, které jsou připojeny k síti a pokouší se vytvořit připojení a generovat poptávku. Pokud si dokážete představit, jedna nebo dvě z těchto věcí možná nejsou tak děsivé, ale když jsem se naposledy podíval, bylo jich více než 110, takže téměř každá značka na planetě se bude snažit získat vlastní malý tlak- tlačítko IoT, že jdete domů a stisknete tlačítko a říká: „Objednejte mi pizzu.“ Stisknete další tlačítko a zítra objednáte dětem předem připravený oběd do školy.

To vyvolává tak obrovskou poptávku po transformaci na zadní straně, na aplikační úrovni, zejména na úrovni databáze, že si myslím, že jsme právě viděli jen špičku ledovce typu transformace výkonu, kterou musíme vidět . A s tím se chystám podat doktorovi Robin Bloorovi a získat jeho nahlédnutí do toho, kde jsme také.

Rebecca Jozwiak: Dobře Robine, prošel jsem tě míčem.

Robin Bloor: Není to dobré? Dobře, jdeme, to jsem já. Viděl jsem Dezovu prezentaci před tím, než jsem přišel na tuto, takže bych řekl spíše věci, které jsou doplňkové, než jen opakuji některé z věcí, které řekl Dez. Myslel jsem, že budu mluvit o vývoji databáze z hlediska toho, co se vlastně stalo architektuře, a tak dále a tak dále, databází z historické perspektivy.

Základním problémem, který má jakýkoli dodavatel databáze, je udržování flexibilní architektury, která mění měřítko a udržuje krok s vývojem hardwaru. Promluvím si o tom, ale když se skutečně podíváte zpět a uvidíte, jak se databáze vytvářely, a způsob, jakým jsou postaveny nyní, jsou ve skutečnosti výrazně odlišné od toho, čemu bych říkal úroveň architektonického designu . Vyplatí se jen přezkoumat, proč tomu tak je, nebo si myslím, že alespoň. Hardwarové faktory a Dez nám daly obzvláště dobrý přehled o nižších vrstvách z hlediska paměti a disku. Co máme teď, a to je budoucnost, Intel je další, CP, který bude mít FPGA na to. Co s tím budou dělat lidé, nemám ponětí. AMD slučuje CPU a GPU a jaký je to rozdíl? To jsou druhy změn, které ve skutečnosti změní databázi, a mám podezření, že Aerospike je mimo jiné, protože Aerospike je poháněn výkonem, pravděpodobně se na to už podívá a pracuje, kde si myslí, že to vlastně půjde. způsobem, jakým produkt funguje.

Máme čip na čipu, který se ještě nevybral. SSD, o kterých víme, ale je třeba si uvědomit, že ve skutečnosti zvyšují rychlost, zhruba Mooreův zákon, každých 10 let faktor 10. Ale Intel se chystá uvolnit 3D křížový bod, který tvrdí, že je schopen jít více než stokrát rychleji než SSD, ve skutečnosti druh kapek do mixu, pak to změní rychlost, jakou mohou produkty jako Aerospike skutečně jít.

Pak máme paralelní hardwarové architektury, jinými slovy způsob, jakým jsme konstruovali hardware ve smyslu - původně to byl jen CPU, který seděl nad pamětí, který seděl nad diskem, ale je to mnohem komplikovanější. Myšlenka systému na čipu spočívá v tom, že ve skutečnosti můžete mít paralelismus z jednoho čipu na druhý a dosáhnout toho, aby všechno šlo mimořádnou rychlostí, a my netušíme, který z těchto produktů bude ve skutečnosti dominovat.

To je jen pohled na budoucnost, ale na hardwarové úrovni se výkon zrychluje a náklady stále klesají, podobně jako to popsal Dez. Vaše procesory nemusí být nutně levnější, jen rychlejší a tak dále.

Z obchodního hlediska je v některých situacích, a to jsou situace na trhu, první místo, kde je obchodní hodnota. Pokud jste obzvláště - pokud jste naprosto přesvědčeni, že určitá populace bude klesat v ceně, první osoba, která dostane objednávku na prodej, získá nejlepší cenu. Je to opravdu tak jednoduché. Proto existuje technologický závod, který pokračuje v automatizovaném obchodování v bankách, aby se tyto situace skutečně pokusily vyhrát. Co se stalo poté? Co se stane poté, co banky s tím vším udělají? Najednou začínáte vidět jiné oblasti nakazené stejným druhem rychlosti.

Opravdu, co se stalo, jsou lidé z rovnice odstraněni, a to se stalo s internetovou reklamou velmi rychle. Jde však o to, že se nejedná o konkrétní transakci, provádění metod, jedná se o celý obchodní proces, je to skutečnost, že webová stránka byla právě vyhozena a musí být učiněno rozhodnutí, které může být docela komplikované rozhodnutí, o tom, na jakou reklamu na danou webovou stránku skutečně umístit, od toho, kdo z uživatele prohlížeče je, je to, co by bylo nejvhodnější pro tuto reklamu, atd. atd. Stalo se to velmi složitou věcí a znovu to zmíním.

Jde ale o to, že výkon a škálovatelnost obchodního procesu není stejný problém jako výkon a škálovatelnost dotazovacích schopností, a to je něco, o čem vím, protože kvůli nedávné briefingové místnosti, kterou jsme udělali s Aerospike, jsem si také vědom. Další věc, když skutečně pracujete při těchto rychlostech, záleží na vlastnostech aktiv pro transakci, zpracování událostí. Opravdu, opravdu záleží. Takže hrozná spousta toho, co některé databáze dělají, což ztratí dopis nebo dvě z aktiv, může v kontextu fungovat docela dobře - to bude dobře fungovat v kontextu, o kterém mluvíme. Není to opravdu přijatelné, abych byl upřímný.

Z technologického hlediska se vlastně díváte na - vím, že existují dva druhy pákového efektu, aby se vytvořil druh architektur, které jsou ve skutečnosti požadovány, aby poskytly takové rychlosti, jaké dokáže, jako je Aerospike, udělat milion transakcí za vteřinu. Pokud jde o vývoj softwaru, musíte být ve skutečnosti velmi přesní. Nemůžete jen tak utéct. Musíte si dělat starosti o délku kódové cesty. Musíte se skvěle využít v paměti a skutečně optimalizujete celé transakce. Potřebujete inteligentní paralelismus a také potřebujete paralelismus bezpečný proti selhání. Musíte se škálovat, spíše než škálovat, protože jakmile zapojíte síť do něčeho, stane se nejpravděpodobnějším ukazatelem, na který budete čekat latence, a začne transakce příliš pomalu.

Musíte se dostat co nejvíce na jakoukoli danou známou síť dříve, než se skutečně změníte měřítko, a opravdu nechcete škálovat rychle, opravdu nechcete mnoho procesů. Chcete síť, kterou nepoužívá nikdo jiný. A chcete mít neuvěřitelně rychlou síť.

Zrychlené úložiště SSD je něco - ve skutečnosti si myslím, že většina z toho se týká toho, co Aerospike dělá. Jednou ze zajímavých věcí je, že je to databáze NoSQL. Dříve tomu věřilo - nevím, před několika lety - věřilo se, že relační databáze byla jedinou databází a dominovala všemu, a to byly jen tyto zvláštní situace, ve kterých jste nepotřebovali jít relační. Teď je to trochu otočené na hlavě. Jsou to rychlé databáze, které jsou v těchto databázích SQL, a jeden z důvodů, proč je to hlavní důvod, proč se vyhýbají spojení dat, ukládají data do značné míry objektovým způsobem. Když skončíte s objektem, jednoduše jej uložíte a poté celý objekt stáhnete zpět, není to spojování věcí za účelem jejich skutečného zpracování. O tom je rychlost. Tyto druhy technik, které generují rychlost v kontextu databáze.

Toto je stopa slz, to je to, co se stalo s databází. Příběh nebo vyprávění relačních databází bylo konec databáze, ve skutečnosti nebyla pravda. I když začali ovládat, bylo to stále nutné. Objektové databáze provedly v těchto dnech minulé transakce, protože relační databáze je ve skutečnosti nemohla udělat, a pak se ukázalo, že relační databáze pomocí řádkových obchodů nemohly provádět ani rychlé dotazy, proto jste potřebovali sloupcové úložiště. A pak jsme zjistili, že pokud byste skutečně chtěli dělat grafické dotazy na data, nebyl by dobrý žádný sloupcový úložiště ani relační databáze, a ve skutečnosti byste pro vás měli mít vytvořenou specificky databázovou databázi. Pak přišly databáze RDF, a jakmile jste vlastně začali uvažovat o významu sémantiky, dostali jsme databáze NoSQL velmi specificky pro rychlost. Říkat jim, že NoSQL je skoro jako kdybyste označovali všechny tyto databáze, jako by byly stejné, ve skutečnosti se radikálně liší v tom, co leží pod nimi. Jediným důvodem, proč nesou jméno NoSQL, je to, že nedávají zatraceně SQL, protože je to příliš drahé. Transakční latence, které potřebují.

IoT - o kterém jsem si myslel, že skončím ve stejném bodě, v jakém to Dez dokončil - to není konec, celá tato situace z hlediska rychlosti a požadavků na latenci, nepřestane, dokud tlustá dáma nezačne tato data zrušit, a to ještě nezačalo. Spousta těchto údajů bude chtít mít latence, které jsem tak trochu naznačovala, takže si myslím, že to je vše, co musím říct. Podívejme se na Aerospike a Brian Bulkowski.

Brian Bulkowski: Ahoj, děkuji za účast v Bloor Group a já za tuto prezentaci dnes. Když přemýšlím o tom, o čem Dez a Robin právě mluvili, rád bych vám řekl něco o cestě, kterou společnost Aerospike provedla v poskytování nových databázových technologií a databázových technologií NoSQL řadě průmyslových odvětví. Byla to skvělá cesta. Aerospike jsme zahájili v roce 2008 a viděli jsme mnoho trendů, které Dez a Robin zmínili. Konkrétně o databázích in-memory, které jsou schopny využívat výhod flash, a také o typu cloudových systémů s měřítkem a o potřebných stupnicích pro personalizaci, analýzu chování a druh VIP VIP zkušeností, o kterých se diskutovalo.

Když jsme přistoupili k problému databáze, která byla front-end operační databází, která byla schopna poskytnout podporu aplikacím, které by mohly být napsány k jejich vyřešení, začali jsme s problémem, jak bychom mohli vytvořit v podstatě distribuovanou hašovací tabulku, paměť - distribuovaná hashovací tabulka, která byla úžasně rychlá a schopná věcí, jako jsou miliony transakcí za sekundu, ale za rozumnou cenu. Když jsme dokončili náš prototyp, uvědomili jsme si, že bychom pak museli přijít na to, kdo bude potřebovat tento druh rychlosti. Jako společnost Silicon Valley jsme rychle zjistili, že je to opravdu reklamní průmysl, který je schopen tyto informace spotřebovávat a zajímá je, a proto bych ráda strávila druhé hovoření o nabídkách v reálném čase a jak to funguje na trhu.

Robin se zmínil o tom, jak funguje finanční obchodování, což je první transakce, která je často vítěznou transakcí, a v zásadě je čas na latenci trhu a hodnotu do latence. Zajímavé je, že reklamní průmysl se poněkud liší, protože cíl v reklamě je konkrétní - to, co se nazývá dojem, schopnost doručit reklamu - je aukce a že aukce probíhá v rozmezí deseti milisekund až padesáti milisekund. Název hry a často existuje stovka společností, které nyní nabízejí v reálném čase na každou jednotlivou reklamu umístěnou na internetu, je získat co největší množství dat a přinést nejlepší algoritmy, které mají nést během těchto deseti až padesáti milisekund v průběhu největší množství dat.

Tato změna a posun se odehrával v reklamním průmyslu, v každé z těch malých milisekund, měla časově omezenou komplikaci s nejlepšími algoritmy na největším množství dat, a to, že spojujete spoustu malých kousků data. Nejnovější informace o IP adrese, nejnovější informace o konkrétní kategorii zařízení, nejnovější informace o chování webových stránek, nedávné vyhledávací dotazy, to vše by šlo do tajné omáčky algoritmů konkrétní společnosti k určení ceny a nabídky.

Byl to fascinující trh, jehož součástí je. Poprvé jsme provedli první nasazení v Aerospike v roce 2010, kdy některé z prvních společností vážně pracovaly v rámci nabídkové ekonomiky v reálném čase, a poté jsme pro většinu společností v tomto oboru dosáhli v podstatě tohoto front-end úložiště behaviorálních dat. prostor. Od té doby jsme zjistili, že jde o konkrétní architekturu, kterou podrobně uvedu v průběhu této prezentace, že vše se dělo v letech 2010, 2011, 2013 a nadále se vyvíjí. Reklama je velmi dynamický trh.

Ale takový VIP zážitek, můžete myslet na umístění správné reklamy, umístění reklamy na dětské výrobky, protože nemám žádné děti, takže nebudu mít efektivní reklamu, pokud je to umístěné na tom, ale pokud jde o rychlá auta, je to druh reklamy, kterou umístit na Briana. To je opravdu ten typ VIP zážitků v obchodech, ať už sleva nebo ne, pokud jste na maloobchodním webu, dokonce i v odhalování podvodů. Je to normální vzor konkrétní osoby nebo konkrétní kreditní karta? Všechny tyto formy technologie real-time analytics, behaviorální predikce, prediktivní analýzy, nyní prosakují z reklamního průmyslu, který to dělá pro zábavu a zisk již několik let a skutečně přichází do maloobchodu a bankovnictví a odhalování podvodů atd. prostřednictvím konkrétní architektury. Aerospike má tedy tu čest být součástí řady těchto případů.

Architektura, kterou považujeme za funkční, a která je pro to praktická, je taková, že místo vytváření sady dotazů z aplikačního serveru se místo toho přesouvá větší část výpočtu do samotného aplikačního serveru a poté se databáze používá jako úložiště. motor pro objekty, o kterých Robin mluvil. V tomto případě si tyto architektury toto zaměří především se skutečnou analýzou. Na pravé straně tohoto snímku vidíte, že zde stále existuje analytika pro vytváření statistik. Jedná se o zakázky, které často pracují nad petabajty, desítky petabajtů dat, ba dokonce exabajty v případě některých našich velkých zákazníků, využívajících různé technologie. Musíte mít velký datový tým, analytický tým, kvantitativní tým a zjistit, co, řekněme, geoprostorových souřadnic záleží, jaké modely fungují, pokud jde o nalezení těchto vztahů a vytvoření VIP zážitku. To je celý problém sám o sobě a ne problém, kterého se Aerospike přímo zúčastnil, a při jednání s tímto druhem systému existuje spousta skvělých technologií.

To, co nás nadchlo a jak jsme s ním spolupracovali, je, jakmile získáte tyto poznatky, jak se zapojíte do druhu transakcí mezi stroji nebo rychlých transakcí mezi lidmi, kde tyto poznatky vezmete a provedete jsou skutečné pro každou osobu, moment za okamžikem? Architektura, kterou jsme používali, je architektura, ve které je napsán aplikační server, který dělá veškerou matematiku a dívá se skrz modely, které jste vytvořili, a dívá se na nedávné chování a dělá to v podstatě klíčovým paradigmatem nebo přinejmenším velmi lehký druh systému dotazů.

Když se zabýváte druhy datových typů, o kterých mluvíme, druh toků, o kterých mluvíme, s miliony zápisů za sekundu, miliony čtení za sekundu, miliony a stovky a tisíce rozhodnutí za za druhé, budování komplexních indexů, vícerozměrných indexů, prostě nefunguje dobře, není škálovatelné. Způsob, jak dosáhnout této formy měřítka, je zapojit hodně paralelismu. O tom, jak to uděláme, si povíme trochu později. Součástí toho je ale aplikační server bez státní příslušnosti napsaný ve vašem vlastním jazyce.

Často vidíme konkrétní projekt, který předpokládá nový aplikační rámec založený na lidech, kteří tam pracují, na technologii, kterou používají, a na problému, který se blíží. Viděli jsme lidi, kteří používají Python, mnoho lidí používá Javu, stále vidíme programátory C, protože mnoho z nich je stále vysoký výkon, možná dokonce s použitím věcí, jako jsou staré knihovny MATLAB. Aby se mohli efektivně rozhodnout, musí se dotknout tisíce a tisíce datových bodů za sekundu.

Jednou z otázek, které jsem se občas ptal, je: „Brian, jestli jsi schopen miliónů transakcí za sekundu, kdo to potřebuje?“ Když se podíváte například na severoamerické zpracování plateb a společnost Aerospike se zabývá řešení provádějící odhalování podvodů v rámci tohoto systému a podporující autory aplikací, kteří dělají v oblasti detekce podvodů některé velmi inovativní věci, prochází i několik největších platebních transakcí za sekundu i přes největší procesory plateb. A přesto, když k nám přišla první společnost a řekla, že se dívají na používání NoSQL, a chtěli vidět, jak by naše řešení vypadalo jako podpora jejich aplikace, řekli, že se chtějí dotknout 5 000 kusů dat v 750 milisekundovém okně. Nyní najednou máte v každém výpočtu několik stovek obchodních transakcí a několik tisíc kusů dat a nyní jste v oblasti potřeby milionů transakcí za sekundu.

Případ - odkládání reklamy na vteřinu, případ podvodu je fascinující, protože tam, kde jsou peníze, jsou podvody a prevence podvodů v reálném čase, na rozdíl od snahy o analytické třídění po tom, co k podvodu došlo, je opravdu přinese vám co nejvíce dat online a vy to můžete považovat za odraz toho VIP zážitku. Chová se tento člověk tak, že se obvykle nechová? Šance na to, že se jedná o podvodný systém, a nikoli vlastně tato osoba, tedy stoupá. Má tato osoba obvykle přístup prostřednictvím určitého zařízení nebo sady zařízení s určitou sadou rozlišení obrazovky? Vykazují obvykle zvláštní nákupní chování? Možná v průběhu samotné transakce dokážeme podvod odhalit v zárodku. To by vám mělo velmi připomenout, co se děje v rámci transakce v reklamním systému.

Druhy systémů, které řešíme, jsou ty, kde každý jednotlivý zpracovatel plateb má velký datový tým, má spoustu historických dat, vytváří nové modely, nesdílí s námi na Aerospike všechny modely, protože opravdu tajná omáčka. Pokud jste předplatitelem společnosti Gartner a slyšeli jste, jak Gartner mluví o ekonomice algoritmů, jedná se o jeden algoritmus a jedna společnost bojující proti sobě, aby se vyhnula podvodům a zvýšila se počet úspěšných transakcí, protože také nemusíte nechci blokovat transakce. To je druh projektů, které v Aerospike hledáme na těchto úrovních.

Dalším případem, na kterém jsme pracovali se společnostmi poskytujícími finanční služby, je tzv. Intraday systém záznamů. V tomto případě, co se děje, je druh bohatší zkušenosti, a to i v systému maloobchodu, takový, kde se chci podívat na mé konkrétní postavení a chci to dělat velmi přesně. Nechci mít před mým systémem DB2 úlovek. Místo toho se chci podívat na přesná data a mezi mobilními zařízeními, ale také na věci jako přepočty rizik, přepočty rizik by nyní měly být prováděny na minutu po minutě, chcete být schopni přepočítat rizika každého stejně jako globální riziko, systémové riziko v celé společnosti během několika minut.

A opět je to stejný problém. Každý účet, který je konkrétní, považujte jej za vyhledávání klíčové hodnoty konkrétního objektu, pak to lze provést paralelně, a co je nejdůležitější, toto paradigma vám umožňuje psát váš kód a vaše algoritmy v jazyce vysoké úrovně, což je snazší ladění a rychlejší doba uvedení na trh. V této ekonomice algoritmů musím být nyní schopen dostat své algoritmy online. To je velmi odlišný problém pro modelování a obchodní vztahy, což jsou relační systémy, které jsou skvělé. Pokud máte tabulku součástí a tyto části jsou spojeny s objednávkami a tyto objednávky jsou spojeny s lidmi, máte obchodní proces, který lze přesně modelovat a pravděpodobně se po celou dobu trvání vašeho podnikání nezmění. Nový algoritmus k nalezení nového vzoru podvodu však musí být napsán přesně a rychle a musí se dostat online, aby se obchodní rozhodnutí dělaly nejpozději do několika dnů, ne-li rychlejší. NoSQL řešení pro tento druh systému záznamu je pro tyto lidi opravdu úžasný systém, protože jim umožňuje přijímat data velmi rychle, stejně jako vytvářet nové algoritmy, takže nejde jen o novou zkušenost se zákazníky při oslovování mobilních zařízení, ale opravdu budování široké škály nových aplikací.

Dlouhodobě na Aerospike vidíme skutečnost, že každý typ databáze, každé fyzické rozložení dat na disku má své vlastní komponenty a v Aerospike jsme se opravdu zaměřili na tuto klíčovou hodnotu nebo na systém orientovaný na role, jak řekl Robin., s vysokou konzistencí transakcí a skutečně umožňují lidem, jako jsou sloupcové obchody a velkoobjemová datová jezera, stejně jako tvrdé transakční systémy, které na ně také vykazují omezení. Vidíme, že všechny se potřebují vložit do řady různých vyhledávacích strojů. Vidíme některé z dotazovacích modulů založených na JSON. Vidíme věci jako elastické vyhledávání, vidíme Sparka, všichni potřebují různé odrůdy v různých časech věcí, jako jsou sloupové obchody, stejně jako řádkové obchody, což je místo, kde Aerospike vyniká.

Skutečně vidíme, že tyto různé typy a odvětví se dostávají do bodu, kdy bude nutné vybrat to nejlepší z každého z nich. Bohužel, vzhledem k realitě dlouhodobé analýzy a dávkových úloh, versus analytiky a provozních omezení, se pravděpodobně nedostaneme do bodu, kdy budeme mít jednu, jednu velikost padne všem, ale dostaneme se do bodu, kdy budeme schopni jasně vybrat mezi některými rozvrženími základních dat.

Pojďme si chvíli promluvit o inovaci blesku. Pořád dostávám otázku, i když, jak již bylo řečeno, flash je s námi už dlouhou dobu. Když jsme v roce 2009 odstartovali Aerospike, věřím, že v roce 2009, možná, ano, v roce 2009 došlo k tomu, že Intel vyšel s X25, což byl opravdu první flash disk SATA s posádkou na velkém trhu, a před tím existovalo množství flash systémů, ale ve skutečnosti to byl ten, který se dostal do vědomí mnoha technologií. Fusion-io opravdu přinesl záblesk na širší podnikový trh poté.

Nyní se děje příchod systému zvaného NVMe. NVMe je standard podobný SATA nebo SAS nebo dokonce SCSI, který umožňuje různým dodavatelům karet spolupracovat s ovladači v operačním systému na vysoké úrovni účinnosti. Vytváří tak vyšší úroveň výkonu, především proto, že NVMe je založen na PCIE jako jeho základním transportu, který je mnohem rychlejší než SATA, SAS nebo cokoli jiného, ​​ale také umožňuje nejlepší ovladače.

Například v Linuxu je tento chlapík Jens a Jens je průvodce ovladačem NVMe, Jens expo, a dělá lepší práci, než jakoukoli jednotlivci, kterou by mohl Intel nebo Fusion-io udělat s jejich jednotlivými ovladači, se všemi jejich zdroji. Když máte sílu samotného operačního systému, který dokáže sestavit nejlepší ovladač, vidíme opravdu úžasné úrovně výkonu. To vše podporuje myšlenku, že flash může skutečně poskytnout spoustu nízké latence RAM.

Nyní je Aerospike díky svému clusterovému modelu stále skvělou databází RAM. Zjistili jsme však, že jakmile provádíte síťový hop, který potřebujete mít škálovatelné úložiště, již utrácíte alespoň pět až 50 mikrosekund, dalších 70 mikrosekund NAND obvykle není překážkou a můžete také použít blesk, protože flash NAND, vzhledem k tomu, že se na tom síť již podílí. Mnoho lidí se pak diví, jak - to všechno zní skvěle, pokud kupujete vlastní hardware, jak se daří veřejným cloudům? Myslím, že právě teď najdete, bez ohledu na to, jaký veřejný cloud používáte, tyto veřejné mraky mají velmi silné bleskové nabídky. Trochu se liší od poskytovatele cloudu do poskytovatele cloudu. Amazon má své případy I2, které byly pro myslím, že rok, dva roky, které jsou opravdu velmi kvalitní flash vymyslí, a Aerospike má vzor nasazení na vrcholu.

Chtěl bych zavolat Google Compute, Google Compute Engine, Google Cloud konkrétně, protože podle našich zkušeností mají zatím některá z nejvýkonnějších zařízení a některé z nejvíce flexibilních, pokud jde o vzory rozmístění. Ale také vidíte nové vzory rozmístění, jako je Pivotal, což je druh veřejné / soukromé, takže můžete dělat správné aplikace Pivotal jak na místech, která podporují flash a podporují různá paměťová zařízení, tak i na Docker vzory. Takže to je opravdu historický bod, ve kterém je flash k dispozici nejen pro nákup a vkládání datových center, ale opravdu se propadl všem poskytovatelům infrastruktury, protože je to opravdu nejlepší způsob, jak získat systémy s vysokým IOPS na velmi rozumnou latenci.

Jen jeden okamžik o Aerospike - Aerospike je klastrově distribuovaná databáze, díky čemuž je velmi dobře přístupný pro cloudová nasazení a datová centra. Zjistili jsme, že flexibilita schopnosti přidávat další data a vyšší výkon je v těchto typech nových aplikací naprosto nezbytná, protože spustíte projekt, nevíte, zda potřebujete padesát tisíc transakcí za sekundu, sto tisíc, milion, dva miliony, takže si chcete dát trochu prostoru pro přidání serverů. A přesto, chcete rozšířit, aby každý server mohl být rychlý sám o sobě. Opravdu nechcete skončit s pěti nebo tisíci servery, které jsou databázovými servery, které jsou pomalé. Scale out není jediná hra ve městě, její měřítko a měřítko, jak řekl Dez dříve, je tu nová osa Z.

Doufejme, že vám to dá nějaké nové představy o tom, jak rychlost a měřítko oslovuje nové trhy, a možná existují projekty, na kterých pracujete, na kterých budete moci zvážit skutečně vybudování bohatších aplikací a použití aplikačního rámce s více klíčem nebo NoSQL databáze pod ní. Na Aerospike jsem určitě viděl mnoho našich zákazníků a mnoho našich uživatelů s otevřeným zdrojovým kódem uspělo s tímto vzorcem a těším se, až ho průmysl přijme ve větší míře.

Rebecca Jozwiak: Díky moc Briane, a jsem si jist, že Dez a Robin pro vás mají nějaké dobré otázky. Červenka?

Dez Blanchfield: Jsem rád, že skočím dovnitř. Robine, máš otázku? Jinak mám rychlý, který můžu začít.

Robin Bloor: Promiň, byl jsem na němý. Ponořil jsem se, ale nikdo mě neslyšel. Otázka se mi okamžitě objevila, protože se jedná o velmi sofistikovanou sadu technologických možností. Co se týče stávajících zákazníků, které máte, jaký druh eskalace nebo míry transakcí, se kterým se setkáváte v souvislosti s některými z těchto reklamních aplikací? Zvyšuje se transakční sazba? A pokud ano, jakou sazbou?

Brian Bulkowski: Zajímavá otázka, Robine. Každé odvětví má v každé společnosti svou vlastní křivku. Podívejme se na severoamerickou reklamu, řekněme 2012, severoamerická reklama běžela pravděpodobně blíže k 200 000 reklamám za sekundu, jakýmsi standardním vnitrodenním dnem, ne mým časem, a nyní se stupňuje pravděpodobně na tři až pět milionů reklam za sekundu. Ale pak se stala zajímavá věc. Reklamní odvětví začalo řešit některé obavy z podvodů a části odvětví, které jsou schopny zabránit podvodům, zaznamenaly u některých našich sofistikovanějších zákazníků, kteří byli schopni podvody určit, mírně poklesly transakční sazby, a to zhruba dvakrát. Samozřejmě museli udělat nějaké vyhledávání v databázi, aby zablokovali podvod, takže to nakonec nakonec bude trochu stejné.

Zajímavý případ použití je v oblasti telekomunikací, opravdu jsem nezmínil, že v oblasti telekomunikací došlo k nárůstu transakcí v důsledku fakturace na základě každého jednotlivého paketu, který prochází sítí mobilních telefonů. Za starých časů jsme měli zavolat podrobné záznamy a jednou za minutu, hovor, co víte, trochu ping by prošel sítí a má tenhle kluk ještě minutu? Nyní musíme vytvořit a vyrovnat trasu na základě každého paketu na internetu. To je - omlouvám se v mobilní síti, což je nyní najednou miliony paketů za sekundu a něco, co stále znovu a znovu roste. Jeden případ je proto, že každá aplikace jezdí pěkně trochu dvakrát. U některých zákazníků vidíme: „Ale počkejte, mám novou aplikaci. Chci ke svému riziku přidat nějaký podvod. Chci přidat ke svému podvodu a mému riziku nějaké hlubší zkušenosti se zákazníky. “Každá z nich vytváří novou zátěž v základní databázi.

Robin Bloor: Ano, myslím, že to bylo to, co jsem naznačoval v krátké prezentaci, kterou jsem dal, že tohle - my jsme si mysleli, že transakce je, někdo něco dělá a možná je tu kaskáda událostí a vše je zaznamenáno a nyní má mnoho transakcí obrovské množství vyhledávání a v prezentaci jste uvedli několik příkladů. A proto již ve skutečnosti neprovedete transakci, ve skutečnosti provádíte druh aplikace, která k tomu může mít mnoho, mnoho prvků.

Druhou otázkou, než předám Dezovi - protože jsme na tom zjevně spojeni, - další otázkou, na kterou bych chtěl, abys odpověděl, pokud na to máš rozumnou odpověď, je Dez a očekávám internet od Věci nebo internet všeho, jak se někdy říká, vytvořit poměrně dramatické množství transakčního provozu. Můžeš s tím mluvit? Je to vaše zkušenost, přivedli vás zákazníci s tímto konkrétním problémem a jaký je váš názor na tuto chvíli?

Brian Bulkowski: Jistě, myslím, že je trochu zmatek, a to je mírně řečeno, o internetu věcí. Zákazníci, které zatím vidím, jednoduše přinášejí internet k věcem, které mají. Zamyslete se nad těmito tlačítky Amazonu - je to všechno Amazon - s těmito tlačítky, nemůžete je znovu použít a nechat je jít na Walmart online. Není to jako prohlížeč, který můžete kombinovat se všemi. Na druhé straně se děje stroj-to-machine, a když připojíte své auto Tesla k jeho dobití, Tesla posílá obrovský zpětný tok informací, každý jednotlivý senzor do auta, ale to plyne do Tesla počítače pro analýzu a vylepšené kvalitní. To, co vidím, je vše, co stroj-stroj, a všechny senzory v rámci jedné společnosti, vytvářející nové požadavky.

Teď většinou dnes, to plyne do těchto analytických systémů, a vezme si případ Tesly; Tesla poprvé použila toto, podle mého pochopení, ke zlepšení životnosti baterie, v části „Jaké jsou provozní teploty, jaké jsou zatížení? Pojďme se na to podívat, pojďme navrhnout lepší baterii. “Ale pak začnou myslet, a to je vše skvělé, to je druh hlubokého analytického problému, který je fascinující, další otázkou je:„ Jak mohu vylepšit zážitek z okamžiku na okamžik ? “

Nyní se podívejme na případ jako Nest, kde se pokoušíte provádět prediktivní analýzu, která mění momentální teplotu v domácnosti. To je ten případ, kdy začneme vidět v Aerospike, kde je toto obrovské datové jezero a jsou tu obrovské analytické procesy, ale co teď udělám? Budu se muset držet, myslet na to jako na hotovost, nějakou část minulého týdne, poslední měsíc, možná i jen informace za poslední den, pravděpodobně na zadní straně, protože se jedná o jednoduchý senzor zařízení, a já budu dělat sadu analytiků v tu chvíli po chvíli změnit zážitky. Takové zážitky podobné Nestu, pro které vidím případy použití Aerospike.

Robin Bloor: Dobře, to, co jsem očekával u internetu věcí, bylo, že začnete dostávat prahové hodnoty a že začnou vytvářet kaskády událostí. Už jste něco takového viděli, nebo jste to ještě neviděli?

Brian Bulkowski: Dez a já jsme byli - jen jsem se ptal Dezova názoru na to, když jsme byli před show show. Co jsem ještě neviděl, je druh kaskády dat jedné společnosti kaskádující do jiné společnosti, že moje lednička Samsung mluví s mou pračkou LG, protože právě přišlo na to, že jsem rozlil spoustu čokolády po celé podlaze, takže takovou společnost od společnosti k zařízení, myslím, že na to stále čekám, pokud jde o internet věcí. Myslím, že existují určité problémy v podnikání a bezpečnosti, které jsou většinou netechnické, a proto je třeba na to odpovědět.

Robin Bloor: Dobře, Dez?

Dez Blanchfield: Mám skutečně velmi silné názory na tento konkrétní poslední bod, který jen krátce uvedu do rozhovoru. Myslím si, že často si podnikání a technologie myslí, že ve skutečnosti řídí, odkud pochází poptávka, ale když se podíváme na to, co se stalo, když se iPhone stal věcí, a podle mého názoru to bylo něco jako první mobilní zařízení, pokud budete milovat hříčka, ale zařízení, které by bylo možné přenášet a které ve skutečnosti může spouštět spoustu malých aplikací ve vaší kapse, a přineslo to významnou transformaci toho, co jsme si mysleli o tom, že jsme počítač. Mnoho lidí přemýšlí o telefonech iPhone, chytrých telefonech nebo telefonech se systémem Android jako o telefonech, ale nejsou, jsou to vlastně jen malý počítač, který spouští aplikace, a jedna z aplikací, která běží, vyřizuje hovory, a nejde o hovory, o kterých si myslíme, že už nejsou analogovým hovorem typu point-to-point, jak zdůraznil Brian, jsou to malé pakety, které jsou směrovány kolem.

Ale častěji než ne, to, co jsme viděli, je toto povstání smartphonů, které se ve skutečnosti nepoužívají k telefonování, takže 98% pravděpodobnosti toho, co na svém smartphonu dělám, není volání. Je to všechno kromě volání, jsou to aplikace. Myslím, že tento kaskádový efekt - a já se ho snažím rychle na tuto otázku položit - ale kaskádový efekt je ve skutečnosti způsoben spotřebiteli, a ve skutečnosti mám jednu linii, kterou často vyhodím, abych získal spoustu CXO sedět v místnosti a věnovat pozornost, pokud si myslím, že zaspí s prezentací, kterou dělám, což se, doufejme, nestává příliš často.

Říkal jsem to v tom nepořádku, které ve vaší firmě vidíte, ve skutečnosti není poháněn výhradně technologií, je to častěji než to, že nejsou poháněni vašimi zákazníky. A tak trochu sedí a vlastně se diví, co tím myslí? Takže když přemýšlím o používání technologie, myslím, že jsme viděli USENET, viděli jsme všechny takové zábavné věci, které se dějí na internetu, ale mnoho lidí předpovídalo sociální a jejich dopad. Každý, kdo chce všem sdělit, co mají k snídani, a hluk, který to vytvořilo, a technologii backendu, kterou jsme měli, a pak se reklama samozřejmě snaží naplnit věcmi.

Myslím, že uvidíme kaskádový efekt do bodu, kdy zařízení mluví se zařízeními, spotřebitelé prostě dohánějí, co to ve skutečnosti znamená a co to může udělat. Zvýšil jste zajímavý bod kolem toho, proč tlačítko Amazon s Walmartem nemluví. Chystám se zveřejnit tuto otázku, co se stane, když Walmart dostane své vlastní tlačítko, a co když pokud dvacet nejlepších Amazonů a Walmartů a další hlavní distribuční a maloobchodní sítě získají vlastní tlačítka? Kam nás to vezme? Konkrétně má otázka s Brianem zní: „Kam jdeme s tímto úplně novým vzorem výkonu? Jste na hranici krvácení a pracujete se společnostmi, které to dělají jak na úrovni fyzické infrastruktury, tak na úrovni přenosu dat. Kam nás to vezme, až přijde další velká vlna? Jaký druh poznatků se o tom můžete podělit s tím, co se děje na pozadí vaší zkušenosti? “

Brian Bulkowski: Jistě, tak o tom, jak přemýšlím o mnoha těchto věcech, je zaměřit se na uživatelské zkušenosti a přesně to, co jste řekl, jsou to uživatelé, kteří řídí, i když jako technologové a jako podnikatelé bychom mohli přijít s chytrý nápad, který si myslíme, že uživatelé mají rádi, a já se nějak vrátím k příkladu Nest. Když moje sestra nainstalovala Nest ve svém domě, řekla: „Můj dům je tišší, slyším věci. Nejde jen o to, že platím méně za energii, “říká, ale nyní jste nemohli vytrhnout toho Nesta z rukou, protože se ráda nachází v tišším domě, na rozdíl od toho, kde vytápění fouká na maximum a pak se zase vypne.

Otázka nakonec zní: Jaké jsou uživatelské zkušenosti, které můžeme posílit? Nakonec to bude ta životní zkušenost, že pokud budeme mít peníze a budeme v prvním světě, zaplatíme hodně. Dám vám příklad z mého vlastního domu, moje přítelkyně má ráda studené mléko. Má ráda opravdu studené mléko, a tak se často musíme snažit zjistit, kde v lednici bude dost chladno, a zbytek věcí se přehřát nemusí. No, to je skvělé - a řekl jsem své přítelkyni: „Zaplatil byste 10 dolarů měsíčně za studené mléko a nezmrazené uzeniny?“ Byla jako „absolutně.“ A dostat 10 dolarů měsíčně od jakéhokoli spotřebitele je těžké.

Myslím si, že v těchto zkušenostech musíme opravdu dohlížet na to, co je to zážitek pro spotřebitele, který by se skutečně mohl řídit. Myslím, že to bylo součástí tajemství iPhone. Myslím, že je to součást tajemství, že společnost Tesla staví lepší auto se všemi údaji, ruší myšlenku výrobního cyklu a roční vydání a ve všech částech neustále vylepšuje. Budeme muset přijít s nějakými chytrými nápady, jak skutečně použít všechna tato data způsobem, který je přesvědčivý okamžik za okamžikem pro životy lidí.

Dez Blanchfield: Jo, to je skvělý přehled. Vedoucí z toho, na druhém konci spektra, které se přesně odráží s nejrůznějšími věcmi, které nyní vidíme s tím, co spotřebitelé žádají, a my všichni máme v domě něco, co je z toho chladné a teplé. Druhým koncem spektra je pak, a my jsme to viděli v jakémsi tradičním „velkém datovém světě“, kde se přiřazení dat stává vzácnějším než slepičí zuby a ty, které jsou na trhu, jsou nabízeny více, než si CIO vydělávají v některých případech typy společností, se kterými pracujete, a typy vývoje, které jste viděli, je to tak, že typy vývojářů a typ datových architektů a síťové speciály jsou stále těžší a těžší najít ? Potřebujeme organizace, aby nyní začaly přemýšlet o tom, jak se dostat před křivku typu dovedností, které potřebují v pozadí pro vývojáře a datové architekty? Co vidíte na této úrovni, pokud jde o dovednosti, kterým budou rozumět, jak nyní tuto technologii správně využít?

Brian Bulkowski: Jo, myslím, že to je jedna z výzev, kterým čelí organizace, se kterými jsem mluvil. Ať už to bude - nejhorší problémy, o kterých jsem slyšel, jsou ve skutečnosti větší podniky, protože pokud řeknete: „Jsem z této velké banky, jsem z Chase a já jsem byl datový architekt, “ Dostal jsem na světě ústřici a váš plat se zvedl, takže je tu problém s churnem získat zaměstnání na jednom z těchto míst, protože není dost lidí, a pak je schopen se jen stěhovat z práce do práce. Neslyším nic jiného než tento druh problému, a to je vlastně jeden z důvodů, proč jsem zaměřil Aerospike kolem pomocí nástrojů, které jsou vhodné pro konkrétní projektový tým.

Místo toho, abyste se pokusili vstoupit do projektového týmu a řekli: „Hej, měli byste použít náš dotazovací jazyk.“ Podívejte, jestli tito kluci dnes jezdí autobusem, kluci a holky, a pokud používají konkrétní dotazovací jazyk a nástroje, budou se tím držet a já je nemůžu promluvit v nic jiného. Mým cílem je být schopen umístit druh energie Aerospike jako databázi za jakékoli nástroje, které používají, a to je součástí tohoto nápadu, snímků, které vidíte o budoucnosti databáze Poliglot. Potřebuji podporovat vzory aplikací a analytiky mezi těmito kluky, protože je opravdu obtížné najít lidi, kteří mají matematické zázemí, stejně jako statistické schopnosti navigovat tento svět.

Dez Blanchfield: Další zajímavá věc, kterou si lidé nemusí být vědomi, myslím, že Aerospike je velmi silný hráč ve světě open source, rád bych získal velmi rychlý přehled o tom, co to znamená, pokud jde o to, jak podnikání funguje a co to pro vás znamená. Zmínili jste se, že jste pracovali přímo s lidmi, kteří dělají věci až na úroveň jádra uvnitř, takže jádro Linuxu. Existují někteří velcí hráči, kteří jsou v tomto prostoru, a tam jsou některé slavné značky, které nebudeme zmiňovat, ale organizace, jako je Aerospike, ve vaší modernější nedávné historii, open-source zážitek, jak to zapadá do celkového obrazu a jaké konkurenční výhody jste viděli?

Brian Bulkowski: Jistě, když jsme v roce 2014 přešli na open source, udělali jsme to proto, že jsme si uvědomili, že základní infrastruktura, jako je databáze, musí být dostupný zdroj, musí být důvěryhodná a přirozená protiváha mezi starým uzavřeným světem zdroj, a jakmile investujete do konkrétní databáze, ti chlapi vás mají na milosrdenství za technologický cyklus po technologickém cyklu a musí existovat rovnováha. Musíme být schopni přinést verze, které dělají nové věci, a možná je to v podnikové verzi, musíme mít duální licenční model, který má open-source verzi pro lidi, kteří kopají do pneumatik a dělají neziskovou práci, stejně jako podniková verze, která je vlastnictvím licence a umožňuje neomezenou práci.

A samozřejmě budeme mít také nejvyšší úrovně rychlosti a měřítka, což je podniková verze. Věříme v duelní licenční model a to bylo skvělé pro naše podnikání. Chceme, aby lidé začali s Aerospike, chceme, aby malé projekty kopaly pneumatiky, je super snadné jít do Amazonu, spustit skript pro potvrzení a nechat do pěti minut běžet klastr Aerospike. Na druhé straně chceme dát více podnikovým zákazníkům.

Dez Blanchfield: Přibližujeme se k vrcholu hodiny, takže za chvilku přejdu zpět k Rebecce, ale pokud by tam byl jen jeden parník, který byste tam vyhodili, druh rady dali byste lidem, kteří se chtějí dostat do prostoru technologie, kterou jste přinesli na trh, a jak ji přijmou, co byste řekli, prvním krokem pro ně je, aby alespoň ponořili své prst a začněte se dívat, jak získají konkurenční výhodu z vaší platformy?

Brian Bulkowski: Jistě, součástí této zprávy je, že úrovně rychlosti a dovednosti jsou nyní snadné. K dosažení miliónů transakcí za sekundu nepotřebujete klastr Cassandra s tisíci uzly. Můžete to udělat i v prvních fázích projektu. Věci jsou tedy mnohem jednodušší, než tomu bylo dříve. Druhou radou je, že budete muset přijít s, jak říkáte, matematické modely obchodních procesů se zákazníky, které využívají všechna tato data, takže dobrá zpráva je, že data jsou k dispozici, špatná zpráva je, že musíte jít najít nějaké vzory a některé přesvědčivé případy použití.

Dez Blanchfield: Jo, skvělá rada, takže se teď vrátím Rebecce. Díky moc za to, byl to skvělý malý chat o technologii, vážím si toho.

Rebecca Jozwiak: Díky, Dez. Mám několik dobrých otázek od publika. Nech mě to hodit. Vím, že jste hovořili o systému záznamů a mainframe, ale jak často vidíte absolutní offloading, nebo je replikací na konci dne smíření, o čem víc vidíte?

Brian Bulkowski: To, co vidíme v Aerospike, používá databázi NoSQL před tímto systémem usmíření na konci dne. Potřebujete intraday, správnou odpověď. Nemůžete mít špatnou odpověď, a to bylo to, co Robin řekl o aktivu, je podceňováno, ale obchodní procesy kolem zákonných požadavků na usmíření se mohou značně komplikovat a kolem desítek let technologie a desetiletí zákona a právní praxe se kolem usmíření děje. Takže to, co vidíme na Aerospike je, že budete dělat své algoritmy v horkější databázi s více transakcemi za sekundu. Ale z právních důvodů potřebujete absolutně systém usmíření, který prošel těmito právními procesy. Vidíme obojí a vidíme, že toto je v podstatě dvojstupňová IT praxe, která je do jisté míry vystavena lidmi, jako jsou Anderson Consulting a Gartner. Vidíme toho hodně.

Rebecca Jozwiak: Dobře, dobře. Někdo jiný projevil zájem o tento konkrétní snímek, řekl, že je to opravdu zajímavé a přemýšlel, jestli byste mohli jít do trochu více porovnávání flash versus v paměti.

Brian Bulkowski: Jasně, dovolte mi vzít si rychlý postranní panel, znovu vím, že jsme blízko konce. Flash je paměť - jsou to čipy - mám sklon myslet na RAM. RAM má tedy zvláštní vlastnosti, vyžaduje hodně energie, je velmi dobrá při náhodných zápisech i náhodných čteních. Tam, kde je NAND schopen rychlých náhodných čtení a nižších výkonů, ale při náhodných zápisech je to velmi špatné. Existují jemné rozdíly v tom, jak tyto dva čipy fungují na úrovni litografie, což vytváří řadu technických rozdílů.

V případě, že děláte analytiku a musíte přeskočit přes mnoho dat, nebo v případě Aerospike, kde máte indexy, jsou indexy stále velmi dobré používat v RAM kvůli paralelismu a náhodnému přístupu. Vyžaduje se vyšší úroveň náhodného přístupu. V Aerospike však najdeme použití těchto indexů k nalezení konkrétního objektu nebo kusu dat, to je vhodné místo pro oslovení NAND, protože se to stává jakýmsi větším úložištěm pod indexy. To je jedna transakce s paměťovým zařízením, ale i po provedení mnoha možností a filtrů ve vašem indexovacím systému.

Rebecca Jozwiak: Dobře, dobře. A pak vím, že už jsme hodně hovořili o internetu věcí a jeden komentář účastníka řekl, že internet věcí je velmi prospěšný, ale jsou společnosti, vládní subjekty a vývojáři bezpečně rostoucí a zabezpečují data stejnou rychlostí, myslíte?

Brian Bulkowski: Možná, Dezi, chtěli byste skočit?

Dez Blanchfield: Ano, jsem rád, že jsem do toho skočil. Myslím, že odpověď zní ne. Ve skutečnosti je jednou z mých nejoblíbenějších úsečných linek na toto téma velmi, velmi stručně, že si myslím, že výbuch stroje na stroj a obecný internet věcí, komunikace a bezpečnost, riziko kolem něj, jsme nyní v bodě, kde vlády nemohou držet krok s mírou změn. A ve skutečnosti víme, že mnoho organizací nedokáže držet krok s mírou změn. Ve skutečnosti, pokud jsem to parafrázoval, je dnes rychlost změn tak velká, že organizace musejí sprintovat, aby udržely krok, ale musí sprintovat ve více závodech. Nemyslím si, že zákon a nemyslím si, že vláda obecně, ať už státní nebo federální, je schopna držet krok s mírou změn.

Nyní je moje obecná rada lidem něco jako akt a požádám o odpuštění později. V minulosti to bylo mnoho příkladů. Budou to dohánět, ale myslím si, že je nyní na podnikatelských a technologických poskytovatelích, aby v tomto prostoru nějak inovovali a zajistili, že jsme obeznámeni s bezpečnostními riziky nebo riziky soukromí a musíme s nimi vypořádat. Zejména banky, jak jste zmínil, když přemýšlíte o tom, co bankovní organizace tradičně dělala s věcmi, jako je praní špinavých peněz a znáte svého klienta, výzvu AML / KYC, bývalo to, že jsme se každé tři až pět let snažili a splnit shodu.

Teď si myslím, že to musí být zabudováno do každé jednotlivé transakce. To jste vždy dokázali udělat na úrovni nabídek s reklamou a obchodem s akciemi, obligacemi a akciemi, myslím, že jsme v bodě, kdy výkon, který přinášíte s platformou Aerospike, nám umožňuje nyní přemýšlet o tom, jak přinášíme soukromí, jak přidáme zabezpečení do tohoto okamžitého řetězce rozhodnutí v reálném čase? A tak odpověď zní ne, nemyslím si, že by vlády držely krok. Myslím, že společnosti musí držet krok, a myslím, že musíme jednat hned a požádat o odpuštění později.

Brian Bulkowski: Dovolte mi ještě pár bodů. Kluci, se kterými se zabývám, technologické společnosti, se kterými se zabývám, si velmi dobře uvědomují, že jsou na správné straně zákona, a velká část diskuse je, je tento PII, mohu to použít, jak jsem Používám tento konkrétní kus dat? Jaká byla prozřetelnost a je to chráněné rozhodnutí nebo zkušenost? Jak to všechno udělat? To je dobrá zpráva. Někdy se zajímám o naši diskusi jako společnost kolem místa, kam směřujeme, a pokud je i naše společenská diskuse na vhodné úrovni, pokud jde o využívání nových schopností od internetu věcí až po strojové učení, což je jediný způsob třídit objemy dat, které máme. Dobrou zprávou však je, že kluci, se kterými jsem mluvil, jsou opravdu na pravé straně a snaží se činit právo na základě právních rozhodnutí, která jsme učinili.

Rebecca Jozwiak: To jsou některé opravdu dobré odpovědi od vás obou a já naprosto souhlasím. Nemyslím si, že se bezpečnost pohybuje rychleji než vývoj technologií, zejména pokud jde o internet věcí, ale musím si myslet, že lidé dělají maximum a doufejme, že se tam dostaneme. Vždy je trochu těžké zůstat deset kroků před kybernetickými zloději a kybernetickými zločinci, ale dostaneme se tam.

Dobře lidi, za osm hodin jsme zašli za osm hodin. Chtěl bych poděkovat našim hostům Brian Bulkowski z Aerospike a Dez Blanchfield a Robin Bloor. Děkuji mnohokrát. Naše archivy můžete vždy najít na insideanalysis.com, SlideShare, YouTube, máme spoustu dobrých webcastů přicházejících lidí, je to rušný měsíc. Příští měsíc to bude rušný měsíc, takže zůstaňte naladěni a doufáme, že se příště uvidíme. Díky lidi, sbohem.

Odhalující diferenciace: přichází nová éra škálovatelné infrastruktury