Obsah:
- Zapojte všechny obchodní sekce do velké datové iniciativy
- Vyhodnoťte všechny modely infrastruktury pro implementaci velkých dat
- Při plánování velkých dat zvažte tradiční zdroje dat
- Zvažte konzistentní soubor dat
- Distribuujte data
- Nikdy se nespoléhejte na jediný velký analytický přístup k datům
- Nezačínejte velkou iniciativu velkých dat, než budete připraveni
- Nepoužívejte data izolovaně
- Neignorujte zabezpečení dat
- Neignorujte výkonovou část analýzy velkých dat
Velká data přináší mnoho příslibů pro všechny typy průmyslových odvětví. Pokud budou tato velká data využívána efektivně a efektivně, mohou mít významný dopad na rozhodování a analytiku. Přínos velkých dat však lze dosáhnout pouze tehdy, pokud je spravován strukturovaným způsobem. Postupně se zavádějí osvědčené postupy pro velká data, ale pokud jde o implementaci, již existují určitá jasná opatření.
Následující pokyny jsou založeny na praktických zkušenostech a znalostech získaných z reálných projektů. Tady jsou moje nejlepší velká data a nedělej.
Zapojte všechny obchodní sekce do velké datové iniciativy
Iniciativa velkých dat není izolovanou a nezávislou činností a zapojení všech obchodních jednotek je nutností k získání skutečné hodnoty a pochopení. Velká data mohou organizacím pomoci využít velké objemy dat a získat nahlédnutí do chování zákazníků, událostí, trendů, předpovědí atd. To není možné s datovým snímkem, který zachycuje pouze část celého objemu dat zpracovávaných ve velkých datech. V důsledku toho se společnosti stále více soustředí na všechny typy dat pocházejících ze všech možných cest / obchodních jednotek, aby pochopily správný vzorec.Vyhodnoťte všechny modely infrastruktury pro implementaci velkých dat
Objem dat a jeho správa je hlavním problémem jakékoli iniciativy s velkými daty. Protože velká data se zabývají petabyty dat, jediným řešením je správa dat pomocí datových center. Současně je třeba před výběrem a dokončením jakéhokoli skladovacího zařízení vzít v úvahu nákladovou složku. Cloudové služby jsou často nejlepší volbou, ale služby různých cloudových prostředí musí být vyhodnoceny, aby se určilo vhodné. Protože úložiště je jednou z nejdůležitějších součástí jakékoli implementace velkých dat, je to faktor, který by měl být v každé velké datové iniciativě vyhodnocen velmi pečlivě. (Získejte další pohled na dnešní velké datové výzvy pramení z rozmanitosti, nikoli objemu nebo rychlosti.)Při plánování velkých dat zvažte tradiční zdroje dat
Existují různé zdroje velkých dat a počet zdrojů se každým dnem také zvyšuje. Tento obrovský objem dat se používá jako vstup pro zpracování velkých dat. V důsledku toho si některé společnosti myslí, že tradiční zdroje dat jsou k ničemu. To není pravda, protože tato tradiční data jsou kritickou součástí úspěchu jakéhokoli velkého datového příběhu. Tradiční data obsahují cenné informace, takže by se měla používat ve spojení s jinými velkými zdroji dat. Skutečnou hodnotu velkých dat lze odvodit, pouze pokud jsou brány v úvahu všechny zdroje dat (tradiční i netradiční). (Další informace naleznete v tématu Vezměte to, velká data! Proč mohou malá data zabalit větší punč.)Zvažte konzistentní soubor dat
V prostředí velkých dat pocházejí data z různých zdrojů. Formát, struktura a typy dat se v jednotlivých zdrojích liší. Nejdůležitější část je, že data nejsou očištěna, pokud jde o vaše velké datové prostředí. Než tedy důvěřujete příchozím datům, je třeba zkontrolovat konzistenci opakovaným pozorováním a analýzou. Jakmile je konzistence dat potvrzena, lze s nimi zacházet jako s konzistentní sadou metadat. Nalezení konzistentní sady metadat pečlivým pozorováním vzoru je nezbytným úkolem při plánování velkých dat.Distribuujte data
Při zvažování prostředí pro zpracování je objem dat velkým problémem. Kvůli velkému objemu dat, se kterými velká data naráží, není zpracování na jednom serveru možné. Řešením je prostředí Hadoop, což je distribuované výpočetní prostředí, které běží na komoditním hardwaru. Poskytuje sílu rychlejšího zpracování na více uzlech. (Další informace o 7 věcech o Hadoopu.)Nikdy se nespoléhejte na jediný velký analytický přístup k datům
Na trhu jsou k dispozici různé technologie pro zpracování velkých dat. Základem všech velkých datových technologií jsou Apache Hadoop a MapReduce. Proto je důležité vyhodnotit správnou technologii pro správný účel. Některé z důležitých analytických přístupů jsou prediktivní analytika, preskriptivní analytika, textová analytika, analýza datových proudů atd. Výběr vhodné metody / přístupu je důležitý pro dosažení požadovaného cíle. Nejlepší je vyhnout se spoléhání na jediný přístup, ale prozkoumat různé přístupy a vybrat perfektní shodu pro vaše řešení.Nezačínejte velkou iniciativu velkých dat, než budete připraveni
Pro každou iniciativu s velkým objemem dat se vždy doporučuje začít malými kroky. Začněte tedy s pilotními projekty, abyste získali odborné znalosti, a poté se pusťte do skutečné implementace. Potenciál velkých dat je velmi působivý, ale skutečné hodnoty lze dosáhnout pouze tehdy, když snížíme počet chyb a získáme více odborných znalostí.Nepoužívejte data izolovaně
Velké zdroje dat jsou rozptýleny kolem nás a každým dnem rostou. Pro získání správného analytického výstupu je důležité všechna tato data integrovat. Na trhu jsou k dispozici různé nástroje pro integraci dat, ale měly by být před použitím řádně vyhodnoceny. Integrace velkých dat je složitý úkol, protože data z různých zdrojů mají různý formát, ale je velmi důležité získat dobrý analytický výsledek.Neignorujte zabezpečení dat
Bezpečnost dat je hlavním aspektem plánování velkých dat. Zpočátku (před provedením jakéhokoli zpracování) jsou data v petabajtech, takže zabezpečení není přísně implementováno. Ale po nějakém zpracování dostanete podmnožinu dat, která poskytuje určitý přehled. V tomto okamžiku se stává nezbytná bezpečnost dat. Čím více jsou data zpracovávána a vyladěna, tím cennější je pro organizaci často. Tato jemně vyladěná výstupní data jsou duševním vlastnictvím a musí být zabezpečena. Zabezpečení dat musí být implementováno jako součást životního cyklu velkých dat.Neignorujte výkonovou část analýzy velkých dat
Výstup analýzy velkých dat je užitečný pouze tehdy, poskytuje-li dobrý výkon. Velká data nabízejí více poznatků na základě zpracování velkého množství dat vyšší rychlostí. Proto je nezbytné jej efektivně a efektivně řídit. Pokud výkon velkých dat nebude řádně spravován, způsobí to problémy a celé úsilí zmizí.
V naší diskusi jsme se zaměřili na to, co je a co není ve velkých iniciativách v oblasti dat. Velká data jsou nově se rozvíjející oblastí a pokud jde o implementaci, mnoho společností je stále ve fázi plánování. Je nezbytné porozumět osvědčeným postupům pro velká data, aby se minimalizovalo riziko a chyby. Body diskuse byly odvozeny ze zkušeností se skutečným projektem, takže budou uvedeny některé pokyny pro úspěšné provedení velké datové strategie.