Obsah:
Objem dat rychle roste díky používání mobilních zařízení, sociálních médií a dat z jiných nestrukturovaných zdrojů. Velké datové technologie, jako je Hadoop, přicházejí na místo řidiče v obchodním světě zavedením nových přístupů k analýze větších objemů dat z různých zdrojů.
Velká data jsou definována jako objem, rozmanitost a rychlost dat, která přesahuje schopnost organizace organizovat a analyzovat je včas. Skutečná výhoda velkých dat je realizována tehdy, když je lze sbírat pro rychlá, na faktech založená rozhodnutí, která mohou vést k velkým obchodním rozhodnutím. Organizace, které jsou schopny prozkoumat a využít výhod velkých dat, tedy mají zřetelnou výhodu. Zde se podíváme na to, co velká data dokážou, jak je lze aplikovat v jedné oblasti bohaté na data a jaké širší aplikace to má pro další oblasti podnikání a vlády.
Výbuch dat
Nejlepší způsob, jak definovat velká data, je „neustále rostoucí množství a složitost informací, které každý z nás vytváří a konzumuje každý den, “ říká Charlie Schick, ředitel řešení velkých dat pro zdravotnictví a vědy o životě v IBM. Ve skutečnosti každý den vytváříme přibližně 2, 5 milionu bajtů dat pomocí různých zdrojů, od různých záznamů o transakčních nákupech po zdravotnické lékařské obrazy, od vědeckých výzkumných zjištění po zprávy ze sociálních médií.
Vyhledávače spolu se sociálními médii, jako je Twitter, vytvořily novou instanci malých kousků dat, které se shromažďují ve velkém měřítku. Také to změnilo náš způsob přemýšlení o shromažďování a správě těchto dat. Současná kultura má spotřebovat větší množství těchto malých datových kusů v krátkém časovém období. Tento přístup představuje obrovské výzvy i vzrušující příležitosti pro správu dat. Aby obchodní model uspěl, měl by být schopen zpracovat větší objemy dat zachycených malými a stále rozmanitějšími způsoby.
Vzhledem k objemu dat se stává výzvou najít účinný mechanismus pro jejich shromažďování. Podívejme se na případy zdravotnictví a sociálních médií. Obě tyto oblasti mají velké soubory dat. Sběr dat pro tato pole je důležitým krokem ve vývoji velkých dat. Bez vhodného mechanismu pro sběr dat nemůžeme mít přesné výsledky.
Zkoumání a zpracování velkých dat
Do budoucna se předpokládá, že organizace, které mohou prozkoumat a využít velká data, by měly být schopny rychle přijímat rozhodnutí založená na důkazech rychle. Použitím velkých dat můžeme snadno poskytnout odpovědi na některé významné otázky téměř v jakékoli oblasti. Zde se však podíváme na sektor sociálních služeb, oblast, kde velká data mají moc mít obrovský dopad.
Například velká data by měla být schopna analyzovat a odpovídat na následující otázky a v konečném důsledku poskytnout lepší výsledek pro pacienta:
- Jaký je vztah mezi opětovným přijetím a přístupem k sociálním službám?
- Existuje nějaká korelace mezi délkou pobytu a účinností intervence?
- Jaký je vztah mezi domácí adresou a frekvencí návštěvy?
- Je možné najít souvislost mezi rodinným stavem, zásahy a výsledky, které nám mohou pomoci identifikovat podobné uchazeče o intervenci při vstupu do systému péče?
- Existuje náhled na část populace, která nás vede k vyladění našich programů, abychom buď reagovali na negativní trendy, jako je těhotenství mladistvých nebo domácí násilí, nebo se posunuli vpřed?
Velká data umožňují řešit tyto situace a zjistit příčinu problémů. To nám pomáhá odstranit problém, jakmile bude identifikován. Tento problém můžeme objevit pouze při pohledu na trendy a historická data. V sociálních médiích musíme při analýze dat mít mechanismus analýzy trendů. Čím větší soubor dat analyzujeme, tím lepší a přesnější výsledky můžeme dosáhnout. Velká data nejen poskytují způsoby zpracování velkých objemů dat, ale také poskytují inovativní řešení pro zpracování širšího rozsahu dat. Velká data mají schopnost zpracovat strukturované, nestrukturované a polostrukturované sady dat. (Další informace naleznete v 5 problémech reálného světa, která mohou vyřešit velká data.)
Analýza velkých dat v sociálních vědách
Analytika sociálních dat není ničím jiným než analýzou sociálních dat. Tato data mohou pocházet z jakéhokoli pole. Jak bylo uvedeno výše, musíme zjistit konkrétní důvod negativních výsledků - například předčasného ukončení školní docházky - v určitém odvětví. Jakmile je problém identifikován, je snazší zvládnout situaci. Velká data jsou nástroj, který umožňuje nalezení těchto poznatků.