Q:
Co znamenají velká data pro oficiální statistiky?
A:Otázka, jak velká data mohou změnit oficiální statistiky, a výzkum federálních nebo vládních agentur, je fascinující, částečně kvůli povaze moderních systémů těžby a sběru dat.
V některých ohledech velká data konkurují jiným tradičním metodám shromažďování informací. Například široce agregovaná data z internetu mohou být přesnějším prediktorem, než co vytváří „komunita odborníků“ v daném odvětví. To znamená, že velká data mohou tlačit různé typy oficiálních statistik k přesnějším předpovědím nebo efektivnější metodologii.
Dalším způsobem, jak data pravděpodobně změní oficiální statistiky, je to, že budoucí výzkumné metody mohou integrovat řešení velkých dat, aby mohly těžit z této složky výzkumného úsilí. Například americký úřad pro sčítání lidu provádí v USA mnoho fyzických auditů lidí, budov a infrastruktury, přičemž své statistiky zakládá na pozorováních a reakcích v reálném čase. Začlenění velkých dat do úsilí amerického sčítání lidu by mohlo znamenat agregaci internetových údajů o stejných systémech a jejich porovnání s tím, co pracovníci zjistí v této oblasti. Existuje celá řada způsobů, jak integrovat velké údaje a terénní výzkum, který určí konkrétní výsledky pro jakýkoli druh hospodářského, sociálního nebo průmyslově specifického výzkumného projektu.
Stručně řečeno, velká data změní oficiální statistiky na modernější a sofistikovanější formu reportingu, kde je pečlivá fyzická tabelace posílena technickými modely a algoritmy, které pracují na základě průměrování nebo promítání z obrovských objemů těžených nebo shromážděných údajů. To je jen jeden z důvodů, že obrovské množství velkých dat shromážděných vládami a podniky je tak cenné a pečlivě chráněno.