Mezi začínajícími technologiemi je datový vědec stále běžnějším pojmem, který se používá k označení geeků dat schopných přemostit tradičně oddělené funkční oblasti datové inteligence. Datový vědec je někdo, kdo pohodlně provádí několik (pokud ne všechny) aspekty projektů inteligence dat:
- Sběr dat: Může to vyžadovat psaní vlastních analyzátorů a webových prolézacích modulů nebo skriptů, které cílí na konkrétní webové služby nebo API pro netradiční zdroje dat.
- Správa dat: ETL, manipulace, dotazování a údržba dat v databázích, úložištích klíč-hodnota nebo Hadoop.
- Vizualizace informací: Odhalování vzorů pomocí statických vizualizačních nástrojů a / nebo interaktivních platforem založených na Flash, JavaScript nebo zpracování.
- Analytika: Může se pohybovat od jednoduchých až po složité techniky ve vícerozměrných statistikách, strojovém učení a NLP.
- Statistiky: Rozbalte, shrňte a prezentujte klíčová zjištění široké veřejnosti.
Existuje mnoho nástrojů, dovedností a technických detailů a člověk může strávit roky zvládnutím každé z výše uvedených položek. Zatímco vědec údajů nemusí mít v žádné z oblastí skutečné odborné znalosti, pohodlně přeskočí tam a zpět a plní základní úkoly ve všech oblastech. Výsledkem je datový geek natolik pohotový, aby rychle prozkoumal datový projekt a vytvořil odpovědi na otázky (na vysoké úrovni) od vedení. (o vědcích v Data Scientists: The New Rock Stars of Tech World.)
Pro podporu vědců v oblasti dat se společnosti musí více zaměřit na kulturu a organizační strukturu. Mnoho pracovníků s údaji má dostatek dovedností a školení, aby se rychle stali produktivními ve více oblastech datové inteligence. Problém je, že většina z nich nefunguje v prostředích, která je povzbuzují, aby se stali vědci v oblasti dat. Jsou zaseknutí v silech a omezují se na jednu nebo dvě oblasti datové inteligence. Často jsou omezeni na používání nástrojů „schválených“ jejich manažery.