Q:
Jaké jsou čtyři základy stát se dobrým vědcem v oblasti dat?
A:Jak mnozí odborníci poukazují, stát se skvělým vědcem v oblasti dat vyžaduje kombinaci dovedností a zkušeností, které se získají díky specializovanému učení a analýze složitého oboru. Vědci dat jako správci a kurátoři cenných datových aktiv jsou dnes velmi žádaní. Pojďme se podívat, co některé z těchto základních dovedností zahrnují.
První ze čtyř základních složek práce vědců s údaji je matematika a statistika. Vědci dobrých údajů by se měli naučit být obeznámeni s různými matematickými pojmy souvisejícími s dohledem a bez dozoru o strojovém učení, včetně typů algoritmů, jako jsou rozhodovací stromy, náhodný les, logická regrese, shlukování a používání dimenzionality ve strojovém učení (ML). Obecně by měli mít dobrou znalost práce s matematickými rovnicemi a statistikami za použití zdrojů statistické analýzy.
Druhou hlavní základní složkou práce s údaji je programování a správa databází. Jednotlivci by měli být silní ve skriptovacích jazycích jako Python a statistických jazycích, jako je R, spolu se zkušenostmi a dovednostmi s databází a sémantikou SQL a operačními technikami. Znalosti softwarových komponent, jako jsou Hadoop, MapReduce, Hive a Pig, jsou také atraktivní pro zaměstnavatele.
Třetím základním prvkem stát se dobrým datovým vědcem je teoretická a filosofická složka pochopení vědy o datech a strojového učení. Tito jednotlivci by měli být sami začínajícími řešiteli problémů se zvědavými myšlenkami - koneckonců kombinují prvotní kvantitativní analýzu s tvůrčím porozuměním procesů strojového učení a vědy o datech. Spíše než být technickými čísly by měli mít hluboké základy toho, co to znamená vytvářet projekty strojového učení a pracovat na iniciativách v oblasti vědy o datech, pokud jde o konečné cíle a konečné výsledky.
Čtvrtý hlavní pilíř učení dobrým vědcům v oblasti dat zahrnuje práci s lidmi a schopnost používat data způsobem, který dává ostatním lidem smysl.
Dobří vědci v oblasti dat mohou být vypravěči - mohou převést kvantitativní data do příběhů a poznatků. Proto by měli mít dobré komunikační dovednosti, aby mohli svou práci předložit a efektivně ji šířit více zúčastněným stranám nebo danému publiku. To jsou některé z hlavních typů dovedností, které staví dobrého vědce v oblasti dat, který je připraven účastnit se dnešního rychle se rozvíjejícího a rychle se rozvíjejícího IT průmyslu.