Q:
Jaké jsou klíčové problémy, které je třeba zvážit ve strategii ukládání velkých dat?
A:Jedním z největších problémů, který je při ukládání velkých dat ignorován, je dostupnost týmů, které to potřebují. Data jsou pravidelně ukládána bez dokumentace, na místech, kde je obtížný přístup nebo kde příslušné týmy nevšímají skutečnosti, že vůbec existují. Nakonec by velké datové úložiště mělo přijmout první otevřenou strategii, kdy by týmy byly informovány o své existenci, o čem data sestávají a jak k nim přistupovat, aby je týmy mohly v softwaru v případě potřeby využít.
Dalším kritickým problémem, který shledávám, je kvalita ukládaných dat. Data by měla být uložena v té nejvyšší kvalitě, v jaké mohou existovat v místě svého konečného uložení. Ukládání dat nízké kvality do datového jezera je obvykle v pořádku, ale jak pokračuje v datovém potrubí, každá fáze by měla zvyšovat kvalitu dat tak, aby byla uložena v nejvyšší kvalitě v systému, jako je datový sklad nebo analytická databáze. Tím se zvýší kvalita systémů, které spotřebovávají místo odpočinku dat.