Domov Trendy Jak lze stávající prostředí datového skladu nejlépe přizpůsobit potřebám analýzy velkých dat?

Jak lze stávající prostředí datového skladu nejlépe přizpůsobit potřebám analýzy velkých dat?

Anonim

Q:

Jak lze stávající prostředí datového skladu nejlépe přizpůsobit potřebám analýzy velkých dat?

A:

Projekty individuálního datového skladu je třeba posuzovat případ od případu. Obecně platí, že ve snaze roztažit stávající návrh datového skladu, aby bylo možné lépe zpracovat analytiku velkých dat, existuje základní proces, jak zjistit, co je třeba udělat. IT profesionálové to mohou nazvat „škálování“ nebo „škálování“.

Webinář: Big Iron, Seznamte se s velkými daty: Osvoboďte mainframe data pomocí Hadoop & Spark

Registrujte se zde

Rozšíření obvykle zahrnuje zkoumání dostatečného výkonu zpracování, získání dostatečného množství paměti a přizpůsobení výkonnějších činností serveru pro zpracování všech větších datových sad, které bude podnik zpracovávat. Naproti tomu škálování může znamenat shromažďování shluků hardwaru serveru a jejich propojení do Corral velkých dat.

Někteří odborníci v oblasti IT navrhli, že běžnější metodou s Apache Hadoop a dalšími populárními nástroji a platformami velkých dat je škálování a shlukování hardwaru pro dosažení požadovaných efektů. Jiní však poukazují na to, že s dnešními technologiemi se datový sklad může rozšířit pomocí strategie nákupu, která přidává prostředky na server, například získáním většího počtu jader zpracování spolu s větším množstvím paměti RAM.

Ať už se rozšiřují nebo zmenšují, datové sklady potřebují další fyzické hardwarové prostředky, aby zvládly větší pracovní zatížení dat. Potřebují také další lidskou správu, což znamená více školení pro interní týmy. Do projektu je potřeba hodně plánování, aby bylo možné určit, jaký druh stresu a tlaku bude mít větší pracovní zatížení dat na existující starší systém, aby jej bylo možné vybavit novým velkým datovým ekosystémem. Velkým problémem jsou úzká místa pro ukládání, která vyžadují upgrade na úložná střediska, a další druhy úzkých míst pro výkon, která mohou narušit rodící se systém, pokud nejsou řešeny.

Jak lze stávající prostředí datového skladu nejlépe přizpůsobit potřebám analýzy velkých dat?