Domov Databáze Co je paralelní analýza dat? - definice z techopedie

Co je paralelní analýza dat? - definice z techopedie

Obsah:

Anonim

Definice - Co znamená paralelní analýza dat?

Paralelní analýza dat je metoda pro analýzu dat pomocí paralelních procesů, které běží současně na více počítačích.

Tento proces se používá při analýze velkých datových souborů, jako jsou velké záznamy telefonních hovorů, síťové protokoly a webové úložiště, pro textové dokumenty, které mohou být příliš velké na to, aby mohly být umístěny do jediné relační databáze. Tato metoda je často používána v analýze velkých dat a obecné analýze dat.

Techopedia vysvětluje analýzu paralelních dat

Primárním konceptem paralelní analýzy dat je paralelismus, definovaný v počítačích jako simultánní provádění procesů.

Toho je často dosaženo použitím více procesorů nebo dokonce více počítačů a je to běžná praxe v distribuovaných počítačích. V paralelní analýze dat různé počítače provádějící různé aspekty analýzy dat současně provádějí tyto procesy a poté později konsolidují výsledky do jediné velké zprávy.

Důvodem pro tento paralelismus je hlavně zrychlení analýzy, ale také proto, že některé datové soubory mohou být příliš dynamické, příliš velké nebo prostě příliš nepraktické, aby mohly být umístěny efektivně do jediné relační databáze. Výsledkem by bylo, že tyto datové soubory jsou umístěny v různých databázích optimalizovaných pro tento druh dat a v různých strojích, takže lineární analýza prostě nebude efektivní možností.

Co je paralelní analýza dat? - definice z techopedie