Domov Databáze Co je dolování dat? - definice z techopedie

Co je dolování dat? - definice z techopedie

Obsah:

Anonim

Definice - Co to znamená dolování dat?

Dolování dat je proces analýzy skrytých vzorců dat podle různých perspektiv kategorizace do užitečných informací, které se shromažďují a shromažďují ve společných oblastech, jako jsou datové sklady, pro účinnou analýzu, algoritmy dolování dat, usnadňující obchodní rozhodování a další informace. požadavky na konečné snížení nákladů a zvýšení příjmů.

Těžba dat je známá také jako vyhledávání dat a vyhledávání znalostí.

Techopedia vysvětluje těžbu dat

Mezi hlavní kroky související s procesem dolování dat patří:

  • Extrahujte, transformujte a načítejte data do datového skladu
  • Ukládejte a spravujte data ve vícerozměrných databázích
  • Poskytujte přístup k datům obchodním analytikům pomocí aplikačního softwaru
  • Prezentujte analyzovaná data ve snadno srozumitelných formách, jako jsou grafy

Prvním krokem v těžbě dat je shromažďování relevantních dat kritických pro podnikání. Údaje o společnosti jsou transakční, neprovozní nebo metadata. Transakční data se zabývají každodenními operacemi, jako jsou prodeje, zásoby a náklady atd. Neoperativní data se obvykle předpovídají, zatímco metadata se týkají návrhu logické databáze. Vzory a vztahy mezi datovými prvky poskytují relevantní informace, které mohou zvýšit organizační příjmy. Organizace se silným zaměřením na spotřebitele se zabývají technikami dolování dat, které poskytují jasné obrázky prodaných produktů, ceny, konkurenci a demografii zákazníků.

Například maloobchodní gigant Wal-Mart přenáší všechny své relevantní informace do datového skladu s terabajty dat. K těmto datům mohou dodavatelé snadno přistupovat, což jim umožňuje identifikovat vzorce nákupu zákazníků. Mohou generovat vzory na nákupních zvyklostech, nejvíce nakupovaných dnech, nejvyhledávanějších produktech a dalších datech využívajících technik těžby dat.

Druhým krokem v těžbě dat je výběr vhodného algoritmu - mechanismu produkujícího model dolování dat. Obecná práce algoritmu zahrnuje identifikaci trendů v sadě dat a použití výstupu pro definici parametrů. Nejoblíbenější algoritmy používané pro dolování dat jsou klasifikační algoritmy a regresní algoritmy, které se používají k identifikaci vztahů mezi datovými prvky. Hlavní dodavatelé databází, jako jsou Oracle a SQL, zahrnují algoritmy dolování dat, jako je shlukování a regresní tress, aby uspokojily poptávku po těžbě dat.

Co je dolování dat? - definice z techopedie