Domov Databáze Co je objev znalostí v databázích (kdd)? - definice z techopedie

Co je objev znalostí v databázích (kdd)? - definice z techopedie

Obsah:

Anonim

Definice - Co znamená vyhledávání znalostí v databázích (KDD)?

Zjišťování znalostí v databázích (KDD) je proces objevování užitečných znalostí ze sběru dat. Tato široce používaná technika dolování dat je proces, který zahrnuje přípravu a výběr dat, čištění dat, začleňování předchozích znalostí o souborech dat a interpretaci přesných řešení z pozorovaných výsledků.

Mezi hlavní oblasti použití KDD patří marketing, detekce podvodů, telekomunikace a výroba.

Techopedia vysvětluje získávání znalostí v databázích (KDD)

Tradičně bylo dolování dat a získávání znalostí prováděno ručně. Jak čas ubíhal, množství dat v mnoha systémech rostlo na větší než terabajtová velikost a již nebylo možné je udržovat ručně. Navíc pro úspěšnou existenci jakéhokoli podnikání je považováno za zásadní objevování základních vzorců v datech. V důsledku toho bylo vyvinuto několik softwarových nástrojů pro objevování skrytých dat a vytváření předpokladů, které tvořily součást umělé inteligence.

Proces KDD dosáhl svého vrcholu za posledních 10 let. Nyní obsahuje mnoho různých přístupů k objevům, které zahrnují induktivní učení, bayesovskou statistiku, optimalizaci sémantického dotazu, získávání znalostí pro expertní systémy a teorii informací. Konečným cílem je získat znalosti na vysoké úrovni z dat na nízké úrovni.

KDD zahrnuje multidisciplinární činnosti. To zahrnuje ukládání a přístup k datům, algoritmy škálování rozsáhlých datových sad a interpretaci výsledků. Proces čištění dat a přístup k datům zahrnutý do datového skladu usnadňují proces KDD. Umělá inteligence také podporuje KDD objevováním empirických zákonů z experimentů a pozorování. Vzory rozpoznávané v datech musí platit pro nová data a musí mít určitou míru jistoty. Tyto vzorce jsou považovány za nové znalosti. Kroky zapojené do celého procesu KDD jsou:

  1. Identifikujte cíl procesu KDD z pohledu zákazníka.
  2. Pochopte příslušné aplikační domény a potřebné znalosti
  3. Vyberte cílovou datovou sadu nebo podmnožinu vzorků dat, na kterých se má provádět vyhledávání.
  4. Vyčištění a předzpracování dat rozhodováním o strategiích, jak zpracovat chybějící pole a změnit data podle požadavků.
  5. Zjednodušte sady dat odstraněním nežádoucích proměnných. Poté analyzujte užitečné funkce, které lze použít k reprezentaci dat, v závislosti na cíli nebo úkolu.
  6. Porovnejte cíle KDD s metodami dolování dat, abyste navrhli skryté vzory.
  7. Chcete-li objevit skryté vzory, vyberte algoritmy dolování dat. Tento proces zahrnuje rozhodnutí, které modely a parametry by mohly být vhodné pro celkový proces KDD.
  8. Hledejte vzorce zájmu v konkrétní reprezentativní formě, které zahrnují klasifikační pravidla nebo stromy, regrese a shlukování.
  9. Interpretovat základní znalosti z těžených vzorců.
  10. Využijte znalosti a začleňte je do jiného systému pro další akci.
  11. Dokumentujte to a podejte zprávy zúčastněným stranám.
Co je objev znalostí v databázích (kdd)? - definice z techopedie