Domov Rozvoj Co je to čištění dat? - definice z techopedie

Co je to čištění dat? - definice z techopedie

Obsah:

Anonim

Definice - Co znamená Scrubování dat?

Čištění dat se týká postupu úpravy nebo odstranění neúplných, nesprávných, nesprávně formátovaných nebo opakovaných dat v databázi. Klíčovým cílem čištění dat je zpřesnit a konzistentní data.

Čištění dat je zásadní strategií pro zajištění toho, aby databáze zůstaly přesné. Je to zvláště důležité v odvětvích náročných na údaje, včetně telekomunikací, pojišťovnictví, bankovnictví a maloobchodu. Dělení dat systematicky vyhodnocuje data na chyby nebo chyby pomocí vyhledávacích tabulek, pravidel a algoritmů.

Čištění dat je také označováno jako čištění dat.

Techopedia vysvětluje čištění dat

Chyby databáze jsou běžné a mohou pocházet z následujících:

  • Lidské chyby při zadávání údajů
  • Sloučení databáze
  • Absence datových standardů pro celé odvětví nebo společnosti
  • Systémy ve věku, které obsahují zastaralá data

V minulosti bylo čištění dat prováděno ručně. To nejenže zvýšilo čas potřebný k dokončení procesu, ale také proces mnohem dražší a náchylnější k chybám. To vedlo k vytvoření účinných nástrojů pro čištění dat, které systematicky vyhodnocují údaje o vadách, které nebylo možné identifikovat v procesu ručního čištění.


Obecně se nástroj pro čištění databáze skládá z řešení, která jsou ideální pro nápravu několika konkrétních druhů chyb, jako je nalezení duplicitních záznamů nebo nahrazení chybějících PSČ. Sloučení chybných nebo poškozených dat je nejsložitějším problémem. Je to dokonce popsáno jako problém „špinavých dat“, protože každý rok stojí organizace miliony dolarů. Tento jev se zvyšuje se zavedením složitějších obchodních prostředí s více systémy a daty. Dočasné čištění dat pomáhá organizacím řešit tyto problémy poskytováním výkonných nástrojů pro čištění dat k identifikaci a odstranění nedostatků dat.

Co je to čištění dat? - definice z techopedie