Q:
Proč by manažeři měli chránit před redundancí databáze?
A:Správci databází a další odborníci v oblasti IT by se měli chránit před „redundancí databáze“ nebo „redundancí dat“ kvůli všem negativním dopadům, které může mít redundance v databázovém systému nebo prostředí. Kdekoli je určitá část dat duplikována, buď ve dvou polích v databázi, nebo ve dvou různých databázových prostředích, může to mít důsledky pro získávání dat.
Jedním z prvních důvodů, jak se vyhnout nadbytečnosti dat, je to, že může být zbytečné nebo nadměrné.
Je důležité zdůraznit, že některé typy redundance dat jsou plánovány, aby byla zajištěna a zálohována data. Jiné však vyplývají ze špatného nebo neefektivního kódování nebo z nedostatečné pozornosti na osvědčené postupy. V mnoha případech způsobuje nadměrné množství dat, že databáze rychle roste nad přiměřenou velikost. S ohledem na to se vynakládá velké úsilí v boji proti redundanci dat, aby se ušetřilo místo v databázi a následně se snížily náklady a úsilí o údržbu. To však musí být provedeno s ohledem na praktičnost - inženýři mohou praktikovat něco, čemu se říká deduplikace dat, ale musí to být provedeno efektivním způsobem.
Správci databází mohou například prozkoumat něco jako odebrání řetězce z opakovaného pole, jako je například sdílený zákazník nebo název společnosti, a jeho nahrazení jednoduchým odkazem na proměnnou, kde se řetězec nachází někde jinde. To může ušetřit místo v databázi - ale může také vyžadovat více činnosti serveru k provedení daného dotazu, takže nemusí být tak efektivní, jak se zdá.
Dalším velkým důvodem deduplikovat data nebo zabránit nadbytečnosti dat je zmatek, který může vyústit. Redundantní data v databázi mohou způsobit různé typy anomálií. Jeden z nich se nazývá anomálie aktualizace - aktualizační anomálie se stanou, když je záznam znovu zadán s aktualizovanými informacemi, ale aktualizace ho nepřesune zpět k původnímu záznamu. V takové situaci mohou existovat tři různé záznamy o konkrétním zaměstnanci společnosti se třemi různými názvy pracovních míst a třemi různými adresami, protože informace o osobě nebyly aktualizovány v celé databázi, ale pouze v posledním vloženém záznamu.
Jak navrhli odborníci, správci databází se mohou záměrně vyhnout redundanci dat. Mohou se také zapojit do postupů normalizace dat, které mohou opravit anomálie aktualizace a další druhy anomálií standardizací způsobu, jakým se uchovávají záznamy databázových tabulek. Správci databáze mohou také usilovat o deduplikaci dat, která vyčistí a standardizuje data jiným způsobem. To vše slouží k vytvoření čistějších databázových tabulek, zajištění konzistentnějších záznamů databáze a zabránění všem bolestem hlavy a složitým problémům spojeným s neplánovanou redundancí dat.