Obsah:
Definice - Co znamená kanonizace?
Kanonikalizace je proces převodu dat, který zahrnuje více než jednu reprezentaci do standardního schváleného formátu. Taková konverze zajišťuje, že data odpovídají kanonickým pravidlům. Toto porovnává různé reprezentace pro zajištění rovnocennosti, pro počítání počtu odlišných datových struktur, pro uložení smysluplného pořadí třídění a pro zlepšení účinnosti algoritmu, čímž se eliminují opakované výpočty.
Kanonikalizace se používá v mnoha internetových a počítačových aplikacích pro generování kanonických dat z nekanonických informací. Kanonická reprezentace dat je široce používána v
optimalizace pro vyhledávače (SEO), webové servery, Unicode a XML.
Tento termín se také nazývá C14N, standardizace nebo normalizace.
Techopedia vysvětluje kanonizaci
V SEO se kanonicalization URL zabývá webovým obsahem s více než jednou možnou URL. To může způsobit nesrovnalosti ve vyhledávání, protože vyhledávací stroj nemusí vědět, která adresa URL by se měla zobrazit. Canonicalization vybere nejlepší URL z několika možností, obvykle se odkazovat na domovské stránky. Přestože se určité adresy URL zdají být stejné, webové servery vrátí různé výsledky pro adresy URL. Vyhledávače považují v kanonické podobě pouze jednu adresu URL.
Zabezpečení počítače je založeno na kanonizaci názvu souboru. Některé webové servery mohou mít bezpečnostní pravidlo pro spouštění souborů pouze v určitém adresáři. Soubor je poté spuštěn, pouze pokud má cesta ve svém názvu určený adresář. Zvláštní pozornost je třeba věnovat kontrole, zda je název souboru jedinečnou reprezentací. Taková zranitelnost se nazývá procházení adresáře.
Většina znaků standardu Unicode má kódování s proměnnou délkou. To vyžaduje zvážení každého znaku řetězce a komplikuje ověření řetězce. Pokud nejsou při implementaci softwaru brány v úvahu všechna kódování znaků, vzniká možnost chyb. Tento problém lze odstranit pomocí jediného kódování pro každý znak. Nejlepší alternativou, kterou může jakýkoli software vzít, je zkontrolovat, zda je řetězec kanonizovaný. Řetězce, které nejsou kanonikalizovány, mohou být odmítnuty.
Kánonický dokument XML je dokument XML v kanonické podobě XML. Je definována kanonickou specifikací XML. Kanonizace v XML eliminuje mezeru ve značkách, třídí odkazy v oboru názvů a eliminuje zbytečné a používá zvláštní kódování znaků. Odstraňuje také deklarace XML a DOCTYPE a transformuje relativní adresy URL na absolutní adresy URL.
