Kaj je kanonilizacija?

Beseda kanonično pomeni nekaj, kar je v skladu s sprejetim standardom. Canonicalization – ali canonicalization v britanski angleščini – je proces, pri katerem se nekaj uskladi s sprejetim standardom. Na področju računalnikov se izraz kanonilizacija uporablja za izpolnjevanje standardov na več različnih področjih. Pogosto se obravnava kot problem, v resnici pa je rešitev za različne probleme. Ker je tako dolga beseda, je kanonilizacija skrajšana z uporabo prve in zadnje črke ter števila vmesnih črk: c14n.

Canonicalization se v IT (informacijska tehnologija) uporablja v več nastavitvah. Nanaša se na naslove pošiljatelja e-pošte, na konstrukcijo imen datoteke, na kodiranje nizov v Unicode, na uporabo XML (EXtensible Markup Language) in na konstrukcijo URL (Uniform Resource Locator). V vsakem primeru je težava sposobnost za več formatov, ki predstavljajo isti element, pri čemer je kanonikalizacija pot do doslednosti in standardizacije.

Vzemite XML kot primer. XML omogoča sintaktične spremembe. To pomeni, da imata dva dokumenta, ki nista enaka, lahko enako kanonično obliko in sta tako funkcionalno enakovredna. Specifikacija Canonical XML je bila zasnovana za reševanje tega z vzpostavitvijo metode, s katero je mogoče ugotoviti identiteto ločenih dokumentov. Metoda za generiranje kanonične oblike za kateri koli dani dokument XML se imenuje metoda kanonikalizacije XML.

Za kanonilizacijo URL-jev je ideja, da se na določeno spletno stran dosledno sklicuje na en URL. Najenostavnejši primer sta dve različici domače strani, od katerih ima ena tri w, druga pa ne:

http://www.Razloženo.com

v primerjavi z
http://Razloženo.com
To je težava za SEO (optimizacija iskalnikov), ker deli poročila o prometu, ki dejansko gredo na isto mesto. Posledica tega je, da se zdi, da spletno mesto z več URL-ji za iste strani deluje slabše, kot je v resnici.
Poleg w-jev so še druge težave. Sem spadajo končne poševnice in razlike med različicami URL-jev z velikimi in malimi črkami. Matt Cutts iz Googla® priporoča, da to rešite tako, da uporabite trajno (301) preusmeritev vseh alternativnih URL-jev na želeni URL, kar omogoča iskalnikom, da presodijo, kateri je kanonični URL.