XML (eXtensible Markup Language) je manj zapleteno, bolj jedrnato narečje večjega kompleksnejšega SGML (Standard Generalized Markup Language). Najpreprosteje rečeno, ta jezik uporablja oznake skladnje za prepoznavanje različnih vrst podatkov v datoteki. Na primer:
XML različnim programom zelo olajša pridobivanje podatkov, ker so oznake skladne z določenimi modeli. Zgoraj vidimo podatkovni model s 7 elementi:
Odjemalec (nadrejeni element) vsebuje 6 ugnezdenih elementov: ime, ulica, mesto, država, poštna številka in telefon. Ime: programi, ki se zavedajo XML, vedo, da to polje vsebuje ime osebe ali podjetja. Ulica: To polje bo vsebovalo naslov ulice .City: Tukaj bo našel mesto.State: skrajšana 2-črkovna koda države.Zip: 5-mestna poštna številka.Phone: Telefonska številka.
Za definiranje podatkovnega modela ali vsebine vsakega od elementov se lahko uporabi DTD (Definicija vrste dokumenta). DTD je eden od načinov za definiranje strukture ali drevesa dokumenta XML. DCD (opis vsebine dokumenta), DDML (označevalni jezik definicije dokumenta), SAX (preprost API za XML) in XSCHEMA so drugi.
Čeprav zgornji poenostavljen primer namiguje le na same osnove tega jezika, bi moralo biti že jasno, v čem se razlikuje od jezika za označevanje hiperbesedila (HTML). Oznake, uporabljene v HTML-ju, narekujejo, kako naj bo gradivo predstavljeno na spletni strani, brez navedbe, kaj je gradivo. Manipulacija ali ponovna uporaba podatkov v datoteki HTML za nadaljnje namene ni izvedljiva. Vendar pa je s podatki, ki jih vsebuje spletna stran, napisana v XML, mogoče manipulirati, jih ekstrahirati z različnimi sistemi baz podatkov in jih reciklirati.
Pri uporabi HTML za ustvarjanje spletnih strani se pogosto uporabljajo slogovne liste. Formalno znan kot kaskadne slogovne tabele, CSS doda elemente sloga na spletno stran HTML.
Spletne strani je mogoče napisati tudi v XML. V tem primeru je ekvivalent CSS XSL (eXtensible Stylesheet Language), implementiran na enak način.
XSL dejansko opravlja dve funkciji. Vsebuje navodila brskalnikom, ki poznajo XML, kako upodabljati kodo za grafične namene, vsebuje pa tudi navodila za pretvorbo podatkov v druge formate, imenovane XLST. XSLT lahko ustvari datoteko, ki se razlikuje po strukturi od izvirnika. To je še posebej uporabno na področjih, kot je e-trgovina, na primer, kjer se vnos strank, kot so ime, številka kreditne kartice, znesek v dolarjih, itd., potisne skozi vrsto sistemskih programov pri obdelavi plačil. Funkcije preoblikovanja XSLT ne ovirajo potrebe upodabljanja in se ukvarjajo izključno z uspešnim premikanjem podatkov med omrežji in programi za namene obdelave. V dobi, ko je izmenjava informacij tako velika povpraševanja, je XML očitna izbira pred HTML.
XML, ki ga je ustvaril World Wide Web Consortium (W3C), je del velike družine označevalnih jezikov in je opredeljen kot metajezik – jezik, ki opisuje druge jezike. Eden od ciljev W3C je bil narediti XML »brez možnosti«, da bi ostal čist, za razliko od HTML, ki ima veliko različnih konvencij in je posledično prikazan različno v različnih brskalnikih, zaradi česar je težko predstaviti podatke na enoten način.
Od testov marca 2005, ki jih je izdal W3C
je razkrilo, da ima Microsoft Internet Explorer 6.0 SP2 omejeno zmožnost XML, saj naj bi uporabljal lasten jezik, ki morda ni vedno v skladu z določenimi standardi. Netscape je imel dobro združljivost z nekaj težavami v različici beta 8.0, medtem ko sta Firefox in Mozilla imela najboljše rezultate brezplačnih brskalnikov s popolnoma implementirano, 100 % združljivo zmožnostjo upodabljanja XML v vseh svojih do zdaj razpoložljivih različicah brskalnikov.
Ker strani XML zagotavljajo veliko večjo prilagodljivost kot strani HTML, se pričakuje, da bodo nadomestile HTML kot izbrani jezik. Za več informacij lahko obiščete uradno stran W3C. Na voljo so tudi spletne vadnice in številne knjige. Učenje jezika bo morda zahtevalo povečanje, vendar strokovnjaki napovedujejo, da je naložba vredna časa.