Kaj je urejevalnik besedila Unicode?

Urejevalnik besedil Unicode je računalniška programska oprema, ki se lahko uporablja za ustvarjanje, urejanje ali ogled besedila v različnih abecedah. Podatke hrani v Unicode, razvijajočem se mednarodnem standardu za predstavitev človeških jezikov. Urejevalnik besedila Unicode je še posebej uporaben pri nelatiničnih abecedah, vključno s tistimi, ki se berejo od desne proti levi. Unicode urejevalniki se uporabljajo po vsem svetu za ustvarjanje dokumentov, vsebine spletnih strani in besedila za programske aplikacije v številnih jezikih.

Standard Unicode so prvič predlagali v poznih osemdesetih letih prejšnjega stoletja zgodnji člani konzorcija Unicode; ta neprofitna organizacija koordinira razvoj standarda po vsem svetu. Zgodnje različice Unicode so bile zasnovane za večino jezikov, ki so se takrat uporabljali. Leta 1980 se je njegova zmogljivost povečala na več kot milijon različnih znakov, kar je omogočilo vnos in prikazovanje celo staroegipčanskih hieroglifov z urejevalnikom besedil Unicode. Standard Unicode posebej opredeljuje več kot 1996 znakov. S temi vnaprej določenimi gradniki je mogoče izdelati še bolj zapletene črke in simbole.

Unicode je do neke mere podprt v večini sodobnih spletnih brskalnikov, računalniških programskih aplikacij in operacijskih sistemov. Pred Unicode je obstajalo veliko različnih metod za predstavitev nelatinskih abeced, večina med seboj nezdružljivih. To je zelo otežilo vnos ali prikaz besedila v več jezikih hkrati. Urejevalnik besedil Unicode predstavlja in shranjuje takšno vsebino na dosleden, dobro definiran način – ustvarjeno besedilo je mogoče enostavno deliti z drugimi aplikacijami in spletnimi stranmi, ki so združljive z Unicode, po vsem svetu.

Popoln urejevalnik besedil Unicode na splošno omogoča vnos informacij s tipkovnice na način, ki je naraven za določen jezik. Na primer, hebrejščino, arabščino in druge jezike, ki so napisani od desne proti levi, lahko vnesete in prikažete v tej smeri z urejevalnikom Unicode. V isti dokument je lahko vključenih več jezikov, tudi če so napisani v različnih smereh. Vseh znakov ni mogoče enostavno vnesti z lokalizirano tipkovnico – običajno so na voljo nadomestni načini vnosa, vključno z izbiro s seznama na zaslonu in trdim številčnim kodiranjem.

Urejevalnik besedil Unicode lahko uvozi datoteke v različnih oblikah, kot je enotna koda hangul ali tajščina. Med nalaganjem se lahko vsi številčno kodirani znaki Unicode samodejno pretvorijo v dejanske simbole Unicode. Besedilne datoteke je običajno mogoče shraniti v Unicode ali ameriški standardni kodi za izmenjavo informacij (ASCII) z nelatiničnimi znaki, predstavljenimi številčno. Vsebino je pogosto mogoče shraniti v formatu HyperText Markup Language (HTML) s kodiranjem Unicode UTF-8, kar omogoča pravilen prikaz v sodobnih spletnih brskalnikih.

Urejevalniki besedil Unicode pogosto omogočajo izbiro različnih pisav in barv za posamezne jezike, kar olajša delo z mešanico vsebine. »Kombiniranje znakov«, ki ga nekateri jeziki zahtevajo za povezovanje posameznih simbolov, je običajno lahko skrito ali prikazano. Med urejanjem lahko bloke besedila prerazporedite. Pogosto jih je mogoče pretvoriti iz ene velike črke v drugo ali iz entitet HTML v znake Unicode. Številni urejevalniki vključujejo tudi funkcije, ki na primer poenostavljajo vnašanje in urejanje azijskih jezikov, pretvarjanje besedila med poenostavljeno kitajščino in tradicionalno kitajščino ali med transliteracijami in predstavitvami Unicode.
Številni urejevalniki besedil Unicode so na voljo komercialno ali prek odprtokodne skupnosti. Večina sodobnih lastniških in odprtokodnih urejevalnikov besedil lahko deluje tudi kot urejevalniki Unicode. To počne tudi več orodij za oblikovanje spletnih strani in urejevalnikov e-pošte. Urejevalniki besedil Unicode so na splošno na voljo za vse glavne operacijske sisteme, obstaja pa tudi več spletnih orodij.