Kaj je besedilna datoteka?

Besedilna datoteka je računalniška datoteka, ki shranjuje vtipkani dokument kot niz alfanumeričnih znakov, običajno brez vizualnih informacij o oblikovanju. Vsebina je lahko osebna opomba ali seznam, članek iz revije ali časopisa, knjiga ali katero koli drugo besedilo, ki ga je mogoče natančno upodobiti v tipkano napisani obliki. Besedilne datoteke so podobne datotekam za obdelavo besedil, saj je vsebina obeh predvsem besedilna; razlikujejo se po tem, da besedilne datoteke običajno ne beležijo informacij, kot so slog in velikost znakov, paginacija ali druge podrobnosti, ki bi določale videz končnega dokumenta. Nekateri računalniški operacijski sistemi razlikujejo med besedilno datoteko, ki je namenjena neposrednemu prevajanju v človeku berljivo besedilo, in binarno datoteko, ki jo računalnik razlaga neposredno.

V večini shem, ki se uporabljajo za kodiranje besedila, je vsakemu znaku dodeljena številska vrednost, pri čemer je besedilo nato zapisano kot niz binarnih števil. Ena družina kodirnih shem, imenovana Ameriška standardna koda za izmenjavo informacij (ASCII), je postala široko uporabljen standard že na začetku zgodovine računalništva, kljub slabi podpori za druge jezike razen angleščine. Družina kod ISO 8859 je zagotovila veliko boljšo podporo za jezike, ki temeljijo na latinici in podobnih abecedah, vendar ni mogla kodirati znakov iz vzhodnoazijskih jezikov, kot je japonščina, kar je povzročilo širjenje nezdružljivih standardov.

Pred kratkim je konzorcij Unicode® razvijal kodirni sistem, imenovan Unicode®, katerega cilj je dodeliti edinstveno številko vsakemu znaku, ki se uporablja v vseh jezikih na svetu. To bo omogočilo uporabo ene kode za vsak jezik in omogočilo, da se besedila iz več jezikov prikažejo v eni datoteki. Prvi del Unicode temelji na ISO 8859, ki sam temelji na ASCII. Uporaba Unicode® ima lahko prednosti tudi v angleško govorečih državah, saj lahko besedilo, kodirano s starejšimi shemami, prikaže manjše nedoslednosti, ko se premika iz sistema v sistem.

Prednosti besedilnih datotek vključujejo majhnost in vsestranskost. Kilobajti ali megabajti, manjši od istih podatkov, shranjenih v drugih formatih, jih je mogoče hitro in množično izmenjati prek e-pošte ali diska. Večino je mogoče odpreti na računalnikih z različnimi operacijskimi sistemi z uporabo zelo osnovne programske opreme. Glavna pomanjkljivost je pomanjkanje formatiranja. Besedilna datoteka je lahko slaba izbira za predstavitev dokumenta, ki vsebuje slike ali ki se zanaša na elemente oblikovanja za sporočanje svojega pomena – na primer datoteka, ki vsebuje tabelarne podatke, matematične formule ali konkretno poezijo.

Besedilne datoteke so običajno namenjene branju in urejanju s strani ljudi, vendar vse ne vsebujejo vsebine, ki je predvsem za prehrano ljudi. Večina programske kode je shranjena v besedilni datoteki, preden se prevede – torej prevedena v strojno berljivo dvojiško datoteko. Datoteke lahko vsebujejo tudi strojno berljive besedilne oznake, ki poleg golega besedila dajejo informacije o oblikovanju. Na primer, datoteko Hypertext Markup Language (HTML) je mogoče odpreti kot datoteko z navadnim besedilom v urejevalniku besedil ali prikazati kot oblikovano spletno stran, potem ko jo razlaga spletni brskalnik. Podobne sheme vključujejo LaTeX, ki se uporablja za postavitev znanstvenih člankov, in Extensible Markup Language (XML), ki se uporablja za strukturiranje podatkov.