Kaj je stiskanje datotek?

Stiskanje datotek je metoda, ki jo uporabljajo računalniki za zmanjšanje velikosti elektronske datoteke ali skupine datotek na najmanjšo možno velikost. Datoteke ZIP so pogost primer stiskanja datotek. Obstaja veliko tehnik, ki jih računalniški programi uporabljajo za stiskanje datotek, vendar je najpogostejša metoda zamenjava ponavljajočih se zaporedij z manjšimi zaporedji. Računalniki to storijo tako, da katalogizirajo prvo instanco in se nanjo sklicejo nazaj v naslednjih primerih. Na primer, v stavkih pred tem so se črke »stisniti« pojavile trikrat. Računalnik jih lahko stisne tako, da katalogizira prvi primerek in izenači vse naslednje primerke s »&cmp« – s čimer zmanjša število potrebnih črk ali znakov in zmanjša velikost datoteke. Pri veliki datoteki lahko taka zamenjava prihrani veliko prostora. Vendar je treba opozoriti, da uporabnik tega ne vidi – računalnik opravi vse delo v ozadju.

Za spremljanje skrajšanih zamenjav računalniški programi ustvarijo tudi slovar za stisnjeno datoteko. V svetu stiskanja datotek je slovar seznam izvirnih besednih zvez in njihovih zamenjav. Ta slovar je vključen v velikost datoteke, zato bo zavzel tudi prostor in zmanjšal količino prostora, prihranjenega s stiskanjem. Zaradi tega je običajno manj učinkovito stisniti eno majhno datoteko kot veliko datoteko ali skupino.

Programi, ki izvajajo stiskanje datotek, delujejo na nekoliko drugačen način. Te razlike so večinoma posledica nečesa, kar se imenuje algoritem. Algoritem je matematična konstrukcija, ki v datotekah išče ponovitve in vstavi preproste reference. Programerji ustvarijo algoritme stiskanja in definirajo vzorce in zamenjave, ki se uporabljajo za stiskanje. Odstopanja lahko vplivajo na učinkovitost stiskanja. Na primer, v besedni zvezi »to so bili najboljši časi, bili so najslabši časi« se ponovita zaporedja »to je bil« in »st of times«. Programer se lahko odloči, da bo zamenjal vsako celotno frazo ali morda zamenjal »to« posebej in »časov« posebej. Zaradi teh majhnih razlik v algoritmih nekateri programi za stiskanje datotek delujejo bolje na nekaterih vrstah datotek kot drugi.

Nekatere vrste stisnjenih datotek se samorazpakirajo, kar pomeni, da se samodejno odprejo, ko jih uporabnik klikne – za njihovo razpakiranje niso potrebni zunanji programi. Za izdelavo teh datotek mora izvirni program stiskanja stisnjeni datoteki dodati dodatno kodo. Zaradi tega je samorazpakirana stisnjena datoteka pogosto večja od iste datoteke, če bi bila stisnjena normalno. To običajno velja za dober kompromis za podjetja, ki izdajajo programe za namestitev na domače računalnike. S tem, da se datoteka samorazpakira, omogoča domačemu uporabniku, da preskoči korak in poveča verjetnost, da bo programska oprema nameščena. Za razpakiranje datotek, ki se ne samorazpakirajo, so na voljo številni programi drugih proizvajalcev za prenos na internetu.