Kaj je prepis zvoka?

Zvočna transkripcija je proces jemanja izgovorjenih besed in njihove pretvorbe v pisno besedilo. V preteklosti je človek sedel in pisal besede, ko so bile izgovorjene. Zdaj obstajajo zvočni posnetki različnih vrst in več načinov transkripcije. Analogni in digitalni načini snemanja bodo omogočili osebi, ki med pogovorom ni prisotna, da še vedno prepiše besedilo. Poleg tega bo veliko programskih paketov prebralo zvočne datoteke in jih hitro pretvorilo v besedilo, ne da bi jih bilo treba dejansko predvajati.

Dolga leta je bilo prepisovanje zvoka specializiran in dolgočasen poklic. Ljudje, ki so prepisovali govor, so morali biti prisotni v času govora, kar pogosto pomeni, da bi morala podjetja najeti ljudi, usposobljene za napredne tehnike, kot je stenografija. To je tudi omejilo storitve prepisovanja na tiste, ki so imeli dostop do usposobljenega prepisovalca.

Z izumom zvočnih posnetkov se je to področje močno spremenilo. S posnetkom bi lahko prepisovalec deloval od koder koli, kamor bi se posnetek lahko dostavil. Poleg tega transkripcija ni več potrebna stenografija, saj je bilo mogoče posnetek obrniti in poslušati večkrat. En sam prepisovalec bi lahko delal tudi za množico strank hkrati, saj ji ni bilo več treba biti prisoten pri govorih.

S povečanjem uporabe računalnika in internetne hitrosti je področje prepisovanja zvoka ostalo večinoma enako. Datoteke in ne kasete so bile pogosto poslane po e-pošti, namesto da bi bile poslane po običajni pošti. Hitrost procesa se je povečala, metode pa ne.

To se je spremenilo v poznih 90-ih z vse večjo uporabo programske opreme za prepoznavanje govora in narekovanja. Naloga prepisovanja je bila vse bolj usmerjena v računalniško pomoč in nato popolno avtomatizacijo. Izšli so programski paketi, ki so lahko prebrali informacije v zvočni datoteki in uporabili valovne vzorce zvočnika za izdelavo besedilne različice govora. To bi trajalo sekunde in ne minute ali ure človeškega prepisovalca.

Računalniško avtomatizirano prepisovanje zvoka ima nekaj pomanjkljivosti, ki jih je težko premagati, med katerimi je največja relativno pomanjkanje korektivnega govora. Ko človeški prepisovalec posluša besedilo, lahko popravi manjše napake v govoru, da ga naredi bolj berljivo. Medtem ko je neka transkripcija dobesedna, kar pomeni, da je točno to, kar je oseba rekla, večina ni. Brez korektivnega govora bo moral človek pogosto preveriti prepis za napake, preden ga uporabi.

Druga pogosta napaka računalniško podprtega prepisa zvoka je v samem govoru ljudi. Ker imajo ljudje veliko različnih tonov in vzorcev, ko govorijo, je ustvarjanje računalniškega programa, ki lahko natančno prebere in prevede celotno paleto, izjemno težko. To pomeni, da je določena količina napak pogosta v skoraj vsej programski opremi za prepisovanje. Najpogostejši način reševanja te pomanjkljivosti je z naučenim govorom, kjer program in en sam zvočnik delujeta dovolj skupaj, da se program osredotoča na vzorce posamezne osebe.

SmartAsset.