Kaj je avtomatska transkripcija?

Samodejna transkripcija je postopek izdelave pisnega prepisa govorjenega ali posnetega govora z uporabo računalnikov in brez neposrednega človekovega posredovanja. Natančno samodejno prepisovanje zahteva visokokakovostno programsko opremo za prepisovanje in napravo, ki lahko natančno sprejema zvočni vnos. Na splošno je potrebno tudi, da je govor ali posnetek, ki ga je treba prepisati, razumno brez popačenj in motenj zaradi hrupa v ozadju. Poskusi so bili tudi prepisovanje glasbe z uporabo računalnikov s specializirano programsko opremo za prepisovanje. Transkripcija glasbe vključuje zapisovanje not določene glasbene skladbe, še posebej, če za to glasbo ni predhodnega zapisa, kot je v primeru improviziranih solistov.

Za uspešno samodejno prepisovanje je potrebna dobra programska oprema za prepisovanje. Programska oprema je odgovorna za obdelavo slušnega vnosa, ločevanje neprekinjenega jezikovnega toka v ločene besede, prepoznavanje teh besed in njihovo pravilno predstavitev v besedilu. Neuspeh v kateri koli fazi tega procesa na splošno povzroči prepis, ki se nekoliko razlikuje od izvornega gradiva. Dobra programska oprema za samodejno prepisovanje bi morala biti sposobna prepoznati subtilne razlike med podobnimi besedami in kompenzirati različne sloge in hitrosti govora. Težko razumljivi naglasi so ponavadi problematični tudi za najboljšo programsko opremo za prepisovanje.

Nekateri ljudje uporabljajo programsko opremo za samodejno prepisovanje, ker raje narekujejo kot neposredno tipkanje ali pisanje besedila. Nekatere oblike programske opreme za avtomatsko prepisovanje so še posebej dobre za ta namen, ker se lahko »naučijo« glasov ljudi, katerih besede prepisujejo. V takih primerih se samodejna transkripcija ne uporablja za ustvarjanje prepisov govora iz različnih virov, zato ni potrebe, da bi bila programska oprema odprta za najrazličnejše govorne vzorce. Omogočanje tega procesa optimizacije, ki se lahko zgodi med daljšo uporabo programske opreme s strani ene osebe ali med predhodno kalibracijo, lahko močno poveča natančnost in potencialno hitrost narekovanja.

Računalniki na žalost niso tako primerni za dosledno in natančno prepoznavanje človeškega govora kot ljudje. Ne morejo na primer uporabiti kontekstualnih namigov, če ne razumejo določene besede. Zato je pogosto potrebno, da človek lektorira prepise, ustvarjene s samodejnim prepisovanjem. Manjše napake pri oblikovanju in različne napake pri prepisovanju so v mnogih primerih pogoste, razen če je prepisani govor zelo jasen. Kljub temu lahko uporaba računalniške transkripcije hitro ustvari trdno podlago za prepis, ki zahteva le omejeno človeško posredovanje pred predložitvijo ali uporabo.

SmartAsset.