Prepoznavanje ključnih besed je ključna značilnost programov in orodij za prepoznavanje govora. Programska oprema za prepoznavanje govora se opira na kompleksne tehnologije, da “razume”, kaj nekdo govori, in ga nato pretvori v besedilo. Za to se mora programska oprema za prepoznavanje govora zanašati na različne tehnologije in analitične metode. Eden od teh je opazovanje ključnih besed.
Dve različni vrsti opazovanja ključnih besed delujeta različno. Prvi je opazovanje ključnih besed v neomejenem govoru ali analiza linearnega toka fonetike brez določenih prelomov besed. Druga oblika je znana kot opazovanje ključnih besed pri prepoznavanju izoliranih besed, kjer ima programska oprema lahko “namige” v smislu tišine ali prekinitev med besedami.
Prepoznavanje ključnih besed v neomejenem govoru se opira na nekatere posebne programe, imenovane algoritmi. Ti programi v bistvu delajo z “biti” ali posameznimi fonemi, da napovedujejo, kaj najverjetneje “pomenijo” ali v kakšen kontekst bodo najverjetneje umeščeni. Eden priljubljenih algoritemov za to nalogo se imenuje iterativno Viterbijevo kodiranje, kar je včasih razloženo. kot iskanje “najmanjše normalizirane razdalje” enega zaporedja od drugega, z drugimi besedami, primerjanje bitov podatkov za “ujemanje”, ki pomaga pri prepoznavanju govora. Nekateri od teh algoritmov so izjemno učinkoviti pri interpretaciji človeškega govora, ne da bi ga resnično razumeli na čuteč način.
Druga vrsta, opazovanje ključnih besed v izoliranem prepoznavanju besed, včasih uporablja tisto, kar strokovnjaki imenujejo »dinamično časovno upogibanje«. Ta proces analizira hitrost ali tempo, da bi pomagal pri prepoznavanju govora. Obstaja veliko analitičnih primerjav, ki pomagajo oblikovati končni rezultat, ki besede razlaga edinstveno.
Obe vrsti strategij za iskanje ključnih besed včasih razlagamo s tem, kar strokovnjaki imenujejo »skriti Markovi modeli«. Markov model je poimenovan po znanstveniku, ki ga je izumil, in uporablja zapletene statistične metode za iskanje izmuzljivih rezultatov. Opažanje ključnih besed in druga programska oprema za prepoznavanje govora v veliki meri temelji na verjetnosti, pa tudi na zapisovanju zaporedij in primerjav, tako da lahko stroj ustvari besedilo, ki bolj odraža tisto, kar pravi človeški uporabnik.
Tehnologija govora v besedilo se izkaže za izjemno uporabno za pretvorbo verbalne komunikacije na stran brez potrebe po velikih količinah ročnega tipkanja. Verjetno bodo orodja za ključne besede in druge tehnologije še naprej poganjale vse zmogljivejše programe za prepoznavanje govora, ki bodo naredili komunikacijo učinkovitejšo v različnih medijih. Tehnologije, kot so te, gredo z roko v roki z digitalnim prenosom informacij, ki bo sodobnemu svetu in njegovim državljanom prinesel več različnih sposobnosti.