Kaj je avdio rudarjenje?

Zvočno rudarjenje se običajno uporablja v programski opremi za prepoznavanje govora in analizi glasbe. Ta tehnologija daje uporabniku možnost iskanja po zvoku govora ali glasbe, ki je bil analiziran za določene značilnosti. Ko se uporablja v tehnologiji za prepoznavanje govora, avdio rudarjenje identificira izgovorjene besede v zvoku in jih shrani v datoteko, po kateri je mogoče iskati. Ta funkcija je lahko uporabna za študente ali tiste v poslovnem svetu, ki se udeležujejo številnih srečanj, saj uporabniku omogoča lažje brskanje po aktualnih informacijah iz govornih predstavitev. To vrsto analize je mogoče uporabiti tudi v glasbi za določitev značilnosti, kot so utripi na minuto (BPM), glasbeni ključ in glasbena struktura, informacije, ki se uporabljajo za razvrščanje glasbe.

Pri prepoznavanju govora, kjer se tehnologija najpogosteje uporablja, se za ustvarjanje akustičnega modela uporablja avdio rudarjenje. Akustični model programira programsko opremo za prepoznavanje govora, da prepozna govorne vzorce kot besede. Ta tehnologija je razvita z zvočnim rudarjenjem posnetka govorjene fraze, ki jo primerjamo z besedilom, ki se ujema z izgovorjeno frazo. Računalnik uporablja informacije za prepoznavanje besed, ko uporabnik oddaja podobne zvoke kot v akustičnem modelu. Akustični model se uporablja v kombinaciji z datoteko, ki pove programu za prepoznavanje govora, kateri jezik naj razlaga in kateri vzorci besed bodo verjetno izgovorjeni v določenih stavkih in situacijah.

Glasbeniki in poslušalci glasbe imajo lahko koristi od avdio rudarjenja v glasbi. Včasih glasbena programska oprema, ki kategorizira glasbo po žanru, uporablja avdio rudarjenje za organizacijo glasbe. Postopek identificira in združuje glasbene datoteke s podobnimi zvoki, ki se pogosto pojavljajo v glasbenih zvrsteh. Čeprav lahko ta tehnologija olajša organiziranje glasbe in iskanje nove glasbe, lahko naredi napake pri razvrščanju skladb, ki imajo podobne izmerjene značilnosti, vendar drugačen splošni zvok. Programska oprema za analizo zvoka je lahko uporabna za glasbenike, zlasti skladatelje, saj omogoča skladatelju, da skoči na določene dele strukture pesmi, vključno s spremembami glasbenih ključev in besedami v besedilu.

Proizvajalec programske opreme za prepoznavanje govora Dragon® prodaja program z imenom AudioMining®, ki prepisuje zvočne datoteke in jih označuje, tako da jih je mogoče iskati po besedilu. Dragon je proizvajalec računalniških lingvističnih programov, tehničnega izraza za področje programske opreme, namenjene interpretaciji govora. Zvočno rudarjenje, kadar se uporablja kot dve besedi, je splošen izraz, ki se nanaša na analizo zvočne datoteke za določen niz zvočnih značilnosti. Drugi proizvajalci programske opreme za rudarjenje zvoka vključujejo Nuance® in Nexidia®.