Pagrindinis technologija

Kalbėjimo atpažinimo technologija

Kalbėjimo atpažinimo technologija
Kalbėjimo atpažinimo technologija

Video: Mokslo sriuba: apie vaizdo atpažinimo technologijas 2024, Liepa

Video: Mokslo sriuba: apie vaizdo atpažinimo technologijas 2024, Liepa
Anonim

Kalbos atpažinimas, prietaisų galimybė reaguoti į šnekamąsias komandas. Kalbos atpažinimas leidžia laisvai valdyti įvairius prietaisus ir įrangą (ypač naudinga daugeliui neįgalių asmenų), suteikia galimybę įvesti automatinį vertimą ir sukuria spausdinimui parengtą diktantą. Tarp ankstyviausių kalbos atpažinimo programų buvo automatizuotos telefonų sistemos ir medicininio diktavimo programinė įranga. Jis dažnai naudojamas diktuojant, ieškant duomenų bazių ir teikiant komandas kompiuterinėms sistemoms, ypač profesijose, kurios remiasi specializuotu žodynu. Tai taip pat įgalina asmeninius transporto priemonių ir išmaniųjų telefonų padėjėjus, tokius kaip „Apple Siri“.

Prieš bet kurį aparatą aiškinant kalbą, mikrofonas turi paversti žmogaus balso virpesius bangos formos elektriniu signalu. Šį signalą savo ruožtu sistemos aparatinė įranga, pavyzdžiui, kompiuterio garso plokštė, paverčia skaitmeniniu signalu. Tai yra skaitmeninis signalas, kurį analizuoja kalbos atpažinimo programa, norėdama atpažinti atskiras fonemas, pagrindinius kalbos elementus. Tada fonemos sujungiamos į žodžius. Tačiau daugelis žodžių skamba panašiai, ir, norint pasirinkti tinkamą žodį, programa turi remtis kontekstu. Daugelis programų sukuria kontekstą, naudodamos trigramų analizę - metodą, pagrįstą dažnų trijų žodžių grupių duomenų baze, kurioje priskiriamos tikimybės, kad du žodžiai bus sekami duoto trečiojo žodžio. Pvz., Jei kalbėtojas sako „kas aš“, kitas žodis bus atpažįstamas kaip įvardis „aš“, o ne panašiai skambanti, bet mažiau tikėtina „akis“. Nepaisant to, klaidoms ištaisyti kartais reikalingas žmogaus įsikišimas.

Kelių pavienių žodžių atpažinimo programos, tokios kaip telefono balso navigacijos sistemos, veikia beveik kiekvienam vartotojui. Kita vertus, nenutrūkstamos kalbos programos, tokios kaip diktanto programos, turi būti apmokytos atpažinti asmens kalbėjimo įpročius; mokymo metu vartotojas garsiai skaito teksto pavyzdžius. Šiandien, augant asmeninių kompiuterių ir mobiliųjų įrenginių galiai, kalbos atpažinimo tikslumas pastebimai pagerėjo. Žodynuose, kuriuose yra dešimtys tūkstančių žodžių, klaidų lygis sumažintas iki maždaug 5 procentų. Dar didesnis tikslumas pasiekiamas riboto žodyno specialiose programose, pavyzdžiui, diktuojant radiologines diagnozes, srityje.