Skip to main content

Cos'è il riconoscimento vocale?

Il riconoscimento vocale può riferirsi a uno dei due tipi di informatica: identificazione della voce forense o funzionalità vocale a testo.Questo articolo affronta quest'ultima definizione.

Il riconoscimento vocale o il riconoscimento vocale in questo caso è una tecnologia informatica che utilizza l'input audio per l'immissione dei dati anziché una tastiera.Parlare in un microfono, ad esempio, produce lo stesso risultato delle parole di digitazione manualmente con una tastiera.Semplicemente dichiarato, il software di riconoscimento vocale è progettato con un database interno di parole o frasi riconoscibili.Il programma corrisponde alla firma audio del discorso con le voci corrispondenti nel database.

Sebbene trasformare il discorso in testo possa sembrare facile, è un compito estremamente difficile.Il problema risiede nella serie praticamente infinita di singoli schemi vocali e accenti, aggravata dalla naturale tendenza umana a far unirsi le parole.

Un'illustrazione delle sfide intrinseche del software di riconoscimento vocale appare su una maglietta creata dai ricercatori di Apple.La camicia legge, ho aiutato la mela a demolire una bella spiaggia.Quando parlato ad alta voce, sembra, Ho aiutato Apple a riconoscere il discorso.

Vari modelli di software di riconoscimento vocale vengono utilizzati per una serie di applicazioni, dalla dichiarazione personale al routing di chiamate automatizzate commerciali, dall'aiutare i disabili allo sport e agli eventi di notiziesottotitoli.Ogni modello si comporta in modo diverso e ha le proprie capacità e confini.

I programmi di riconoscimento vocale che richiedono all'utente di addestrare il software per riconoscere i loro particolari modelli di linguaggio stilizzati sono chiamati sistemi dipendenti da altoparlanti.Le persone usano comunemente questi tipi di programmi a casa o in ufficio.Email, memo, lettere, dati e testo possono essere inseriti parlando in un microfono.

Alcuni sistemi di riconoscimento vocale, chiamati

Speeti discreti sistemi, richiedono all'utente di parlare in modo chiaro e lentamente e di separare le parole. Discorso continuo I sistemi sono progettati per comprendere una modalità di parlare più naturale.

I sistemi di riconoscimento vocale del linguaggio discreto sono ampiamente utilizzati per il routing del servizio clienti.Il sistema è

Speaker indipendente , ma comprende solo un piccolo pool di parole o frasi.Il chiamante viene data la scelta di rispondere a una domanda, di solito con sì o no.Dopo aver ricevuto una risposta, il sistema intensifica il chiamante al livello successivo.Se il chiamante risponde con una risposta unica, la risposta automatizzata è di solito, scusate, non ti ho capito;Riprova, con una ripetizione della domanda e delle risposte disponibili.Questo tipo di riconoscimento vocale è anche indicato come Riconoscimento vincolato alla grammatica.

Il discorso continuo è una forma più sofisticata di software di riconoscimento vocale, in cui il chiamante può parlare in modo naturale per spiegare un problema o richiedere un servizio.Questo programma è progettato per raccogliere parole o frasi chiave e rendere un meglio statistico su ciò che il cliente desidera.Parlare chiaramente aiuta il riconoscimento vocale nell'identificare la necessità.Questo tipo di sistema ha un database molto più intenso rispetto ai sistemi vocali discreti ed è anche definito riconoscimento del linguaggio naturale.

Il riconoscimento vocale automatico (ASR) è un modello di riconoscimento vocale progettato per la dettatura.Questo software differisce dai modelli precedenti in quanto non si sforza di capire cosa viene detto, solo per identificare le parole pronunciate.Poiché molte parole in lingua inglese suonano allo stesso modo, gli errori vengono facilmente commessi.Tuttavia, le principali aziende come Microsoft stanno investendo nel riconoscimento vocale e la previsione di Bill Gates ha una comprensione del discorso continuo dell'ASR nel 2011. Il software ASR si trova spesso sui registratori vocali digitali.

I giocatori dominanti nel software di riconoscimento vocale sono stati scansoft e sfumature, con l'ex società che acquisisce quest'ultima.I giocatori più piccoli includono Fonix Speech, Aculab e Verbio, tra gli altri, con le principali societàCome IBM e il summenzionato Microsoft investe anche nella tecnologia.Sebbene molti ritengano ancora più difficoltà a formare software e correggere errori piuttosto che usare semplicemente una tastiera, sta arrivando un tempo in cui il software di riconoscimento vocale probabilmente colmerà questo divario.L'aumento delle tastiere con la capacità discriminata di usare il linguaggio diventerà probabilmente un luogo comune.

Il software di riconoscimento vocale sta guadagnando popolarità in quanto diventa più sofisticato.È particolarmente utile negli affari in cui può sostituire un operatore in diretta per incanalare le chiamate, diffondere informazioni, prendere ordini ed svolgere altre funzioni altamente utili.Tuttavia, sta anche guadagnando favore come un'applicazione desktop, aiutata da software rinomati come scansofts, dragonnaturalmente che spazzano e IBMS Viavoice .