Controllo vocale dello smartphone

Esistono molte soluzioni diverse per il controllo vocale delle funzioni degli smartphone, ma non tutte sono implementate con una qualità sufficiente. Abbiamo selezionato quelli che funzionano davvero.

Il controllo vocale quando si lavora con moderni smartphone e comunicatori dotati di CPU sufficientemente potenti è una tendenza consolidata nella creazione di comode interfacce utente. È possibile a vari livelli su tutte le principali piattaforme mobili. In iOS, è apparso nella versione 3.0 (completamente funzionante a partire dalla 4.0), in Google Android - nella versione 1.6 (completamente funzionante - dalla 2.2). Questa funzione è relativamente ben implementata in Windows Mobile e S60. Abbiamo selezionato diverse soluzioni che possono sostituire i moduli di controllo vocale standard, oltre a software per espandere le funzionalità.

Principali caratteristiche dei sistemi di riconoscimento vocale

Negli ultimi due o tre anni, il controllo vocale è stato considerato una delle tecnologie più promettenti utilizzate nella creazione di interfacce utente. Lo annunciano i leader di Microsoft ei rappresentanti di Google e Apple stanno mostrando notevole interesse.

In effetti, il controllo di un dispositivo di comunicazione mobile premendo i pulsanti sembra già arcaismo. I touchscreen e la voce sono commercializzati come modi naturali per gli esseri umani di interagire con un dispositivo intelligente. Una caratteristica importante di tali sistemi è il corretto riconoscimento dei comandi. Se tutto è più o meno chiaro con il controllo touch (gli smartphone moderni supportano anche il controllo tramite gesti multitouch complessi), allora le cose non sono così semplici con i comandi vocali.

Innanzitutto, il sistema potrebbe non rispondere sempre correttamente alla pronuncia dei comandi. Dovrai adattarti a tale controllo, che non è sempre conveniente: è molto faticoso tenere sempre traccia del timbro della voce e delle intonazioni. In questo caso, i comandi devono essere separati dal rumore di fondo generale, che richiede risorse di calcolo.

In secondo luogo, un tale sistema non si accende automaticamente: per attivarlo, di norma, è necessario premere un pulsante su un dispositivo o un accessorio (ad esempio, un auricolare wireless). L'inclusione del software non è sempre conveniente. Nei comunicatori con Windows Mobile con stack software Broadcomm, l'attivazione di Microsoft Voice Commander da un auricolare Bluetooth potrebbe funzionare in modo instabile o non funzionare affatto.

In terzo luogo, il controllo vocale non è ancora in grado di correggere le imprecisioni e gli errori degli utenti. Ad esempio, se provi ad avviare la riproduzione di una canzone di un gruppo il cui nome contiene l'articolo "il" senza menzionarlo, nella maggior parte dei casi il dispositivo non capirà tale comando. Le difficoltà sorgono anche quando si compongono omonimi e omonimi da un notebook: per un corretto funzionamento, è necessario compilare il campo "nickname" e assegnare un comando di avvio aggiuntivo.

In quarto luogo, per l'uso costante della composizione vocale (ad esempio, durante la scrittura di un SMS), il processore del dispositivo mobile lancia moduli del sistema di riconoscimento che richiedono molte risorse. Ciò non ha l'effetto migliore sulle prestazioni e sulla durata della batteria del comunicatore. Tuttavia, ora questo problema viene gradualmente risolto.

Vlingo è un modulo di controllo vocale multipiattaforma per lavorare con software di terze parti

Speereo Voice Launcher offre un ricco set di funzioni per il controllo vocale e comprende anche una pronuncia non molto chiara

Gestione delle funzioni di sistema standard e ricerca vocale.

In tutti i sistemi operativi mobili più diffusi, in un modo o nell'altro, è implementata la possibilità di riconoscimento vocale dei comandi per l'avvio di applicazioni tipiche. Ad esempio, comporre un numero da un blocco note, aprire un client di posta elettronica o avviare una playlist. Inoltre, questi moduli possono riprodurre i processi del sistema, informando che il telefono si sta esaurendo o è passato alla modalità di avviso silenzioso. Nessuno dei programmi è in grado di eseguire comandi più complessi (ad esempio, "apri un client di posta elettronica, scrivi una lettera al signor Ivanov e contrassegna tutti i messaggi nella Posta in arrivo come letti dopo averlo inviato"). Tuttavia, si stanno gradualmente sviluppando. Quindi, se chiedi a un iPhone basato su iOS4 che ora è adesso, verrà annunciata l'ora del sistema. Oltretutto,lo stesso programma vocale di questo sistema operativo comprende le risposte negative dell'utente: "no", "wrong", "wrong", ecc. In altri sistemi mobili, al loro posto, devi ricorrere al controllo tattile.

Sui dispositivi WM classici, vengono utilizzati due pacchetti per il controllo vocale: Cyberon Voice Commander e Microsoft Voice Command. Tuttavia, utilizzarli contemporaneamente non funzionerà: devi sceglierne uno.

Il primo richiede un po 'di formazione per riconoscere i comandi, sebbene l'elenco non sia molto grande. Il programma può chiamare contatti, voci del calendario, eseguire tutte le applicazioni standard e alcune di terze parti e riprodurre musica, nonché leggere i messaggi in arrivo. Il secondo pacchetto controlla inoltre il volume, la modalità di funzionamento delle connessioni wireless e suona anche gli eventi di sistema. Microsoft ha anche recentemente avuto un prodotto interessante, TellMe, per il controllo vocale avanzato. È in grado di avviare il client di ricerca Bing con una richiesta dettata di informazioni, parlare di quotazioni azionarie, risultati sportivi, meteo, filmati e condizioni del traffico. Ma per tutto questo, il dispositivo deve essere connesso a Internet ed essere nel campo di visibilità dei satelliti GPS. Sono questi strumenti che vengono utilizzati per calcolare la posizione.Inoltre, questo servizio non è disponibile in russo.

In iOS e Android sopra la versione 2.2 di FroYo, i sistemi di chiamata vocale integrati sono approssimativamente gli stessi, con l'eccezione che il prodotto di Google ha la capacità di instradare percorsi utilizzando mappe verso la posizione dell'ufficio di una determinata azienda o un punto specifico. In Symbian OS 5th Edition, il controllo vocale è responsabile solo delle prestazioni delle funzioni di sistema standard e per la ricerca vocale sarà necessario installare un software separato, ad esempio Google Mobile App.

Controllo vocale di funzioni aggiuntive e avvio di programmi di terze parti

Naturalmente, gli strumenti vocali non dovrebbero solo facilitare parzialmente il lavoro quotidiano con il comunicatore, ma assumere completamente il controllo delle attività quotidiane. E non solo con programmi standard, ma anche installati dall'utente. Per questi scopi, puoi utilizzare prodotti separati, ad esempio Speereo Voice Launcher. Questo programma è compatibile con il sistema operativo Symbian (incluso S60), Windows Mobile e, in futuro, con il sistema operativo Android. È una shell compatta che consente di pianificare l'avvio di qualsiasi applicazione e file e la transizione a qualsiasi pagina Web nel browser.

Il prodotto non dipende molto dalle caratteristiche della voce del proprietario: il motore di riconoscimento è in grado di rilevare comandi pronunciati con accento o piccoli difetti di dizione. Viene fornita l'integrazione con programmi standard (notebook, organizer, client di messaggistica istantanea), ma non è previsto il trasferimento dei segnalibri dai Preferiti. La definizione dei comandi da lanciare viene effettuata tramite le impostazioni dell'applicazione. L'utente scrive il nome del comando in russo in latino o in una delle lingue supportate (inglese, tedesco, francese, ecc.), Dopodiché viene inserito nel database. È interessante notare che Speereo raccoglie i comandi anche in ambienti rumorosi.

Per le versioni di Google Android precedenti alla 2.2, ci sono tre applicazioni che sostituiscono il servizio di avvio delle applicazioni Voice Actions che appariva nel sistema operativo Android FroYo. In primo luogo, questi sono i programmi Edwin e Vlingo, che funzionano solo con l'inglese.

Il primo è un client avanzato di riconoscimento dei comandi vocali che fornisce non solo ricerche su Google, ma anche la ricerca di formule matematiche in Wtolfram Alpha, l'invio di messaggi a Twitter, ecc.

Il secondo client (funziona su piattaforme iOS, WM, S60 e RIM BlackBerry) ha le stesse funzionalità di TellMe di Microsoft. Oltre alla possibilità di inviare stati ai social network, cercare percorsi e informazioni di contatto sulle aziende della zona. Infine, c'è TopVoiceControl per i comunicatori Android. Oltre alla consueta composizione dei numeri dalla rubrica e al riconoscimento dei numeri parlati, può controllare le interfacce wireless e aprire il calendario.

Lista di cose da fare

Gli organizzatori vocali sono ancora esotici, ma le prime applicazioni di questo tipo stanno già apparendo e guadagnando una certa popolarità. Quindi, il suddetto sviluppatore Speereo Software offre il programma Speereo Voice Organizer, progettato per creare voci nel "Calendario" e "Attività", e-mail. Tuttavia, in questo caso, la voce non viene convertita in testo. Il messaggio viene inviato come file audio allegato e avvisi sulle attività correnti. IOS ha un client di posta elettronica QuickVoice2Text che riconosce i messaggi dettati e li traduce in formato testo.

Per Google Android, è stata rilasciata un'applicazione vocale Taskos To Do List per aggiungere attività a una lista di cose da fare e un programma per inviare SMS, lettere e messaggi a Twitter chiamato VoiceLink.

Taskos To Do List Crea un elenco di cose da fare dettandole al tuo dispositivo con sistema operativo Android

Riferimento storico

Le prime tecnologie di riconoscimento vocale apparvero nel 1952 e consentirono di rilevare automaticamente i numeri parlati. All'inizio degli anni '90 sono apparse sul mercato soluzioni in grado di gestire singole parole e frasi, nonché frasi semplici. Erano comuni negli Stati Uniti e utilizzati dai medici e dai militari. La divulgazione dei sistemi di controllo vocale tra i consumatori ordinari è iniziata solo a cavallo tra il 20 ° e il 21 ° secolo, con l'avvento degli smartphone.