Storia dell'articolo

Chiudi

Questo articolo è stato pubblicato il 22 gennaio 2012 alle ore 08:18.

My24

Per ora parlano, ascoltano e ubbidiscono. Quanto a capire, fanno un po' di testa loro. Proprio per questo, forse, tutta l'elettronica di consumo ci sta scommettendo. I sistemi di riconoscimento vocale sono la novità ma da tempo una realtà consolidata in molti settori. Navigatori satellitari, programmi per pc e telefoni hanno già da tempo incorporate applicazioni che riconoscono un set di comandi e le traducono in funzioni. Banche, call center e servizi di customer care da anni sperimentano questi servizi con risultati incerti e a volte frustranti. Tuttavia, la tecnologia se si appoggia a un dominio di comandi limitato funziona. Anche la traduzione della voce in una stringa di testo ha fatto passi da gigante. Dragon Naturally Speaking (100 euro circa) è uno dei migliori programmi in circolazione ma non è esente da errore. Più interessanti sono invece gli esperimenti sui cellulari. Dragon Go! (multipiattaforma e gratuito), il sorprendente Siri (per iPhone), l'applicazione ricerca vocale (Android) non si limitano a tradurre la voce in comandi per governare il cellulare ma attraverso la semantica e algoritmi statistici sul linguaggio interroga web services e Api di servizi come OpenTable, Yahoo Local e Wolfram Alpha. Questi software in una logica di cloud computing capiscono (o almeno dovrebbero) capire il senso delle domanda e cercano su internet una lista di risposte. L'ambizione è quella di formulare domande e ottenere non una serie di opzioni ma una risposta univoca.
Il Ces di Las Vegas ha incoronato riconoscimento vocale e gestuale come una delle tecnologie chiave per il 2012. Le nuove tv di Samsung ed Lg, che sulle innovazioni per lo schermo televisivo si sono distinte, integrano queste opzioni. Nel caso di Samsung con telecamera posizionata sulla parte alta del display, doppio microfono e riconoscimento facciale. In quello di Lg con telecomando dotato di microfono e telecamera da integrare. Una specie di Kinect, la periferica di Microsoft che ha fatto scuola.
Non finisce qui. Intel ha promesso che la nuova generazione di ultrabook, marchio registrato dal produttore di chip, si comanderà anche, e ovviamente, con la voce. Per non parlare dell'automotive. Lo sviluppo di un'interfaccia fatta di voce e gesti può rappresentare uno spartiacque nell'accessibilità dei media per alcune forme di disabilità e per gli anziani. Per il resto, la scommessa è capire quali applicazioni saranno in grado di accompagnare i cosumatori.
La frontiera di questi sistemi è l'interazione multimodale, ovvero combinare gesti, movimenti e tocco con la voce. Si tratta di più input e quindi di una complessità maggiore di dati da elaborare. Ma l'integrazione di gesti e parole potrebbe consentire una maggiore precisione in termini di inferenza e semantica. È la sfida.

Shopping24

Dai nostri archivi