riconoscimento vocale – Pagina 3

Comandi vocali nascosti nei video attivano i telefonini? Calma un attimo

2016-07-10
di Paolo Attivissimo
Android, attacchi informatici, ReteTreRSI, riconoscimento vocale

Sta circolando la notizia che dei ricercatori della Georgetown University e della University of California hanno dimostrato di poter eseguire comandi a distanza sugli smartphone Android e iOS ricorrendo a istruzioni vocali fortemente distorte, diffuse da un altoparlante. Il video è notevole, anche perché i comandi sono incomprensibili all’orecchio umano (perlomeno al mio) ma vengono capiti egregiamente dal telefonino, e hanno una sonorità inquietante.

Il risultato, nel video, è che un comando vocale riesce a far visitare un sito (che potrebbe essere un sito ostile o imbarazzante) e addirittura riesce a mettere il telefonino in modalità aereo: in pratica lo spegne a distanza, rendendo irreperibile il suo proprietario.

Ma la realtà dei fatti non è così semplice ed elegante come mostrato nel video, perlomeno secondo le mie prove. Infatti non sono riuscito a replicare gli effetti descritti facendo ascoltare il video all mio Nexus 5X, sul quale ho Android 6.0.1, che ho impostato andando in Impostazioni – Lingua e immissione – Lingua – English (US) e poi attivando OK Google (Settings – Language and input – Google Voice Typing – “Ok Google” detection – Always on), probabilmente perché questa versione di Android confronta l’audio con i campioni della mia voce che mi ha chiesto e accetta solo la mia voce o una voce molto simile.

L’articolo scientifico originale cita la versione 4.4.2 di Android (oltre alla versione 9.1 di iOS), per cui ho riesumato un vecchio Switel con Android 4.4.2 e l’ho configurato come sopra. Stavolta Google non mi ha chiesto campioni della mia voce e il riconoscimento dei comandi distorti è andato un pochino meglio: il comando “Ok Google” è stato riconosciuto, ma soltanto quando ho riprodotto l’audio mettendo l’altoparlante a ridosso del microfono dello smartphone.

Morale della storia: la dimostrazione dei ricercatori è concettualmente intrigante, perché mostra una vulnerabilità che molti non immaginano, ma in termini realistici le possibilità di eseguire un attacco in questo modo sono piuttosto modeste: serve un Android vecchio, sul quale sia attiva l’opzione OK Google e sia anche stata scelta la lingua corrispondente a quella delle registrazioni audio usate per l’attacco. Inoltre le condizioni audio necessarie sono particolarmente delicate.

In realtà se avete un Android vulnerabile a questo attacco dovreste preoccuparvi del fatto che state usando una versione di Android troppo antica, che vi espone a ben altri attacchi più semplici e probabili. Ma questa è un’altra storia.

Ricerche fatte a voce? Google le ha registrate, ecco come cancellarle

2016-04-09
di Paolo Attivissimo
Google, privacy, ReteTreRSI, riconoscimento vocale

L’articolo è stato aggiornato estesamente dopo la pubblicazione iniziale. Ultimo aggiornamento: 2015/10/23 17:00.

Non è un segreto che Google ricorda tutto quello che ciascun utente digita nella casella di ricerca; è forse meno noto che quando si usa Google per una ricerca fatta a voce, come si fa spesso con i telefonini, questo motore di ricerca registra la voce e la conserva.

Lo scopo di questa registrazione di massa non è la sorveglianza, ma l’affinamento del riconoscimento vocale, che migliora man mano che aumenta il numero di campioni di riferimento (generali dei vari utenti oppure dello specifico individuo). Ma è comunque impressionante vedere quanti brani della nostra voce sono stati incamerati da Google. Se volete farvi un’idea dei vostri spezzoni vocali collezionati dal motore di ricerca, entrate nel vostro account Google e poi seguite questo link. Troverete sorprese notevoli: io, per esempio, ho in archivio anche spezzoni casuali di conversazioni, probabilmente registrati perché ho toccato inavvertitamente l’icona del microfono nella casella di ricerca di Google sul telefonino.

Per fortuna è possibile cancellare selettivamente o in massa tutte queste registrazioni andando nelle Opzioni di eliminazione ed è possibile dire a Google di anonimizzare la raccolta di questi spezzoni di audio (seguendo questo link e scegliendo di disattivare l’opzione Comandi e ricerche vocali): si ottiene la richiesta di conferma mostrata qui di seguito, che spiega che “questa impostazione non incide sulla memorizzazione di informazioni da parte di prodotti Google (come Voice) che potrebbero essere utilizzati per memorizzare i tuoi input vocali o audio. Google potrebbe anche continuare a raccogliere e memorizzare dati audio in forma anonima.”

A questo punto, però, arriva una domanda inevitabile: cosa fanno gli altri fornitori di ricerche vocali, come Siri di Apple, Echo di Amazon e Cortana di Microsoft? Ci sono sospetti che Siri e Cortana conservino le registrazioni. Di questi tre, solo il servizio di Amazon offre esplicitamente un’opzione di cancellazione; per Siri e Cortana e più in generale, se volete essere sicuri di non regalare campioni della vostra voce l’unica soluzione semplice è non usare mai la ricerca vocale.

Fonti aggiuntive: Wired, Time.

Google Docs attiva la dettatura, anche in italiano

2015-09-06
di Paolo Attivissimo
Google, privacy, ReteTreRSI, riconoscimento vocale

Google Docs, il servizio di creazione di documenti via Web, ha attivato il riconoscimento vocale: ora è possibile dettare un testo al computer senza dover installare nulla e senza dover svolgere tediose sessioni di addestramento.

Per usare questa nuova funzione si apre un documento con Google Docs, si va nel menu Strumenti e si clicca la voce Digitazione vocale. Un clic sull’icona del microfono e si può cominciare subito a dettare usando il microfono integrato nel computer, senza cuffie microfoniche speciali. Bello, ma funziona?

Dipende. Se l’ambiente in cui si detta è silenzioso e si scandiscono bene le parole, facendo finta di essere uno speaker da telegiornale, i risultati sono molto buoni, anche se bisogna superare l’imbarazzo di parlare a un computer e bisogna imparare a dettare la punteggiatura: per esempio, per andare a capo si deve dire “nuova riga”, non un più normale “a capo”.

Per esempio, ecco come Docs ha riconosciuto la mia dettatura dei primi due paragrafi di questo articolo:

Google Docs servizio di creazione di documenti via web attivato il riconoscimento vocale due punti ora è possibile dettare un testo al computer senza dover installare nulla e senza dover svolgere tediosa sessione di addestramento. Nuova linea per usare questa nuova funzione si apre un documento con Google Docs, si va nel menù Strumenti e si clicca la voce digitazione vocale. Un clic sull’icona del microfono e si può cominciare subito a dettare usando il microfono integrato nel computer senza cuffie microfoniche speciali. Bello, ma funziona?

A parte le applicazioni ovvie, il riconoscimento vocale di Google si presta anche alla trascrizione di lezioni, discorsi e dialoghi di film, a patto che non ci siano musiche o rumori di fondo, perché è indipendente dalla persona che parla. Normalmente, invece, i software di riconoscimento vocale hanno bisogno di essere calibrati sulla singola persona che li usa.

Questa nuova funzione di Google metterà in crisi i produttori di software specializzato, come Dragon? È improbabile, perché non c’è per ora la possibilità di personalizzare il vocabolario e c’è un filtro contro le parolacce che sicuramente salverà da imbarazzi involontari ma potrebbe essere limitanti per chi usa un linguaggio colorito. Inoltre la funzione richiede una connessione continua a Internet e manda tutto quello che viene detto a Google (l’analisi viene infatti svolta dai server di Google, non dal computer locale), per cui ci sono implicazioni di riservatezza non banali. Nei miei test ho notato che il riconoscimento perde il filo se detto appena un po’ rapidamente, anche se scandisco bene le parole (cosa che sono abituato a fare, sia per abitudine radiofonica, sia perché uso software di dettatura tutti i giorni da oltre un decennio). Ma per una dettatura occasionale spiccia è sicuramente un’opzione interessante e a costo zero.

Anche Google origlia, se glielo permettete

2015-02-14
di Paolo Attivissimo
Google, ReteTreRSI, riconoscimento vocale, sorveglianza

C’è polemica sulle abitudini “spione” delle Smart TV, ma l’idea di tenere costantemente aperto un microfono incorporato nei dispositivi dell’utente è oggi una tendenza informatica diffusa: la segue anche Google, per esempio, che offre la ricerca basata su comandi vocali con un’opzione che tiene permanentemente aperto il microfono del computer.

In pratica, se si installano il browser Google Chrome e la sua estensione sperimentale Google Voice Search Hotword, per fare una ricerca in Google usando la voce invece della tastiera non serve più cliccare sull’icona del microfono nella casella di ricerca di Google: basta dire “OK Google” e Chrome ascolta quello che viene detto e lo immette in Google.

Ovviamente il prezzo di questa comodità è che Chrome ascolta tutto quello che viene captato dal microfono e lo trasmette a Google per l’analisi. Anche altri servizi di Google stanno introducendo o hanno già introdotto l’ascolto costante su tablet e telefonini.

Per ora questi servizi sono opzionali, ma la tendenza è chiara: in nome di una piccola comodità in più ci viene chiesto sempre più spesso di rinunciare alla riservatezza delle nostre conversazioni personali. E la cosa ci viene presentata come un vantaggio.

Skype Translator, anteprima del traduttore automatico

2014-12-19
di Paolo Attivissimo
ReteTreRSI, riconoscimento vocale, Skype, traduzioni

Entro fine anno Skype rilascerà l’anteprima di Skype Translator, la versione di Skype che fornisce la traduzione automatica delle conversazioni e rende possibile comunicare superando le barriere linguistiche. Ci si può prenotare qui per riceverla. All’inizio Translator permetterà la traduzione fra un numero ristretto di lingue (al momento solo inglese e spagnolo) e sarà disponibile soltanto su dispositivi che usano Windows 8.1 oppure Windows 10 Technical Preview.

Usare Skype Translator è semplice: si imposta una videochiamata o chiamata vocale Skype con qualcuno che parla un’altra lingua e si comincia a parlare. La conversazione viene tradotta nell’altra lingua dopo una lievissima pausa, la traduzione viene letta da una voce sintetica e sullo schermo compare una trascrizione della chiamata. Translator permette anche di mandare messaggi istantanei in più di quaranta lingue.

Ma funziona? Il video della demo fra inglese e tedesco inciampa qualche volta, ma consente una conversazione semplice fra persone che non parlano la stessa lingua. Le prime recensioni sono positive e parlano di “effetto Star Trek”: il riconoscimento vocale esiste già, la traduzione automatica c’è già, ma è la loro fusione semplice ed elegante a fare la differenza. Probabilmente il lavoro dei traduttori professionisti non sarà a rischio, perché il software fa fatica a captare le sfumature, i doppi sensi e i modi di dire, ma se i due interlocutori sono capaci di parlare in modo letterale e semplice Skype Translator potrebbe risultare rivoluzionario per la comunicazione di base, non solo fra persone che non hanno una lingua in comune ma anche per la trascrizione automatica di conversazioni, lezioni e interviste.

C’è, come sempre nei servizi offerti via Internet, la questione della riservatezza: il riconoscimento vocale e la traduzione non vengono effettuate sui dispositivi degli utenti, ma sui server di Skype, e questo implica che l’intera conversazione deve essere accessibile a Skype. Meglio tenerne conto nella scelta degli argomenti da discutere tramite Skype Translator.

Android si Siri-izza un po’ con l’update di Google Search (ma soltanto in inglese USA)

Durante la puntata del Disinformatico di venerdì scorso ho provato ad aggiornare in tempo reale sul mio telefonino Android l’app di ricerca di Google, dato che correva voce che consentisse di dialogare a voce e comandare il dispositivo in modo interattivo (in altre parole, come Siri su iPhone), ma l’esperimento è fallito miseramente.

Ho scoperto perché: avevo settato l’inglese USA come lingua d’interfaccia del telefonino ma non avevo fatto la stessa cosa per la lingua della ricerca vocale. Se volete sapere come si fa e provare (finalmente?) l’ebbrezza di mandare un SMS usando soltanto la voce su un cellulare Android, leggete queste mie istruzioni.

Riconoscimento vocale, occhio agli equivoci

2010-08-16
di Paolo Attivissimo
antibufala, chicche, riconoscimento vocale

I pericoli del riconoscimento vocale

Alcune emittenti TV usano sistemi di riconoscimento vocale per generare in tempo reale i sottotitoli per sordi delle trasmissioni realizzate in diretta, come i telegiornali. A volte questi sistemi dimostrano il loro limite fondamentale: non sanno riconoscere e capire il contesto. E così nascono perle come questa, risalente al 24 novembre 2007, proviene dall’emittente KABC-TV di Los Angeles, è autenticata da Snopes.com ed è stata recentemente riproposta da Failblog.org.

Snopes spiega che il giornalista della KABC-TV stava spiegando quanto è importante che gli abitanti evacuino le zone colpite da incendi, così i pompieri si devono preoccupare solo dell’incendio e non anche delle persone in mezzo alla strada che stanno evacuando la zona. L’originale, quindi, era presumibilmente “firefighters to deal with just the fire and not also with people in the middle of the road evacuating”.

Paolo Attivissimo su Artemis II, il mio racconto nei media
Grazie!!
zoomx su Podcast RSI – Dietro le IA c’è manodopera africana sfruttata
Faccio una analogia uomo macchina tra la schiavitù classica e la nuova schiavitù. Mi metto dal punto di vista del…
PierGiGiggi su Artemis II, il mio racconto nei media
Ciao Paolo, ti ho ascoltato con piacere nell'episodio di Ci vuole una scienza. Bravo.
PierGiGiggi su Podcast RSI – Dietro le IA c’è manodopera africana sfruttata
Secondo me Lea intendeva esprimere il suo apprezzamento per i contenuti e la forma dei commenti di daryl e lo…
Guastulfo su Podcast RSI – Dietro le IA c’è manodopera africana sfruttata
Susan Calvin diventa realtà...
Guastulfo su Podcast RSI – Dietro le IA c’è manodopera africana sfruttata
Il tuo punto di vista si ferma sulla definizione tecnica. Quanto affermi è corretto: in senso giuridico la schiavitù implica…
PGC New Edition su Podcast RSI – Dietro le IA c’è manodopera africana sfruttata
però è abbastanza comune estendere il termine "schiavitù" quando certi fattori rendono di fatto impossibile godere di certi diritti e…
daryl su Podcast RSI – Dietro le IA c’è manodopera africana sfruttata
Stai usando "schiavitù" come metafora estesa per qualsiasi forte vincolo economico o sociale. Il problema è che così perdi il…
PGC New Edition su Podcast RSI – Dietro le IA c’è manodopera africana sfruttata
e ora pure questo: https://www.ilpost.it/2026/04/21/meglio-essere-gentili-con-chatbot/?homepagePosition=2 In futuro mi aspetto un drone, che va dall'autore del prompt. E lo ammazza. Altro…
PGC New Edition su Podcast RSI – Dietro le IA c’è manodopera africana sfruttata
Io non sono molto d'accordo con lui, ma daryl ha espresso un parere legittimo e in forma educata. Perché rispondere…

Archivi