Come Alexa ascolta la tua voce e la parola di attivazione

Alexa parola di attivazione
Seguici su Google News

Alexa è sempre in ascolto ma non registra la nostra voce in maniera continuativa. Usiamo Alexa per le ricette, per i giochi e per tutte le skill collegate alla smart home, ma questo vuol dire che Echo Dot non invia alcun dato ai server cloud fino a quando non ti sente pronunciare la parola di attivazione. Sappi, comunque, che ascoltare le parole di attivazione per Alexa è molto più difficile di quanto tu possa pensare.

Alexa parola di attivazione

L'hardware dei vari modelli di Amazon Echo non è poi così intelligente: qualsiasi domanda o richiesta tu voglia porre senza la connessione ad internet, rimarrà priva di qualsivoglia risposta. Ciò accade perché i comandi che impartisci ad Alexa vengono inviati al cloud affinché siano interpretati. Amazon non vuole che vengano registrate tutte le conversazioni tra te e lo smart speaker ma soltanto i comandi che impartisci all’assistente vocale. Ecco perché viene utilizzata la parola di attivazione per attirare l'attenzione di Alexa. Per far ciò, Amazon utilizza una combinazione di microfoni ottimizzati, un buffer di memoria breve e l’addestramento della rete neurale. Il nostro consiglio è comunque quello di seguire alcuni consigli per migliorare la sicurezza di Alexa.

I microfoni ottimizzati individuano la tua voce

In genere, gli altoparlanti dell'assistente vocale (come, ad esempio, Echo ed Echo Dot), sono dotati di molteplici microfoni integrati. L'Echo Dot, per esempio, ne ha sette. Questa molteplicità di microfoni permettono all’assistente vocale non solo di ascoltare i comandi pronunciati a distanza ma anche di separare la voce dal rumore di fondo. Ed è attraverso quest’ultima funzione, in particolare, che lo smart speaker è in grado di rilevare utilmente la parola di attivazione.

Inoltre, usando i suoi molteplici microfoni, Echo può individuare la tua posizione nella stanza ed ascoltare in quella determinata direzione ignorando i suoni provenienti dal resto della camera. Puoi “toccare con mano” questa straordinaria funzione con un esperimento: mettiti accanto al tuo dispositivo e pronuncia la parola di attivazione. Noterai che Echo Dot si illumina in blu scuro e poi in un blu più chiaro mentre cerca di individuare la tua posizione e, poi, la lucina si accende proprio in corrispondenza del punto in cui ti trovi. Ora, spostati di lato e pronuncia ancora una volta la parola di attivazione: nota come le luci azzurre si accendono nella posizione in cui ti trovi! Sapere dove sei ubicato aiuta il dispositivo a concentrarsi meglio su di te e ad eliminare i rumori provenienti da altre zone della stanza.

La memoria corta impedisce all'altoparlante di memorizzare troppe informazioni

Alexa parola di attivazione

I dispositivi Echo sono dotati di molto spazio di archiviazione ma non lo usano completamente. Secondo Rohit Prasad, vicepresidente di Amazon e capo scienziato dell'intelligenza artificiale di Alexa, un Echo può archiviare fisicamente solo pochi secondi di audio.

Riducendo la capacità di memorizzazione, Amazon non solo offre una privacy maggiore agli utenti ma impedisce anche ad Echo di ascoltare intere conversazioni e limita la sua attenzione alla ricerca della sola parola di attivazione. In particolare, Alexa registra continuamente ma, allo stesso tempo, cancella tutto ciò che ha appena registrato. E’ dunque dotata di una “breve capacità di attenzione”, il che significa che tutto ciò che è davvero in grado di sentire è la parola di attivazione e non molto di più. Tre secondi, tuttavia, sono sufficienti perché quella parola venga registrata, esaminata e gestita in modo appropriato.

L'allenamento della rete neurale aiuta con il pattern matching

Amazon ha insegnato ad Echo a rispondere coerentemente alle tue richieste attraverso la formazione della rete neurale. Proprio come accade con altre forme di apprendimento automatico, Amazon “addestra” e potenzia i suoi algoritmi alimentandoli richiesta dopo richiesta e, quindi, ogni volta che viene pronunciata la parola di attivazione. In questo modo, Amazon vuole arrivare a coprire (e capire) non solo ogni inflessione ed ogni accento ma anche il contesto in cui la frase di attivazione viene pronunciata. In definitiva, Amazon vuole che il tuo assistente vocale arrivi a riconoscere il momento in cui parli “con lui” dal momento in cui parli “di lui”, incluso il caso in cui tu stia parlando con una persona di nome Alexa! I microfoni direzionali aiutano gli speaker a raggiungere anche questo ulteriore e straordinario obiettivo.

Gli algoritmi di cui è composta Alexa sono progettati anche per escludere falsi positivi e per ricercare suoni simili alla parola di attivazione. Quando il dispositivo decide di aver davvero sentito la parola di attivazione, inizia a registrare e a trasmettere l'audio ai server cloud di Amazon. In particolare, Amazon utilizza quattro algoritmi: uno per ogni parola di attivazione (Alexa, Computer, Echo) e uno per Alexa Guard che, ti ricordiamo, si attiva con suoni specifici, come il rumore di un vetro che si rompe.

Il dispositivo, infine, è in grado di effettuare anche controlli molto più complicati. Hai notato che, quando qualcuno pronuncia la parola Alexa in tv, di solito il dispositivo non risponde? Questo accade perché Amazon esegue anche un controllo sul cloud.

I controlli cloud escludono alcuni falsi positivi

Alexa


Quando le aziende producono spot pubblicitari su Alexa, possono inviare l'audio della pubblicità ad Amazon. L'azienda gestisce l'audio sulla base di algoritmi con un pattern simile a quello utilizzato dal dispositivo per identificare la parola di attivazione. La richiesta dell’azienda viene catalogata ed aggiunta al database.

Questo database viene controllato da Echo ogni volta che sente la parola di attivazione. Quando trova una corrispondenza con l’audio contenuto nel database, gli algoritmi di Amazon ordinano a Echo di ignorare la parola di riattivazione e di scartare qualsiasi audio registrato.

Allo stesso tempo, Amazon controlla anche le richieste provenienti da una parola di attivazione pronunciata contemporaneamente. Non tutte le aziende pubblicitarie inviano l’audio ad Amazon, quindi si è cercata una differente soluzione. Dopo aver verificato se sussiste una corrispondenza con il database, Amazon confronta “l’impronta” della parola di attivazione con qualsiasi altra istanza in arrivo in contemporanea. È davvero poco probabile che due persone che pronunciano “Alexa” contemporaneamente abbiano esattamente la stessa voce e lo stesso timbro. Quindi, se c’è una corrispondenza, Amazon sa che è molto probabile che sia uno spot pubblicitario o un programma televisivo e fa in modo che Alexa ignori la richiesta.

In ogni caso, nonostante tutti i controlli approntati da Amazon, i falsi positivi sono sempre in agguato. Puoi ascoltare ciò che il tuo Echo ha registrato accedendo alla sezione Privacy Alexa nell’app oppure collegando all’apposita pagina web.

Probabilmente troverai almeno un falso positivo nel gruppo degli audio registrati! Ma, ricorda, tecnologia viene continuamente migliorata e, in un futuro nemmeno tanto lontano, potremo forse usare Alexa senza dover per forza pronunciare la parola di attivazione.

Lo sapevi che puoi sfruttare le skill di Alexa per dormire meglio?

Seguici su Telegram per ricevere le migliori offerte

Chi siamo?

CasaHiTech è il luogo in cui troverai notizie, approfondimenti e guide riguardanti l’uso della tecnologia nelle abitazioni.
Entra nello staff
COPYRIGHT © 2023 OUTOFBIT P.IVA 04140830243, TUTTI I DIRITTI RISERVATI.
crossmenu linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram