assistenti vocali creazione portali

Assistenti vocali meno simpatici e più efficienti

In questi giorni mi sono imbattuta in un articolo di Wired il cui sommario recitava:

“Per mettere a proprio agio la gran parte di noi, gli assistenti vocali usano pause e riempitivi tipici delle conversazioni tra esseri umani. Invece dovrebbero diventare meno simpatici e più efficienti.”

L’articolo in questione riportava la tesi di Bert Brautigam, UX designer presso Amazon, secondo cui si dovrebbe smettere di progettare degli assistenti vocali che imitano il modo di parlare degli esseri umani, in favore di una comunicazione più veloce e genuina. “Sotto accusa” risultano essere non solo i giri di parole tipici degli esseri umani con cui i bot rispondono alle nostre richieste (“Guarda cosa ho trovato…” come introduzione ai risultati di ricerca ad esempio), ma anche le pause e i riempitivi che rendono la conversazione più umana. Ma vediamo in dettaglio quale è la sua tesi.

Lo scheumorfismo nelle interfacce vocali

Iniziamo definendo cosa sia lo scheumorfismo. Con questo termine intendiamo l’utilizzo di metafore e referenze dal mondo reale per far apparire un oggetto con le caratteristiche di un altro, allo scopo di aumentare la loro comprensibilità nell’interfaccia. L’esempio classico nelle interfacce grafiche sono i bottoni disegnati con ombreggiature, effetti 3D e tutte quegli artifici che potrebbero farlo sembrare un pulsante reale.

interfacce vocali

Il pulsante scheumorfico di sinistra ha tutte le caratteristiche di un bottone fisico.

Nelle interfacce che ci permettono di comunicare con la macchina attraverso comandi vocali ed emettono un suono come output (le interfacce conversazionali o vocali con cui interagiamo con Siri, Cortana, Alexa ad esempio), lo scheumorfismo è rappresentato dal fatto che l’assistente vocale finge di essere una persona. Esso infatti parla come tale, con intonazioni e pause, ha spesso un nome e un sesso definito, a volte finge di provare emozioni o addirittura è programmato per mostrare una certa personalità.

La tesi di Brautigam

E fin qui non c’è nulla di male. Ma Brautigam afferma che il valore di un assistente vocale non è determinato dalla sua bravura nel mimare la conversazione umana, ma dall’efficienza con cui fornisce soluzioni riguardo i problemi per cui è stato interpellata. Così, pause e intonazioni sono un abbellimento inutile che presto verrà sorpassato così come le ombre e gli effetti 3D sono stati abbandonati nelle interfacce grafiche, a favore di soluzioni più semplici e “genuine”.

Lo scheumorfismo infatti è anche nelle interfacce vocali un livello superficiale, utile nei primi stadi di nuovi metodi di interazione con la tecnologia per aiutare le persone a comprenderli, ma diventa grottesco successivamente, quando le persone si sono abituate a usare la voce per rapportarsi alla tecnologia stessa. Egli quindi si augura una progressiva de-scheumorficazione delle interfacce vocali, a favore di una comunicazione più snella e autentica, in cui il flusso commando-azione non sia interrotto da inutili giri di parole.

Così, se io chiedo al mio assistente vocale che tempo fa, una buona risposta sarebbe ermeticamente “24°C, soleggiato”, pronunciato con una voce robotica, priva di intonazioni che possano apportare un valore connotativo alla mera informazione.

Alcuni dubbi

Trovo il discorso fin qui condivisibile, ma fino ad un certo punto. Fino al punto, cioè, in cui stiamo parlando di richieste di informazioni triviali e veloci che avvengono una tantum. Ma è questo il vero uso che pensiamo possano avere in futuro gli assistenti vocali? Oppure ci immaginiamo per essi un uso più estensivo?

La (futura) pervasività degli assistenti vocali

Le previsioni sull’uso degli assistenti vocali parlano chiaro: secondo un’analisi di Gartner, nel 2019 il 20% di tutte le interazioni con uno smartphone avverrà attraverso una conversazione. Si prevede un’esplosione nell’uso delle interfacce vocali nei prossimi decenni tanto che al Mobile World Congress, Masayoshi Son, fondatore e amministratore delegato del colosso nipponico SoftBank, ha dichiarato che “le intelligenze artificiali supereranno quelle umane nel corso dei prossimi tre decenni” e le interfacce vocali diverranno sempre più pervasive. Già Alexa, il software di Amazon Echo, interagisce con noi prima di tutto con voce e riconoscimento facciale/di immagini e a differenza degli smartphone incoraggia l’utilizzo della voce fin dall’inizio, mentre le funzioni touch sono opzionali o secondarie. Inoltre, questi assistenti vocali impareranno i nostri gusti e le nostre abitudini e ci daranno la sensazione di conoscerci molto bene.

L’attitudine alla conversazione dell’uomo

E ci dimentichiamo un altro aspetto: l’uomo è avvezzo alla conversazione molto più e da molto più tempo rispetto all’interazione con un’interfaccia grafica. Anzi, parola, linguaggio, conversazione sono cose intrinseche all’essere umano e l’umanizzazione/deumanizzazione di oggetti e persone partono dal linguaggio. Per un interlocutore è impossibile non classificare istintivamente un ente verbalizzante come un essere dotato di carattere.

L’unione di questi due fattori, la futura pervasività delle interfacce vocali/conversazionali e il valore della conversazione per l’essere umano, mi fanno dubitare che vedremo mai gli assistenti vocali semplicemente per quello che sono, dei robot, e che quindi ci aspetteremo o gradiremo di più se parlassero come semplici robot. Secondo una ricerca di Google, le persone parlano per prime con i dispositivi e con gli assistenti virtuali come se fossero umani: dicono “per favore”, “grazie” e anche “scusi”, usano un linguaggio naturale e non quello tipico da “motore di ricerca”. Le persone percepiscono i device non solo come oggetti elettronici, ma come amici.

interfacce vocali - sondaggio google

E questa tendenza, per i motivi sopra citati, non credo sia solo una tendenza. Soprattutto per il fatto che Google, Amazon, Apple stanno lavorando per dare una vera e propria personalità ai loro assistenti vocali, cosa che renderà la tecnologia ancora più “umana”.

Lo scheumorfismo favorisce usabilità e piacevolezza di utilizzo

Poste queste premesse, se alcuni degli elementi scheumorfoci superficiali messi in luce da Brautigam alla lunga magari diventeranno effettivamente sorpassati, la metafora degli assistenti vocali come persona quantomeno rimarrà. E alcuni elementi scheumorfici sono e rimarranno essenziali per un’interfaccia vocale che sia d’appealing e usabile dagli esseri umani.

Pensiamo ai ritardi e alle pause messe sotto accusa da Brautigam: un bot potrebbe effettivamente parlare molto più velocemente e senza pause. Ma sarebbe meglio per noi umani? Pause e ritardi sono nella conversazione una sorta di spazio bianco che ci è utile a capire meglio e seguire il processo comunicativo. Proprio come lo spazio bianco in un’interfaccia grafica, questo serve a dividere un concetto da un altro e ad aiutarci a memorizzare le cose, quindi a comunicare in modo più efficace.

O pensiamo alla personalità stessa dell’assistente vocale e alla sua pretesa di provare emozioni: aldilà del fatto che anche in un’interfaccia grafica il designer cerca di imprimervi una personalità, veramente preferiremmo un bot che ci dia un robotico messaggio d’errore al posto del messaggio che dice Alexa: “Mi dispiace ma non ne sono sicura”? No, perché il modo con cui interagiamo con gli assistenti vocali è sociale e le ricerche dimostrano che preferiamo computer amichevoli e simili a noi.

Questi sono solo alcuni esempi di come lo scheumorfismo non sia un crimine ma qualcosa che ci aiuta nell’interazione e che la rende più piacevole a prescindere dal fatto che siamo o meno avvezzi alla tecnologia.

No Comments

Post A Comment