Google Duplex: un sistema di Intelligenza Artificiale per condurre una conversazione ed eseguire attività

Un obiettivo di lunga data dell’interazione uomo-computer è stato quello di consentire alle persone di avere una conversazione naturale con i computer, come accadrebbe l’uno con l’altro. Negli ultimi anni, abbiamo assistito a una rivoluzione nella capacità dei computer di comprendere e generare discorsi naturali, in particolare con l’applicazione di reti neurali profonde (ad esempio, la ricerca vocale di Google, WaveNet).

Tuttavia, anche con i moderni sistemi di ultima generazione, è spesso frustrante dover parlare con voci computerizzate stilate che non comprendono il linguaggio naturale. In particolare, i sistemi telefonici automatizzati (IVR) stanno ancora lottando per riconoscere parole e comandi semplici. Non si impegnano in un flusso di conversazione e costringono il chiamante ad adattarsi al sistema anziché al sistema che si sta adeguando al chiamante.

Da oggi è invece disponibile Google Duplex, una nuova tecnologia per condurre conversazioni naturali per svolgere attività “reali” al telefono. La tecnologia è diretta al completamento di compiti specifici, come la pianificazione di determinati tipi di appuntamenti. Per tali compiti, il sistema rende l’esperienza della conversazione il più naturale possibile, consentendo alle persone di parlare normalmente, come farebbero con un’altra persona, senza doversi adattare a una macchina.

Uno degli approfondimenti chiave della ricerca è stato quello di vincolare Duplex a domini chiusi, che sono abbastanza ristretti da poter essere esplorati in modo approfondito. Duplex può effettuare conversazioni naturali solo dopo essere stato profondamente addestrato in tali domini. Non può condurre conversazioni generali.

La tecnologia Google Duplex è costruita per sembrare naturale, per rendere confortevole la conversazione. Per Google è importante che utenti e aziende facciano una buona esperienza con il servizio, e la trasparenza è una parte fondamentale del progetto.

Le conversazioni di Google Duplex sono naturali grazie ai progressi nella comprensione, nell’interazione, nella sincronizzazione e nella conversazione.

Al centro di Duplex è una rete neurale ricorrente (RNN) progettata per far fronte a queste sfide, costruita utilizzando TensorFlow Extended (TFX). Per ottenere la sua alta precisione,Google ha addestrato l’RNN di Duplex su un corpus di dati di conversazione telefonica anonimizzati. La rete utilizza l’output della tecnologia di riconoscimento vocale automatico (ASR) di Google, nonché le funzionalità dell’audio, la cronologia della conversazione, i parametri della conversazione (ad esempio il servizio desiderato per un appuntamento o l’ora corrente del giorno) e altro ancora.

leggo l’articolo completo alla fonte: Google

Post correlati