Google+WaveNet%3A+il+computer+avr%C3%A0+una+voce+vera
computerideait
/google-wavenet/amp/
Computer

Google WaveNet: il computer avrà una voce vera

L’azienda di Mountain View ha dato vita a Google WaveNet, la nuova tecnologia Voice che sarebbe in grado di riprodurre, tramite computer, una voce virtuale molto simile a quella umana e non più metallica e robotica. Gli sviluppatori hanno definito la suddetta tecnologia come fully convolutional neural network, ovvero capace di modificare l’onda grezza un sample alla volta, con dei risultati strabilianti. Il campione mondiale di Go è stato battuto e il futuro dei PC si avvia verso funzionalità sempre più realistiche e “umane”.

Google WaveNet: l’intelligenza artificiale con la voce umana

Nel colosso statunitense, lo sviluppo delle intelligenze artificiali è affidato al reparto DeepMind che è stato in grado di realizzare le voci artificiali più realistiche in assoluto. Tutto ciò, detto in termini semplici, è stato possibile modellando i suoni su campioni di voci umane.

La nuova tecnologia è stata testata attraverso il sistema di text-to-speech, ovvero il computer che legge, e i risultati ottenuti sono davvero convincenti e i migliori al mondo.

Di base, lo sviluppo è molto simile a quanto avvenuto per gli assistenti vocali più famosi, che sono Siri e Cortana. La tecnologia delle due funzionalità è, però, quella della concatenative text to speech, che offre sicuramente ottimi risultati, ma con un limite.

Di base, viene registrata una reale voce umana poi ricombinata isolando i suoni. Tuttavia, ne esce fuori comunque una voce con dei connotati innaturali. L’alternativa proposta da Google non prevede, invece, alcun tipo di campionamento. In pratica, grazie al sistema machine learning, l’intelligenza artificiale è in grado di apprendere da sola come modulare il suono, proponendo un risultato molto più naturale.

Text to speech di DeepMind: note e caratteristiche

Scendendo nei dettagli di ciò che Google WaveNet può fare e non fare, è interessante segnalare alcuni aspetti. Il primo, che è piuttosto una curiosità, è che la nuova tecnologia si basa sul suono della voce senza però (ovviamente) comprenderne il significato. Ciò significa che può generare frasi completamente senza senso, ma con una modulazione e pause quasi perfette.

L’altra curiosità da segnalare è che il sistema elaborato da DeepMind è in grado anche di suonare il piano, producendo note musicali con lo stesso meccanismo con cui viene riprodotta la voce, ovvero completamente automatizzato nella modulazione.

Il test vocale è stato eseguito in inglese e in cinese mandarino, con risultati che, su una scala da 1 a 5, si avvicinano al massimo, più di ogni altro sistema. Presto, quindi, i computer avranno una voce!

Redazione

Recent Posts

Questo forse non lo sapevi: la vera storia del logo Apple

Il logo di Apple, riconoscibile in tutto il mondo per la sua semplicità ed eleganza,…

6 giorni ago

Vuoi iniziare a leggere in inglese? Sfrutta questo trucco per avere ebook gratuiti

Se ami leggere libri in inglese potrebbe interessarti un semplice trucco per avere tutti gli…

6 giorni ago

Come collegare iPhone a una stampante

Collegare il proprio iPhone a una stampante wireless attraverso AirPrint è un processo semplice e…

6 giorni ago

Offerte di lavoro truffa su Linkedin? L’IA può aiutarti a smascherarle così

Lo vedi spuntare nel feed: ruolo perfetto, stipendio alto, tempi rapidi. Poi qualcosa stona. Un…

6 giorni ago

Il tuo PC ha rallentato? Ti basta sostituire pochi pezzi per farlo tornare come nuovo

Il desktop che non si carica, il cursore che gira, quel senso di impotenza: capita…

6 giorni ago

Prestazioni elevate e schermo buono, l’iPad economico da acquistare immediatamente

Scopri come scegliere l’iPad più economico, ma ancora in grado di offrire tanto per studio,…

6 giorni ago