Google+WaveNet%3A+il+computer+avr%C3%A0+una+voce+vera

computerideait

/google-wavenet/amp/

Google WaveNet: il computer avrà una voce vera

L’azienda di Mountain View ha dato vita a Google WaveNet, la nuova tecnologia Voice che sarebbe in grado di riprodurre, tramite computer, una voce virtuale molto simile a quella umana e non più metallica e robotica. Gli sviluppatori hanno definito la suddetta tecnologia come fully convolutional neural network, ovvero capace di modificare l’onda grezza un sample alla volta, con dei risultati strabilianti. Il campione mondiale di Go è stato battuto e il futuro dei PC si avvia verso funzionalità sempre più realistiche e “umane”.

Google WaveNet: l’intelligenza artificiale con la voce umana

Nel colosso statunitense, lo sviluppo delle intelligenze artificiali è affidato al reparto DeepMind che è stato in grado di realizzare le voci artificiali più realistiche in assoluto. Tutto ciò, detto in termini semplici, è stato possibile modellando i suoni su campioni di voci umane.

La nuova tecnologia è stata testata attraverso il sistema di text-to-speech, ovvero il computer che legge, e i risultati ottenuti sono davvero convincenti e i migliori al mondo.

Di base, lo sviluppo è molto simile a quanto avvenuto per gli assistenti vocali più famosi, che sono Siri e Cortana. La tecnologia delle due funzionalità è, però, quella della concatenative text to speech, che offre sicuramente ottimi risultati, ma con un limite.

Di base, viene registrata una reale voce umana poi ricombinata isolando i suoni. Tuttavia, ne esce fuori comunque una voce con dei connotati innaturali. L’alternativa proposta da Google non prevede, invece, alcun tipo di campionamento. In pratica, grazie al sistema machine learning, l’intelligenza artificiale è in grado di apprendere da sola come modulare il suono, proponendo un risultato molto più naturale.

Text to speech di DeepMind: note e caratteristiche

Scendendo nei dettagli di ciò che Google WaveNet può fare e non fare, è interessante segnalare alcuni aspetti. Il primo, che è piuttosto una curiosità, è che la nuova tecnologia si basa sul suono della voce senza però (ovviamente) comprenderne il significato. Ciò significa che può generare frasi completamente senza senso, ma con una modulazione e pause quasi perfette.

L’altra curiosità da segnalare è che il sistema elaborato da DeepMind è in grado anche di suonare il piano, producendo note musicali con lo stesso meccanismo con cui viene riprodotta la voce, ovvero completamente automatizzato nella modulazione.

Il test vocale è stato eseguito in inglese e in cinese mandarino, con risultati che, su una scala da 1 a 5, si avvicinano al massimo, più di ogni altro sistema. Presto, quindi, i computer avranno una voce!

Redazione

Next iOS 10: in arrivo oggi l’upgrade del software »

Previous « Novità Mac: Tim Cook promette sorprese

Published by

Redazione

Tags: Google

10 anni ago

IL CALDO È IL VERO NEMICO DI SINNER? L’INCREDIBILE COINCIDENZA CHE PREOCCUPA I TIFOSI

Negli ultimi mesi c’è una statistica che ha iniziato a far discutere tifosi e addetti…

7 giorni ago

Computer

Quando ti siedi sul WC non puoi fare a meno di queste app sul cellulare

Quel minuto tutto tuo, porta chiusa e telefono in mano. Il mondo si allarga nel…

3 mesi ago

Questo forse non lo sapevi: la vera storia del logo Apple

Il logo di Apple, riconoscibile in tutto il mondo per la sua semplicità ed eleganza,…

3 mesi ago

Tablet

Vuoi iniziare a leggere in inglese? Sfrutta questo trucco per avere ebook gratuiti

Se ami leggere libri in inglese potrebbe interessarti un semplice trucco per avere tutti gli…

3 mesi ago

iPhone

Come collegare iPhone a una stampante

Collegare il proprio iPhone a una stampante wireless attraverso AirPrint è un processo semplice e…

3 mesi ago

Computer

Offerte di lavoro truffa su Linkedin? L’IA può aiutarti a smascherarle così

Lo vedi spuntare nel feed: ruolo perfetto, stipendio alto, tempi rapidi. Poi qualcosa stona. Un…

3 mesi ago

Google WaveNet: il computer avrà una voce vera

Google WaveNet: l’intelligenza artificiale con la voce umana

Text to speech di DeepMind: note e caratteristiche

Related Post

Recent Posts

IL CALDO È IL VERO NEMICO DI SINNER? L’INCREDIBILE COINCIDENZA CHE PREOCCUPA I TIFOSI

Quando ti siedi sul WC non puoi fare a meno di queste app sul cellulare

Questo forse non lo sapevi: la vera storia del logo Apple

Vuoi iniziare a leggere in inglese? Sfrutta questo trucco per avere ebook gratuiti

Come collegare iPhone a una stampante

Offerte di lavoro truffa su Linkedin? L’IA può aiutarti a smascherarle così