Tehnološki gigant Google otkrio je kako će uskoro njihova umjetna inteligencija zvučati puno prirodnije no što je to do sada bilo. Program koji se zove Tacotron 2 učio je na primjeru dijaloga između ljudi i tekstualnih transkripata kako bi govor umjetne inteligencije učinio prirodnijim. Audio demonstracija je pokazala kako je program uspio svladati i neke od poznatih jezikolomki, ali na nekim težim riječima i dalje postoje problemi.
Zvuči poput profesionalca
Googleovi stručnjaci tvrde kako je njihov novi TTS sustav (sustav koji pretvara tekst u govor) može sam generirati vlastiti govor na temelju onoga što je naučio. To je zapravo sasvim drugačija metoda od svih ostalih TTS sustava koji uče na temelju kompleksnih jezičnih i zvukovnih inputa.
Google kaže kako je testna skupina kojoj su pustili zvuk Tacotrona 2, zaključila kako novi sustav umjetne inteligencije zvuči poput profesionalnog spikera.
Tacotron 2 u svoj govor uključuje i interpunkciju, intonaciju i brzinu izgovora nakon čega se sve prebacuje na valnu duljinu od 24 kHz.
Pogodite!
Poslušajte sami audio primjere i pokušajte pogoditi u kojem primjeru se radi o čovjeku, a u kojem o robotu. Audio zapisi će se automatski vrtiti jedan za drugim, ali klikom možete odabrati onaj koji želite preslušati.
[playlist ids="1268119,1268121"]
[playlist ids="1268138,1268139"]
[playlist ids="1268141,1268142"]
Jeste li pogodili? Ako vas muče tko je čovjek, a tko je robot, evo rješenja - audio zapisi označeni dodatkom 'gen' su zapisi robota.