LOZINKA JE – VAŠ GLAS: Nizozemska banka pustila aplikaciju za glasovnu sigurnost
Brži i točniji
Ali napredovao je. Novi sustav za prepoznavanje govora može pisati riječi u smartfon oko tri puta brže nego što ih prosječna osoba može utipkati.
Razvojni tim popularne kineske tražilice Baidu stvorio je program po imenu Deep Speech 2, koji koristi strojno učenje kako bi znatno poboljšao svoje mogućnosti prepoznavanja govora.
Istraživanje koje su zajedno proveli Sveučilište Stanford, Baidu i Sveučilište Washington otkrilo je kako sustav radi 20,4% manje pogrešaka nego ljudi koji su tipkali na engleskom i 63,8% manje pogrešaka nego oni koji su tipkali na mandarinskom jeziku.
Veliki potencijal
Baidu ne namjerava ponuditi ovaj softver javnosti, već će ga integrirati u Baidu aplikacije u Kini.
Unatoč tome, suautor istraživanja James Landay vidi potencijal za šire korištenje ovog sustava za prepoznavanje govora.
"Možete zamisliti sučelje gdje koristite govor za počinjanje rada, a zatim se prebacite na grafičko sučelje koje možete dodirnuti i kontrolirati prstima", kaže Landay. "Trebali bi staviti govor u više aplikacija, a ne samo u email i SMS poruke".