Deep Speech 2

PREPOZNAVANJE GOVORA: Nova Android tipkovnica piše SMS-ove tri puta brže od ljudi

Sve od nedavno, softver za prepoznavanje govora bio je preloš. Zbunjivala ga je pozadinska buka, riječnik mu je bio ograničen i bio je čudan osjećaj koristiti ga u javnosti, piše Mashable.

LOZINKA JE – VAŠ GLAS: Nizozemska banka pustila aplikaciju za glasovnu sigurnost

Brži i točniji

Ali napredovao je. Novi sustav za prepoznavanje govora može pisati riječi u smartfon oko tri puta brže nego što ih prosječna osoba može utipkati.

Razvojni tim popularne kineske tražilice Baidu stvorio je program po imenu Deep Speech 2, koji koristi strojno učenje kako bi znatno poboljšao svoje mogućnosti prepoznavanja govora.

Istraživanje koje su zajedno proveli Sveučilište Stanford, Baidu i Sveučilište Washington otkrilo je kako sustav radi 20,4% manje pogrešaka nego ljudi koji su tipkali na engleskom i 63,8% manje pogrešaka nego oni koji su tipkali na mandarinskom jeziku.

Veliki potencijal

Baidu ne namjerava ponuditi ovaj softver javnosti, već će ga integrirati u Baidu aplikacije u Kini.

Unatoč tome, suautor istraživanja James Landay vidi potencijal za šire korištenje ovog sustava za prepoznavanje govora.

“Možete zamisliti sučelje gdje koristite govor za počinjanje rada, a zatim se prebacite na grafičko sučelje koje možete dodirnuti i kontrolirati prstima”, kaže Landay. “Trebali bi staviti govor u više aplikacija, a ne samo u email i SMS poruke”.

 

Imaš komentar?

Povratak na Net.hr