NAJMANJE GREŠAKA

Microsoftovi sustavi najbolje prepoznaju govor

15.09.2016 u 11:12

Bionic
Reading

Čelna osoba u Microsoftu kad je riječ o tehnologijama vezanim uz prepoznavanje govora, Xuedong Hudang, objavio je kako je kompanija postavila novi industrijski standard po kvaliteti prepoznavanja govora

Microsoftovi stručnjaci su postigli WER (Word Error Rate) od 6,3 posto, najniži u cijeloj industriji. U istraživačkom radu objavljeno je kako dosadašnji najbolji sustavi imaju WER od 6,9 posto na NIST 2000 Switchboard setu.

Na nedavno održanoj međunarodnoj konferenciji o komunikaciji i tehnologijama prepoznavanja govora (Interspeech), IBM je objavio kako su postigli WER od 6,6 posto, što je i dalje lošije od Microsoftovog rezultata.


Prije 20 godina, najbolji sustavi su imali WER od 43 posto ili gore.

Tehnologije vezane uz prepoznavanje govora danas su dio svakodnevice - posebno kod ljudi koji koriste virtualne pomoćnike na svojim mobitelima (Google Now, Siri, Cortana), no prepoznavanje govora i prevođenje u stvarnom vremenu stiglo je i na Skype.

Algoritmi postaju sve složeniji, a svaki djelić postotka koji se 'skine' predstavlja fenomenalan korak unaprijed.

Više o svemu: Microsoft Blog