早在計算機面世之前,自動語音識別的設(shè)想就已經(jīng)被研究人員提上了日程。而隨著科學(xué)技術(shù)的飛速發(fā)展,此前僅出現(xiàn)在電影中的智能語音技術(shù)終于步入了人們的生活!但一個巨大的“難題”卻始終盤踞在科技巨頭們面前——如何提升語音識別的準(zhǔn)確率。
2016年9月,微軟宣布自家語音識別技術(shù)的最低錯誤率為6.3%,打破此前IBM保持的6.9%紀(jì)錄。而就在此后的幾個月,微軟再次宣布將最低錯誤率降低到了5.9%,這已經(jīng)與普通人類齊平。
現(xiàn)在,IBM終于實現(xiàn)了反超!
IBM最新宣布,已經(jīng)成功將語音識別中的單詞錯誤率降低到5.5%,并正在向5.1%努力。
據(jù)IBM方面介紹,其是通過“長短期記憶、WaveNet語言模型和三個強聲學(xué)模型”三大法寶才得以實現(xiàn)5.5%的低錯誤率。據(jù)悉該結(jié)果是使用SWITCHBOARD和CallHome語料庫測試后得出的,其權(quán)威性自然不言而喻!
留言與評論(共有 條評論) |