深度学习应用到语音识别领域之后,词错率有了显著降低。但是语音识别并未达到人类水平,仍然存在多个亟待解决的问题。其中语音识别最明显的一个缺陷在于对口音和背景噪声的处理。最直接的原因就是:绝大多数训练数据都由具有高信噪比的美式英语组成。也就是说,大部分训练数据都是英语母语者(大部分是美国人)在几乎无噪声的环境中录制的。

就一般而言,一辆行驶的汽车内的噪声几乎不可能有-5dB 那么低。人类在噪声环境中能够轻易理解彼此所说的话,但根据研究数据显示,人类和语音识别模型的词错率差距在低信噪比和高信噪比音频之间存在巨大的差距。换而言之,语音识别器的性能会因为噪声的存在而急剧下降。

新闻出处:这里

One thought on “【声学小常识】背景噪声直接影响语音识别的正确率

  1. 人工智能本身就是把双刃剑,当机器具备理解能力,那人类的优势在哪里呢?

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据