国内知名互联网公司搜狗推出了一种人机交互新技术——唇语识别,这也是业内首个公开演示的唇语识别系统。它是通过机器视觉识别,不用听声音,仅靠识别说话人唇部动作,就能解读说话者所说的内容。与语音识别不同,唇语识别是一项基于机器视觉与自然语言处理于一体的技术,因此在研发难度上比语音识别大得多。目前,搜狗的唇语识别效果业界领先,在非特定人开放口语测试集上,搜狗唇语识别系统已经达到 60% 以上的准确率,超过 google 发布的英文唇语系统 50% 以上的准确率,在垂直场景如车载、智能家居等场景下甚至已经达到 90% 的准确率。可以想见的是,作为人机交互的形式之一,未来唇语识别技术可以辅助语音交互及图像识别,在日常生活、安防、公益等各个领域实现广泛应用。搜狗的唇语识别破解了噪声环境中语音识别准确率低的长久难题,为人工智能技术带来新思路和更多可能。

新闻出处:这里

【声学新闻】搜狗推「唇语识别」 破解噪声环境下语音识别准确率低局面”的一个响应

  1. 现在科技真是日新月异,竟然能读唇语了,这已经超出很多人的能力范围了吧

发表评论

Fill in your details below or click an icon to log in:

WordPress.com 徽标

You are commenting using your WordPress.com account. Log Out /  更改 )

Google+ photo

You are commenting using your Google+ account. Log Out /  更改 )

Twitter picture

You are commenting using your Twitter account. Log Out /  更改 )

Facebook photo

You are commenting using your Facebook account. Log Out /  更改 )

Connecting to %s