站点图标 智诚创科:您的声学科技伙伴

【声学新闻】搜狗推「唇语识别」 破解噪声环境下语音识别准确率低局面

ZCCK 智诚创科 ZCCK Asia Nor140 Nor848 Nor150 声级计 Shengjiji Nor850 声学照相机 Vibration Monitoring Vibration Monitoring 震动监测系统 噪声 声学软件 声像仪 声学照相机 声学照相机 声学照相机 Norsonic Norsonic 公司官网 SoundPLAN Info

国内知名互联网公司搜狗推出了一种人机交互新技术——唇语识别,这也是业内首个公开演示的唇语识别系统。它是通过机器视觉识别,不用听声音,仅靠识别说话人唇部动作,就能解读说话者所说的内容。与语音识别不同,唇语识别是一项基于机器视觉与自然语言处理于一体的技术,因此在研发难度上比语音识别大得多。目前,搜狗的唇语识别效果业界领先,在非特定人开放口语测试集上,搜狗唇语识别系统已经达到 60% 以上的准确率,超过 google 发布的英文唇语系统 50% 以上的准确率,在垂直场景如车载、智能家居等场景下甚至已经达到 90% 的准确率。可以想见的是,作为人机交互的形式之一,未来唇语识别技术可以辅助语音交互及图像识别,在日常生活、安防、公益等各个领域实现广泛应用。搜狗的唇语识别破解了噪声环境中语音识别准确率低的长久难题,为人工智能技术带来新思路和更多可能。

新闻出处:这里

退出移动版