烽火社区 首页 应用 安防监控 查看内容
人工智能 新风净化 电源技术 嵌入式系统 单片机 模拟技术 LED照明 光电技术 安防监控 传感技术 RFID技术 通信网络 防盗报警 电子测量 PCB技术 基础电子 工业电子 医疗电子 汽车电子 消费电子

唇语精准识别私语传音成真

2017-12-17 06:18 PM| 发布者: 河源房源信息| 查看: 178| 评论: 0

摘要: 唇语识别通过呆板视觉技能,从图像中识别出人脸,并提取此人一连的口型变革特征,将一连变革的口型特征输入到唇语识别模型中识别出对应的发音,再盘算出大概性最大的自然语言语句。   只动动嘴巴,纵然不作声,光 ...

唇语识别通过呆板视觉技能,从图像中识别出人脸,并提取此人一连的口型变革特征,将一连变革的口型特征输入到唇语识别模型中识别出对应的发音,再盘算出大概性最大的自然语言语句。

 

  只动动嘴巴,纵然不作声,光看口型就知道你在说什么,这种存在于武侠剧中的桥段正在加快成为现实。日前,在乌镇第四届世界互联网大会上,{方案}人工智能与大数据可视分析能力的唇语识别系统能够实现“私语传音”,成为时下最吸睛、最炫酷的黑科技之一。

 

  当你说出“这首歌叫什么名字”时,呆板不消收音、举行语音识别,通过识别你的唇部动作,就能准确识别语义的内容。这让不少体验后的网友感叹,“之前只知道有语音识别、面部识别,没想到还能唇语识别,有种武林高手的感觉!”

 

  据研发企业海云数据先容,唇语识别的原理其实是使用呆板视觉技能,从图像中识别出人脸,判断其中正在说话的人,并提取此人一连的口型变革特征。随后,将一连变革的口型特征输入到唇语识别模型中识别出对应的发音。最后,根据识别出的发音再盘算出大概性最大的自然语言语句。

 

  那么,唇语识别的精准度如何?海云数据首创人冯一村表现,通过使用1万多小时的新闻素材对唇语识别系统举行训练,目前海云数据对英文的识别准确率在80%左右,中文准确率为71%,而国外所知的最高识别率仅为不到50%。未来,随着“语料”越来越多,唇语识别率还将得到稳步提升。

 

  相比于唇语识别的技能路径,人们更关心它将用于那边。据悉,唇语识别应用技能是目前国际研究的热门课题,可应用的范畴包罗场景教诲、身份识别、公共安全、移动支付、军事情报等。好比,通过唇语识别,可以让无法开口说话的残障人士自由表达、让听力障碍者和不少老年人更清晰地听懂他人;通过口型支付暗码,可以举行移动支付;而在军事情报范畴,唇语识别则让远间隔获取情报成为大概。

 

  “最初的想法是用于公安系统中,因为公安部分的视频数据占到其全部数据的95%以上,根本都是无声数据,激活视频的语义内容代价非常巨大。”冯一村说,可以预想,参加唇语识别技能后,公安人员可通过平台锁定视频中犯罪嫌疑人的语言记载,这将极大助力犯罪缉查工作的开展。

 

  值得一提的是,唇语识别背后并不是一个小众的市场。在噪音太大或只有摄像头等无法捕获声音的场所中,唇语识别技能具备很强的实用性。好比,在公路、集会室、火车站等噪音嘈杂的场景中,唇语识别可以资助规避音频噪声对用户说话内容获取的影响,确保交换顺畅举行。而在电梯、公路等监测场景,只有摄像头,没有麦克风,通过唇语识别技能,可以获取重要的用户发言信息,为公共安全提供有效的支持。

 

  无独有偶,搜狗也在本届互联网大会上演示了其最新的唇语识别系统。该系统可提取人面部的三维图像信息,提取面部的动作序列,识别的效果相比以前更准确。据先容,未来这项技能有望应用于车载系统,以及资助听障人士“翻译”正凡人语言,通过唇读技能把语音转换成文字,资助他们更好地相识世界。

 

  业内人士预计,鉴于在公共安全、身份识别、残障教诲、军事等范畴的竞争力,唇语识别技能或将开启万亿级的大数据市场。但鉴于语言情况的复杂性,唇语识别真正投入实战还尚需时日,仍需进一步增强大数据、可视分析、人工智能技能等范畴的融合研究。


关键字:唇语识别  呆板视觉

编辑:鲁迪 引用地点:http://www.eeworld.com.cn/afdz/article_2017121111417.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站接纳的非本站原创文章及图片等内容无法一一接洽确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由流传,或不应无偿使用,请实时通过电子邮件或电话通知昨们,以迅速接纳适当步伐,制止给双方造成不须要的经济损失。

鲜花

握手

雷人

路过

鸡蛋
热点图文
推荐阅读
文章排行
返回顶部