主页 > 游戏加加 >

东京1.5分彩开奖号码调侃语音助手?工大教授:我们的研究领域会

编辑:凯恩/2018-12-31 02:28

  寂静的夜里,百无聊赖的你是否曾经拿起手机,挑逗过QQ小冰,调侃过siri?

  但是有一位工大教授表示:这绝不是人工智能的宿命,我们的研究领域会开启人工智能新世界!

  广大的漫威迷是否对钢铁侠斯塔克的超级智能管家,那个无所不能、可以和主人密切交流,会帮助主人处理各种事务,计算各种信息的贾维斯印象深刻,假如没有贾维斯的钢铁侠的战力恐怕会严重缩水。

  《机器人总动员》这部电影作可谓是大多数同学的经典回忆,电影中的胖船长只需一句指令甚至一个单词,服务机器人就会帮助他完成洗脸,刷牙,准备咖啡,处理数据等工作,甚至日常移动也可以通过“声控”机器人帮助他完成。这可能也是大多数“肥宅”们的极致追求吧。

  以现有的技术,我们能否也拥有这样一个超级管家呢?这个问题困惑着小微这个门外汉,想必也是大多数同学所好奇的,这不,小微十分有幸采访到了我校计算机学院教授谢磊,让谢教授为我们指点迷津。

  谢教授长期从事智能语音的深度研究。对于这个问题,他告诉我们,类似电影中这种超级管家,事实上要具备两个最基本的特征:第一,就是需要这个超级管家要有“综合”联系协调、调动资源的能力。第二,要具备充分了解人类的需求,有和人类进行“零”障碍的交流能力。对于第一个特征,事实上随着互联网的大规模产业化,特别是以手机为载体的移动互联网的智能化,使得衣食住行都离不开手机上的各种APP。手机APP就是对各类资源与服务的协调,很多资源、服务都可以在线上完成,在这样的条件下,我们离“超级管家”基本上完成了一大步,只不过这个“超级管家”基本上是集中到了手机端,人们在使用的时候还需要打开每个相应的APP。而上述的第二个特征正是科学家们集中力量“攻坚”的关键,就是如何实现人机无障碍交流,而这种交流最简单有效的就是通过语音交互完成。

  抛开距离现实较远的电影“贾维斯”的超级功能,回到现实,谢老师在采访中谈到,如果有一个语音助手可以按照我们的语音指令,准确地完成我们“类似”在手机上的各种操作,比如,产品搜索、订机票、订酒店、订车、订外卖、查天气、导航、控制家居、帮你做会议纪要、日程提醒等。在这过程中,语音助手可以和人进行自然地语音反馈交流、信息确认,最终完成任务。这时我们就不需要再去根据不同需求手动选择不同的APP,而所有的这一切都可交给这个“懂你”的语音助手。可以说,这时的语音助手就成为了一个控制“流量”分配的“阀门”,相当于掌控了目前众多APP的能否被使用、能否继续生存下去的“生杀大权”。全世界的各大巨头公司都看好语音助手这个下一代互联网流量经济最重要的入口,纷纷加大投入研发“智能语音”技术。

  正是在这个原因的驱动下,全球的智能语音产业已经步入研发与应用的快速增长期。目前,谷歌、微软、亚马逊、苹果、腾讯、百度、搜狗、阿里则获得了迅速的增长,而作为这一入口的另一载体——智能音箱市场销售状况良好,像国际上亚马逊、谷歌、苹果公司的产品占据较大市场份额,国内小米、百度、腾讯、阿里、华为、京东和众多公司都纷纷推出了自己的产品。搭载智能语音交互设备层出不穷,如各种语音对话机器人、智能耳机、智能手表、车载智能后视镜、智能电视等。

  智能语音产品在市场上炙手可热、风风火火的背后,却和很多同谢磊教授一样的科技工作者们日复一日的研究与创新分不开,每一项核心技术的突破,都会对整个行业、产业产生不小的影响。

  走进谢老师的实验室,各式各样的小机器人和智能硬件立刻让我们感觉到“科技感”十足,谢老师兴致勃勃的给我们演示他的“宝贝们”,”宝贝们”非常听谢老师的话,开关设备、预报天气、聊天样样都行。谢老师告诉我们,这些产品中搭载了和实验室共同研发的技术。很多产品都已近走入人们的家庭生活,看似自然的功能却有非常复杂技术支撑,很多技术都凝结了他们团队的心血。

  智能语音最终的目的就是实现人和设备之间的语音交互,简单的说就是让人和设备可以像人与人一样自然交流。在我们日常生活中,正常的语言交流是再简单不过的事情,这涉及语音和听觉两个大的方面。语音这个看似简单的一维声波信号,却蕴含着极其丰富的信息,诸如身份、内容、意图、情感、语种、口音甚至生理状态和环境等信息,而智能语音技术是指获取、传输、处理、加工与生成人类语音的一类技术的泛称,其中包括语音编码与压缩、语音增强、语音识别、情感与情绪识别、关键词检出、语音合成、东京1.5分彩全天计划语音理解、说话人识别、语音翻译等技术。“形简意丰”的特点让语音技术研究极具挑战性,整个人机语音交互过程非常复杂。这些过程中最重要的环节之一就是语音识别,通俗的讲就是让“机器” 听见、听清。

  谢教授告诉我们,随着近年来的技术突破,在较为理想的条件下用大众化的语言交流,现有的语音识别系统基本上可以完成准确识别。但在日常生活中,交流过程中往往会遇到这样或那样的干扰和不确定性,有的是环境的,比如不规律噪音的干扰,远距离的语音交互的语音衰减、环境回声或混响干扰,再者说话人的语种切换、口音、说话方式、其他说话人的干扰等都会影响语音识别的性能。而现实存在这些都是影响智能语音技术进一步推广的技术难题,即语音识别的“稳健性”问题,目标是如何提升语音识别在各种实际复杂场景下的性能,让系统变得更加稳健。针对稳健性问题,谢磊教授团队经过长期的研究与探索,包括通过与华为、小米、阿里、出门问问等企业合作,取得了一些重要进展。

  噪声干扰是最典型的一类“稳健性”问题。日常语音交流的过程通常会受到周遭环境声的干扰,比如家居噪声、房间混响等。以房间混响为例,是指声源停止发声后,在环境中还存在来自各个表面的发射引起的声音“残留”现象。这种反射残留过多,不仅会影响语音听感,也会严重影响设备语音识别的准确率。比如,在某中文语音识别测试中可以看到,干净情况下字错误率是7.86%,在有混响的情况下字错误率迅速攀升到23.85%,所以说诸如混响干扰问题的解决对于语音识别技术的推广具有重要的意义。

  对于这一普遍问题,谢磊教授团队创新性地运用最新的深度学习方法来解决。大家要知道,AlphaGo战胜李世石和柯洁背后的核心技术就是“深度学习”,深度学习也无疑是这一波人工智能浪潮的背后推手。基于深度学习的方法运用大数据的规模效应和神经网络强大的多层非线性学习能力,通过回归任务建立一个从带噪语音输入到干净语音输出之间的一个映射,更加直观的去除包括混响在内的各种噪声。通俗的讲,这种学习就是无限逼近和修正的过程,通过大数据样本的反复对比,最终实现噪声成分剥离,完成噪声消除。看似简单的道理实现起来却异常困难,尤其是在各种复杂的实际应用场景中。谢磊教授带领团队反复验证,不断优化,最终形成较为理想、高效的算法,为推动复杂环境下语音识别技术的推广发挥了重要作用。目前该项技术已经应用在高端智能手机中,正在向智能音箱产品进行推广。

  除了识别和降噪技术的攻关,还有一个重要的研究课题是语音唤醒技术,它是激活语音助手的第一步,类似手机和智能音箱上的“Hi Siri”和“小爱同学”功能。如何减少误“唤醒”和提升“唤醒率”是主要攻关的内容。谢教授团队同小米语音团队合作,提出了基于注意力机制的语音唤醒方法。基本原理就比如我们听到别人叫我们名字的时候,“注意力”就转换到这个人的讲话上。同理,当设备听到有人叫它名字时,就会“排他”性的优先关注该对象,并对对象的声音进行学习与分析。经过大数据的反复验证,在该方法的作用下,设备的误唤率大幅减低,同时运算量也缩减了数倍以上。

  除了上述关键性技术攻关外,谢磊教授团队在语音识别后处理技术、低资源语音建模和个性化语音合成等多个领域上都取得了突破性的进展。正是由于很多关键性技术的突破,东京1.5分彩开奖号码,国内的多个巨头企业都主动寻求和谢磊老师团队合作,比如华为、百度、腾讯、小米、华为、搜狗、阿里巴巴等。

  人工智能被人们誉为“最前卫”的研究领域,谢磊教授谈到智能语音的发展前景时显得信心十足。他说,目前的人工智能行业竞争非常的激烈,每一个商家都想抓住“流量”的分配权,就像当年兴起的搜索引擎可以决定你的曝光度、显示度一样,智能语音在这方面具有更大的优势与潜能,用市场推动技术的革新甚至革命是最有效的。在采访结束之前,谢磊教授再一次给我们构想了智能语音的未来蓝图:随着人工智能技术的进步,大数据和大算力的支撑,未来每个人个性化的语音助手将“无缝”出现在不同的设备和场景下,可能是你的手机、你的音箱,你的电视、你的车里、你的耳机或你的手表,成为你的“伴侣”。借用小米人工智能与云平台副总裁崔宝秋博士的话说,智能语音技术将“无处不在、无所不能、与时俱进、如影随形”。相信在不久的将来智能语音技术或将会开启一个人工智能的崭新世界。

  好久不见,最近要体测了呀,大家在锻炼的同时注意防寒哦!我们来看看各个公众号的表现吧~

  WCI榜第一名由西工大就业获得。文章总数、阅读总数和WCI(微信传播指数)完全力压其他公众号,其中,阅读总数更是直接突破了2w+,这真是太厉害了!祝贺!

  WCI榜第二名由小瓜工大助手获得。仅仅6篇文章就收获了这么多阅读总数和点赞总数,质量真的非常棒哦~

  WCI榜第三名由西北工业大学研究生教育获得。各项指标都十分出色,继续加油啊~

  西工大就业获得,2w+的阅读量和35篇文章是压倒性的胜利呀!而且很多次都是这个成绩了,真的非常厉害!

  本周平均阅读数由西北工业大学研招办获得,有兴趣的小伙伴要继续关注他们哦~