范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

告别智障第一步小米靠这个让小爱同学更聪明

  要问智能手机上最鸡肋的功能,小编第一个想到的是人工智能语音助手:几乎不使用,扔掉又可惜。
  为什么几乎不用呢?且不说别的,首先就因为语音助手们不会像人一样说话。
  每和它说一句话,都要先说"嘿,Siri",或者"你好小艺",或者"小爱同学",或者……说久了小编觉得自己都快成智障了……
  这第一步就让人望而却步,所以,打入冷宫呗。
  不过,在11月19日举行的小米开发者大会上,小米小爱同学3.0的发布引起了小编的注意,因为她有一个重要的更新:更自然的连续对话。
  小爱同学也成了首个在手机上实现自然语言连续对话的AI助理。
  最近,IT之家小编汐元更新了小爱同学3.0,体验了一下这个连续对话究竟是怎样的。
  一、小爱同学3.0连续对话的体验
  汐元使用的是小米9 Pro 5G版,更新时只需要对小爱同学说"现在升级",她就能够自动升级到3.0版本了。
  升级之后,连续对话功能不是默认开启的,你需要在小爱同学的设置选项中手动开启。
  开启后,汐元尝试和小爱同学进行了一段对话:
  在这之前,汐元还和旧版的小爱同学进行了一段类似的对话:
  对比上面两个测试的视频,很明显,支持连续自然语言对话的小爱同学3.0比以前好用多了,体现在:
  说一次唤醒词,就可以一直对话下去,不用反复喊"小爱同学"了;
  在小爱同学话说一半的时候,你可以打断她,让她执行下一个指令;
  当然,目前在连续对话下,你和小爱同学闲聊,她仍然会回答一些不合逻辑的话:
  但至少,现在和小爱同学说话,在方式上很像和人交流了。
  汐元觉得,这才是AI助手摆脱"智障"标签的第一步。
  别小看这第一步。"人机语音交互"的终极目标,不就是要像"人人语言交互"一样吗?
  这么,这一小步背后,又是哪些技术在制程呢?连续对话功能,究竟是怎么实现的?
  二、全双工多轮交互技术到底是什么?
  根据小米的介绍,他们采用的是全双工多轮交互技术。这是个什么技术呢?
  首先,全双工的意思就是,在同一时间里,信号可以双向传输,即A可以发消息给B,同时B也可以发消息给A。
  也就是A和B都可以同时发送信息和接收信息。
  同理,半双工的意思就是在同一时间,信号只能单向传输,即要么A发消息给B,要么B发小给A。
  这个差别就像是现实中双行道和单行道的差别。
  全双工本身不是什么尖端的、困难的技术,相反,很早就有了。它就是在芯片层面和外部之间采用发送线和接受线各自独立的方法。
  例如,电话就是典型的全双工技术,而电话已经诞生100多年了。
  只是,要在AI语音交互中加入全双工技术,这就有点困难了,毕竟,你要对话的不是真实的人啊。
  三、插曲:常规情况下,语音助手是怎么识别人声的
  这里汐元要插一段,简单给大家说一下通常AI进行语音识别是怎么实现的。
  例如,我在对语音助手说"打开IT之家"的时候,手机通过麦克风接受到汐元的声波模拟信号,然后将模拟信号转化为数字信号。
  接着,系统会对数字信号进行特征提取,提取时会将这段语音信息分成很多小块,然后根据每个小块的特征组成音素——"da kai ai ti zhi jia",再将这些音素根据声学特征进行分类。
  然后,系统会将这些因素和自己的语言库进行比对,根据语言的规律,找出对应的文字。
  接着,系统还要根据文字进行自然语言理解,去理解文本的含义,然后找到答案,最后去进行自然语言的生成,输出回答语音。这个过程中,需要强大的对话引擎参与。
  目前对话引擎主要分为检索模型和生成模型。
  检索模型,意思就是从知识库中检索最相近的问题,然后找出对应的答案。
  ▲图片来源:微软小冰技术讲解PPT
  生成模型,这个有些抽象,通俗说就是根据神经网络训练的结果来给出答案。这个答案是AI自创的,不是检索数据库得到的。
  所以,在算法不成熟的时候,AI的回答可能会有些不合逻辑。但这个更符合连续对话场景的需要。
  小爱同学大部分时候采用的就是生成模型。
  这相当于AI助手完成一个语音识别并回答的过程,也可以理解为完成一个半双工的过程。
  四、全双工交互的难点和解决方法
  那么全双工下有什么不同呢?
  首先我们知道,对于AI助手而言,全双工就是输入、输出可以同时进行,这本身不是什么难点,毕竟电话都能做到了。
  难在哪里呢?难在你和AI交互的时候,一旦全双工,会带来整个系统性的问题需要解决。
  包括:
  第一:怎么全面地降低功耗?
  第二,连续对话是一个长时间的过程,怎么消除噪声干扰?这个噪声包括杂音,还有你不是对AI说地那些话。
  第三,AI怎么理解、记住上下文语义,让对话能够继续下去?
  第四,AI在说话时,你也说话了。AI怎么判断你是不是要打断他,也就是怎么避免被误打断。
  还有一个比较远,就是AI和你持续对话时,能不能判断什么时候沉默,什么时候打破沉默,要不要引出新话题?就是让你觉得你说话的对象不是死板、机械的。
  能够解决这些问题,全双工也就能普及了。
  上面这些问题,其实目前都没有十全十美的解决方案,但已经有可用的了。
  具体看小爱同学,怎么解决呢,
  1、连续对话免唤醒
  这个技术需要解决一系列问题。
  连续对话免唤醒,也就是只唤醒一次,就可以多轮对话。现在你每说完一个指令,AI不会歇着,而是随时待命。那么问题来了,首先怎么降低功耗呢?
  有一个办法是分级处理。比如说,我向小爱同学下达了一个指令,她响应后,不会像以前那样休息,而是继续待命,等待再有人声被检测到。
  等待的过程中,她不会做复杂地监听,而是第一级先简单处理噪音,再做二级高精度处理。等有人声出现,才会进行声纹识别等操作。也就是说,她是逐步提升计算性能的。
  还有一点,也有利于降低功耗,就是语义拒识的算法,这个不仅是去除噪声, 也可以检测到环境中,包括人说话中一些没有语义意义的音频片段(例如音乐声、尖叫声,说话中的嗯啊口语等),然后将他们去除,这样也可以节省后端处理的计算资源。
  当然,降低功耗也离不开硬件层面的进步,这是软硬结合才能实现的效果。
  然后就是,过去你在唤醒词后面就是要对AI说的,现在连续对话了,AI怎么知道你是对它说话呢?
  这里有一个过程叫语义选择。通俗理解,就是当AI收到人声,进入语义分析的环节时,它会先看看这句话的意思是否跟我这个设备覆盖的语义规模、意图相吻合,从而判断当前人是不是跟设备说话。
  汐元也模拟了一段包含噪声、不同说话声的测试场景:
  小爱同学很稳地过滤掉了背景的音乐噪声,完全没有受到干扰。
  周围的其他声音中,汐元本人的说话声,小爱同学基本都能准确识别出来。而另一台手机播放的声音,有时候会对交流造成打断,有时候也能识别完整的语义,有时候则只能识别只言片语,然后给出错误的回答。
  这说明,小爱同学已经具备在复杂环境中识别指令的技术, 但是,判断的准确性还不太完美。
  目前还有一种多模态交互的技术,就是除了语音之外,终端还会配合其他的传感器,特别是视觉方面,这样,AI就能更加精确地判断用户说话地意图了。
  2、让对话稳定持续下去
  在连续对话中,怎样让对话持续下去呢?
  首先要让对话显得自然,不出错。我们在和语音助手交流地时候,经常会发现,你说话地时候,稍微停顿长一些,AI的识别就停止了(以为你说完了),然后给出一个错误的回答。
  这种情况,小爱同学的解决办法是,在云端根据用户说话节奏和内容,进行动态断句, 这可能需要一定时间的学习。
  在回复时,则可以适时的回复"嗯"等人类常用的接话话术,这样,系统就打破了对说话规则的要求,用户也可以按照自身的说话习惯来进行交流。
  怎样理解上下文呢?说实话,这目前还是AI语音助手的一个难点。
  这一点上,小爱同学的思路是,引入交互认知智能的概念,简单说就是她在分析语义的时候会思考,会解读当前所处的语境环境,并结合历史任务,判断用户的意图到底是什么。
  这其中,涉及一些专业的技术,例如跨技能的上下文处理、多引擎(信息检索、任务)的融合、指代消解、知识推理等。
  指代消解是这里一个很重要的技术,大意就是能够理解上下文代词的意义。跨技能的上下文指代消解,就是在不同场景下也能判断代词。
  例如汐元对小爱同学说:"今天上海天气怎么样?"然后又说"导航去那里",查天气和导航是两个不同的技能,小爱同学就能够理解其中的代词。
  然后还有一点,是防止误打断。这一点,小爱同学也有对应的技术,可以在对话的过程中,实时判断是否需要打断,不容易出现误打断,同时,对没有语义的输入,则不会打断语音合成播放。
  3、让对话更有灵性
  最后还有主动交互的技术,它可以智能判断,甚至主动打断用户的啰嗦的表述,当对话陷入冷场时,也可以主动打破沉默僵局,实现流畅自然的用户口语交流习惯。
  这个技术暂时还没有完全成熟的应用,不过在不久的将来,相信我们会看到更有灵性的AI助手。
  总结
  小爱同学3.0第一次将全双工多轮对话的技术带到了手机AI语音助手上,从而实现了连续对话的能力,正如汐元所说的,这是手机AI助手真正可用的第一步。
  不过,汐元也了解到,这个技术此前在一些品牌的智能音箱产品上已经使用了,这说明,全双工的语音识别,是一个趋势。
  当然,全双工的语音识别技术还没那么成熟,也需要更长时间的技术优化,但好歹,它已经让我们看到了AI助手在未来的无限可能性。

华为HUAWEIWatchGT儿童手表3Pro价格公布988元1288元1488元IT之家10月26日消息华为在今日的发布会上正式将华为Mate20系列手机带到了国内。同时,华为还正式发布了华为手表GT(HUAWEIWATCHGT)等一系列新品。华为官方宣布,华华为AI音箱亮相丹拿专业音质,支持手机通话IT之家10月26日消息华为HUAWEIMate20新品手机发布会在上海举行,亮相了旗下首款智能音箱产品华为AI音箱。音箱基于华为在AI人工智能技术,具备了一系列智能特性。华为AI苹果AppleWatchSeries6物料成本仅为136美元,SoC内存占据大头IT之家6月4日消息凭借时尚现代的设计,再加上最好的智能手表界面之一,苹果AppleWatch在2021年第一季度拿下了约33的智能手表市场份额。最新的AppleWatchSeri249元至289元,荣耀手环6NFC版正式发布1。47英寸AMOLED全面屏,磁吸快充14天续航IT之家11月3日消息荣耀正式发布最新一代智能手环荣耀手环6。其中荣耀手环6售价249元,荣耀手环6NFC版售价289元,将在11月4日0点预售,11月11日0点正式发售。IT之家荣耀手环6全面屏渲染图曝光1。47英寸2。5D彩屏,售价200多元IT之家11月3日消息荣耀将发布荣耀最新一代智能手环荣耀手环6。此前海报显示,荣耀手环6将采用窄边框屏幕。同时,荣耀也首次提出开启手环全面屏时代的口号。现在微博博主数码闲聊站曝光了荣耀手环6官宣荣耀首款全面屏手环,11月3日见IT之家10月29日消息今日,荣耀宣布将于11月3日发布荣耀最新一代智能手环荣耀手环6。本次发布的官宣海报中也首次露出了新品手环剪影,可以看到荣耀手环6将采用窄边框屏幕。同时,荣耀云从科技IPO率先过会将成科创板AI第一股IT之家7月22日消息科创版官网显示,云从科技的IPO申请已获得上交所科创板上市委会议审议通过,云从科技将成为科创板AI第一股。按照科创板流程,云从科技距离上市只剩下提交注册和公布换脸已不算事儿,能合成整个身体的AI伪造技术将至在俄罗斯小说家维克多佩雷温(VictorPelevin)的网络科幻小说智人(HomoZapiens)中,名叫巴比伦塔塔斯基(BabylenTatarsky)的诗人被大学老友招募,前依图终止上市背后AI企业的病根在哪儿市场对于人工智能的理解与接纳程度,正变得理性而客观,同时也更加地现实。在为上市准备了8个月之后,人工智能独角兽企业依图科技主动申请退出科创板上市,正式对外宣告科创板IPO终止。作为小米可穿戴设备全球总出货量突破1亿,新品4月3日揭晓IT之家4月1日消息今天米家MIJIA官方微博宣布喜讯,据2014年2019年IDC全球可穿戴智能设备市场报告,小米可穿戴设备全球总出货量突破1亿。米家MIJIA官方微博在公布的海苹果HomePodMini拆解确认电源线不可拔出IT之家11月19日消息苹果新发布的HomePodmini采用了USBC电源线,可以插在一个独立的电源适配器上,有人猜测电源线可以或许被拆下来,但事实并非如此。MacRumors论
小米小爱触屏音箱通过3C认证有望即将亮相IT之家2月18日消息小米官方最近为即将发布的小米9新手机造势做了大量的工作,该机将在2月20日正式发布。现在国家认证消息揭示了小米已经在准备中的另外一款新品。国家3C认证信息显示小米米家智能门锁即将发布IT之家12月4日消息今天下午,小米米家官方宣布,小米米家智能门锁将于12月5日14点mi。com直播发布。这款产品采用了一体化活体指纹识别,并且还支持密码NFC蓝牙等6种开锁方式天猫精灵产品进化论万物互联时代入口争夺战今年6月6日,工信部正式发放5G商用牌照,标志着中国正式进入5G时代。说到5G,很多人的直接印象可能是手机上网的速度会变得超级快,但其实5G时代能带来的改变可不止那么简单,一句话概脱去诺基亚外装,Withings于CES2019发布多款智能手表注原标题为从诺基亚脱身后,Withings发布了一款可以测心电图售价为AppleWatch13的智能手表。如果你在几年前就关注过可穿戴设备,应该对Withings这个名字不会感到陌苏宁小Biu空调3。15再次开卖前1万台还是1999元感谢IT之家网友学士的线索投递!IT之家3月11日消息3月6日上午,苏宁极物小Biu空调首发开售,前10000台的1999元优惠名额刚刚开售就被抢购一空。没有以1999元的价格抢到英伟达AI智能画笔,随手涂鸦秒变美丽风景IT之家3月20日消息在最新的官方博客中,英伟达介绍了一款自家的AI软件,可以将随手的涂鸦变成靓丽风景。这款软件名为GauGAN,使用了生成对抗网络AI模型GAN。它就像是智能画笔百度与浦发银行发布数字人一人可服务千万人7月3日上午消息,2019年百度AI开发者大会今日举行,现场李彦宏演讲开场。李彦宏在现场展示了百度和浦发银行联合培养的一位超级员工,她有一个超级大脑,非常聪明而且完全不怕什么996台积电创始人张忠谋未来25年内很多职业将被AI取代12月19日下午消息,台积电创办人张忠谋日前接受台湾地区经济日报专访时表示,未来25年内,很多职业将被人工智能(AI)取代。为什么说25年内就会改变人类?他以互联网(Interne香港中文大学开设首个人工智能学位课程IT之家10月21日消息香港中文大学日前发布新闻稿,宣布学校计算机科学与工程学系将开办香港地区首个人工智能工程学士课程,名为人工智能系统与科技(ArtificialIntelligTicWatchPro4G版智能手表上架小米有品双屏幕双终端IT之家12月2日消息11月28日,出门问问发布了TicWatchPro4G版智能手表,TicWatchPro4G版售价1799元,TicWatchPro4G版的表体直径为45mm华米科技与高通达成合作,将推出eSIM独立通话智能穿戴新品IT之家6月3日消息今天,华米科技和高通共同宣布,双方在智能可穿戴产品领域达成合作,华米科技旗下AMAZFIT品牌将推出搭载高通骁龙移动平台支持全网通eSIM独立通话功能全新智能可