童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

AI干起了实时翻译,我们离跨越语言的鸿沟还有多远?

5月25日 先锋客投稿
  AI已经运用到了实时翻译的领域中,那么我们是否离无障碍的语言沟通越来越近了?
  1954年,美国成功研制出了世界首个机器翻译系统,实现了俄英两种语言之间的简单转化。但由于人类语言本身的复杂性和多样性,半个多世纪以来,计算机系统对于人类语言的理解一直处于相对较低的阶段,投入实际应用的研究成果寥寥无几。
  直到近10年,以“深度学习”为代表的人工智能技术在语音识别、自然语言处理等基础应用领域与产业结合的业务中取得了较大突破,能够识别语音的机器翻译逐渐从实验室走向普罗大众。
  在AI机器翻译这条赛道上,互联网巨头都在虎视眈眈
  自去年乌镇互联网大会上,百度、搜狗相继亮相人工智能同声传译技术之后,又一次引发机器翻译是否会取代同声传译的激烈争论。
  尽管专业人工翻译公司依然看衰AI对翻译产业的颠覆性,但包括Google、Facebook、微软、百度、腾讯、搜狗在内的各大技术巨头却在不遗余力地推进深度学习在机器翻译领域的研发和应用。
  2016年9月,Google发布谷歌神经机器翻译(GNMT:GoogleNeuralMachineTranslation)系统,声称该系统利用神经网络技术,模仿人脑的神经思考模式,产出媲美人工翻译的高质量译文,并将误差降低了5585。谷歌公司己经将该技术应用于网页翻译与手机应用,译文质量明显提升。
  腾讯、百度、阿里巴巴等国内互联网公司将深度学习理念应用到机器翻译,在智能翻译领域持续发力,推出多款基于神经网络技术的在线翻译和手机应用。甚至在手机浏览器的升级战争中,智能翻译也被当作重要功能革新,搜狗手机浏览器推出“智能翻译”,集合了语音对话翻译、AR实时翻译、拍照翻译等常用功能。
  智能翻译架起了不同语种间人们便利沟通的桥梁,已经成为日常交流、出国旅游、外文学习等方面不可或缺的助手。笔者就简要梳理一下AI实现文字和口语翻译的基本原理、结合实例介绍智能口语翻译难点以及智能翻译有哪些需要解决的问题。
  各种花哨的技术概念,核心仍然是AI处理人类语言的三种方法
  实现让计算机处理人类自然语言是人工智能领域的一个重要课题,与句法分析、语义理解和自然语言生成等计算语言学核心理论密切相关。目前,AI主要有三种方法翻译人类自然语言。
  1、基于规则的机器翻译方法。早期机器翻译的主流方法。基于规则的机器翻译系统依靠人工编纂的双语词典和专家总结的各种形式的翻译转化规则,但在通用领域中的应用性不强,往往被限制在了专有应用上,逐渐被新的方法取代。
  2、基于实例的机器翻译方法。从已有的翻译经验知识出发,将源语言句子切分为翻译知识中见过的短语片段,通过对已有翻译资源进行自动总结,得出双语对照的实例库,并设计规则处理双语对照实例库中的歧义性等问题,实现对新的源语言句子进行翻译。
  3、基于统计的翻译方法。统计机器翻译方法将任何目标语言句子都看成源语言句子的可能翻译候选,从语料自动学习翻译模型,然后基于此翻译模型,对输入源语言句子寻找一个评价分数最高的目标语言句子作为翻译结果。目前谷歌、搜狗等基本采用的是这种。
  深度学习能够自动学习抽象特征表示、建立源语言与目标语言之间复杂的映射关系,给统计机器翻译的实现提供新途径,目前已经在词对齐、语言模型训练、解码等模块的优化应用方面取得较多成果。
  例如,2006年谷歌发布基于短语的机器学习(PBMT)系统,该系统将句子分解成词和短句,进行逐个翻译。它的弱点在于忽略了上下文,因此译文质量不佳。2016年谷歌发布的神经机器翻译GNMT,将句子视为基本单元,不再对词和短句逐个翻译,明显改善了译文质量。
  作为智能翻译的“制高点”,AI口语翻译难在哪?
  与普通文字翻译相比,AI口语翻译难度更大,原因有二:
  一、想要“译的准”,首先要能“听得清”。
  AI要准确判断出指令发出者的语音、停顿,并在极短时间内进行“语音断句”,在涉及一些模糊音时能够根据“上下文”进行及时调整,这需要有深度学习的模型自动更换为一个语义通顺、更符合作者指令的句子,然后才能进行文字翻译处理。
  二、想要“译的准”,还要包容口语的“4个任性”
  基于神经网络技术的智能翻译系统越来越多,翻译质量确有较大提高,但是能不能很好地包容口语的各种任性,我们来做几项测试,检验一下人工智能翻译的水平。为便于说明,选取了具有代表性的谷歌翻译和搜狗手机浏览器自带的智能翻译进行比对。
  1、日常口语具有不连贯的特性。在口语交谈中,经常会出现一些不连贯的成分,如:重复、次序颠倒、冗余和语句残缺。下文是一个典型的兼有语句残缺和发音重复的句子。
  原文:那六楼呢?咱们咱们,下午谈一谈吧?
  谷歌翻译:Thesixthfloor?Let’stalkaboutusintheafternoon?
  搜狗手机浏览器智能翻译:Whataboutthesixthfloor?Let’sLet’stalkthisafternoon。
  谷歌翻译在重复的处理上未真实体现原文,搜狗手机浏览器智能翻译如实还原。但是,两个翻译结果在表达上都不同程度地存在错误。
  2、语法约束相对较弱。口语中很少会有严格符合语法约束的结构完整、正确的句子,而大量存在的是语法规则难以处理的现象。一方面是由于系统的语法知识对语言现象的覆盖程度不足;而更主要的则是口语本身的特性所决定的,例如口语中存在大量的代词,人类口语比较容易理解,但是AI不能结合上下文,缺乏背景知识,难以区分指代对象,导致翻译结果偏离原意。
  原文:Look,man,youdon’tgottodoanything。Thisonemeansalottome。
  谷歌翻译:看,男人,你什么都不做。这对我来说意义重大。
  搜狗手机浏览器智能翻译:听着,伙计,你什么都不用做,这对我意义重大。
  翻译的关键在于两个词:look和man。谷歌的翻译也对,而看起来,搜狗手机浏览器的翻译结果更符合生活实际。
  3、没有明确的句子边界。口语中没有标点符号来标志句子,也基本没有传统意义上的句子,缺少了必要的声调和停顿,很容易造成句子的歧义。
  例如:“这苹果不大好吃”。那么该句有两种不同的理解结果:这苹果不大好吃(苹果不大,但是味道好),这苹果不大好吃(苹果味道不好)。两家AI都未能分清句子结构发音上的差别,都默认翻译为“苹果味道不好”。
  4、非正式语体材料多。中英口语中都存在较多随意性的口语或网络用语,生活化气息浓厚,多为非正式的语体材料,智能翻译需要庞大的基础词汇库支撑。
  原文:近期我们注意到国际上有一种看法,认为中国已经成为世界上最大的经济体,一方面挑战了美国的领导地位,另一方面在很多国际事务上中国仍在搭便车。请问您怎么看待这样的看法?(总理记者会上中国日报记者的现场提问)
  谷歌翻译:WehaverecentlynoticedthatthereisaviewthatChinahasbecometheworld’slargesteconomy,ontheonehandchallengestheleadershipoftheUnitedStates,ontheotherhandinmanyinternationalaffairs,Chinaisstillfree。Whatdoyouthinkofthisview?
  搜狗手机浏览器智能翻译:RecentlywehavenoticedaninternationalviewthatChinahasbecometheworld’slargesteconomy。Ontheonehand,itchallengestheleadershipoftheUnitedStates。Ontheotherhand,theChinesearehitchhikinginmanyinternationalaffairs。Iwouldliketoaskwhatyouthinkofthisview。
  专家译文:RecentlywehavenoticedthatthereisaviewintheinternationalcommunitythatChinahasbecometheworld’slargesteconomy,ontheonehandchallengestheleadershipoftheUnitedStates,ontheotherhandinmanyinternationalaffairsinChinaisstillafreeride,howdoyouthinkofthisview?
  可以说,两家AI对这段话的翻译,虽然都有些许瑕疵,但是总体都还是比较到位的,搜狗手机浏览器对于“搭便车”这个典型口语化词汇翻译相对更准确。
  中国古诗英译一直是文化翻译的一个难题,甚至被认为是可译性最小的文学形式。我们来试验一下两家AI对王维《九月九日忆山东兄弟》的理解和翻译能力。
  独在异乡为异客,每逢佳节倍思亲。遥知兄弟登高处,遍插茱萸少一人。
  谷歌翻译:Aloneinaforeignlandforthestranger,everyfestivetimes。
  Distinguishedbrotherascendedthethrone,whowasfullofcornelia。
  搜狗手机浏览器智能翻译:Aloneinaforeignland,Imissmyrelativesmorethananythingelseduringtheholidays。Iknowmybrotherhasclimbeduptothetopandplanteddogwoodeverywhere,butonepersonismissing。
  参考译文:Alone,alonelystrangerinaforeignland,Idoublypineformykinsfolkonholiday。Iknowmybrotherswould,withdogwoodsprayinhand,Climbingupthemountainandmissmesofaraway。
  翻译古诗词,确实非常难为两家AI。不过,翻译的结果很有趣,搜狗手机浏览器对前两句翻译尚可,后两句翻译成了我的兄弟在高处到处种植茱萸,谷歌对最后两句完全是进行了想象性的拓展。
  要跨越语言不通的鸿沟,智能翻译还需往哪加油
  智能翻译确实取得了令人惊喜的进展,拿着手机和老外进行日常交流已经基本没有问题。但是智能翻译还存在“短板”,会有“词不达意”的时候,AI要想更进一步发展,和有着数十年积淀的高水平翻译员进行竞争,可能还需要从以下几个方面进行努力。
  1、大量补充口语化语料
  智能翻译对于口语化文本处理能力还不强,一是由于翻译语料库口语化语料不足,二是针对口语词汇与口语表达多采取直译方式,因此出现较多误译。该问题的解决应该从扩大对应部分语料库入手,增加口语类文本语料库,包括常见口语化词汇、表达与生活用语。
  2、提高语境理解能力
  智能翻译对于中文复杂含义句式中的时态辨别能力还不够,往往需要充分理解整句话的意思才能准确把握时态。智能翻译并非基于理解,而是基于统计学与语料库,只能做到将这句话意思大致翻译准确,在识别感情色彩方面,还有欠缺。
  将神经网络学习的抽象表示和传统符号语义方法结合,建立新的基于语义的机器翻译系统,或许可以大幅提高AI对组合语义、复杂的递归语言结构的处理能力。
  但,我们依然满怀期待AI让我们摆脱语言鸿沟的那一天。
投诉 评论 转载

AI干起了实时翻译,我们离跨越语言的鸿沟还有多远?AI已经运用到了实时翻译的领域中,那么我们是否离无障碍的语言沟通越来越近了?1954年,美国成功研制出了世界首个机器翻译系统,实现了俄英两种语言之间的简单转化。但由于人类……外卖“环保”压力:面对“餐盒垃圾”的窘境,各方平台如何突围?最近外卖三巨头的“戏码”真是一台加一台,相当精彩。前几天还在大肆报道“饿了么”收购“百度”,这几天各大平台纷纷站队“环保”,纷纷发出声明以及后期“环保”计划。网络订餐的普……西天取经,一路直达看小米直达服务的印度之旅由于国内应用市场趋于成熟稳定,用户增量较少,超级应用的格局难以撼动,相似的应用形态竞争激烈。因此,不妨把目光转向小米最大最成功的海外市场印度,看看小米直达服务的印度之旅胜算几何……巴塞电影产品体验报告笔者通过体验巴塞电影这款产品,结合个人的分析与思考撰写了此体验报告,以此提出功能和交互体验优化建议。一、产品概述体验环境使用机型:一加3体验版本:v2。……KEEP的未来,或许会是在线下8月13日,国内移动运动应用Keep对外正式宣布注册用户数突破1亿大关,成功晋级亿级移动互联网俱乐部梯队。在国内上百个运动类APP中,Keep用户数率先破亿,成为国内……三阶段多维度,浅析三大视频网站的苹果发布会文章基于本次苹果新品发布会,对三大视频网站的直播页面进行对比分析,希望对你有所启发。先看这里哟,这里是一些关于本篇文章分析的一些背景、前提条件等:2017年苹果秋季……小米直达服务:从手机到智能终端的进化尝试若小米直达服务能成为现象级的产品时,手机能随时使用到的应用数量将趋于无限。以下为本文目录:一、直达服务的背景1、互联网发展趋势2、巨头们的尝试二、……关于对学习通APP首页的改进建议本文为个人于体验后对此款APP首页内容的一些更迭改进意见,望各位看官多多提点意见。前言学习通APP在应用宝下载的时候,评论区的评论信息告诉我,评论数不多,而且里面还……战备:让内容生产奔流不息(短视频二)继上篇文章,本文继续就短视频产品展开分析,主要探究不同内容产品的核心战略、服务目标,是如何影响内容生产的。引言:在上一篇战局与战因:内容产品服务于什么?(短视频一)中,笔……或许小米可以构造自己的软件服务生态闭环小米在通过直达服务与传送门就可以构建属于自己的一个互联网生态闭环。小米最近推出了小米直达服务,被认为是MIUI版的小程序。与此同时,小米在MIUI9中为用户提供了两个重大……小米直达服务,或许是下一代的生活方式阉割的轻应用,想要替代传统的应用,追求的重点绝不是轻,而是需要在用户主场景的主需求满足到极致。在看到产品介绍的时候,很多人都认为这是小米做的“小程序”。的确,一眼咋看与小……当年的“南表表,北格子”现在可还好?5年过去,当年的“南表表,北格子”,现在可还好?通过文章来一窥究竟。目前,我国拥有将近四千万的大学生,大学生因为乐于接受新鲜事物,有一定的消费能力,受教育程度高,年轻群体……
从一个痛点说起,谈谈用户体验的“情感价值”工作中应该怎么样做好需求分析?产品经理的知识管理方法交流和书单产品工作的三个方法论数据分析相信你定的指标还是相信你的经验?产品经理接需求的正确姿势【Lisa带你逛起点】微信大神带你做产品设计关于产品,关于运营,关于“全栈pm”(三)面试图解电影时,我提出了这4种意见AB测试算法揭秘第二篇:如何分析试验数据(上)如何进行流失用户研究(上):信息收集与方案设计分析需求时,我们还能想些什么?有关小学生写长城的作文400字六篇如何提高孩子的阅读速度漂白剂如何使用什么是见绿杀除草剂我们看海去作文800字钙片怎么吃(您知道如何服用钙片吗?)实践教学总结孕妇可以吃海鲜吗哪些海鲜可以吃哪些不能吃?祭青春结束了夜之韵婚姻下半场,拼的是妻子NASA宇航员分享壮美震撼的太空夜景延时视频

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界