范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

语音识别技术原理是什么讯飞语音识别技术特点介绍详解

  语音识别技术原理简介
  自动语音识别技术(Auto Speech Recognize,简称ASR)所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。ASR技术在“能听会说”的智能计算机系统中扮演着重要角色,相当于给计算机系统安装上“耳朵”,使其具备“能听”的功能,进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。
  语音识别技术所面临的问题是非常艰巨和困难的。尽管早在二十世纪五十年代,世界各国就开始了对这项技术孜孜不倦的研究,特别是最近二十年,国内外非常多的研究机构和企业都加入到语音识别技术的研究领域,投入了极大的努力,也取得了丰硕的成果,但是直到今天,距离该技术得到完美解决还存在着巨大的差距,不过这并不妨碍不断进步的语音识别系统在许多相对受限的场合下获得成功的应用。
  如今,语音识别技术已经发展成为涉及声学、语言学、数字信号处理、统计模式识别等多学科技术的一项综合性技术。基于语音识别技术研发的现代语音识别系统在很多场景下获得了成功的应用,不同任务条件下所采用的技术又会有所不同。下图是在一个相对通用的任务条件下的语音识别系统示意图。语音识别系统构建过程整体上包括两大部分:训练和识别。训练通常是离线完成的,对预先收集好的海量语音、语言数据库进行信号处理和知识挖掘,获取语音识别系统所需要的“声学模型”和“语言模型”;而识别过程通常是在线完成的,对用户实时的语音进行自动识别。识别过程通常又可以分为“前端”和“后端”两大模块:“前端”模块主要的作用是进行端点检测(去除多余的静音和非说话声)、降噪、特征提取等;“后端”模块的作用是利用训练好的“声学模型”和“语言模型”对用户说话的特征向量进行统计模式识别(又称“解码”),得到其包含的文字信息,此外,后端模块还存在一个“自适应”的反馈模块,可以对用户的语音进行自学习,从而对“声学模型”和“语音模型”进行必要的“校正”,进一步提高识别的准确率。
  语音识别技术发展历史及现状
  语音识别的研究工作大约开始于20世纪50年代,当时AT&T Bell实验室基于共振峰提取技术实现了第一个可识别十个英文数字的语音识别系统——Audry系统。
  60年代,计算机的应用推动了语音识别的发展。这时期的重要成果是提出了动态时间规划(DP)和线性预测分析技术(LPC),其中后者较好地解决了语音信号产生模型的问题,对语音识别的发展产生了深远影响。
  70年代,语音识别领域取得了较大进展。在理论上,LP技术得到进一步发展,动态时间归正技术(DTW)基本成熟,特别是提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。在实践上,实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。
  80年代,MFCC的参数提取技术和HMM模型的深入使用使得语音识别技术得到进一步的发展,语音识别的问题逐步在理论体系上得到了比较完整和准确的描述,同时在实践上又逐步研发出效率较高的解决算法。
  90年代以来,在美国国防部的Darpa测试、Ears计划、近期的Gales计划,以及我国863计划等推动下,一大批高水平的研究机构和企业加入到语音识别的研究领域,极大地推动了语音识别技术的发展和应用。语音识别系统已经从过去的小词汇量、孤立词识别、特定人识别、安静环境等简单任务逐步发展到大词汇量、连续语音、非特定人、噪声环境下的识别任务,从单纯的语音识别任务发展到语音翻译任务,从实验室系统走向商用系统。
  讯飞语音识别技术
  讯飞语音识别技术的理念是提供信息时代人机沟通的最佳方式。在核心技术研究方面,科大讯飞公司一直秉承着“顶天立地”的方针。“顶天”,就是要求在基础技术上不断创新,不断突破;“立地”,就是技术要和实际应用相结合,最终能够产生经济效益和社会效益。讯飞语音识别技术的研究继承了这样的优良传统,在基础技术方面锐意进取,不断创新,特别是在特征鲁棒性、模型区分性训练、大词汇量语音识别解码技术、语音模糊搜索等方面提出了多项创新性观点,并多次在国内外著名的学术期刊、会议及专刊上进行发表,取得了丰硕的成果。在技术与实际应用相结合方面,也充分考虑了应用系统之间的差异,为客户量身定制,提供了语音命令识别、智能语音搜索、语音检索等技术,并正在开展针对自然连续语流的会议内容转写识别整套解决方案。
  下面是科大讯飞对语音识别技术的整体规划:
  命令词识别技术—在受限的命令词或者语法范围提供自动语音识别服务,需要很少的计算资源,但是要求用户能够“配合”语音识别系统,尽量说“集内词”。
  智能的人机交互技术—结合大词汇量语音识别、自然语言理解、信息检索等技术提供特定领域内相对开放输入的语音识别服务,对用户的限制较为宽松,在所限定的领域内可以以自然语言的方式进行人机交互。
  语音转写技术—在无特殊限定的范围内完成对连续自然语音进行内容转写,目前还需要较大的计算资源。
  语音搜索技术—语音技术和搜索技术的结合,提供最便捷的信息搜索服务。

MOTOXT390续航能力怎么样MOTOXT390配备了一块1430毫安时的电池,续航能力还是令人满意的。正常使用的话,两天应该不在话下。不过实际的电量情况还是因人而异。MOTOXT390采用HVGA级别3。5英MOTOXT390能拍摄1080p视频吗MOTOXT390不能拍摄1080p视频。MOTOXT390采用HVGA级别3。5英寸大TFT材质的手机触控屏,分辨率320480像素,使其色彩饱与度更出色,还原能力更好,对比度更MOTOXT390的CPU主频是多少MOTOXT390采用了联发科MT6573处理器,主频为800MHz。GPU方面采用了PowerVRSGX531,同时拥有512MB内存。MOTOXT390采用HVGA级别3。5英MOTOXT390能拍摄720p视频吗MOTOXT390不能拍摄720p视频。MOTOXT390采用HVGA级别3。5英寸大TFT材质的手机触控屏,分辨率320480像素,使其色彩饱与度更出色,还原能力更好,对比度更高MOTOXT390屏幕怎么样MOTOXT390机身正面采用了一块3。5英寸的屏幕,分辨率为320x480,屏幕虽然不大,但是比较适合单手操作,尤其是对女性朋友来说更为适合。MOTOXT390搭载MTKMT65MOTOXT390内存是多少MOTOXT390搭配了512MROM和512MRAM的机身内存。该机采用了联发科MT6573处理器,主频为800MHz。MOTOXT390采用HVGA级别3。5英寸大TFT材质的MOTOXT390容量是多少MOTOXT390搭配了512MROM和512MRAM的机身内存。该机采用了联发科MT6573处理器,主频为800MHz。MOTOXT390采用HVGA级别3。5英寸大TFT材质的MOTOXT390有LED闪光灯吗MOTOXT390采用HVGA级别3。5英寸大TFT材质的手机触控屏,分辨率320480像素,使其色彩饱与度更出色,还原能力更好,对比度更高。机身尺寸为116times63。5tiMOTOXT390拍照怎么样MOTOXT390采用一枚300万像素的摄像头。支持数码变焦和连拍功能,能够录制有声视频,最大支持20481536像素照片拍摄,并带有CMOS传感器。MOTOXT390采用HVGAMOTOXT390屏幕尺寸是多少MOTOXT390采用3。5英寸炫丽大屏,分辨率达到了240times320像素,使用TFT的屏幕材质。MOTOXT390搭载MTKMT6573处理器,频率为800MHz,配上51MOTOXT390运存是多少MOTOXT390搭配了512MROM和512MRAM的机身内存。MOTOXT390采用HVGA级别3。5英寸大TFT材质的手机触控屏,分辨率320480像素,使其色彩饱与度更出色
SUSE是什么SUSELinux原是以SlackwareLinux为基础,并提供完整德文使用界面的产品。1992年PeterMcDonald成立了SoftlandingLinuxSystem(S雨林木风系统是什么自2008年12月31日正式解散工作室之后,雨林木风再度进军操作系统领域。与以前不同的是,此次雨林木风选择以独立研发的方式,推出完全基于Linux开源代码的操作系统,以避开此前颇受NetWare是什么Netware是NOVELL公司推出的网络操作系统。Netware最重要的特征是基于基本模块设计思想的开放式系统结构。Netware是一个开放的网络服务器平台,可以方便地对其进行扩LinuxDeepin是什么LinuxDeepin,原名Hiweed,是一个基于Ubuntu的中文Linux发行版,口号是ldquo免除新手痛苦节约老手时间rdquo。早期的Hiweed(0。7之前)基于DeOS2是什么OS2是由微软和IBM公司共同创造,后来由IBM单独开发的一套操作系统。OS2是OperatingSystem2的缩写,是因为该系统作为IBM第二代个人电脑PS2系统产品线的理想操实时操作系统是什么实时操作系统(RTOS)是指当外界事件或数据产生时,能够接受并以足够快的速度予以处理,其处理的结果又能在规定的时间之内来控制生产过程或对处理系统作出快速响应,并控制所有实时任务协调Novell是什么Novell,Inc是世界上最具实力的网络系统公司,其主要产品NETWARE网络操作系统可将多台个人电脑连接到一个统一的整合了目录,存储,打印,数据库等的网络中。Novell旗下的kubuntu是什么kubuntu是基于KDE的一个非常友好的操作系统,中文名称酷班图,是由ubuntu衍生的一款操作系统,最新版本是11。10,支持中文。采用Kde作为桌面环境,最新版本采用KDESQNX是什么GordonBell和DanDodge在1980年成立了QuantumSoftwareSystems公司,他们根据大学时代的一些设想写出了一个能在IBMPC上运行的名叫QUNIX(MacOSX是什么MacOSX是苹果公司(原苹果电脑公司)为麦金塔电脑开发的专属操作系统MacOS的最新版本。MacOSX于2001年首次在市场上推出,并从2002年起随麦金塔电脑发售。它是一套Unfedora是什么Fedora是一个开放的创新的前瞻性的操作系统和平台,基于Linux。它允许任何人自由地使用修改和重发布,无论现在还是将来。它由一个强大的社群开发,这个社群的成员以自己的不懈努力,