范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

试论中文信息处理与现代汉语语法

  "
  论文关键词:中文信息处理 现代汉语语法 句处理
  论文摘要:用计算机来处理汉语信息包括"字处理"、"词处理"和"句处理"三个阶段。"句处理"是实现自然语言的处理与理解这一关键性的技术难关。其中遇到的问题比较多:词性的判断;短语、句子的结构分析;歧义现象分析等等,最根本的方法是语言学家尽可能地把语言中的这些现象通过归纳、分析、总结出规律,再用形式化的方式描述出来,以便利于计算机处理。
  用计算机来处理汉语信息,就是汉语信息处理,又称中文信息处理。中文信息处理包括"字处理"、"词处理"和"句处理"。"字处理"、"词处理"分别与汉字和词汇有关,在此主要谈谈"句处理"。
  句处理的主要内容是,怎样使计算机理解自然语言(如现代汉语)的句子的意思,又怎样使计算机生成符合自然语言规则的句子。"句处理"所需要的语言知识,将是一种涉及到语音、语义、语法、语用等诸方面的综合性知识。目前。大家都深感现有的关于汉语的知识远远不能满足中文句处理的需要。单就句法方面的情况说。在中文信息处理过程中将会不断遇到我们想象不到的问题,许多问题在人看来还是比较容易解决的,但计算机就解决不了。也有一些问题,本身在学术界就有不同的观点,那么,就给中文信息处理增加了更大的困难。
  用计算机来处理中文信息,遇到了很多困难,从现代汉语语法的角度来看,主要有以下一些问题:
  一、词性的判断
  由于汉语缺乏形态。汉语的词性判断主要是根据词的语法功能,不同的词,词性意义可能不同,同一个词出现在不同的地方,词性意义也可能不同,汉语中,大多数词有固定的词性,但有些词的用法比较特殊。例如:
  1.他花了十块钱买了一盆花。
  2.你用那个锁把门锁上。
  3.他比雷锋还雷锋。   目前,在中文信息处理中,是这样来定义兼类词的:亢世勇认为"兼类词有广义兼类词和狭义兼类词。广义兼类词就是中文信息处理中所说的现代汉语的同形词,对于计算机而言,只要词形相同,不管读音是否相同、意义是否相通,是同形异音词、同形同音词,还是一词多义、一词多种用法,都是相同的,都要从多个当中选一个。狭义的兼类词就是指一般的现代汉语著作定义的,‘同形同音、意义上有一定的联系,且具有两类或两类以上词的语法功能的词"’。陆俭明认为,兼类词是"指同字形、同音而意义不同或词性不同的词"。如果按这种定义理解,以上三个句子中的两个"花"、"锁"、"雷锋"都可以称之为兼类词。因为,中文信息处理的目的是让计算机能根据具体环境判断出词的词性,从而准确理解其中的含义就可以了。尽管如此,但是,汉语词类是多功能的,一类词不需要发生词形变化就可以充当不同的句子成分,不同类的词可以充当相同的句子成分,这样就给兼类词区分带来了更多的麻烦。因而,兼类词的选择是计算机词性自动标注的一个"瓶颈"。尽管信息处理专家运用了规则排歧、统计概率排歧或者两者结合起来等多种方法进行排歧,但到目前为止,还没有一种方法、一种系统能够彻底解决这个问题。
  二、短语、句子的结构分析
  由于汉语缺乏形态。所以。语序和虚词成了汉语中表示语法的主要手段。有些短语、句子的结构不好理解,需要形式和意义结合起来分析。例如:
  A组:a。陕西+甘肃+宁夏 ("陕西+甘肃+宁夏"三者为联合关系)
  b.中国+(北京+陕西)("中国"与"北京陕西"是偏正关系."北京"与"陕西"是联合关系)
  C.中国(陕西(西安))("中国"与"陕西西安"是偏正关系,"陕西"与"西安"也是偏正关系)这一组中的abe三个短语对人来说,都很容易分清楚,但计算机目前还很难区分,要让计算机分辨清楚,就得把三个处所名词组合在一起构成a类、b类、e类不同关系的条件与规则研究清楚,并将这些条件与规则加以形式化输入到计算机内。
  B组:开始讨论(述宾关系)分析研究(联合关系)研究结束(主谓关系)
  取下来(述补关系) 看完再说(连谓关系) 叫他回来(兼语关系)
  生产管理(定中关系) 讽刺说(状中关系) 介绍写(不构成合法的句法关系)
  这组是现代汉语里"动词性词语+动词性词语"构成的种种不同的结构关系,对人来说,通过讲解大致可以分辨,可是让计算机要分清楚,就非常难,因为我们至今还没有总结出"动词性词语+动词性词语"构成各种不同句法关系的具体规则。换句话说,"动词性词语+动词性词语"在什么条件下一定构成合法的什么句法关系,能构成什么样不同的句法关系,我们至今还说不清楚。 "
  C组:天气好——好天气(主谓——偏正)很好——好得很(偏正——述补)
  来人了。——人来了。(述宾——主谓)
  一张票三元钱。——三元钱一张票。(主谓——主谓)这一组都是由于语序的不同而形成的结构和意义都不同的短语和句子。这些结构对人而言,稍加学习就可以理解,但这些给计算机理解意思增加了难度。需要人们把这些语序的变化形成的不同的结构概括出规律来,再用形式化的方式描述出来。输入到计算机里。
  三、歧义现象
  现代汉语短语结构的歧义是进行汉语句法分析的一大障碍。"句处理"要解决的核心问题是排歧问题,计算机面对的歧义,不只是我们人所能感觉到的诸如下面这样一些句子的歧义现象:
  (1)他正在输血。(他正给病人输血。/他病了,正输血。)
  (2)看望的是病人。(你看望的那个人是病人。/看望你的那个人是病人。)
  (3)我们急需进口产品。(我们急需进口的产品。/我们急需从国外进口产品。)
  某些在人看来不存在歧义的句子计算机会认为有歧义.例如:
  (4)a他被警察叫去罚了一百块钱。   其实以上所举的例子都存在歧义问题,因此,也可以这么说,"句处理"要解决的核心问题是排歧问题。
  中文信息"句处理"的研究工作,上个世纪80年代就开始了,最早进行"句处理"研究工作就是基于规则展开的,但上个世纪90年代初,基于规则的"句处理"研究工作遇到了重重困难与难关,主要是语言学家所提供的语言规则远远不能满足信息处理的需要。目前,为了解决好中文信息处理中的"句处理"难题,出现了一个竞相研究、竞相发展的局面。对于句处理,提出的各种策略和途径,归纳起来。主要有基于规则和基于统计这两种策略。基于规则的研究者,一般求诸专家的理性知识,由人来对语言知识进行抽象:基于统计者,一般求助于计算机对大规模语料库真实文本的统计分析,由计算机来抽象出语言知识。各种策略和途径,目前,我们还很难说哪一种是唯一正确的。各种策略和途径,表面看不同,其实,最终都需要依赖可靠的汉语知识来驱动计算机正确处理自然语言(汉语)。因此,"无论是比较传统的基于规则的处理策略,还是90年代以来方兴未艾的基于统计的方法,在对语言知识的需求这一点上实际上都是共同的。所不同者,走规则路线的研究者一般求诸专家的理性知识,由人来对语言知识进行抽象(比如以带有合一条件的规则形式给出)。而走统计路线的研究者一般求助于计算机对大规模的语料库的统计分析,由计算机来抽象出语言知识(比如以一定的数据结构记录的统计结果等)。两种路线孰优孰劣,不能笼统判断,只能跟具体的应用目标结合起来,由实践结果来评价。"目前,越来越多的学者提倡把两种方法结合起来使用。因此,相信在不久的将来,我们会攻克难关,实现计算机对自然语言的处理与理解的目标,使中文信息处理技术处于世界领先地位。
  参考文献:
  2.亢世勇:面向信息处理的现代汉语语法研究[M].上海:上海辞书出版社,2004,177。
  3.陆俭明:现代汉语语法研究教程(第三版),[M].北京:北京大学出版社。2005年,51。
  4.詹卫东:面向中文信息处理的现代汉语短语结构规则研究[M].北京:清华大学出版社,2000,2。

面向对象软件工程开发探讨摘要当前计算机软件的复杂性处于日益增长的趋势,不仅意味着软件技术的飞跃,同时也意味着计算机软件的规模也将随之不断扩大。在这样的背景下,面向对象的软件工程逐渐成为了软件开发过程中的主计算机软件工程的管理与应用分析摘要随着新时期的发展,计算机软件工程在项目的研发上也越来越广阔。然而随着领域的扩大,所要面临的风险也越来越多,促使计算机软件开发项目成为了复杂的系统性工程。文章结合目前计算机软件开计算机软件工程升级策略内容摘要国家经济的快速发展和科技的大幅提升,拓展了计算机的应用范围,推动了计算机的发展,信息时代背景下,计算机愈发重要,已成为一种必需设备。对计算机而言,软件属于基础部分,至关重要计算机软件工程管理及应用摘要随着社会的不断发展,科学技术不断进步,人们逐步进入信息化社会,计算机网络技术在人们生活中的影响越来越大,生活中各个领域都应用到计算机网络技术,计算机软件成为人们生活不可或缺的一坚持以人为本,提高高校图书馆服务创新能力论文摘要读者服务工作是高校图书馆工作的根本,以人为本是图书馆工作永恒的主题。坚持以人为本,创新服务理念模式内容手段,不断提高图书馆服务的能力。论文关键词以人为本,高校图书馆,服务创新一分析儿童幸福的多维度费尔巴哈说人的任何一种追求也都是对于幸福的追求。恩格斯说每个人都追求幸福并认为这是永远不变的原则,是无需加以证明的。人类关于幸福的追求不言而喻,学者们对幸福的研究也是层出不穷。然后让校园洋溢着快乐,引师生幸福地成长早在2000多年前,孔子在论语中提出知之者不如好之者,好之者不如乐之者。教育的最高境界是从教育中享受快乐,并提出寓教于乐的教育原则。英国19世纪著名的教育家斯宾塞说教育的目的是让孩知行合一成就幸福人生摘要哲学家费尔巴哈认为,一切的追求,都是对于幸福的追求。而教育的本意就是促进人的发展和完善,引导个体向善,走向幸福。作者所从教的广东省广州市海珠区晓港西马路小学的育人目标正是育幸福心理学指引下的英语学科幸福教育作为新时期的英语教师,我们有义务和责任给每一个孩子创设英语课堂的幸福教育,然而这一切离不开心理学各个研究和理论的指引。一英语教学准备阶段,即创设幸福教育课堂的奠定期英语教学准备阶段解读积极心理学及其对幸福的阐释我国正处在深化改革和社会转型的关键时期,日益扩大的贫富差距,再加上不平衡的利益分配,极容易产生剧烈的社会心理变化,人们的幸福感不再跟随经济的增长而增长,反而出现逆行下降,这种现象被2013年高考文字题解题指导策略分析对每位高考考生来说,高考试卷中的文字论述题得分情况将会直接影响到他的高考成绩,影响到他能否被大学录取。品学网论文网为您编辑了2013年高考文字题解题指导策略分析2013年高考文字题
电涡流无损检测技术分析论文摘要无损检测是工业发展必不可少的有效工具,也是机械工程的重要组成部分。电涡流无损检测技术作为一种传统的无损检测技术,具有线性度高分辨率高响应速度快结构简单且能静态及动态的进行测量等远程无线管控体系的设计研究论文1引言随着我国航天事业的发展,测量船所承担的任务呈现高密度高强度的趋势,造成码头期间的任务准备工作越来越繁重,面临着考核项目多考核时间短和多船协调对标等现实情况,如何提高对标效率确管理会计本土化的思考论文一管理会计本土化的思考1管理会计本土化的概念管理会计,根植于组织本身,也服务于组织本身。作为嵌入组织型的一种管理工具,管理会计主要利用组织提供的各种信息进行规划控制协调监督组织活动关于我国居民储蓄存款情况分析论文关键词居民储蓄存款影响因素居民储蓄存款增长情况的变化2004年第3季度末,我国居民储蓄存款余额为115458。7亿元,增加额从2003年第3季度以来出现了连续下降的势头(2004年快乐体育的方法体系论文体育教育根本观点的转变,必然要引发与之相应的实践方法体系的根本转变。一快乐体育方法体系的基本特点快乐体育从方法论角度讲,是指在教学过程当中充分调动教和学的积极性,使教师乐教学生乐学初一学生科技小论文怎么写有些同学把写科技小论文看得很神秘,认为是科学工作者的事,对我们少年儿童是高不可攀的。这完全是一种误解,同学们不仅能写而且可以写出质量较高的论文来。接下来是小编为您整理的初一学生科技关于零能耗太阳能住宅优化设计论文1模拟方法1。1研究对象该零能耗太阳能住宅位于天津市天津大学26号教学楼旁,北纬39。1,东经117。2,海拔5m。运用Airpark2。1模拟软件模拟参赛建筑室内通风工况,作为建声乐课堂教学实效性探析论文1教师要有正确的声乐教学理念声乐学习的最终成效与实效性,取决于学生自身的感受及领悟能力,这样的能力,是在以学生作为主体的前提下才能够逐渐培养起来的,所以,想要确保声乐教学的实效性,汉武帝用人的特点论文古语说得好得人心者得天下,失人心者失天下。当政之人,最重要的是获得人心。在中华上下五千年中,但凡出色的帝王,都能做到知人善任慧眼识人。汉武帝刘彻当政期间,在政治经济文化军事外交等各平面设计中的字体设计的理念应用论文文字具有传达情感和美感的功能,文字形态的变化,不影响信息本身,但影响信息传达的效果。设计师对于文字的选择以及文字版式的编排,直接影响到整个视觉作品的审美情趣。如何在平面设计中进行字字体设计在平面设计中的应用论文摘要从字体设计的概述出发,分析了字体设计的标准要求设计原则及重要作用,以期能够通过教学研究促进字体设计在平面设计中的推广与应用。关键词字体设计平面设计应用字体设计被引入到平面设计给