词是语言中的最小意义单位。(王力,一,16页) 一个词,就是一个简单的意义单位。(王力,二,171页) 词是能够单独成句的单位。(Bloomfield,178页) 词是概念的个别形象(洪堡特,116页) 词的定义一直是个难题。我们怎样知道哪些是词?语言学家进行了长期探索,试图设计出可行的标准,但还没有一个完全成功的(克里斯特尔,145页)。 但这个难题不是专属语言学的,它也一直为哲学所关心。词的定义涉及意义问题,而意义理论通常认作是语言哲学的核心,仅此一点就可说明为什么词的定义问题是语言学和哲学的交汇点。 最小的意义单位 词的最常见的定义之一是最小意义单位。有人反对用意义、观念来定义词,因为这些似乎是内在的东西,没有提供形式特征,不宜用来下定义。一个明显的问题是,意义怎样分解为单位呢?固然,意义是可以分析的,例如我们常说分析一篇文章的意义,然而,分析不见得是把一样东西分解成较小的部分、分解为要素(永井成男,序论,一,什么是分析),例如把三角形分析为由三条线段组成的封闭图形,其中三、封闭、图形等显然不是比三角形更小的意义单位。奥斯丁曾指出意义的一部分是个没着没落的用语(Austin,31页),那么自然也就谈不上最小的意义单位了。 简单的意义单位 最小的意义单位这个表达式含义不明,于是有人把它进一步理解为简单的意义单位(王力,二,171页)。刘叔新把词定义为意义单纯的语言单位,并举例说知识表示一个单纯的概念,与此相对,知识分子是个词组,其意义是复杂的(邢公畹,118页)。这是个更糟的定义,知识、法、衍射,这些都是单词,但何尝意义简单?在我看,知识是个很复杂的概念,至少和知识分子同样复杂。况且,决定一个概念是否复杂,不是件容易的事,并不比确定什么是意义的单位容易。 最小音义结合体:语素 其实,采用这一定义的论者多半指的是语言中独立地具有意义的最小声音单位、最小的音义结合体或诸如此类。这个定义不问词义是否还能分解为更小的单位,问的是一个语音是否还能分解为具有含义的语音单位。Beacon固然可以分解为bea和con两个音节,但这两个音节各自或者没有意义,或者其意义不能说明beacon的意义。醉是承载意义的最小单位,一方面,若把它分解为更小的单位,z和ui,那是些没有意义的声音;另一方面,他喝醉了固然承载意义,但它不是承载意义的最小单位,因为它是由他、醉等更小的音义结合体组成的。用同样的方法来分析囫囵,可知囫、囵都不是词,囫囵才是单词。 最小音义结合体是一条值得追循的线索,但拿它来作词的定义则有疑问。次要的一点是它仍然和意义相连,缺少外在判别式,例如作为词缀的儿和子,怎样判断它们独立具有意义,抑或只是附加的符号?但这个定义的主要困难在于:语言学里普遍把承载意义的最小单位称为语素(morpheme)。语素是比单词低一级的音义结合体,固然,多数语素本身就是单词,如he,top,但也有些语素不成其为单词,如co,pro,trans、ness、ism,它们符合音义结合体这个定义,但不是词。语素概念也早被引入来分析现代汉语,按照这种分析,虽然汉语里很多语素同时就是词,但也有大量的字,?quot;英、始、鞠,有音有义,是语素,但不是词。 基本造句单位:独立成句 赵元任基本上同意单独成句这个定义,但他提出了不少附加标准(赵元任,二,79页、86页、101页)。王力则反对这个定义,因为这样一来至少得把吗之这些单词都排除在单词之外(王力,一,17页)。对此,吕叔湘提出一个补充方案:把一个句子里能单独成句的成分拣走,剩下的成分,若不是一个词的一部分,就是词,例如我下午再来,把我、下午、来拣走后,剩下的再字也是词。但比赛现在开始里的始字不属此列,因为始是开始这个词的一部分(吕叔湘,17页)。 基本造句单位:自由形式 另一种理解不把基本造句单位看作能单独成句,而是理解为自由成分或自由形式(freeform)。自由形式是不粘附于其它语言成分的单位,它不必须和某个其它成分连用而能和别的单位自由组合。我、是、看见可以出现在无数种前后文里,在合乎句法的条件下可以和任何语词搭配,是典型的自由形式。相反,英这个字只出现在英雄、英俊、群英会等特定的搭配之中,所以它不是自由形式。至于龌龊,龌只带着龊,龊永远跟着龌,两个字分开来都没什么含义,自然更不是自由形式了。另有一些字,?quot;取和笑,在取笑这话里粘连在一起,不能自由移动,在取订单、笑他弟弟这些话里则是自由形式。 自由形式和单独成句是对基本造句单位的不同理解。吗符合自由形式这个定义,但不符合独立成句这个定义。然而有论者不加辨别,已经把基本造句单位明确界定为在语句中能独立活动的基本语法单位,接下来立刻又把这话解释成能够单独成句(陈光磊,9页),或干脆把两者混在同一个定义里,说词是能够单独说的、自由运用的造句单位(李荣,14页)。我认为,最小造句单位只能由自由形式来定义,而不能由独立成?quot;来定义。 自由形式和最小音义结合体显然是不同的定义,英是音义结合体,但英在现代汉语里却不是自由形式。然而有些论者同时采用这两种定义:词是由句子中分出来的最小意义单位,这就是说,词是句子所由组成的各个可以独立运用的部分(王力,三,238页)。这种兼收并蓄不能解决而最多是掩盖了我们的困难。我们希望找到把不同线索结合起来的结构,而不是在两条线索之间摇摆的折中主义。 自由形式这个定义有自己的困难。驼和鸭都不是自由形式,羊和鸡都是,推论下来,似乎驼毛和鸭蛋都是单词,而羊毛和鸡蛋都是自由词组(吕叔湘,2021页),这未免有点奇怪。不过我们先放过这层困难,来看一看怎样确定自由形式。 扩展法 比起从意义方面来定义的音义结合体,自由形式这个定义看来有一个优点,那就是可以由外在的标准来判别。最通用的判别方法是扩展法或插分法:我们想知道hittheman是一个单词还是三个单词,我们可以试着在hit和the之间以及the和man之间插入另一些语言成分,看看成不成话,例如把它扩展成为hitandkilledtheyoungman,现在我们看到这仍然成话,于是就确定hittheman是三个单音节的单词而不是一个三音节的单词。相反,在youngest中间,在young和est之间,无法插入任何别的成分,由此可知youngest是个单独的词。同理,something是词组而something是单词,因为我们说somegoodthing,但只能说somethinggood。由此也可知,虽然un、est、ness等等可以加在很多词上产生新词,但它们本身只是词缀,不是单词。 很多研究汉语的学者也采纳扩展法来区别单词和词组(王力,一,46页;高名凯、石安石,106页),有些在运用时有所变通(参考:陈光磊,1314页)。根据扩展法,可以判定老婆是单词而老人是词组,在老人之间可以插入别的字,扩展为又老又丑的人,但老婆中间就插不进任何别的字了。马车可以扩展成马拉的车,所以是词组,不是单词。说话和取笑都是动宾结构,但一个是词组,一个是单词,说话可以扩展为说大话、说废话,取笑中间则不能再插入任何语词(王力,一,46页)。 我们也可以用扩展法来检验包括英字的所有语词,如英雄、英俊、群英会等等,结果发现英与另一个语素之间都插不进别的成分,由此可知在现代汉语里英是语素但不是单词。 扩展法的缺陷 扩展法的一个优点,是它能提供外部标准。但这个优点其实十分有限,我们说允许在几个语言成分之间插入其它成分,当然是说插入了其它成分而意思没有大变。我们凭什么?quot;老婆不能扩展成老年的婆婆?因为老婆和老年的婆婆意思不一样。然而,把马车换成马拉的车,意思就当真没变吗?一辆车现在由骡子拉着,我们仍然叫它马车,用马来拉一辆小汽车,这辆小汽车并不因此叫作马车。这个反诘虽然有点刁钻,但的确需要回答。总的说来,意思不变、意思一样是极难澄清的概念。但无论意思变了还是没变,总要对意思有个了解,而这种了解恰恰又回到了内在方面去了。 而且,我们根据什么规则允许把马车换成马拉的车,而不是仅仅换成马的车?马车可以扩展为马拉的车,那么火车、卧车、机车、大车、铁路呢?我们能否说火车是火力推动的车,铁路是铁轨铺成的路?如果提供不出一定的规则,说不定所有的复音词都能扩展,即如取笑,亦可扩展为取其短处加以嘲笑。 而且,在西语分析中采用扩展法就会碰到不少模棱两可的案例,应用于汉语分析,疑难的例子更多。王力承认有时会碰上分不清的例子,如干儿子、帝国主义等(王力,一,14页)。进一步的验试发现疑难实例远比有时更经常。物理(物之理)、宇宙(上下四方为宇,古往今来为宙)、人心、六边形、法律学,算不算合乎扩展法?打倒等动补式组合通通可以插?quot;得字不字,构成了另一大类难题。再如鞠躬,人人都会认之为单词,却可以扩展为鞠了个躬。另一方面,含沙射影,天将降大任于斯人也等成语、熟语在句子里总是连在一起用的,不能在中间插入别的成分,但因此可以说它们是单词吗? 仂语 即使马车、说话等等不是单词,但它们总比一般自由词组结合得紧密,我们的实感总觉得它们和大车、取笑更近些,和一匹白马拉的破车或说了一上午的话远些。王力采用仂语这个概念,就是为了解决这个问题。貌似单词而经不起扩展法检验的复音语词,都是仂语。仂语是汉语里一个庞大的中间体,一边与复音词邻接,另一边和自由词组邻接。 然而,我们应当怎样定义仂语呢?我们看来只是把给词下定义的困难转移过来而已。凡词群没有句子的作用者,都是仂语(王力,一,42页)。这个定义实在糟糕,按照这个定义,马车、马拉的车、这辆从来没有任何人动过的车,都该归在仂语里。但显然,马车的结构、功能和具有意义的方式都和挡车、大车这些标准的单词更为接近,和这辆从来没有任何人动过的?quot;则相去甚远,故有论者说:我们把它(马车)当作一个单词看待,也不能算错,而且在习惯上是很自然的(文炼,226页)。可以肯定,王力心目中的仂语,只有马车、说话一类,而不包括这辆没人动过的车一类,所以他会说仂语在原则上等于一个单词的用途(王力,一,45页)。可按照他对仂语的定义,偏偏要把马车和这辆没人动过的车划在一类。看来,仂语概念无助于明确词的定义。 外部标志:拼写与语音 科学偏爱具有形式标志的定义,在这一点上,语言学殊非例外。所以很多语言学家反对从意义方面来下定义。造句单位可由扩展法判别,但不仅例外太多,而且再追一步,扩展法仍然依赖我们对意义的了解。在哪里能找到较为确实的形式标志呢? 在拼音文字里,似乎有个简捷的办法:看一看语词是怎样书写的。然而,谁能单凭这一点来确定roadblock是一个词而roadmachinery是两个词呢?海滩在英文里有时写成seashore有时写成seashore,那么它是一个词还是两个词?至于中文这样的非拼音文字,书写特征就更不足为凭了。陆志韦很早就指出单根据声音来给词下定义是不可能的,而且这个办法在汉语尤其行不通,他举的一个例子是代表和戴表(陆志韦,14页)。王力的看法也是这样(王力,三,240页)。陆志伟自己采用的方法叫作同形替代法(陆志韦,1526页),这个方法没有被后人普遍认同,他的工作可说是后继无人。赵元任曾对这个方法的主要缺点做了说明(赵元任,三,236页),不过他认为把某些语音特点和同形替代法综合起来考虑,也许会产生出一个跟其它语言的word很相似的概念(赵元任,三,239页),这些因素(重音声调等)看来至少能给出部分答案(赵元任,三,237页),但他同时也指出,汉语复合词固然有轻重音型这一特定的音型,但在这一方面,词组跟复合词没有区别(赵元任,二,7980页、190页),袖手是词而就走不是,图书馆是词而他不管不是。 词和字 为词下定义的工作陷入困境,根本的原因也许在于word这一级单位在汉语里没有确切的对应物(赵元任,三,233页)。在西语里,语言的基本的单位是词,在汉语里,是字?quot;字这个概念的外延很清楚,字读出来是一个音节,写出来是一个方块。小学校里最初一个一个教的,任何语文工具书必须一个一个解释的,就是字。在中国人的观念中,’字’是中心主题,’词’则在许多不同的意义上都是辅助性的副题(赵元任,三,248页)。 在一个基本的意义上,汉语的字和西语的word大致相当:在西语里,绝大多数的语素本身就是单词(元素词),而在汉语里,绝大多数的语素都是字。在西语里,复合词是由元素词构成的,汉语里的复合词则是由字组成的。语言学的中心任务是研究语音和语义的联系,因此,确定最小音义结合体始终是语言学的一项中心任务,而在汉语里,音义结合体就摆在字这个自然层面上,那我们似乎是该把字当作中心主题。综观前面对词这个概念所作的分析,主要得出语素(最小音义结合体)和自由形式(最小造句单位)这两条线索。在西语word这个层次上,这两条线索大致重合:绝大多数语素同时也是自由形式,只有trans、ism等少数例外。所以,西语研究把word作为语言的基础层次,颇为自然。在古汉语里,在字这个层次上两条线索也基本重合,只?quot;囫囵这样少量的连绵词是例外。如果讨论的是古汉语,我们满可以用字来翻译word。但上古以后,通过意义兼并、近义词结合、习惯用法等等,多音语词渐渐多了起来,语素和自由形式不再相合:字大都是语素,但其中一半是自由形式,一半不是;词汇多半是复音词,是自由形式,但不是最小音义结合体。所以,字或词都不能和word对上。语素这条线索大致落在字上,自由形式馓跸咚鞔笾侣湓?quot;词上。这样我们也就清楚了:以字还是以词为基础单位,实际上争点在于侧重于音义结合体还是侧重于造句单位。像赵元任那样建议以字为基础单位,等于是说音义结合体是主导线索,像王力那样坚持以词为基础单位,等于是说造句单位是主导线索。人们更经常把word译作词,这似乎表明人们更偏重于从造句单位来理解word。 依我的看法,这两条线索的重要性差不多。后面我将表明这一看法的依据。其实,虽然汉语研究者有的赞成以字为基础单位有的赞成以词为基础单位,但在具体的研究工作中差不多都是两者并重的。 定义和概念分析 我们行到中途,有必要停一下,看看自己走到哪里了,看看我们是否已经接近了词的定义。 对定义工作有一种极常见也极幼稚的误解,以为给词下定义就是要找出一个或一些特征,为一切词所共有,为一切非词所不具有,似乎这样的特征就构成了词的本质。词这个概念从来不是从所有词的共同点归纳出来的共相,我们原不可能把天下的单词或至少一种语言里的单词都摆到眼前,以便抽绎出它们的共同之处。所谓经验主义的归纳法实是完全无视经验的主张。词是日常用语,我们平时用词所称的,原不一定具有某一或某些共同点,这一点已由维特根斯坦的家族相似概念讲得很清楚了。退一步讲,如果是由于所有的词都有一个或一些共同点所以都称作词,像所有的兔子都具有一些共同点那样,那只说明词这个词没什么概念内涵,不过是个名称而已。而本质却是属于概念的,我们不谈论兔子的本质。 要理解词的本质,首先需要的不是定义,而是概念分析。对词作所谓概念分析,说得最简单,就是弄清我们把这些语言单位叫作词而不把另外一些语言单位叫作词道理何在。词的概念分析回答词这个概念是根据什么道理形成的,而不是回答所有被称作’词’的东西的共同特征是什么。音义结合和造句单位就是这样的道理。 但其中每条道理,乃至各条道理的联合,通常都不能充分界定词的实际用法。首先,我们不能保证我们已经穷尽了实际用法所基的全部道理;其次,一些新道理可能在不断改变实际用法;最后也是最重要的,我们不能保证一切实际用法都必定符合某种道理。 那么,词岂非不可能得到充分的定义了?自然概念本来就不可能得到充分定义。像音元、语素这样的理论概念是可以充分定义的,所有语素都是最小音义结合体,没有例外。这并不奇怪,因为语素不是一个自然概念,它本来就是其定义的缩写。与逻辑主义者的论断相反,概念的可充分定义性并非泛泛的优点,而只是建构精密理论的一条必经之路。 如果把音义结合、造句单位这样的分析结果称作定义,那它就是揭示性的或概念性的定义,与理论概念的定义不是一回事。概念性的定义无需提供形式标志。本文第一节提到,从意义、观念、概念方面来定义词,人们疑虑重重,因为意义等概念缺少形式标志。在概念分析的范围之内,这种疑虑是多余的。 词、句、意义等,一方面来自自然语言,同时又是语言学理论中的概念;它们是语言学的基本概念,也可说是桥梁概念,是沟通自然理解和专业理解的桥梁。我们在为理论目的定义这些语词的时候,既要梳理其原始概念结构,又要考虑其构建理论的功能。在这些基本概念的基础上,进一步构建起语素、音元等纯粹理论性的术语。这些术语的整体构成了一门科学的语言,即建立在自然理解基础上的一种亚语言。 从建构理论的目标来看,可以把概念分析看作定义的准备工作。但严格的定义工作不是用来界定词的实际用法的,而是用来构建语言理论的。我们会纳闷,即使能够通过重音声调等等确切地界定什么是词,对平常人怎样确定什么是一个词也并无帮助。这些技术性的方法,十分繁难,我们未经训练,没有设备,所以无法应用,其结果也只是一些技术术语,完全不能增进我们对词这个概念的理解。然而,这些定义本来不是为了直接增进我们的理解,而是为了建构科学理论的。 概念分析是在自然理解的层面上进行的,始终依托于感觉。在这个园地里,我们经常听到研究者互相询问:这种提法是否符合实感。然而,概念的技术性越强,我们就越不可能诉诸实感来检验它。我们平常看作静止的,牛顿说(匀速直线)运动,从前,光和明晰可见连在一起,伦琴以来却有了可见光和不可见光的区分。技术性概念的功能是建构理论,而不是为模糊的自然概念提供精确的界说。我们也许会抗议说,如果科学对运动、光等等的定义和我们对这些词的日常理解相悖,科学干嘛还要说它讲的是运动和光呢?它满可以为它所界定者另起一个名字,就像语素、夸克这类与日常语言无关的语词。然而,科学所理解的光、运?quot;、词,并不是与日常理解的光、运动、词完全无关的全新概念,它们是日常概念的某种变形、伸张、深入,虽然在不断的理论构建过程中最后变得和日常概念完全无关了。语言的基本单位 回顾历来对词的各种各样的定义,音义结合体也好,造句单位也好,以字代词也好,不难看到,都是要确定某种基本单位。那么,我们径直把词定义为语言的基本单位行不行?这个笼统的提法也许不错,但它实在太笼统了,行得通行不通仍然要看下面怎样解释这一定义。在采取这一定义的论者那里,所?quot;基本单位仍被理解为最小音义结合体或最小造句单位,或无原则地在两者之间跳跃。 我们可以换一个角度来思考这个问题。若说词是基本单位,那么,什么是不基本的单位呢?自由词组和句子也是语言里的单位,但它们既然由单词这个更小的单位组成,所以它们不是基本的单位。然而,句子和单词却不是同一个意义上的单位,正是由于认不清这一点,引起了经久不息的争论和广泛的混乱。从一个角度着眼,人们主张词是基本单位,从另一个角度着眼,人们又会主张句子是基本的单位。我颇喜读的一位论者,竟在同一本书里一时明?quot;词是语言的基本单位,一时又称(语言的)基本单位是句(朱星,5页、62页)。 词是构成句子的单位,句子又是什么的单位?是一篇讲话的单位?一篇文章的单位?这样的思路错失了关键之点:词的用法是约定的,而句子、段落、文章等等都不是约定的。人们常说语言是交流、交通。那么,词就是我们进行交通的设施,而句子则是交通本身。交通设施是建好的,交通则依各人每天的需要进行。单词是约好的表达手段,句子则是自由表达。 约定用法与自由表达 约定用法与自由表达,即叶斯柏森所称的formulasandfreeexpressions,这一组范畴提示出了语言的本质,恰如叶斯帕森所说的那样,约定用法和自由表达的差异渗透到了语法的各个部分(叶斯柏森,7页),约定用法可以是一个完整的句子,也可以是一个词组,或是一个词,或一个词的一部分(叶斯柏森,13页)。所以,他在《语法哲学》里开篇就讲解这对范畴。最重要的对照不是语素和单词的对照,而是约定表达和自由表达的对照。喷饭不能说成喷哺,吐哺不能说成吐饭,这是典型的约定;我明天来是典型的自由表达。有了心细心碎的成说,心思细碎就只好说心思细碎或心思琐碎,不能再说心细心碎。就连吃了吗?也应该视作约定用法。叶斯柏森就提供出很有力的理由,把Howdoyoudo和Begyourpardon都叫作约定用法(叶斯柏森,5页)。 音义结合体、单词、以及短语等等,它们都是约定的用法,它们之间的区别在于约定自由的程度各个不同。语言在各个层次上都有着程度不同的约定,整个语言可看作是使用完全约定的符号编制约定性质较弱而自由程度较大的符号,直至于自由的表达。 我们可以把约定大致分为两个等极。第一级的约定是语素,大致就是字,如始、走、大,它们是没有什么道理可讲的纯粹约定。第二级的约定依据一定的道理乃至某些规则,但这些道理和规则是不充分不完整的。地震是约定的说法,不能说成地动,但地震这个约定是以地震这两个字原有的含义为基础的,所以不是纯粹的约定,我称之为次级约定。次级约定里有一种特别的约定,如吐脯、瓜田李下、爱你没商量等等,它们的意思不仅有赖于其组成成分的语义,而且也有赖于某种特殊的文化、历史情况。在约定用法之外是不经约定的自由表达或自由词组。飞机是个约定用法,飞来和大飞机是自由表达。 基础约定,语素、字、连绵词、混一词 最基本的约定是最小音义结合体,或语素。大就是大的意思,把大分解成d和a,这两个音要就没意义,要么其意义和大没有关系。雨不指雪,跑不指跳,这些完全是约定的,没有道理可讲,只有单独学过才懂得其意义。 汉语里的语素大致就是字。有些字是自由形式,如大和我,有些字不是自由形式,如英和始。英语里的trans不是自由形式,但其中文对应物跨则应视作自由形式。 无论是不是自由形式,语素都是造词的元素,始终这个词是由始和终这两个非自由形式的语素构成的,大话这个词是由大和话这两个自由形式的语素构成的。一个语素尽管可能不是自由形式,不能自由地用来造句,但它造新词的能力体现了一定的自由度(Hockett,307308页)。迢和遥都不是自由形式,但遥的自由程度较高,因为它具有更强的造词能力,如遥望、遥盼、遥祝,而迢已大致丧失造词能力。英、始这样的字自由程度更高,它们虽不是完全的自由形式,但在多种语言游戏里可以单独使用,包括玩笑、对联。 基础约定还包括鸧鶊、囫囵、蝴蝶这样的连绵词。连绵词是双音的,就是说,是两个字,但也是最小的音义结合体,因为它与复合词不同,其成分没有独立的意义。 各种连绵词的约定程度稍有不同。囫和囵都不能单独使用,蝴蝶中的蝶却是可以单独使用的,?quot;庄生梦蝶。在现代汉语里,蝶是个独立成分,构成粉蝶、蛱蝶等词,颇类于鲸鱼、鲫鱼里的鱼字。不过,鲸鱼、鲫鱼里的鲸和鲫本身是语素,而蝴蝶里的蝴不能拆出来使用。连绵词里至少有一个字不是语素。概括说,复音词里只要有一个字不是语素,我就把它归入一级约定。依此,蝴蝶是一级约定而鲸鱼是次级约定。外语词的音译通常也是第一级的约定,如坦克、逻辑、托拉斯。有些译名混合了音译和意译,如拖拉机、来福枪、乌托邦,按照上述原则,这些仍该算作一级约定。 次级约定,派生词、复合词 牙和齿意思相同,但齿冷不能说成牙冷。同理,人造,不说成人制。地震山摇和地动山摇都说得,七级地震却不可以说七级地动。人造、地震、齿冷,这些都是约定的说法。不过,它们是次级的约定,因为它们以人、造这些一级约定为基础,是由其成分的意义促动的约定。 汉语里最基本的约定至少已经是一个字,那么次级约定当然两个字或更多,所以次级约定都是复音的。 次级约定的约定程度有深有浅,相差甚多。打听的约定程度明显高于听说,口吻的约定程度明显高于口译。发韧的约定程度甚深,近乎混一词,我们很可能只知道它的整体意思而不清楚其词素的意思,或不尽能看?quot;发和韧这两个字怎样合成了发韧一词的意思。另一端,闭上的约定程度很浅,但仍应看作是约定,我们不说闭下眼睛,虽然实际上我们很难说眼睛是闭上的而不是闭下的。次级约定主要包括通常所说的派生词和复合词。 汉语的派生词结构比较简单,由一个词根和一个词缀合成,例如桌子、肘子、老师、老虎、大李老李和小李。词缀本身不是一个语素,但具有构词功能。 借词缀构成的单词不多,词缀的数目也不大。有一些字词,该不该算词缀,尚有争论,如作者、智者,药性、革命性,氧化、现代化,激进主义、自由主义,我们、人们。我认为只有那些大致不具有意义的构词成分才应被当作词缀,所以,上面列举的这几种成分依我看都不是词缀。 组成复合词的成分,本身各是语素,复合词的含义建立在这些语素的含义之上,但这几个语素如此结合,却有约定在内,不能完全推论出来。我们后面将详细讨论这一点。 我们所说的复合词,不仅包括王力所说的复合词(复音词),而且也包括他划作仂语的说话、扩大等,这些语词也有约定的成分,只不过约定程度较低而已。在我看,既然仂语是与自由词组对照提出的,那么无论就用途而言还是就语法而言,它们本来就该归属于复合词的范畴。 三级约定,短语 次级约定里有一些词语,它们之成为约定用法,不仅基于语义,而且含有特殊的历史文化因素。吐脯、喷饭,从结构上看就像喷水那样是普通的动名结构,两者字面上的意思也差不多,但它们的实际含义来自特定的典故,结果意思相去甚远。玩的就是心跳结构上是个普通句子,一旦被视作某种时代心情的标题,就成了约定用法。若加细分,可以把这类语词称作三级约定。 英语表示速度之快的词如quick,fast等,都和心情之欢畅没有什么联系,但学习汉语的英国人不必了解中国哪一个特别的故事,就能够理解快这个字同时含有速度之快和心情之畅快。然而,他不读古典或注解就不可能知道为什么吐脯意指求贤若渴,高山流水意味着知音难觅,我们也无法从任何或全或偏或显或隐的道理向他解释断袖的同性恋倾向。从瓜田李下和天上地下的相同结构我们也推导不出同类的含义结构。 上节说到语词的约定程度有深有浅。三级约定既然在语义之外还含有文化积淀,像蛊惑、杀青,约定程度通常都更深,人们常只明白整个这个词的意思,却不清楚各个词素的意思,以及这些词素如此组合怎么一来就有如此含义。 三级约定中有些是普通的复合词,如吐脯。三级约定中最大量的是成语、谚语、熟语、流行语、歇后语等,我总称为短语。成语一般指书面上的短语,谚语则指民间的短语,日常生活中新近涌现的短语,七八年搞一次、你别无选择、过把瘾就死,我称之为流行语。我称之为短语的,别的书里常称作固定语、固定词组、现成说法、习语、习用语等。 教科书对短语主要有两点界说,一是结构的完整性,二是意义的完整性(高名凯、石安石,10 7、108页)。从结构上看,多数短语并没有什么特点,玩的就是心跳,原是再寻常不过的话。如果结构的完整性是说瓜田李下不能说成瓜田桃下,爱你没商量不能说?quot;爱你不磋商,那么这显然不是短语的特点,而是所有约定说法的共性:口译不能说成嘴译,闭上不能说成闭下。至于短语意义的完整性,仍定义为不是它的各个结构成分的意义的简单总和(高名凯、石安石,108页),这也一样不成立,因为这说法也可套在复合词上。另有教科书说组成短语的词的意义明显,由词所组成的短语的意义则显得复杂(邢公畹,118119页)。我们在简单的意义单位一节已经批评过这种说法,玩的就是心跳,意义有什么不明显的?再说,显得复杂这种话也实在不适于用来对概念进行界定。至于说短语是极常用的词组,那就更不着边际了。短语不是由频率决定的?quot;今天下午、看电视,这些话出现的频率极高,却不是短语,藕断丝连出现频率要低得多,却是短语。其实,与复合词一样,短语之有别于自由词组,只因为它是约定的说法,只不过短语的约定牵涉到特定的历史文化来源。 约定与规则,类推 我们根据什么说理想是个词,万一是词,你讲和两万则不是单词,一唱一和是成语而一大一小不是?概括说来,我们根据什么区分约定用法和自由词组? 在谈到约定用法与自由词组的区别之时,最常见的说法是,复合词等等约定用法的意义不是它的几个构成成分(字面)的意义的简单总和(高名凯、石安石,106页),例如,白事是白和事这两个字的有机结合,产生出了新的意义,不是白和事的机械和(陈光磊,10页)。有机结合(或化学结合)和机械和这些提法即使不算错,也差不多只是把所要解释的疑问换了个名称,而没有提供真正的的解释。怎样算含义的简单相加,怎样算有机结合?约定用法中的成分在结合中真改变了含义吗?在鞠躬这个词里,看不出鞠和躬哪一个改变了含义。 所谓约定,就是不能根据规则类推得出。所以,叶斯帕森视自由组合法等于类推法(叶斯帕森,11页)。次级约定是有些道理可循的约定,就是说,并非完全不守规则,但又不可能尽由规则推导出来若能完全推导出来,那就不是约定了。这也等于说:没有一定的规则告诉我们类推到哪一点就失效了,为什么就失效了。我听到口译、口信,但我想说口头提供的证据时能说口证吗?我们常说一等、头等、一流,可偏偏不说头流。有时候意义相加虽等于相加的意义,可是不知道加起来成不成这个语言所用的词(赵元任,一,43页),赵元任喜欢举的一个例子是法语用四个二十,十九来表示九十九。 有一些单词,粗粗一看像是自由的组合,但若细加考察,便会发现其中含有某种约定的因素。 强大。固然,强和大都是自由形式,而且强大也就意味着强而大,但强而大或大而强却不能说成大强。此亦约定不可类推之一例。 高山。我们说高山、高峰、高楼、高空,但不说高树、高柜(比较矮柜)、高杯(比较高脚杯)。形名组合不是很自由的,特别是单音形容词。组合不自由,就是有熟语性,这是复合词的特点。短语的组成,原则上应该是自由的,应该是除意义之外没有任何限制的(吕叔湘,23页)。吕叔湘在这里所说的熟语性,就是我们所说的约定。 我们须注意,这里的关键不在于是否有时能够类推,而在于有时不能够类推。让我们再用一个例子来说明这一点?quot;窗子和桌子、椅子的构成是有规则的,我知道窗和窗子是一个意思,第一次听到桌子椅子,可以类推它和桌椅是一个意思。然而不知何时,类推终止了。我们说桌子、窗子,却不说门子,说新娘子却不说新郎子,说儿子、孙子、侄子、外孙子、小舅子,却不说哥子、姐子,说狮子却不说熊子。 说话人与听话人 这里我们接触到语言学里常讲的听话人和说话人的区别。之所以有这种差别,是因为存在着大量的次级约定。我学到了子这个词缀,第一次听到新娘子就懂得它的意思,但作为说话人,只要没听到过别人这样说,我自己就不会说新娘子,就像我不会说新郎子。口译遵循另一个规则构成,我知道口信中的口是口头的意思,相对于白纸黑字而言,第一次听到口译,就像听到一个自由词组一样,立刻可以类推得知它是口头翻译的意思,与笔头的翻译相对,实际上,口头的正是口的主要构词规则,译也是翻译构词的规则。然而,我自己不会造出口证这样的说法来表示口头说出的证据。用成分意义的联合是否能说明复合体的意义作标准来判定自由词组和复合词,这是从听话人方面来看的,依此标准,口译就是自由词组。从约定来看侍猓炊运祷叭死此凳欠裼姓庋殖傻脑级捣?quot;口译自然是个单词。 叶斯帕森说学习约定用法全凭记忆或重复已经学过的内容(但自由用语则要求另一种脑力劳动)(叶斯帕森,7页),那是着眼于说话人而不是听话人说的。成年人学外语,记不住那么多约定,只好求援于语言的逻辑来类推,经常编出各种各样的说法,外国人听得懂,但听上去不是地道的外语。 数理科学寻求的是完备的规则,在那里,听话人和说话人的逻辑地位是一样的。历史诸科学所要对待的却是一系列完备程度不等的规则。因此,语言学作为一门历史科学,虽能事后能总结出构词法等规律,却不可能根据这些规律预测我们将构造出哪些新词来,就像我们不能靠某些历史规律制造历史。这显然远不止是规则与例外的问题。这更远不等于说历史是一大堆偶然性的堆积。在必然和偶然之间有着广阔的原野。 自由词组 约定用法里包含约定,与各式各样的约定相反,在自由表达中,各成分完全根据规则联系在一起,前者由构词法研究而后者属于句法(狭义的语法)范围语法研究语言的普遍事实,而词汇学则研究特定的事实(叶斯帕森,23页)。马耳朵是一个自由词组,因为凡动物名称加耳朵的说法统统成立,例如驴耳朵、牛耳朵、兔子耳朵。根据同样的道理,可?quot;马耳是自由词组而木耳则是约定用法,因为某耳这一构造只在动物范围内通行。执牛耳也是个约定用法,但这属于三级约定。 我们在扩展法的不足一节中已指出仅凭扩展法不足以判断约定用法和自由词组之间的区别。按扩展法,口译可以扩展为口头的翻译,因此是自由词组,但按我们的标准,它显然是个复合词,我们不说嘴译,也不说口证。按照我们的理解,打仗是一个单词,虽然打和仗这两个字在一个句子里可能分开甚至倒转:打胜仗,打了三年仗,仗打赢了,仗打了三年。可以说仗打了三年却不能说革改了三年,这是各种单词的语法弹性不同,为了标识这种不同,把打仗称作离合词也不妨,但这不影响打仗和改革同为单词。 约定用法既然总有约定在内,所以这个词语多多少少都需要从新学习。但把约定用法连到一起,则是基本的说话能力,不需要每次说一个新词组时再学习什么。只要懂得经济也懂得新闻,就会说经济新闻。懂得子也懂得夜,要从新学习子夜;懂得子夜,则自然会说子夜之前。词是现成造好的,供我们使用,句子还等我们去造,所以我们说遣词造句。 因此,我们只问约定用法的意思,不问自由词组和句子的意思。我会问’别墅’是什么意思,我不会问’我昨天晚上到他的别墅去了’是什么意思,除非别墅两个字下加了重音。一旦我懂了别墅,我就知道大别墅、去了别墅这些自由词组是什么意思。我怎么知道的?这等于问,我从来没有把自然数系列写到过100056,我是怎么知道100055后面跟的是这个数呢?知道100055后面是100056是知道自然数系列的应有之义,是对一种规则的掌握,知道大别墅、大耳朵、大窗户是基本的说话能力。依此类推是学习的基本机制。我们用这种方法学会展开一个代数式,用这种方法学会交通规则。 一级约定、次级约定和自由词组构成一个连续统,一端是完全的约定,即没有什么道理和规则的纯粹约定,另一端是完全的自由表达。这三个阶梯之间不是界限分明的,我们很难断?quot;打尖是一级约定(元素词)还是次级约定(复合词),像大吵大闹这样的说法,算它固定词组还是自由词组都行。我们只求从原则上说明这些区别,明白什么是典型的约定用法,如自行车(其实你不蹬它就不走)或单车,什么是典型的自由词组,如小红车、破车、新车、马拉的车。不过,一般说来,我倾向于把两难之间的语词视作约定用法。例如马车,虽可解为马拉的车,但也可以是牛、骆驼、骡子拉着。火车可以解作靠火力发动的车,但电力发动的仍?quot;电气火车,和电车有别。小车则有两种用法,有时是最典型的自由词组:小的车,有时专指小轿车或手推车。此类还有大车(大的车和牲拉的车)、快车(开快车和旅客列车的一种)。 一边是由句法照管的自由表达,另一边是纯粹约定,而渭对级飧龅卮蚴亲罡灰馊牡卮?quot;大这个语素的语词,大方、大员、博大,大多数保留大的通常含义,这个叫大米而那个叫小米,这个叫大老爷们儿而那个叫小媳妇儿,道理相当明显。但也有些几乎没有规则可循,大粪是人的粪便,大车却是牲口拉的车。人排泄的、牲口拉的,不包含在大的通常含义之中,我们学会什么叫大车,毋须知道为什么叫它大车。但即使在这里,我们也不能断定毫无道理可言,牲口躯体大力气大,人的粪便肥力大。大不是一个由三五种固定意义合起来的语词,而是一个提供了某些可能用法的概念空间。 总结:词的定义 确定什么是一个词,简单说,就是从两个方面为词划出界线,一方面是词怎样区别于比词小的单位,区别于语素,另一方面是词怎样区别于比词大的单位,区别于短语和词组。语言学家早已指出,由于汉语缺少发达的形态,在确定某一语言单位是不是一个词的时候,常常要综合几方面的标准(吕叔湘,12页)。本文讨论了音义结合、造句单位、韵律、约定这些线索,把重点放在了约定这一概念上。所谓最小的音义结合体或语素,就是语言中的基本约定。两个以上语素的组合可以是一种约定,如他杀,也可以是自由的组合,如他去。检验是不是约定的形式标志依靠类推,我们不能从他杀类推而得出我杀、你杀的用法,但从他去可以类推而知我去、你去、他来。 凡不是约定的组合,都不是词,都是自由词组。我们不说’他坏’这个词、’快来’这个词。但并非凡约定组合都是词。藕断丝连、爱你没商量都是约定组合,但通常不称?quot;词,而称为成语、流行语等。 日常语言中对字、词、语的区分,我相信主要是以音节数来定的。凡一个音节,我们就说它是一个字。我们倾向于说’飞’这个字,而不是’飞’这个词。双音节的约定用法,我们都管它们叫词。由三个字组成的约定用法,名词性的如图书馆、人造革等,通常称为词,其它类型的如只不过、面对面、敲竹杠则为短语。凡四个音节的,我们就不愿再叫它词,一心一意和专心都是次级约定,分桃和瓜田李下都是三级约定,但我们通常把专心和分桃叫作词,而把一心一意和瓜田李?quot;叫作成语或短语。只从语义而不从韵律学上来考察是无法说明这些现象的(冯胜利,89页)。 依此,我们可以从两个角度来看待词这个概念。从语法上下定义:词是不包括短语在内的基本造句单位。在这个框架里,我们可以从好多角度来把词分类。从音节来分类,可分为单音词如我、复音词如英雄、多音词如照相机(综合词)。从语素来分类,单个语素成词的可称为元素词(赵元任称作单纯词),包括单音词、连绵词(葡萄)、混一词(马虎)。从结构上说,语素加词缀的是派生词,语素加语素的是复合词。 但是在日常说法里,我们愿意区别字和词,就是说,把单音词排除在词的范围之外?quot;词一方面和字有分别,另一方面和短语有分别。词和字合在一起,可统称作字词,词和短语合在一起,可统称作语词。在这个框架内,自由形式这个概念在讨论字的时候才有实际意义,它告诉我们哪些字可以直接造句,如就、飞、稳、重,哪些字只能构词不能直接造句,如始、扩、英、雄。这种区别也许不像很多语法学家设想的那么重要,乃至字典通常都不标明一个字是不是自由形式。我想主要原因在于那些不能直接造句的字的实际自由程度相差极大,有些可以相当自由地构词,有些则不能。至于一个多音词是否由自由形式构成,则是个颇为次要的区别。狐狸这个词只包含一个语素;英雄这个词包含两个语素,但这两个语素都不是自由形式;强大这个词包含的?quot;和大都是自由形式。然而,狐狸、英雄、强大都是一个词。由同样的方式我们可以确定鸡蛋和鸭蛋具有同样的身份,这里无关乎鸡和鸭一个能单独说而另一个不能单独说。 参考书目: Austin,J。L。,PhilosophicalPapers,OxfordPress,1961。 Bloomfield,Leonard,Language,NewYork,1933。 BolingerandSears,AspectsofLanguage,HarcourtBraceJovanovich,Inc。1981。 陈光磊,《汉语词法论》,学林出版社,1994。冯胜利,《汉语的韵律、词法与句法》,北京大学出版社,1997。 高名凯、石安石,《语言学概论》,中华书局,1963。Hockett,Charles,ACourseinModernLinguistics,NewYork,1959。 洪堡特,《论人类语言结构的差异及其对人类精神发展的影响》,商务印书馆,1997。 胡裕树主编,《现代汉语》,上海教育出版社,1981。 克里斯特尔,《剑桥语言百科全书》,中国社会科学出版社,1995。刘叔新,《论词的单位的确定》,天津人民出版社,1984。 刘叔新,《汉语描写词汇学》,商务印书馆,1990。 陆志韦,《国语单音词词汇》,北京,1938。 陆志韦,《北京话单音词词汇》,载《陆志韦语言学著作集》 (三),1990。 吕叔湘,《汉语语法分析问题》,商务印书馆,1979。 齐冲天,汉语单音节词的构成问题,载《词汇学论文汇编》,商务印书馆,1989。 Ryle,Gilbert,OrdinaryLanguage,载V。C。Chappell《OrdinaryLanguage》,NewYork,1981。 王力,一,《中国语法理论》,《王力文集》第一卷,山东教育出版社,1984。 王力,二,《汉语语法纲要》,《王力文集》第三卷,山东教育出版社,1985。 王力,三,词和仂语的界限问题,《王力文集》第十六卷,山东教育出版社,1990。 文炼,关于研究仂语的两个基本问题,载王松茂主编,《汉语语法研究参考资料》,中国社会科学出版社,1983。邢公畹,《现代汉语教程》,南开大学出版社,1992。 叶斯柏森,《语法哲学》,语文出版社,1988。张志公主编,《现代汉语》(试用本),人民教育出版社,1982。 赵元任,一,《语言问题》,商务印书馆,1980。 赵元任,二,《中国话的文法》,香港中文大学出版社,1984。(AGrammarofSpokenChinese)朱星,《汉语词义简析》,湖北人民出版社,1981。王松茂主编,《汉语语法研究参考资料》,中国社会科学出版社,1983。