动趋式的语言学特征分析 动趋式指动词带趋向动词作补语。如:ldquo;趴下rdquo;ldquo;坐下去rdquo;和ldquo;走出办公大楼rdquo;等。本文主要对动趋式进行了语言学特征考察。本文所使用的语料是1998年1月份《人民日报》经过分词和词性标注的语料。我们对文中的动趋式进行了标注。具体语料样例如下: 随着p1998年t春节t的u临近v,w一些m地方n和c部门n也d开始v【忙碌a起来v】,w准备v一年一度i和cldquo;w老a关系户nrdquo;w礼尚往来i,w来去v拜年v。w如今t,w这些r单位n间f的u拜年v已经d完全ad变v了u味Ng。w主要d表现v在p重vldquo;w礼nrdquo;w轻aldquo;w情nrdquo;w。w去v拜年v时Ng,w要么c【捎v上v】几m种q本地r的u土特产品n,w要么c【带v去v】名牌n烟酒n,w否则c面子n上f【过不去v】。一、内部构成和用字情况这24个词除了具有趋向动词的用法外,还有其它的用法,例如:ldquo;上、下rdquo;等词还可以作方位词,ldquo;过去rdquo;可以作时间名词。简单趋向动词和复合趋向动词作不同兼类的比例也有所不同。其中,复合趋向动词ldquo;开来rdquo;不能单说,也不能作别的句法成分,只能作补语;其余13个复合词相比较ldquo;来、去、上rdquo;等10个单音节词作趋向动词的比例也较高。换句话说,在识别动趋式时,如果出现这14个复合词时,基本上可以确定它们就是动趋式的右边界。而ldquo;来、去、上rdquo;等单音节词作趋向动词的频率差异较大。我们对1998年1月《人民日报》的语料进行了统计,具体数据如下:表1:简单趋向动词用字频率表词作为趋向动词的频率具体例子出75营造v出v过69走过v起30树立v起v来29拿v来v进16推进v开10裂开v下8按v下v回7捧v回v上6捎v上v去6望v去v根据对《人民日报》的统计,还可以发现下列问题:1。简单趋向动词兼类问题。这10个单音节词兼类现象比较复杂。虽然有的词性比较单一,作为趋向动词的比例比较高,如:ldquo;出rdquo;;但多数功能多样化,除了可以放在动词后充当趋向补语,还可能充当谓语中心、连动谓语的后项。2。动词和趋向动词结合起来是词还是词组问题。有些动词后的趋向动词意义虚化,读起来与前面的动词更接近,如:ldquo;放下rdquo;;有的因为常用,因而与动词结合更紧密已经凝固成了一个词,如:ldquo;推进rdquo;;不过大多数动词都可和趋向动词构成词组。趋向动词用字的兼类现象为动趋式的识别带来了较大的难度,但在识别动趋式时,我们仍可以将这些词作为动趋式识别的右边界,以提高识别的召回率,然后再通过统计和规则的方法进行过滤,排除误识别的词语,来提高正确率。二、趋向动词和宾语的位置 我们来看看具体的实例: A。动趋宾B。动宾趋C。动趋1宾趋21。跑上楼跑楼上mdash;mdash;2。带来一本字典带一本字典来mdash;mdash;3。剥来一个桔子剥一个桔子来mdash;mdash;4。送上一束花送一束花上mdash;mdash;5。倒来杯咖啡倒杯咖啡来mdash;mdash;6。拿出来一个手机拿一个手机出来拿出一个手机来7。爬上来山爬山上来爬上山来8。走进去两个学生走两个学生进去走进两个学生去9。拿进去卧室拿卧室进去拿进卧室去10。跑出去一只狮子跑一只狮子出去跑出一只狮子去从上面的例子可以看出,这三种格式分布具有不平衡性。主要表现在以下几个方面:(一)C式的数量比其它两种句式的数量少。简单趋向动词只能出现在A、B式里,如:ldquo;喝上一杯酒rdquo;和ldquo;坐火车来rdquo;;而复合趋向动词既可以出现在A、B两式里,也可以出现在C式里,如:ldquo;走进来了一个警察rdquo;ldquo;走了一个警察进来rdquo;和ldquo;走进了一个警察来rdquo;。当趋向动词所带的宾语为小句或复句时,一般采用A式。例如:可以说ldquo;看出来屋里的空气有点不大对rdquo;,但不能说ldquo;看屋里的空气有点不大对出来rdquo;。 (二)无定宾语的位置比有定宾语自由,不论充任述语的动词是及物的还是不及物的,A、B、C三种句式都成立,有定宾语只能在述语是及物动词的格式里出现,这时只能用B式和C式,而不能用A式。(三)当动词带简单趋向动词时(ldquo;来rdquo;ldquo;去rdquo;除外),不管动词的性质如何,也不管宾语的性质如何,一律只能采用A式,不能采用B式。例如:我们可以说ldquo;拿出一支笔rdquo;,但不能说ldquo;拿一支笔出rdquo;。(五)复合趋向动词句中宾语的位置:1。C式为复合趋向动词的常见格式,不受宾语确指与否的限制。2。当复合趋向动词带处所宾语时一般只能采取C式,不能用A式和B式。例如:我们可以说ldquo;跑进病房来rdquo;,但不能说ldquo;跑进来病房rdquo;和ldquo;跑病房进来rdquo;。3。ldquo;开来rdquo;作趋向动词时跟宾语共现的情况比较特别,ldquo;开来rdquo;这一趋向动词跟受事宾语共现时只能采用C格式。例如:可以说ldquo;翻开一本书来rdquo;,但不可以说ldquo;翻开来一本书rdquo;和ldquo;翻一本书开来rdquo;。4。A式及B式通常不用于确指宾语,目前在普通话里使用频率很低。总之,通过统计不难发现:简单趋向动词出现的频率要高于复合趋向动词;在复合趋向动词带宾语时,C式使用频率最高,A式次之,B式出现频次最低;而在所有动趋式带宾语的情况中,A式出现频率最高,B式次之,C式出现频率最低。从以上这些可以看出来:A、B、C三种格式在语言中分布具有不均衡性。这种不均衡性增加了计算机识别动趋式的难度,但我们可以根据以上观察,制定相应的规则进行限定。本文重在从计算语言学的角度,对动趋式的内部结构、用字情况和外部与宾语的位置关系进行初步分析,旨在为计算机识别动趋式提供语言学依据。因此,没有对其中具体问题做理论上的深入分析。