汉语单音词的语素化研究
上QQ阅读APP看书,第一时间看更新

2 汉语语素的研究概况

2.1 语素的界定

“语素”在结构主义的语法研究中占有重要地位。“语素”这一术语源自美国描写语言学派,是morpheme的译名。学者在将morpheme引入汉语研究时,曾出现了“形素”“语素”“词素”“辞素”等译名。morpheme的汉译译名以及汉语“语素”的性质等问题,在汉语学界引发了一场热烈的讨论。[2]经过1957年的讨论,“词素”的概念建立起来了。

朱德熙(1961)提出用“语素”的名称来取代“词素”:“我们把Morpheme译为‘语素’。流行的译名是‘词素’。Morpheme有两种涵义:或指词内部的有意义的组构成分(词根、词头、词尾等),或指最小的、有意义的语言单位。就前一种涵义说,译作‘词素’是合适的,就后一种涵义说,译作‘词素’会让人感到先有词,从词里头再分析出‘词素’来。本书所谓‘语素’,指后一种意义上的morpheme。”后来吕叔湘(1979:15)也重申他在1958年发表的观点,认为“比较起来,用语素好些,因为语素的划分可以先于词的划分,词素的划分必得后于词的划分,而汉语的词的划分是问题比较多的”,并就汉语语素做了较为深入的阐释。自此,汉语语法学界更多的人接受了“语素”这一译名,但在词汇学界,张永言(1982:35)、葛本仪(2001:49)等学者仍然主张使用“词素”这一术语来涵括朱德熙(1981)所说Morpheme的两种涵义,而张寿康(1981:173)、刘叔新(2005:70)认为Morpheme的这两种涵义应分别用“词素”和“语素”来表示。王洪君(1994)等主张“字本位”的学者认为,“语素”大致相当于他们理论中的结构单位——“字”。尽管各派学者在术语的名称问题上意见很不统一,但术语所指称的对象都包括汉语结构系统中“最小的语音语义结合体”,它既可以独立成词,又可以充当构词成分(吕叔湘,1979:15)。

本书对于语素的定义问题不拟做太多的讨论,采用目前学界大多数人认同的观点:语素是语言系统中最小的语音语义的结合体。

2.2 语素的判定

语素来源于结构主义语言理论,线性理论是结构主义学派的理论基础。在他们看来,语言系统是一个线性的分层装置,依音位、语素、词、短语、句子逐层套合而成。语言结构是一种由下而上的系统,各层单位必须与同层单位组合之后才能进入更高层级。在印欧语系中,天然单位是词(Word),词进入句子有一套丰富的形态变化,语素和词的界限总体上是分明的。

汉语学界在引入结构主义理论时,也建立了汉语的结构分层。吕叔湘(1979)提出了语素、词、短语、小句、句子的五级单位。但由于汉语缺少形态变化,在划分语素、词、短语方面存在很多纠缠不清的问题。问题的焦点在于汉语中到底有没有与Word相当的语言单位,这一问题至今没有一个令人满意的答案。[3]

汉语中的语素、词、短语的划分是个老大难的问题。层级划分的依据主要是句法和词法标准,也有人从语音、书写形式(汉字)方面进行了探索。由于没有形态变化的标志,汉语的语素和词就没有了明显的判别标准,进而导致词与短语难以划分。汉语学界曾就语素、词和短语的界定展开了论辩,如王宗炎(1981)、方经民(1982)、卞觉非(1983)、郭良夫(1988)等。

从各级结构单位的特性上来说,语素和词都属于句子的组成部分,在合适的语境中以不同的方式进入句法结构,从这一点上讲,语素和词都是语言系统的构成部件,这些部件都是供语言使用者在需要的时候选择性地抽取,因而可以说,语素和词都具有备用性(徐国庆,1999)。不同的是,词是个现成的部件,而语素可能需要进行一定的加工才能进入句子,如不成词语素要与其他成分组合后才能入句。此外,语素和词都具有复呈性,作为结构单位,可以同样的性质反复出现在句子的不同位置。语素和词的备用性和复呈性,加强了二者的同一性,使得语素与词的分别更加困难。

就目前的情况而言,学界对语素的判定通常采用的是“替换法”,这种方法能将大部分的语素鉴别出来。如果说“替换法”在分析现代汉语语素时基本能解决问题,那么将“替换法”用于判定古代汉语的语素可能会遇到很多问题。

认知语言学认为,形式语言学理论把句法独立出来甚至作为核心自治系统,再分成词法、句法、语义、语用等不同的部分,完全是人为的或是为了研究的方便而已。实际上词法、句法、章法之间并没有绝对的分界,句法和语义、句法和词汇之间也没有绝对的分界,语言的意义跟人的知识和信仰系统分不开,纯语义知识和百科知识也不能截然分开,语义和语用之间也没有绝对的分界。因此从词法到句法到语义再到语用,这是一个渐变的连续统(陆俭明、沈阳,2004:345)。从单音词到构词语素的演变也是个渐变的连续统,若是采取“一刀切”的方式用一条硬性的标准来判定一个单音词何时完成语素化,即到底发展到何种程度算是语素,在演变到何种程度之前还应算是词,这对于历时研究来说是很难做到的。我们可以一个演变体获得典型范畴的典型特征的多少来判定其范畴的归属,具体办法参看本章6.1。

2.3 语素的分类

2.3.1 多角度的语素分类

语素作为语言结构系统的一个组成部分,存在语音、语法、语义等方面的关联,依据单一标准很难对汉语语素进行分类,需要综合考虑。由于研究目的的不同,不同的学者从不同的角度对汉语语素进行了不同的分类,这种语素的分类主要是就共时平面的语素而言的,如张松林(1990)、柯彼德(1992)、宗世海(1997)、刘公望(1993)、鹿荣、张小平(2004)等。

杨晓黎(2008)把汉语语素分为八大类十六小类。

甲、语音形式标准:单音节语素、双音节语素、多音节语素。

乙、组合能力(成句或构词能力)标准:成词语素、不成词语素;定位语素、不定位语素;自由语素、不自由语素(黏着语素)、半自由语素;可替换语素、不可替换语素(剩余语素)。

丙、意义标准:实义语素、虚义语素、弱化语素;实词素(实素)、虚词素(虚素);表义语素和别义语素(化石语素);单义语素和多义语素。

丁、意义/功能标准:词根语素、词缀语素、词尾语素(词根语素+附加语素)。[4]

戊、内部结构标准:单纯语素、合成语素。

己、与词类对应标准:名词性语素、动词性语素、形容词性语素。

庚、来源标准:原生语素、移植语素、移用语素。

辛、其他:语段语素、超语段语素;句法性语素、非句法性语素;高频语素、中频语素、低频语素。

有关语素的分类还有很多讨论,此处不再赘述。

2.3.2 “自由”和“黏着”

在语素的众多分类中,我们比较关注从“自由”和“黏着”角度对语素的分类。尽管很多学者都用到了“自由”和“黏着”这一对术语,但各家对此有不同的定义。

赵元任(1979)、吕叔湘(1962)、朱德熙(1982)、张志公(1981)等都根据“自由”和“黏着”对汉语语素进行了分类,其中吕、朱两家的分类影响较大。

布龙菲尔德(1955)的“自由”表现在“成句”上,其自由形式是“可以单独成句的”,黏着形式是“不可以单独成句子的”。赵元任(1979)认为,一个自由字,“同时也是一个句法词”,一个黏附字“必须与其他字相结合才能组成一个句法词”,其“自由”表现在“成词”上,并强调“黏着语素始终是黏着的,而自由语素只意味着有时是自由的”。赵元任(1979)根据布龙菲尔德自由和黏着理论,以及Murray 关于结合面宽和结合受限制的理论将汉语语素分为四类:(ⅰ)自由而结合面宽;(ⅱ)自由而结合面窄;(ⅲ)黏着而结合面宽;(ⅳ)黏着而结合面窄。

吕叔湘(1962)第一次从理论上对“自由”和“黏着”这对概念进行了系统研究,认为区别“自由”和“黏着”的标准是“单说”,但在汉语里受较大限制(一个人自言自语不大会只说一个词),实际理解为“单独回答问话”,但单独回答问话也有限制,因此又运用模拟法,把“单说”的标准又改成了“单用”,这就意味着不能严格遵守最小自由形式的原则。吕叔湘(1979:19)接受了赵元任(1979)的分类标准,也将语素分为四类:(ⅰ)能单用的,单用的时候是词,不单用的时候是构词成分;(ⅱ)一般不单用,在特殊条件下单用的,单用的时候是词;(ⅲ)不单用,但是活动能力较强,结合面较宽,有单向性,即只位于别的语素之前,或别的语素之后,或两个语素之间,即所谓的“语缀”或“词缀”;(ⅳ)不单用,结合面较窄,但不限于在前或在后,专作构词成分,可以称为“词根”。

朱德熙(1982)的分类与赵元任(1979)、吕叔湘(1979)略有不同,他对语素做如下分类:按照能单独成句与否,分出自由语素和黏着语素;按照能单独成词与否,分出成词语素和不成词语素;按照位置固定与否,分出定位语素和不定位语素,定位语素又分出前置定位语素和后置定位语素。

董秀芳(2004/2016:45-46)综合各家研究成果,将语素分为三类:自由语素、半自由语素和黏着语素。“所谓自由语素(Free Morpheme),是指能够独立成词的语素;所谓黏着语素(Bound Morpheme)是指不能够独立成词,必须与其他语素结合才能成词的语素。”她对半自由语素的定义是:“不能单独成词,必须与其他语素组合成词,但在一定条件下又可以出现在句法中词所能出现的位置,这一类语素在表现上介于自由语素与黏着语素之间,这就是‘半自由语素’。”她强调她所定义的半自由语素的“自由”是受特定韵律条件限制的,不包括那些仅由语域或句法环境本身就可决定其自由的边缘性的可成词语素。

2.4 语素与语言结构系统

美国结构语言学的理论基础是线性结构理论,认为“语言是一种线性的表达系统,分两层,第一层是音位系统,基本的结构是音位(Phoneme);第二层是语法系统,基本的结构单位是语素(Morpheme);这两种结构单位都是以-eme收尾,性质一样,都是从连续的语言事实中分离出来的离散性结构单位”(徐通锵,1997:59)。语言表达系统的这两个结构层面具有“组成”关系,即第二个结构层面的单位“语素”由第一个层面的单位“音位”组成。这种“组成”关系的观点给美国结构语言学的方法论带来了深刻的影响,他们认为语言分为若干层次,较高层次依靠下一层次。较低层次整理好之前,不能进入较高层次(鲍林格,1975:228;转引自徐通锵,1997:60)。由此可以看出,语言结构的线性理论对印欧系语言的语法研究,采取的就是一种封闭性的结构框架,这个结构单位的序列是:语素—词—词组—句子,每一种单位都直接或间接地受一致关系控制(徐通锵,1997:430)。吕叔湘(1979)第一次把五级单位制引进了汉语语法研究,即语素—词—短语—小句—句子,并特别强调语素的重要性。结构主义对语言的这种分析模式,对于深入认识共时平面的语言结构是有益的,积极推动了语言的研究。

线性理论把语言看成一种封闭的、静止的、自足的僵硬(rigid)系统,这种理论最严重的弱点就是把意义和体现语言运转及演变机制的变异排除出语言研究的范围。就语言的本质而言,线性只是语言的局部的、表层的结构特征(徐通锵,1997:62)。结构主义的线性理论中,各结构层之间的分别近乎界限分明。通常下层结构单位要与同层的单位组合才能进入更高的上一层单位。但实际上,语言结构的本质特征应当是非线性的、开放的、呈现出动态平衡的系统。语言结构不同层次的成分在语言的运转中,相邻的两个结构层之间会因语用环境的改变而发生转化,甚至出现跨层的转化。由于汉语形态变化较少,语素、词、短语之间的转化不需要形态上的改变,这种特征一方面使得汉语语素、词、短语之间的界限模糊,同时,也为不同层级的结构成分之间的转化提供了条件。如汉语有的语素加上语调就能单说成句,这体现为跨层的升格现象;短语内的组构成分固化为一个词,这是短语降格为词的现象。汉语中有的语素不需要与其他语素组合就可以作为一个词直接入句,还可以与其他语素组合成词之后再入句,也就是一个语素出现了跨层的双重身份,可将汉语中的这种语素看作两个语言单位层级之间,“交集”中的元素(杨锡彭,2003:9)。以上诸多结构层之间的转化,主要是从共时状态下语言系统的运转过程而言的。在历时的演进中,语言的各种结构要素受内外因素的触动,可能产生某些变异,随着时间的推移,演进的程度逐渐加深,最终可能导致语言范畴的改变,如词汇化、语法化等现象就说明了这一点。

2.5 汉语语素的共时研究现状

20世纪90年代以前的语素研究主要围绕语素的性质(吕叔湘,1979;张寿康,1981;张志公,1981)、语素的分类(赵元任,1979;吕叔湘,1979;张寿康,1981;朱德熙,1982)、语素和字(陆志韦,1957;张寿康,1957;吕叔湘,1979)、语素义和词义(周荐,1991;王树斋,1993;杨振兰,1993;符淮青,2004;郑厚尧,2006)等方面的内容展开了讨论,仍有许多问题难成定论,详参潘文国等(2004:96-106)。

杨锡彭(2003)在前人研究的基础上,对语素进行了全面深入的研究,致力于揭示汉语语素的面貌,讨论汉语语素的性质、特点及其对于汉语结构系统(包括词法系统、句法系统)的影响,同时也从语素的性质、特点出发,检讨汉语结构系统研究中的种种问题。这是目前关于现代汉语语素研究影响较大的一部著作,全书主要采用结构主义的研究方法,从语法角度入手,关注较多的是语素结构形式方面的问题,对语素的语义问题、语素的历史来源等问题论述不多。

孙银新(2003)从词汇学角度对汉语语素做了深入的研究,其中不乏新意,尤其是他从历史来源的角度,将汉语词素(即本书所指的语素)分为三类:原生词素、移植词素、移用词素,这对于本书的研究具有很大的启示意义。

汉语词汇的双音化,使得现代汉语中单音节词的活动受到限制,吕叔湘(1963)列举大量例证说明了单音节词活动受限的种种情况。吕文的重点是摆事实,并没有对此问题做规律性的探讨。董秀芳(2004/2016)敏锐地观察到,吕文的讨论没有明确区分词法层面和句法层面,如吕文所举“不宜:宜于”一类例子,单音节语素“宜”与“不”组合时,是出现在句法层面;“宜”与“于”组合成词时,是出现在词法层面。董秀芳在区别词库和词法的基础上,以二者的互动与关联为线索,对汉语语素的分类进行了新的探索,提出汉语语素的整体三分模式:自由语素、半自由语素、黏着语素,并指出半自由语素的存在是由汉语的历史演变以及语素在汉语语法中的枢纽地位所决定的。董秀芳(2004/2016)基于词法学、句法学和词汇化、语法化等理论,重点讨论了半自由语素的特点及判定、使半自由语素在句中自由的手段、汉语能产的词法模式等问题,从理论上揭示了汉语词法方面的特点和规律。这是一部理论性很强的著作,对于深化汉语语素的理论研究具有重要意义。

汉语的构词法研究和语素研究密不可分。Packard(2000)从严格意义上的形态学入手来研究汉语的构词法,他先就汉语语素的判定、自由语素同黏着语素的区别等问题展开了讨论。他将构成汉语复合词的语素分为三类:实质性自由语素、实质性黏着语素以及功能性黏着语素,实质性黏着语素又分为成词词干和黏着词干两类,这样一来,汉语复合词就有了四种构词部件(Packard,2000:石定栩导读)。此外,Packard还提出了“核心原则”,即(双音节)名词一定有个名词性成分在右边,而动词一定有个动词性成分在左边。尽管该原则有例外,但对专题的研究有重要的参考意义。

王勤、武占坤(1983)将不能独立成词的构词语素称为“专职语素”,实际上就是本书所指的黏着性构词语素,张莹(2008)对现代汉语中的专职语素进行了专门研究。姜自霞(2007)探讨了影响语素项构词力强弱的因素,认为语义属性对语素项构词力的制约力最强,语法属性和时间属性也会产生一定的影响。符淮青(2007)、苏宝荣(2011、2017)对语素入词后的语义变异、语素义与复合词词义的关系等问题进行了深入探讨。

语言研究由传统的定性研究逐渐向定量研究转变,汉语语素的定量研究已取得了重要成果。尹斌庸(1984)发表了第一篇对汉语语素进行定量研究的重要论文,以累积出现频率为99.94%以上的4200字为依据,对汉语语素的词性、独立性、结合性等问题进行了定量研究,认为汉语独立的单音节语素(即单音节词)约有2400个,几乎占全部单音节语素的一半(49%),其中动词性语素的独立性远远大于名、形两类语素,语素的结合性和语素的相对独立性构成一种反相关的关系。

出于中文信息处理的需要,清华大学建立了大规模汉语语素资源库。它对覆盖6763个汉字的汉语语素及其所构二字词、三字词及四字词进行了穷举描述。在汉语语素资源库中共有汉语语素项17470个,语素10442个,二字词78230个,三字词6700个,四字词14200个。整个资源库共有116600条记录。苑春法、黄昌宁(1998)基于该资源库,对汉语语素的分布、汉语中二字复合词的结构、语素在构成二字复合词时意义的转化等问题进行了研究。研究认为,汉语语素素类的分布和汉语二字词词类的分布基本类似,语素在构词时一般总是保持原来的意义不变。北京大学针对中国国家标准GB2312—80所包含的全部汉字,开发了一个单音节语素库,共有6671个记录,登录的都是不成词的语素。该语素库是汉语信息处理领域的一个可用的基础资源(俞士汶、朱学峰、李峰,1999)。这种定量的统计分析,使得当前的语素研究更加科学化,所得出的结论更加准确可靠,无论是对于语言本体研究,还是对于语言应用研究,必将起到有力的推动作用。

对外汉语教学界近年来努力推进语素教学,在一定程度上也促进了汉语语素研究向纵深发展,如肖贤彬(2002)、杨晓黎(2006)、邢红兵(2006)、朱志平(2006)等。值得一提的是吴茗(2015),为了彻底分析汉语语素在不同意义上的不同属性,建立了“语素项属性库”,对语素项的语法类别、构词频率、构词位置、单用频率、自由度、在合成词中的平均显义度等属性进行了较为深入的探索性研究;并从对外汉语教学的实际出发,在定性与定量相结合的基础上,对语素项进行分类、分级和级内排序,对语素项进行了教学方法上的标注,将研究成果直接运用于教学实践和教材编写。

有学者甚至提出“语素学”,指专门研究语素的语言学科,首见于苏联科学院1970年编的《现代俄语语法》(转引自林春泽,1998)。国内学者也有相关论著问世,如周一农(1994、2012)、林春泽(2006)等。

2.6 汉语语素历时研究现状

20世纪后半叶以来,学者们在讨论古代汉语的语词结构时,多会触及构词语素的问题,但总起来看,大多是就构词语素的语法属性和构词特征、语素和语素之间的语义关系、语素义与词义的关系等问题展开讨论,如魏达纯(1998)、郑厚尧(2006)、程湘清(2008)、卜师霞(2009)、张烨(2013)等。近年来,运用定量统计的方法从历时角度研究汉语语素的成果不断涌现,如李波(2006)、刘燕(2009)、刘秀梅(2016)等。总体说来,整个研究的手段和研究的思路与同期现代汉语语素的研究差别不大,只不过将分析的对象由现代汉语构词语素换成了古代汉语构词语素。此类研究对于发掘汉语史的事实很有意义,但就语素研究的理论拓展而言并没有新的进展。至于古汉语单音词发展为现代汉语构词语素这一问题,前辈学者虽有所论及,但亦多属举例性质,如赵元任(1979:103)、齐冲天(1960)、王力(1980/2008)、马真(1980)、向熹(2010)等。

自20世纪90年代后期起,王宁发表系列论文,主张用动态的视点来看待先秦汉语和现代汉语的传承关系,在研究思路方面有了新的拓展,对于语素化研究提出了一些富有启示意义的观点。比如王宁(1999、2006)把历史传承词的词汇化原因归结为三点:(ⅰ)单音词语义系统变动,造成词语职能重组,使古代汉语某些单音语素退出造句法并沦为不自由语素,产生了依附性,使双音词组凝固为不可分开的双音合成词;(ⅱ)古代汉语句法结构模式弱化和消失,使原来采用这种模式结构起来的词组凝固成词而词汇化;(ⅲ)两个词素在古代已经组合,但经过语用的积淀,产生了与原有组合完全不同的意义,这个过程称作非词源化。她还指出,单音词的全部或部分义项丧失独立构句的性能,沦为不自由语素,产生了依附性,致使一批受语法支配的词组无法分开而凝结成词,文言单音词在现代汉语中的构词力总是大于它的同义口语单音词。

此后,不少青年学者从合成词成词的角度对语素的结合规律进行了研究,如肖晓晖(2003/2010)、符渝(2003)、丁喜霞(2006)、卜师霞(2007)等。他们的研究细致深入,揭示了不少语素复合成词的规律。如卜师霞(2007)认为,黏着语素的产生有两方面的原因:首先是汉语词汇系统在从离散、平行向有序、层级发展的过程中,一批自由语素变为黏着语素;另一个根源是汉语词汇系统中同义新要素的出现,以其在句法中强大的活动能力使得一批自由语素退出句法层而只在词法中存在。这类同义新要素的产生主要指历史同义词的进入,包括三种类型:第一类是原有单音词的双音化,使文言单音词和现代汉语双音词成为历史同义词,如告—告诉等;第二类是同义双音词进入词汇系统,如日—太阳等;第三类是同义单音词的产生,如视—看等。本书的研究思路与卜文的这些观点有不少相通之处,不过卜文只是简要地论及以上三类词汇演变现象,并没有展开详细论证。需要强调的是,肖晓晖(2003/2010)、符渝(2003)、卜师霞(2007)的研究都是建立在对先秦汉语和现代汉语直接对比的基础之上,没有详细考察古今词汇演变的历时过程,也未对语素化问题做深入探讨,而这正是本书重点研究的问题。