【论文主题词】 现代汉语语法;比较;解读
【论文摘要】 文言文,是古人用书面用语写成的文章。本文主要从现代汉语的句法和词法两个方面探讨了如何轻松、快速和准确地解读文言文。
文言文,是古人用书面用语写成的文章。运用现代汉语的语法知识,不仅可以清晰地透视文言文语法现象,快速准确地解读文言文,而且对初次大量接触文言文的初一、高一学生来说,运用这些方法可以更加轻松有效地学懂文言文,从而很好地传承祖国的文化遗产。
一、运用现代汉语句法知识,进行古今句式比较,正确理解句意
现代汉语中常式句一般表达形式为:
(状语)定语+主语+(状语)谓语+(定语)宾语(补语)
我们可以把现代汉语的常式句作为“标准句式”拿来与文言文的句式进行比较,可以很容易地发现古今句式的不同之处。从而识别文言文的特殊句式,正确理解和翻译文言语句。
下面以文言文“倒装句”为例来谈谈这一方法在教学中的运用。
文言文的倒装句,也叫“变式句”,就是句子的表达形式不同于现代汉语“常式句”的句子。
1、“大哉,尧之为君也!”此句中“尧之为君也”是个主谓短语,意思为“尧作为君主”。“尧作为君主”怎样呢?没有表达一个完整的意思,需要进一步陈述,说明,形容。而“大”是形容词,意为“伟大”,是要陈述,说明,形容某个对象的。这样“尧之为君”与“大”构成主谓关系,但句子形式是先谓语后主语,不符合我们现代汉语通常的表达习惯,明显属于主谓倒装。说话人为了强调谓语,把谓语前置了。学生有了这样的认识,在理解翻译时只需把主谓关系理顺即可。
2、“蚓无爪牙之利,筋骨之强”。让学生划分此句的句子成分可以发现:蚓(主语)+无(谓语)+爪牙(宾语)。主谓宾完整,“利”似乎多出来了。但依据词类知识,“利”是形容词,意思为“锋利”,在句中应作定语或谓语,“什么锋利呢?”,在句中该词语修饰的对象只能是“蚓”或“爪牙”,而“锋利的蚓(蚯蚓)”是讲不通的,只能修饰“爪牙”。因此,“利”是“爪牙”的定语,应该在“爪牙”的前面。该句是把定语后置了,这是个定语后置句。翻译时,学生只需把定语提放到中心语前面即可。
3、“青取之于蓝,而青于蓝”、“李氏子蟠,……不拘于时,学于余”、“形似酒撙,饰以山龟鸟兽之形”。以上三句中“于蓝”、“于余”、“以山龟鸟兽之形”都是“于(以)+名词”构成的介宾短语(介词结构),均置于谓语动词的后面。用现代汉语的句法知识分析,它们处于谓语后面,既不能作宾语(介宾短语不能作宾语),也不能作补语,而现代汉语中介宾短语一般作状语。实际上,三个介宾短语都修饰句中谓语作状语,分别表示比较、对象、方式,属状语后置。翻译时,学生只要把介宾短语提前,放置于谓语动词前即可。
4、①“沛公安在”;②“一言以蔽之”;③“古之人不余欺也”④“何陋之有”。以上所列四类句式是文言文中宾语前置的四种形式。不管哪一种形式的宾语前置,都可以用现代汉语的句法知识加以辨析。如“沛公安在”一句中“沛公”为名词,是句子的陈述对象。“安”是疑问代词,相当于“哪里”,“在”为介词,表示处所。该句本来要表达的意思是“沛公在哪里?”。在让学生认识这一语言现象时,我们可以举出一个相类的现代汉语常式句,如“你在哪里?”与“沛公安在”进行比较:“在哪里”与“安在”的意思一样,但前者是“介词+宾语(疑问代词)”,后者是“宾语(疑问代词)+介词”,显然后者把“宾语”前置了。同样“古之人不余欺也”一句中,构成该句的每个词的意思和现代汉语的意思一样,学生容易理解。但学生对“古代的人不我欺”这种说话的方式却大为疑惑,古人为什么要这样说话呢?教者可举一相类句式进行句法分析,如“他不欺我”,“他”是主语,“欺”是谓语,“我”是宾语。两相比较,学生会很容易发现“不我欺”是把宾语“我”放在了谓语动词前面,是宾语前置。这是古人语言表达的习惯之一,是为了强调宾语。可见,利用现代汉语语法知识认识文言文的特殊句式,从而正确理解句意,快速翻译句子,是一种既简便又实用的方法。
二、把现代汉语的词法与句法知识相结合,快速解读句子,全面理解文意
以苏轼《石钟山记》一文第一段为例。
《水经》云:“彭蠡之口有石钟山焉。”郦元以为下临深潭,微风鼓浪,水石相搏,声如洪钟。是说也,人常疑之。今以钟磬置水中,虽大风浪不能鸣也,而况石乎!至唐李渤始访其遗踪,得双石于潭上,扣而聆之,南声函胡,北音清越,桴止响腾,余韵徐歇,自以为得之矣。然是说也,余尤疑之。石之铿然有声者,所在皆是也,而此独以钟名,何哉?
理解这段文字时,教者可让学生有意识地与现代汉语进行比较,并用现代汉语语法知识加以分析。这段文字绝大部分实词含义和用法与现代汉语一致,只有“鼓”、“是”、“鸣”、“名”用法比较特殊。我们可以用词法知识进行分析。“鼓”现代是名词,而在“微风鼓浪”一句中,“鼓”处在主语和谓语之间,由名词活用为动词,陈述“微风”,支配宾语“浪”,意为“鼓动”。“是”现代是判断词,而在“是说也,人常疑之”一句中,“是说”是偏正短语,是“之”指代的对象,作“疑”的宾语,“是说”应是名词性偏正短语,“是”是代词,限制“说”,意思是“这个”。“鸣”是动词,“虽大风浪不能鸣也”一句中,“鸣”后省略代词“之”。补充完整后的句子应是“虽大风浪不能鸣之(钟磬)也”。按照现代汉语句子成分分析法提取该句主干为:浪鸣之。可以看出主语“浪”和宾语“之”之间产生了“主语使宾语怎样”的意味,据此可以判断“鸣”为动词的使动用法,可理解为“使……鸣”。“名”,现代是名词,在“而此独以钟名”一句中,用句子成分分析法可以看出:“名”处在谓语位置,作谓语。但依据现代汉语的词类知识名词一般不作谓语,由此可推断“名”是名词活用为动词,作谓语,意为“命名”。
同样,用句法知识比较分析这段文字,可以看出,大多数文言句式与现代汉语一致。而“得双石于潭上”、“石之铿然有声者,所在皆是也”两句的表达习惯就与现代汉语不一样。为了让学生清楚地认识古汉语的特殊句式,教者可用现代汉语的句法知识加以分析。“得双石于潭上”这个句子的主语是“李渤”,承前句省略,谓语是“得”,宾语是“双石”,这三个词按现代汉语常式句表达习惯组成一句话就是:“李渤得双石”。而原句中“于潭上”是个介宾短语,现代汉语中介宾短语一般作状语修饰谓语。据此,“于潭上”应作“李渤得双石”这个句子的状语,这样,该句的完整表达应是“李渤于潭上得双石”,把这个句子与“得双石于潭上”比较,学生自然可以发现原文句子介宾短语后置了,从而掌握状语后置句式。“石之铿然有声者,所在皆是也”一句中,“所在皆是也”意为“到处都是这样”,这是个缺少主语的句子,表达完整应该是:“(什么)到处都是这样”。“什么”是该句陈述说明的对象,这个对象就是“石”,“石”后“铿然有声”似乎与“石”构成主谓关系,但这样一来,原句就成为两个句子,这两个句子形成并列关系,表达两层意思,即:“石(头)铿然有声”、“石(头)所在皆是”,这显然不符合作者本来要表达的意思。那么“铿然有声”是不是作状语呢?用句法知识分析可以看出,“铿然有声”是动词性状谓短语,一般作谓语。据此,“铿然有声”只有作“石”的定语,意为“铿锵作响的石头”,是一个名词性偏正短语,正好与后面的“所在皆是”构成主谓关系。这样,学生就可以认识古汉语的定语后置句式。
论文摘要:用计算机来处理汉语信息包括“字处理”、“词处理”和“句处理”三个阶段。“句处理”是实现自然语言的处理与理解这一关键性的技术难关。其中遇到的问题比较多:词性的判断;短语、句子的结构分析;歧义现象分析等等,最根本的方法是语言学家尽可能地把语言中的这些现象通过归纳、分析、总结出规律,再用形式化的方式描述出来,以便利于计算机处理。 论文
关键词:中文信息处理 现代汉语语法 句处理
用计算机来处理汉语信息,就是汉语信息处理,又称中文信息处理。中文信息处理包括“字处理”、“词处理”和“句处理”。“字处理”、“词处理”分别与汉字和词汇有关,在此主要谈谈“句处理”。
句处理的主要内容是,怎样使计算机理解自然语言(如现代汉语)的句子的意思,又怎样使计算机生成符合自然语言规则的句子。“句处理”所需要的语言知识,将是一种涉及到语音、语义、语法、语用等诸方面的综合性知识。目前。大家都深感现有的关于汉语的知识远远不能满足中文句处理的需要。单就句法方面的情况说。在中文信息处理过程中将会不断遇到我们想象不到的问题,许多问题在人看来还是比较容易解决的,但计算机就解决不了。也有一些问题,本身在学术界就有不同的观点,那么,就给中文信息处理增加了更大的困难。
用计算机来处理中文信息,遇到了很多困难,从现代汉语语法的角度来看,主要有以下一些问题:
一、词性的判断
由于汉语缺乏形态。汉语的词性判断主要是根据词的语法功能,不同的词,词性意义可能不同,同一个词出现在不同的地方,词性意义也可能不同,汉语中,大多数词有固定的词性,但有些词的用法比较特殊。例如:
1。他花了十块钱买了一盆花。
2。你用那个锁把门锁上。
3。他比雷锋还雷锋。
这三个句子中分别有两个“花”、“锁”、“雷锋”。但它们只是音同、形同,词性和意义都不同。句子1中的第一个“花”是动词,“花费”的意思,第二个“花”是名词,“植物”的意思。句子2中的第一个“锁”是名词,即“锁子”的意思,第二个“锁”是动词,是“锁住”的意思。句子3中第一个“雷锋”是名词,表示人名,第二个“雷锋”是形容词,表示“雷锋的精神、品质等”。具有一定语言知识的人大体上都能分清它们的区别。从传统语言教学的角度来讲,句子1中的两个“花”是词形、读音相同,但词性和意思都不一样,且两个“花”的意思之间没有联系,所以属于同音词。句子2中的两个“锁”,也是词形、读音相同,词性和意思都不一样,但两个“锁”意思间有联系,所以属于兼类词。句子3中的两个“雷锋”词形、读音相同,词性和意思都不一样,意思也有联系,但第二个“雷锋”属于词类活用。Ⅲ从教学的角度看,这种分类比较细致,便于人们的理解和掌握,但是,从中文信息处理的角度来看,这种分法太细,不便于计算机掌握。
目前,在中文信息处理中,是这样来定义兼类词的:亢世勇认为“兼类词有广义兼类词和狭义兼类词。广义兼类词就是中文信息处理中所说的现代汉语的同形词,对于计算机而言,只要词形相同,不管读音是否相同、意义是否相通,是同形异音词、同形同音词,还是一词多义、一词多种用法,都是相同的,都要从多个当中选一个。狭义的兼类词就是指一般的现代汉语着作定义的,‘同形同音、意义上有一定的联系,且具有两类或两类以上词的语法功能的词”’。陆俭明认为,兼类词是“指同字形、同音而意义不同或词性不同的词”。如果按这种定义理解,以上三个句子中的两个“花”、“锁”、“雷锋”都可以称之为兼类词。因为,中文信息处理的目的是让计算机能根据具体环境判断出词的词性,从而准确理解其中的含义就可以了。尽管如此,但是,汉语词类是多功能的,一类词不需要发生词形变化就可以充当不同的句子成分,不同类的词可以充当相同的句子成分,这样就给兼类词区分带来了更多的麻烦。因而,兼类词的选择是计算机词性自动标注的一个“瓶颈”。尽管信息处理专家运用了规则排歧、统计概率排歧或者两者结合起来等多种方法进行排歧,但到目前为止,还没有一种方法、一种系统能够彻底解决这个问题。
二、短语、句子的结构分析
由于汉语缺乏形态。所以。语序和虚词成了汉语中表示语法的主要手段。有些短语、句子的结构不好理解,需要形式和意义结合起来分析。例如:
A组:a。陕西+甘肃+宁夏 (“陕西+甘肃+宁夏”三者为联合关系)
b。中国+(北京+陕西)(“中国”与“北京陕西”是偏正关系。“北京”与“陕西”是联合关系)
C。中国(陕西(西安))(“中国”与“陕西西安”是偏正关系,“陕西”与“西安”也是偏正关系)这一组中的abe三个短语对人来说,都很容易分清楚,但计算机目前还很难区分,要让计算机分辨清楚,就得把三个处所名词组合在一起构成a类、b类、e类不同关系的条件与规则研究清楚,并将这些条件与规则加以形式化输入到计算机内。
B组:开始讨论(述宾关系)分析研究(联合关系)研究结束(主谓关系)
取下来(述补关系) 看完再说(连谓关系) 叫他回来(兼语关系)
生产管理(定中关系) 讽刺说(状中关系) 介绍写(不构成合法的句法关系)
这组是现代汉语里“动词性词语+动词性词语”构成的种种不同的结构关系,对人来说,通过讲解大致可以分辨,可是让计算机要分清楚,就非常难,因为我们至今还没有总结出“动词性词语+动词性词语”构成各种不同句法关系的具体规则。换句话说,“动词性词语+动词性词语”在什么条件下一定构成合法的什么句法关系,能构成什么样不同的句法关系,我们至今还说不清楚。
C组:天气好——好天气(主谓——偏正)很好——好得很(偏正——述补)
来人了。——人来了。(述宾——主谓)
一张票三元钱。——三元钱一张票。(主谓——主谓)这一组都是由于语序的不同而形成的结构和意义都不同的短语和句子。这些结构对人而言,稍加学习就可以理解,但这些给计算机理解意思增加了难度。需要人们把这些语序的`变化形成的不同的结构概括出规律来,再用形式化的方式描述出来。输入到计算机里。
三、歧义现象
现代汉语短语结构的歧义是进行汉语句法分析的一大障碍。“句处理”要解决的核心问题是排歧问题,计算机面对的歧义,不只是我们人所能感觉到的诸如下面这样一些句子的歧义现象:
(1)他正在输血。(他正给病人输血。/他病了,正输血。)
(2)看望的是病人。(你看望的那个人是病人。/看望你的那个人是病人。)
(3)我们急需进口产品。(我们急需进口的产品。/我们急需从国外进口产品。)
某些在人看来不存在歧义的句子计算机会认为有歧义。例如:
(4)a他被警察叫去罚了一百块钱。
b他被警察叫去写了一份检查。例(4)a句和b句,在人的眼里结构是不一样的。a句“被警察”这个介词结构一直管到底。全句意思是“他被警察叫去,他被警察罚了一百块钱”:而b句“被警察”这个介词结构只 管到“叫去”,管不着“写了一份检查”。可是,计算机分辨不清楚。要让计算机分辨清楚,我们就得将“PP+VPI+VP2”(PP代表介词结构,VP1和VP2分别代表紧挨着的不同的动词性词语)这种结构中的PP对后面动词性词语管辖的范围及其条件与规则进行充分、准确的描写,并加以形式化,“交给”计算机。而这一类现象与规则我们过去根本就没有考虑过,更不用说研究了。
其实以上所举的例子都存在歧义问题,因此,也可以这么说,“句处理”要解决的核心问题是排歧问题。
中文信息“句处理”的研究工作,上个世纪80年代就开始了,最早进行“句处理”研究工作就是基于规则展开的,但上个世纪90年代初,基于规则的“句处理”研究工作遇到了重重困难与难关,主要是语言学家所提供的语言规则远远不能满足信息处理的需要。目前,为了解决好中文信息处理中的“句处理”难题,出现了一个竞相研究、竞相发展的局面。对于句处理,提出的各种策略和途径,归纳起来。主要有基于规则和基于统计这两种策略。基于规则的研究者,一般求诸专家的理性知识,由人来对语言知识进行抽象:基于统计者,一般求助于计算机对大规模语料库真实文本的统计分析,由计算机来抽象出语言知识。各种策略和途径,目前,我们还很难说哪一种是唯一正确的。各种策略和途径,表面看不同,其实,最终都需要依赖可靠的汉语知识来驱动计算机正确处理自然语言(汉语)。因此,“无论是比较传统的基于规则的处理策略,还是90年代以来方兴未艾的基于统计的方法,在对语言知识的需求这一点上实际上都是共同的。所不同者,走规则路线的研究者一般求诸专家的理性知识,由人来对语言知识进行抽象(比如以带有合一条件的规则形式给出)。而走统计路线的研究者一般求助于计算机对大规模的语料库的统计分析,由计算机来抽象出语言知识(比如以一定的数据结构记录的统计结果等)。两种路线孰优孰劣,不能笼统判断,只能跟具体的应用目标结合起来,由实践结果来评价。”目前,越来越多的学者提倡把两种方法结合起来使用。因此,相信在不久的将来,我们会攻克难关,实现计算机对自然语言的处理与理解的目标,使中文信息处理技术处于世界领先地位。
参考文献:
1、兰宾汉、邢向东:现代汉语(下册)[M].北京:中华书局,2007,48.
2、亢世勇:面向信息处理的现代汉语语法研究[M].上海:上海辞书出版社,2004,177.
3、陆俭明:现代汉语语法研究教程(第三版),[M].北京:北京大学出版社。2005年,51.
4、詹卫东:面向中文信息处理的现代汉语短语结构规则研究[M].北京:清华大学出版社,2000,2.