论文关键词 语文词典 收词 质的标准 量的依据
论文摘要 文章从词与短语、新词与旧词、语文词与百科词、语言义与言语义四个方面讨论汉语语文词典的收词问题,认为语文词典收词应该把质的标准和量的依据结合起来,既要做到收词标准明确,执行标准严格,标准具有可操作性,又要兼顾词条的总量控制以及量的平衡和量的统计、力避收词增义的主观随意性。
2005年3月至6月,笔者有机会参加了《现代汉语规范词典》(李行健主编,外语教学与研究出版社、语文出版社,2004。以下简称《规范》)的审订修改工作,负责t、w两个字母的全部词条。在审阅过程中产生了一些想法。在查阅《现代汉语词典》(商务印书馆,2005。以下简称《现汉》)的过程中,也有一些感触。下面即以这两部词典为据,讨论语文词典收词的若干问题。
一、词与短语
词典,顾名思义,应当只收词和功能与词相当的固定短语。但由于受语文辞书收词立目传统习惯的影响,目前汉语语文辞书往往字、词典功能不明,词典往往兼具字典的功能。笔者曾主张区分两者功能,让它们各司其职。
无论词典以什么样的单位立目,词无疑是诃典的主体。因此,对词的确定乃是关键。《规范》和《现汉》都不同程度地存在收词标准不严、失之过宽的情况,《规范》尤甚,主要表现为收了不少短语或叫“短语词”。例如,“挨(áī)”字头下,《规范》收录“挨板子、挨呲儿、挨打、挨刀、挨斗、挨黑枪、挨闷棍、挨蒙、挨批、挨日子、挨时间、挨宰、挨整、挨揍”14条,《现汉》收录“挨板子、挨批、挨宰、挨整”4条。WwW.133229.cOm《规范》14条注有引申义或比喻义的有“挨板子、挨打、挨刀、挨黑枪、挨闷棍”5条,《现汉》4条注有比喻义的有“挨板子、挨宰”2条。下面是两词典对以上没有转义的词的释义:
挨眦儿 <口>受批评;受训斥。(《规范》)
挨斗 遭受批判斗争。(《规范》)
挨蒙 遭受欺骗。(《规范》)
挨批 遭受批评或批判。(《规范》)
挨批 受到批评或批判。(《现汉》)
挨日子 艰难痛苦地度时日。(《规范》)
按时间 无所事事,苦等时间过去。(《规范》)
挨整 遭受打击迫害。(《规范》)
挨整 受到打击迫害。(《现汉》)挨揍挨打。(《规范》)
“挨(áī)”,两词典都收录“遭受;忍受”、“困难地度过(岁月)”、“拖延”三个义项。《规范》对语素和词都标注词性,《现汉》只有词才标注词性,因此,《现汉》标注词性的单位可以认为是词。根据《现汉》的词性标注和举例,“挨(áī)”的三个义项都可以独立成词,“呲儿”(申斥;斥责)、“斗”(斗争)、“蒙”(欺骗)、“批”(批判;批评)、“日子”、“时间”、“整”(使吃苦头)、“揍”(打)都可以独立成词,两部词典都有解释。也就是说,整体意义等于成分意义的加合,而且每个成分都可以独立成词。因此没有理由作为词收录。如果这样收词的话,“挨鞭子、挨棍子、挨冻、挨饿、挨骂、挨训”都可以收,那么词典就会变得臃肿不堪。
即使注有转义的几条也有商榷的余地。比如“挨打”,《规范》的解释是“遭受殴打;比喻遭受批评或处罚”。《现汉》未收。这个比喻义到底是否凝固成了词义?再如“挨宰”,两部词典都收了“宰”的比喻义“比喻向买东西或接受服务的人索取高价”,都注了动词,那么“挨宰”就可以通过成分义相加得出。因此,“挨宰”是不是词也要打个问号。
还有,《规范》收了“鹅蛋”、“鸭蛋”(认为有转义,如“今天考数学,吃了个鸭蛋”),不收“鸡蛋、鸟蛋、龟蛋”;收了“岸边”,不收“河边、水边、地边、路边”;收了“猜着、猜中”,不收“猜对、猜透”。《现汉》均不收。
这里涉及汉语中词和短语的划界这个老大难问题。关于汉语词的确定,笔者曾有论述,此处不赘。词典应从严掌握收词标准。王同亿所编词典受到批评,收词不严是很重要的一个原因。我们认为,如果一个片段同时符合以下条件,就不宜收作词条:(1)各成分都可以独立成词;(2)组合义等于成分义的加合,没有引申、比喻等整体义;(3)各成分的意义词典都有解释。
二、新词与旧词
毫无疑问,词典应该及时增补反映社会变化的新词和新义。例如,《现汉》收录了“欧元”,《规范》收录了“欧共体、欧盟、欧元”,笔者认为有增补的必要。再如,在“垃圾”条下,《现汉》增补了“比喻失去价值的或有不良作用的事物”的义项,举了“垃圾邮件、清除社会垃圾”的例子。《规范》也增补了类似的比喻义。这种增补就很有必要。但增补的词条却有商榷的余地。《规范》收了“垃圾电站、垃圾股、垃圾邮件、垃圾债券”4条,《现汉》只收“垃圾股、垃圾邮件”2条。《现汉》和《规范》都收了“水电站”,即“利崩水力发电的设施”,与此相类,“垃圾电站”是“利用垃圾发电的设施”,而不是“废弃无用的电站”的意思,照顾到系统性,可收。但“垃圾股、垃圾邮件、垃圾债券”中的“垃圾”用的都是比喻义,“像垃圾一样的东西”的意思,两部词典都有解释,而不是整个词语有比喻义,我们认为没有必要增补。我们用百度搜索引擎搜索浏览了一下网页,就发现有“垃圾短信、垃圾网页、垃圾文件、垃圾食品”等许多说法,为什么这些词语不收?新词和新义随时都会出现,哪些该收,哪些不收,应该有个标准。笔者认为,对拟收新词,一要看是不是符合上面讲的收词标准,二要考虑使用度(通用面+使用频率),应以语料统计数据作支撑。不能看“新”就收,以避免滥收。
跟新词相对的是旧词。旧词是产生时间较长的词。根据在现代语文生活中的使用频率,大致可以分为三类:一是仍在频繁使用的词,如“人、我、看、大、很”等这些基本词,可称为“传承词”。二是只在一些语体或特殊场合里使用的词,又分为文言词和历史词。文言词如“兹、此、故(因此)、其、之”等,形成庄重、典雅的风格;历史词如“朕、太监、妃子”等,在描述历史事件时要用到。三是现代已经不再使用的词,如“印(我)、汝(你)”,可称为“古语词”。
对前两类,现代汉语词典收录一些常用的是必要的。对第三类,我们认为没有必要收录。因为我们编纂的是“现代汉语”词典,应立足于现代汉语这个共时平面。但《规范》《现汉》都不约而同地收了“印”等古语词。究其原因,可能有两个方面:一是编者可能觉得工具书应满足查考的需要,为方便读者,酌收一些古语词。二是由长期以来字典、词典不分的传统造成的。如果不收这些古语词,有些字在词典里就没有了,如“印”便是。词典编纂者内心里还是觉得多收些字为好。笔者认为,这两点考虑都是没有必要的。不同词典的功能不同,要查这些字(或词),找古汉语字典(或词典)便是。一旦收了这些词,就会引发其他问题,比如哪些该收,哪些不收,用何标准。比如收了“印(我)”,同属于上古第一人称代词的“我、吾、余、予、朕、台”都得收录并给予解释,但《现汉》和《规范》对“台”的第一人称代词用法都没有解释。如果都一一交代,则又侵吞了古汉语词典的领地。这在理论上和实践上都是不可取的。另外,在《现汉》中出现“而今安在”这样的例句,就像在现代社会里突然见到一个古人一样别扭。
因此,编纂现代汉语词典,还需要站稳“现代”脚跟,在现代口语和书面语里都不用的词不应该收录。
三、语文词与百科词