【大家谈·语言文字规范那些事儿】
编者按
生活中无处不在的数字,似乎可以“随意”使用。然而,对于汉字数字和阿拉伯数字这两种不同的数字表达形式,他们的表达功能、使用场合有何不同,在正式的中文出版物中,应该如何使用数字等问题,恐怕仍不被大多数人所熟知。本刊特邀《出版物上数字用法》课题组首席专家詹卫东教授及其团队,解读标准背后的规律和“故事”。
在现代社会生活中,需要用到数字的场合可谓比比皆是。身份证号、学号、银行账号、电话号码、邮政编码、书号……数字的具体应用恐怕多到无法列出一个完整的清单,但概括起来,数字的主要功能可以归纳为两个:计量和编号。
与其表达功能相对应,数字在中文文本中主要有两种表达形式:一种是中文固有的书写形式,即汉字数字形式,基本符号有“零、一、二、三、四、五、六、七、八、九、十、百、千、万、亿”等;另一种是自19世纪末20世纪初开始,伴随西学东渐和中国现代化进程,逐步在中文中推行开的阿拉伯数字形式,基本符号有“0、1、2、3、4、5、6、7、8、9”等。在实际使用中,阿拉伯数字还可以根据需要,使用小数点“.”、多位数分节符“,”、以及短线“-”和分隔符“∶”等辅助符号。用汉字书写的数字则不含其他辅助符号。
可见,数字的上述两种表达形式跟数字的主要表达功能之间是有大致对应关系的,即在强调精确计量和编号功能的场合,倾向于使用阿拉伯数字,而作为一般语词使用以及表达概数的场合,则倾向于使用汉字数字形式。
不过,这种分工并不是绝对的。一方面,汉字数字也有计量和编号的功能。在阿拉伯数字进入中国之前,中国人正是用自己的汉字数字书写形式来计数的,包括做计算和用数字来编号、排序。另一方面,阿拉伯数字在使用过程中,其表达功能也逐渐拓宽,从最开始的主要用于精确计量发展到各种编号功能,进而发展到跟汉字成分结合在一起来表达概数。这样,就造成了在一些场合二者可以换用的情形。也正是因为这个原因,才需要对两种数字书写形式进行适当的规范,尽可能将不同的表达形式跟不同的表达功能对应起来,实现汉字数字跟阿拉伯数字相对分工明确,各司其职的目标,从整体上提升中文文本传递信息的效率。
形式是为内容服务的,数字形式也不例外。在书面上选择数字书写形式时,总原则是根据数字的表达功能(或者说表达目的)来选择其书写形式。但正如上文指出的,数字的形式和功能之间尽管有大体的对应关系,但仍然存在交叉和可以换用的情况。因而,在具体落实根据表达功能来选择表达形式这一总原则的时候,要遵循四个更具体的原则。
1.编码效率原则
数字的主要功能是计量和编号。对于这两个功能来说,都要求信息传递的效率高。因而在用数字计量和编号的时候,需要用到的数字越多,就越应该使用阿拉伯数字书写形式。因为在表达同样的数值时,阿拉伯数字总是比汉字数字形式的编码简短。此外,从视觉效果上,因为编码简短,阿拉伯数字给人的整体感觉是结构紧凑。加之笔画线条简洁,不同于一般的汉字符号,文本中的阿拉伯数字总是能收到醒目之效,这也会节省辨识的时间,提高解读的效率。
2.尊重传统原则
汉字数字是中文书写系统中固有的符号,在中文文本中,其历史比阿拉伯数字要悠久得多。因而有许多表达场合,习惯上要使用汉字数字。特别是在不强调计量的时候,更是如此。使用汉字数字形式,可以让文本整体更好地保持中文文字系统的统一美感。在不影响信息传递效率的前提下,使用汉字数字书写形式,是对汉民族悠久历史文化的尊重和传承。
3.表意清晰原则
前两个原则是在宏观层面针对全体数字而言的。编码效率原则鼓励多使用阿拉伯数字形式。尊重传统原则鼓励多使用汉字数字形式。这里谈的表意清晰原则则是在微观层面,针对具体的数字形式而言的,一个数字形式在具体语境中出现的时候,总是要传递一定的表意信息。如果不同的数字形式在表意时清晰度有差别,则应该根据语境中实际表意的需要,选择表意更清晰、更准确的形式。
为了更好地说明这个原则,不妨看一个对比例子:“他在等晚1点的航班。”和“他在等晚一点的航班。”前一句用阿拉伯数字形式“1”,后一句用汉字数字形式“一”。很显然,前一句意思更清晰,后一句则有歧解的可能性。“1点”只能理解为“1点钟”的意思,指一个确定的时点。“一点”则既可以指“1点钟”这个确定的时点,也可以指“一小段时间”这个模糊时间长度量。如果要表达“晚上1点钟”这个确定时点的意思,从编码效率高和表意清晰两个原则的要求来说,就应该选择用阿拉伯数字形式。如果选择用汉字数字形式,那么,为了提高表意的清晰度,就要增加字符,也就是加长编码(损失编码效率),来换取表意的清晰,比如上面两句可以分别写成:“他在等晚上一点的航班”和“他在等更晚一点的航班”。这样的表达形式,就完全满足“表意清晰原则”的要求了。
4.系统一致原则
系统一致原则,也可称为“同类别同形式”原则。这个原则主要是针对阿拉伯数字和汉字数字两种形式均可使用的情况,是兼顾宏观层面和微观层面提出的。无论是从中文文本整体的美观来说,还是从文本中每个具体表达形式的效率以及准确性来说,保持一个文本内部数字使用的一致性这个原则都是一个正向的推动力。反之,内部形式上的不一致,则不仅会增加阅读的负担,甚至还有可能造成表达不准确、不清楚的问题。
比如在提到年份的时候,行文中应该使用完整的数字表达形式,如“1978年”或“一九七八年”,都指向的是公元纪年中的同一个年份。在同一篇文章中,应该根据表达的需要,选择其中一种形式,而不应该两种形式随意换用。再比如在表达具体的日期时,更不应该出现汉字数字形式和阿拉伯数字形式混用的情况,比如“一九七八年10月1日”,就是违反系统一致性原则的情形。遵循系统一致性原则的写法应该是“一九七八年十月一日”或“1978年10月1日”。
概括而言,上述四个原则实际上回答了在有竞争的情况下,如何选择优先的书写形式的问题。四条原则的含义分别可简要表述为:编码短的书写形式优先,历史悠久的书写形式优先,无歧义的书写形式优先,无矛盾的书写形式优先。
显然,上述四个原则各有自己的倾向:编码效率原则会突出阿拉伯数字的功用,尊重传统原则会突出汉字数字的功用,表达清晰原则会对前两条规则进行约束,无论是阿拉伯数字,还是汉字数字,其具体的使用形式,都应该追求清晰、准确的表达效果。系统一致原则将更多的选择主动权交给文本的作者,即由作者来决定文本中哪些数字是同类的表达功能,那么这些数字就应该选用相同的表达形式,不能随意换用不同的表达形式。
在具体实践中,可能出现不同原则之间的冲突。如果发生这种情况,应该有更基本的“元规则”来决定如何处理冲突。这个元规则就是:应该选用适用原则多的那种数字形式,而不应该选用明显违反某个原则的那种数字形式。此外,上述原则也可以帮助我们更好的理解,两种数字表达形式有时候并不是非此即彼的关系,也可能是任选其一都合乎规范的要求。
(作者:詹卫东,系北京大学中文系教授)