为了更好地贯彻落实《中华人民共和国国家通用语言文字法》,促进国家通用语言文字的规范化和标准化,适应新形势下现代语言生活和国家信息化发展的实际要,提供现代社会通用汉字的字量、字级和字形标准,教育部、国家语委组织研制了《通用规范汉字表》(以下简称《字表》)。
《字表》共收录规范汉字8105个,依据通用程度和通用范围划分为三级。其中一级字表3500字,是使用频度最高的常用字集,其作用相当于《现代汉语常用字表》,主要满足基础教育和文化普及层面的用字需要;二级字表3000字,与一级字表一起构成一般社会应用领域的通用字集,其作用相当于《现代汉语通用字表》,主要满足现代社会用字的一般需要。三级字表1605字,是姓氏人名、地名、科学技术术语和中小学语文教材文言文用字中未进入一、二级字表,但在特定领域中较为通用的字,主要照顾社会大众对专门领域用字的基本需求。
为明确规范汉字与相应的繁体字、异体字之间的对应关系,教育部、国家语委还组织研制了《规范字与繁体字、异体字对照表》(以下简称《对照表》),作为附表与《字表》配套使用。《对照表》列出了与2546个规范汉字相对应的繁体字和异体字,其中繁体字共计2574个,异体字共计1023个。
《对照表》对简繁对应关系的整理是以《简化字总表》为基础的,其总体精神与《简化字总表》保持一致,以不恢复繁体字为根本原则,重点对其中96组不能一一对应的简化字与繁体字进行了分解。如《简化字总表》中的“斗[鬥]”,表面上看好像是一一对应的,其实在繁体字印刷的文本中,简化字“斗”分别对应“斗”和“鬥”两个字。前者表示量器,音dǒu;后者表示争斗,音dòu。如果不加以分解,在简繁转换时就非常有可能将“斗”全部转换为“鬥”,这样就会出现诸如“北鬥星”之类的错误。《对照表》对简繁对应关系的整理,为古籍阅读和两岸三地交流提供了方便。
《对照表》对规范字与异体字之间对应关系的整理,是以《第一批异体字整理表》为基础的。鉴于异体字问题情况复杂,涉及问题众多,《对照表》没有扩大异体字的整理范围,而是把重点放在《第一批异体字整理表》原有异体字组的重新审订上。《字表》和《对照表》根据现代社会的实际用字需要,将一些仍然具有较大应用价值、与人们日常生活息息相关的“异体字”,恢复或部分恢复为规范字,以方便人们使用。如“氾”字在《第一批异体字整理表》中被作为“泛”的异体字废除,但“氾”原本是一个姓氏用字,该姓氏起源于周朝的氾国,具有十分悠久的历史。一个姓氏用字代表了一个家族的血脉,出于对家族传统的尊重,《字表》将这类汉字以姓氏用字的身份恢复到三级字表中。再如“喆”字,《第一批异体字整理表》视为“哲”的异体字,但经调查发现,由于“喆”字的构形中包含两个“吉”,看起来比较吉祥,全国有数万人的姓名选用了这个字。考虑到民众的这种用字需求和用字现实,《字表》把它收入了三级字表,专门作姓名用字使用。《字表》和《对照表》在《第一批异体字整理表》的基础上,将“挫、凋、噘”等26个字确认为规范字,将“仝、氾、喆”等45个字在特定意义上视为规范字,并在《字表》或《对照表》中的相应位置加注说明其使用范围。
在字形方面,《字表》所收的《印刷通用汉字字形表》和《现代汉语通用字表》之内的字,均按两表中的字形收录。两表之外的字,依据两表内部的字形规则作统一调整。
《字表》是在新型的汉字规范理念指导下,根据当代社会的用字状况和信息时代的需要,运用现代技术方法研制的,比之过去的汉字规范,该字表主要有以下特点:
新中国成立以来,国家十分重视语言文字工作,在汉字整理与规范方面做了很多工作,相继发布了多种字表,对社会用字起到了重要的规范作用。但由于这些规范各自独立,非常零散,用起来极为不便。如了解简化字与繁体字的对应关系,需要查1964年中国文字改革委员会编印的《简化字总表》(1986年国家语委经国务院批准重新发表时作了个别调整);了解规范字与异体字的对应关系,需要查1955年文化部和中国文字改革委员会联合发布的《第一批异体字整理表》;了解字形标准,需要查1965年中国文字改革委员会发布的《印刷通用汉字字形表》;了解字量标准,需要查1988年国家语委和国家新闻出版总署联合发布的《现代汉语常用字表》和《现代汉语通用字表》。此次研制《字表》,对这些相互独立的汉字规范进行了全面整合,用一个字表和一个附表覆盖了以前多种字表的功能,大大方便了大众的使用。
由于此前的几种汉字规范是在不同时期、针对不一样的情况、出于不同目的制定的,相互之间缺乏照应,难免出现相互矛盾之处。如“並”字,《第一批异体字整理表》作“并”的异体字处理,《印刷通用汉字字形表》又作为规范字收录。“颺”字,《第一批异体字整理表》作“扬”的异体字处理;《简化字总表》简化作“飏”,视为规范字。对这些不一致的地方,使用者往往无所适从。此次研制《字表》,对这样一些问题做了重点调整,给出了明确统一的规范标准,消除了原有分歧。
此前的规范标准发布最晚的距今也有20多年了,当时无论研制基础还是研制手段都无法与现在相比。如在语料基础方面,1988年发布的《现代汉语常用字表》和《现代汉语通用字表》,依据的是14个不带使用频度的静态字表和6个带有使用频度的动态字表,这些字表最多的有7754字,最少的只有1000来字,分布极不均衡;靠20个不同用途的字表进行二度统计所得出的字表,缺乏客观统一的选字标准,所得出的结果也必然带有一定的局限性。此次研制《字表》的时代背景已与过去大不相同,现代信息技术为大型语料库的建设和运用提供了科学的手段,而规模庞大、分布均衡的语料库则为汉字通行度的测查提供了可靠的依据。本次所采用的基础语料库为国家语委“现代汉语平衡语料库”,该语料库是在海量语料基础上随机抽样而成,全库约9100万字符,时间上覆盖了从现代白话文通行以来近一个世纪的语料,内容上覆盖了55个学科,语料来源非常全面。语料库的规模和多方面的平衡性,很好地保证了字频和覆盖率统计数据的可信度。再加上多个辅助语料库的运用,以及科学的统计方法和合理的人工干预,从而为《字表》的科学定量和选字提供了有力的保障。
以前的汉字规范是在文化教育大普及时代制定的,考虑较多的是普及层面对汉字的需求。如今,人们的文化知识结构日趋多样化,社会语言生活面貌日趋多元化。《字表》作为国家规范,将要面对的是全国各阶层的使用者,各阶层的文化水平不同,交际范围不同,行业需求不同,对汉字的使用上的要求也必然会有差异。《字表》最大限度地考虑到了这一点,根据通用程度和通用范围将所收的字划分为三级,体现了不同阶层和行业的需求差异,反映了现代汉字的实际使用状况,从而在很大程度上提高了《字表》的实用性。
三级字表的设立是《字表》的一大亮点。以往的汉字规范只限定在一般社会应用层面,但跟着社会的发展,社会用字量逐渐增多,一些特殊领域的用字与人们的日常生活越来越密切,成为现代信息储备和信息传递所必不可少的用字,不对这些汉字进行规范,就不足以满足民众日常生活的用字需求。这次制定《字表》,本着以人为本的原则,将与民众日常生活关系紧密的专门领域用字也纳入到汉字规范的范围。参照公安部、民政部、科技名词委员会等有关部门提供的资料,特别采集了常用的姓氏人名用字、乡以上地名用字、与民众生活有关的科技用字、教材印刷需要的文言用字,形成三级字表,从而在某些特定的程度上解决了身份证、户籍卡等姓氏人名用字问题,也满足了民众日常生活中对医药、营养等专门领域用字的需要。
此外,《字表》的研制得到了社会各界的普遍关注,各主要部门和领域都给予了全力支持和帮助,为数众多的专家学者直接或间接地参与了研制工作,广大民众也通过种种方式表达了个人的意见和建议,这种将规范标准研制全民化、社会化的做法,也是《字表》不同于以往的一大特色。(,男,北京师范大学文学院教授、博士生导师,教育部人文社会科学重点研究基地民俗典籍文字研究中心汉字研究室主任,教育部“新世纪优秀人才”入选者。)