2011年3月16日上午,我校申报的“国家‘十一五’时期文化发展规划纲要”重大项目——“中华字库工程·明清图书用字搜集与整理之三•文字整理与考释”合同草签仪式在北京稻香湖景酒店举行,新闻出版总署委托的专家组组长田胜立教授与项目负责人杨宝忠教授代表甲乙双方在项目合同书上签字,项目经费为1803.08万元。
中华字库工程是引领中华文化步入信息化、数字化时代的先导性、奠基性工程,是列入《国家“十一五”时期文化发展规划纲要》(中办发[2006]24号文件)的重大建设项目。《纲要》确定,中华字库工程要“建立全部汉字及少数民族文字的编码和主要字体字符库。重点研发汉字的编码体系、输入、输出、存储、传输以及兼容等关键技术”。
国家《文化产业振兴规划》(国务院常务会议讨论并原则通过)在提到“实施重大项目带动战略,以文化企业为主体,加大政策扶持力度,充分调动社会各方面的力量,加快建设一批具有重大示范效应和产业拉动作用的重大文化产业项目”时,特别指出,要推进中华字库工程等重大文化建设项目。
中华字库工程要在文字学深入研究的基础上,探讨各种文字收集、筛选、整理、比对和认同的方法与原则;充分利用先进的数字化技术,开发相应的软件工具,在统一的数字化平台上,探索人-机结合的文字收集、整理、筛选、比对和认同的操作与管理流程。从数千年流传下来的文字载体中,将尽可能搜集到的古今汉字形体和古今少数民族文字形体汇聚起来,在各种实际文本原形图像的基础上,确定规范形体,标注各类属性,有序地分层级排列,建立字际间的相互联系,并按照出版及网络数字化需求,建立汉字及少数民族文字的编码和主要字体字符库。完成后的“中华字库”,预计可编码字符数在50万左右(汉字古文字约10万、楷书汉字约30万、各少数民族文字约10万),力争达到能对我国所有的出土、传世文献和当代文字作品进行数字化处理,全面打通信息化的发展瓶颈,满足中华各民族古今各类文献的出版印刷、数字化处理和传输的需要,满足国家信息服务与监管的用字需求,满足两岸四地间信息的互联互通的需求,使中华各民族文字的使用,中华文明的普及与传播,更加方便和高效。
中华字库工程共分为27个项目,我校申报的是其中第15个项目——“明清图书用字搜集与整理之三?文字整理与考释”。明清时代的图书是传世古代典籍中数量最大的部分,许多图书在长期流传过程中还出现了不同的版本。由于这一部分内容太多、工作量太大,分为第13、14、15三个平行但相互衔接的项目。其中第13包“明清图书用字搜集与整理之一?底本选择与图像制作”,负责明清图书底本选择与图像制作;第14包“明清图书用字搜集与整理之二·文字采集与校对”,负责对第13包选定的明清图书进行文字的采集和校对;第15包“明清图书用字搜集与整理之三·文字整理与考释”,负责对第14包采集到的明清图书所见已有超大字符集之外的汉字(约100万字)进行辨识、考释与整理。通过科学的辨识、考释与整理,研制《明清图书用字待收字总表》和《明清图书用字待收字属性数据库》,提交工程总体组整合、集成。本项目是“中华字库”工程主体部分——楷书汉字集成的主要研发任务之一,其特色是学术性强、难度高、工作量大。
该项目的成功申报,对我校汉语言文字学学科和文学院的发展具有十分明显的推动作用;对扩大我校在全国的影响、提升我校在全国社科领域的地位,也将产生一定的积极意义。
该项目研究将于今年7月正式启动,2015年6月完成。