打开“殷契文渊”网站,第一感觉是简洁,沉静。深蓝色背景上是醒目的搜索栏,支持使用者在三大数据库中搜索信息;搜索栏左边,排列着“殷契文渊”四个甲骨文字,右边则是一张缀合甲骨的图像,下方还有一行橙色小字:甲骨著录154种,甲骨图像239902种,甲骨论著34409种。
这是2019年上线的甲骨文大数据平台,面向全世界免费提供各类人工智能技术研究所用的专用公开数据集及各类信息资源整合服务,是国内甲骨文研究领域最重要的数字资源平台之一。它的作者,就是今年荣膺第28届“中国青年五四奖章集体”称号的安阳师范学院甲骨文传承研究创新团队。
安阳殷墟出土的甲骨文是迄今所见中国最早、体系完备的文字,记载着宝贵的历史信息。如果说殷墟是中华文明探源的起点和基石,甲骨文就是打开这座文明宝藏的钥匙。现存甲骨以碎片居多,又因年代久远、材质特殊,保存、缀合、展示多有不易。为了古老的甲骨文传承不辍,安阳师范学院甲骨文传承研究创新团队(以下简称“团队”)三代人接续深耕,坚守“冷门绝学”39年。
1985年,安阳师范学院依托考古优势,组建青年先锋队,专攻甲骨“绝学”。与中国社会科学院历史研究所合办殷商文化研究班,延请当时国内甲骨学研究的著名专家胡厚宣、李民、侯明儒等来校授课,逐渐积蓄起甲骨文研究的骨干力量。
安阳师范学院对于甲骨文数字化的探索源自2000年成立“甲骨文信息处理小组”,这也是甲骨文传承研究创新团队的前身。当年,刘永革自西北工业大学计算机软件专业毕业后,回到安阳师范学院工作。为了实现将甲骨文输入电脑,他与同事埋头钻研三年,终于开发出可视化输入法,做成了第一个甲骨文输入法软件,甲骨学与计算机科学的交叉研究就此开启。
殷墟已出土刻辞甲骨16万余片,近4500个单字,已释读的仅约三分之一。如何将庞杂零散的甲骨资料汇集起来,为研究者提供更多便利?打造一个线上数据库成为团队努力的方向。面对堆积如山的数据,团队攻坚克难,在中国社会科学院学部委员宋镇豪的指导下,历时四年打造出甲骨文大数据平台“殷契文渊”,破解了过去获取甲骨文研究资料难的瓶颈,用数智技术把甲骨文传承保护研究带入了智能化时代。
在甲骨文研究中,除了考释,缀合是另一个公认的重点和难题,依赖传统研究手段进展缓慢。近年来,科技飞速进步为甲骨文研究提供了新路径。“甲骨文很多都是碎片,必须拼对完整才有上下文,团队用信息技术进行甲骨文缀合,提高甲骨文缀合的效率。”已经是安阳师范学院甲骨文信息处理教育部重点实验室主任的刘永革介绍道。2021年,团队成员张展申报的项目《基于位置敏感网络的甲骨碎片多源图像拼接方法研究》,获批国家自然科学基金青年科学基金项目。该项目以“殷契文渊”数据为支撑,利用人工智能深度学习技术,研发甲骨文自动缀合系统并不断优化,在成千上万块甲骨碎片中搜索边缘、纹理、残辞匹配的目标,实现甲骨碎片的智能缀合。团队已经利用此技术缀合甲骨碎片78组,是目前国内计算机辅助的甲骨缀合最多的研究机构。
凭借多年技术积累,近几年,团队又完成了“微痕分析”和“甲骨三维建模”的新突破,成功研发“甲骨文全信息数据模型”。该模型包括三维模型、微痕增强图、微痕灰度图、数字摹本、数字拓片等,实现了甲骨实物在数字空间的高保真还原和保护。在数字云端的甲骨,动动手指就可以360度旋转、放大缩小;甚至能看清甲骨片上的文字刻写风格和笔画叠压关系、看清钻凿形态和卜兆裂纹及材质纹理等信息,最大限度地发掘甲骨文字里蕴含的历史价值。
如何让甲骨文走出象牙塔,走进大众生活,焕发新的生机?团队紧跟潮流,甲骨文表情包、甲骨文广播体操、“了不起的甲骨文”微信小程序……这些活泼有趣的点子被团队里的年轻人提出并实现。目前49人的团队中,35周岁以下的青年学者占比超过七成。为了储备更多年轻力量,团队依托河南省特色骨干学科群——“甲骨文信息处理”对本科生和研究生进行交叉学科培养,并出版相关教材。此外,团队向青年科技人员提供开放课题,鼓励更多年轻人加入甲骨文研究中来。“甲骨文陈列馆”也于2023年6月落成开放。
前不久,安阳师范学院甲骨文传承研究创新团队携手腾讯SSV数字文化实验室发布了更加强大的“殷契文渊”AI协同平台,显著提升甲骨文研究考释过程中的文字查找效率和准确性。平台还整合建立了覆盖143万甲骨文单字的庞大数据库,为研究者和爱好者提供了强大的文字智能搜索工具。同时发起的“数字甲骨共创计划”,寄托了所有团队成员的“甲骨文大数据回乡之愿”,助力流失海外散落各地的甲骨汇聚在殷墟故地的数字空间。
“新形势下,要确保甲骨文等古文字研究有人做、有传承。”谆谆嘱托,责任重大。安阳师范学院甲骨文传承研究创新团队继承了老一辈学人的家国情怀和优良学风,以建设国际甲骨文数据中心、促进文明交流互鉴为己任,在技术创新的征途上探索不停。我们相信,在殷墟故土,这份传承会更远,更长……