在古代,人们是怎么计数的?
是不是像我们一样,拿根树枝在地上划拉,一、二、三?
你别说,还真是。请看⬇️
3000多年前,我们的老祖宗就用石头等趁手的家伙,在甲骨片上刻「一、二、三」,用来记录当时发生的事情。
再考考大家:以下甲骨文分别代表什么天气?(此处无抽奖,但文末会有)
(答案是:下雨下雪下冰雹)
甲骨文,是目前已知人类最古老的文字之一,也是汉字的起源。研究甲骨文,我们可以发现很多有趣的事情,比如:
有的,记录了耳朵鸣响就得去算一卦的心理活动⬇️
(跟当代打工人心情一致了)
有的,记录了一起因前车刹车不及时导致后车追尾的车祸⬇️
(此处呼叫交警叔叔)
有的,则记录了一场神奇的流星雨⬇️
(「星率西」,意思是所有星星都向西移动)
......
这些甲骨文,是3000多年的古人,凭着观察和想象力,把生活中的所见所闻,变成一个个表意字符,刻在龟甲和兽骨上。
对我们研究中国文明、乃至人类历史,都有重要的意义。
这个研究的过程,会遇到一个极大的阻碍,那就是——「不认字」。
比如这些⬇️
2016年,中国文字博物馆曾面向社会发出的「悬赏令」,破译一个甲骨文奖励10万元。在2023年之前,仅有一位研究学者拿到了这笔奖金。可见,破译甲骨文并不容易。
时至今日,已有近16万片甲骨、4500多个甲骨字被发现,但能被正确考释出来的文字,只有1500个字。
主要原因是:很多甲骨模糊不清、相似字形难分辨、人工翻找效率低等,实在是有亿点点难。
我们的AI技术能不能帮上忙?
2022年开始,我们和社科院、安阳甲骨文信息处理实验室、安阳文物局及殷墟、中国文字博物馆等多个部门合作,希望用腾讯的人工智能和数字化能力,帮助「看清」甲骨文。
2年过去,想和大家分享一下我们的成果:
通过我们的AI微痕增强技术,用显微摄像技术加上微痕成像工具,能把多张不同角度的微痕图像进行合并,得到一张更全面、更清晰的图像。
它能让甲骨文变「超高清」,看清起笔收笔、人为痕迹,甚至是背面钻凿形态等。
现在,我们已完成了100多个甲骨文高保真全信息模型的处理。
我们还一起建了一个覆盖143万字的全球最大甲骨文单字数据库,利用数字化能力,把相似字形、甲骨等做匹配、关联等。
比如输入一个牛,就能找到3504个相似字形和对应甲骨。
这样或许能根据相似语义的推理,加速破译甲骨字。
近期,这个数据库已正式开源。此外,我们还开源了首个甲骨文多模态数据集(含有1万片甲骨的拓片、摹本,甲骨单字对应位置、对应字头等数据)。
我们希望「共享」给所有研究者和爱好者,他们可基于该数据集研发甲骨文检测、识别、字形匹配和释读等算法,一起加速甲骨文被考释的进程。
(进入 「殷契文渊」AI协同平台,就可体验数据库)
今年5月,我们的多个业务团队,和安阳师范学院甲骨文信息处理教育部重点实验室、中国先秦史学会及社科院考古所和历史所、郑州大学汉字文明中心、安阳市政府、中国文字博物馆、殷墟博物馆、各文博机构、学校和海内外收藏机构,共同发起「数字甲骨共创计划」。
希望对各地甲骨进行数字化搜集,用科技的方式进行文物保护及活化利用,让散落于世界各地的甲骨以全新的数字化形式回归。
有人问:为什么要研究甲骨文?
也有人问:为什么腾讯要花力气助力研究甲骨文?
前面提到的流星雨,在当时,被称之为“天有异象”,恐有不测。
这份“异象”记录,也成为了中国最早的流星雨记录。
可以说,中国人是全世界最早期、最精确的天文观测记录者。
尽管以现代的技术来看,精确度显然不够,但这些古早的记录对现代彗星与流星群的周期性及轨道变迁研究非常重要。
英国著名科技史专家李约瑟博士曾说过:「现代天文学家在许多场合(例如对彗星,特别是哈雷彗星重复出现的记载),都曾求助于中国的天象记事,并得到良好的结果。」
如今,我们已经知道流星雨是宇宙碎片与大气层摩擦产生的光迹,并且赋予了它浪漫的意义。当流星划过,我们双手合十许愿,古人则在甲骨刻下了这一奇观。
正是人们对星辰大海、对自然规律的不停探索,才推进了社会文明从自然崇拜,走向科学昌明。
岁月虽失语,甲骨却能言。
这或许就是古老的甲骨文,之于现代的意义之一,也是我们做这件事的原因。
用最新的技术,追寻最古的汉字源头,这是中文世界的工程师的浪漫。
未来,我们将持续用擅长的AI技术和数字化能力,去帮助更多专家学者,让甲骨文更快速地「言说」从前,去试着回答一个终极问题——我们的今天,从何而来。
想学习更多甲骨文,可前往我们的「了不起的甲骨文)小程序。
(长鹅风筝「上天」实物图)