新書推薦丨莫伯峰、武智融 編著《甲骨補合集》出版



图片

甲骨補合集

莫伯峰、武智融 編著

2026年1月出版

198.00元

978-7-5732-2026-4






内容簡介

甲骨拓本是開展甲骨文研究的主要材料,同一版甲骨的多種拓本之間往往互有優劣,需要借助“補合”來合成出最佳圖像。系統性的甲骨拓本補合工作,能全方位提升拓本質量,爲甲骨綴合、字形修復、形態還原等提供幫助,是一項具有多重價值的基礎性整理工作。借助人工智能和數字化技術,本書實現了甲骨拓本的自動比對,新發現了一大批重片,並依據疊壓圖展開對比,比較出重片之間的差異,最終生成了更完整清晰的補合拓本。全書共收録補合300則,每則包含原圖、疊壓圖和補合圖,並附以相關説明。本書是《甲骨文合集》《甲骨文合集補編》之後,首次開展的系統性補合整理,是利用人工智能推動甲骨文研究的最新成果,對於該領域的科研範式轉變有重要示範作用。



作者簡介

图片

莫伯峰,首都師範大學甲骨文研究中心教授、博士生導師。於中央民族大學、北京師範大學、首都師範大學分獲學士、碩士、博士學位。2012年博士畢業後即在首都師範大學工作,歷任講師(2012)、副教授(2016)、教授(2021)。曾主持國家社科基金等各級項目多項,在《中國語文》《中國史研究》《文獻》等刊物上發表論文五十餘篇。研究旨趣主要包括甲骨字體分類、甲骨綴合、甲骨文與殷商史等方面。近年的研究側重古文字與人工智能結合,推動了綴合、校重、編聯等古文字研究工作的智能化。


图片

武智融,微軟亞洲研究院視覺計算組高級研究員。2013年本科畢業於清華大學自動化系,2017年博士畢業於香港中文大學多媒體實驗室;2013-2015年在美國普林斯頓大學視覺組做訪問博士生,2017-2018年於美國加州大學伯克利分校從事博士後研究;2018年加入微軟亞洲研究院任研究員。研究興趣爲視覺計算中的遷移學習和自監督學習。已發表學術會議期刊論文二十餘篇,論文引用量一萬餘次,並曾以第一作者發表過3D ShapeNets和Instance Discrimination等突破性成果。



目  録

左右滑動查看


序  一

現執教於首都師範大學甲骨文研究中心的莫伯峰教授,長期從事甲骨文的整理和研究工作,熟悉甲骨斷代、字體分類、甲骨校重、甲骨綴合、甲骨形態、甲骨文例、文字考釋等。近年來,他和微軟亞洲研究院合作,利用電腦進行甲骨校重、綴合,完成《甲骨補合集》一書。現在,此書即將付梓,他希望我爲這部書寫一篇序。我很樂意借此機會,來介紹一下讀這部書稿的一些感想。

甲骨文數量衆多、内容豐富,是研究商代歷史和語言的珍貴資料。學者研究甲骨文主要依據甲骨著録書。甲骨著録書有紙質書和電子書兩種。二者各有優劣,可以互相取長補短。由於甲骨是有機物,出土之日,便是毁損之始。因此,保留甲骨出土時的原貌,迫在眉睫。

文字清晰且拓影完整的拓本(或照片)是研究甲骨的基礎。但是,這種優質的拓本(或照片)並不是很多。首先,因爲一片甲骨在流轉的過程中,越早製作的拓本(或照片)越能保持原貌,隨着時光流逝,甲骨表面剥蝕,文字就會缺損,比如,大家熟知的著名三版大胛骨,在1914年出版的《殷虚書契菁華》(第1—6頁)裏文字完好,在1978至1982年出版的《合集》(第6057、10405、137號)裏文字已經缺損,檢視拓本(或照片)自明。其次,拓工椎拓技術有高有低,所拓文字的清晰度自然有優有劣。再次,早期甲骨學者,重文字而輕文字所依附的甲骨材質及其形態:或是“剪裁拓本”,如《前編》中有些拓本被裁成豆腐乾的方塊形,這是爲了版面美觀而剪裁拓本造成的;或是“未拓全”,只椎拓有字的部分。經過這麽一剪一省,就使甲骨學者無從知道其原來的甲骨形態,不利於甲骨綴合。

我剛拿到《甲骨補合集》書稿,不明白“補合”是什麽意思。讀了“前言”就明白了,所謂“補合”,指同一片甲骨常有多個拓本,需要通過校重發現其重片,這些不同拓本往往互有優劣,通過甲骨補合來取長補短,合成一張恢復甲骨原貌的優質拓本。《甲骨文合集》在編纂過程中,曾進行過補合工作。《甲骨文合集·凡例》説:“極少數拓片,在數種著録裏各有長處者,則分别擇優,按原部位加以‘補合’。”其實,我主編的《甲骨文摹本大系》也做過補合工作。《甲骨文摹本大系·凡例》説:“如果同一片甲骨見於數種著録文獻,則選用字形清晰、拓面完整的進行摹寫,即‘選用號’。有少量摹本兼采兩種或兩種以上甲骨著録文獻之長而摹之。”例如:《合集》4874與《鐵》242·2是重片,《大系》539兼采二者之長而摹之;《合集》6968與《續編》6·9·8是重片,《大系》3627兼采二者之長而摹之;《合集》20192與《上博》17645·228是重片,《大系》1333兼采二者之長而摹之;《合集》22588與《合補》9682是重片,《大系》32353兼采二者之長而摹之;《合集》23002與《佚》401是重片,《大系》33725兼采二者之長而摹之。《合集》25909與25976、25977是重片,《大系》37937兼采三者之長而摹之。

我過去以爲“補合”工作只有摹本可以做,現在看來用拓本進行“補合”,效果更好。《甲骨補合集·凡例》説:

每則補合包括“原圖”“疊壓圖”“補合圖”三張圖像。“原圖”是補合之前的《合集》圖像。……“疊壓圖”是兩張或多張拓本疊壓在一起的圖像,通過不同透明度的設置,可以看到不同拓本間的差異;“補合(及綴合)圖”是利用智能化數字處理技術,綜合各拓本的優點所形成的合成圖像。

《甲骨補合集》每則補合包括三張圖像:原圖>疊壓圖>補合圖。這種著録方式很好,簡潔明瞭,其拓本流轉之迹,宛然可尋。

任何學科研究工作的開展,資料的完備是其先决條件,甲骨學的研究也不例外。有字甲骨約有16萬片。過去,憑借人腦進行校重與綴合,勞而少功。現在,利用電腦進行校重與綴合,效率倍增。甲骨補合,大有作爲。只要錨定目標,沉下心來,長期耕耘,總能結出碩果,作出成績!

黄天樹(清華大學教授)

2026年1月於清華園



序  二

站在2025年回望過去三年的技術迭代與創新,人類正處於一場前所未有的技術奇點。以ChatGPT/DeepSeek爲代表的大模型技術横空出世,不僅重塑了我們與機器對話的方式,更以驚人的速度融入人類生活的方方面面,成爲加速社會生産、驅動知識創新的“新質生産力”。從自動化的代碼編寫到智能化的醫療診斷,人工智能正在以前所未有的深度和廣度深刻改變着人類社會的運行方式與生活形態。

在AI加速奔向未來的同時,我們也在思考:能否利用這股强大的算力,去重新發掘與復原那些被時間掩蓋的歷史文化遺産?

當我第一次在實驗室看到武智融展示的甲骨補合結果時,其展現出的高精度匹配能力令人印象深刻。屏幕上,原本斑駁模糊、連人工都難以辨析的甲骨拓本碎片,在演算法的驅動下,能够通過極其細微的邊緣與紋理特徵實現嚴絲合縫的疊合。這一成果讓我意識到:在大模型時代,人工智能不僅能用於預測未來,同樣可以成爲我們復現歷史、連接過去的有力工具。

本書所呈現的成果,並非孤立的技術突破,而是微軟亞洲研究院長期踐行“AI for Good(技術向善)”理念的深度實踐。

在萬物皆可“大模型化”的今天,研究院始終保持着理性的思考與社會關照—我們關注技術如何更精準地服務於人,以及如何通過技術手段守護文化根基。多年來,我們持續投入社會公益與遺産保護領域:我們曾深耕於敦煌壁畫的數字化修復,利用圖像增强技術使受損的壁畫在數字世界中得到高精度重現;我們也曾研發人工智能手語翻譯系統,爲聽障群體構建無障礙溝通渠道;此外,我們還致力於唇齶裂語音識别修復,以及基於腦電信號的嬰兒癲癇早期監測等。

依托研究院深厚的技術積累與算力資源,武智融研究員利用自監督學習方法,使模型能够從未經標注的殘片影像中自主學習到甲骨文獨特的紋理與筆畫特徵。在拼接邏輯上,演算法將電腦幾何匹配(如單應性變换)與深度學習相結合,輔助人工完成了大量傳統手段難以應對的複雜補合任務。爲了確保疊合後的甲骨拓本在視覺上嚴絲合縫、渾然一體,演算法會動態選擇信息更完整的殘片作爲幾何與紋理基準,隨後對關聯碎片進行精細化的顔色與紋理的校準。這種對齊與補償的做法,不僅消除了碎片間的視覺斷層,更真實地還原了甲骨文拓本的整體面貌。

在如今的學術探索中,跨學科協作早已不再停留在概念層面,而是成爲了拓展研究邊界的實際手段。特别是在人工智能快速演進的背景下,計算方法與人文學科的關係正發生深刻變化:人工智能已不再僅僅是簡單的“輔助工具”,而是開始參與到核心問題的界定與重塑中。如何在尊重傳統學科積澱和學術規範的前提下,有效地引入新技術,使其在不損害學科嚴謹性的同時,催生出新的學術發現,是跨界研究中必須面對的挑戰。本書提到的“補合”概念,正是計算科學與古文字學深度交融的成果,也是對跨學科研究路徑的一次具體實踐。

《甲骨補合集》的成書,得益於人工智能對大規模校重工作的深度介入,它幫助人類發現了大量有别於傳統“綴合”範式的拓片補合樣本。然而,我們對技術始終抱有審慎的態度。人工智能雖然能顯著擴展感知範圍、降低試錯成本,但其本質上並不具備歷史語境的理解與判斷力。因此,本書將人工智能定位爲一種“可被質疑、可被修正”的研究工具,而非絶對的權威結論。每一項演算法生成的方案,最終都必須由具備深厚學養的專家進行學術定音,這種“技術發現、人類判斷”的協作模式,既發揮了計算優勢,又確保了學術研究的嚴謹本質。

我期待,隨着這些補合樣本的公開與應用,能有更多被時間掩蓋的歷史細節被重新發掘,助力中華文明根脉的研究取得新突破。希望讀者能透過這些數字影像,洞察三千年前古人的生活痕迹,並體會到在人工智能時代,科技爲守護歷史遺産、服務社會所付出的持續努力。甲骨學雖被視爲“絶學”,但在數字時代,它絶不應是孤芳自賞的枯燥學問。

郭百寧(微軟亞洲研究院常務副院長,微軟技術院士)

2026年1月於微軟亞洲研究院



前  言

作爲三千多年前的古物,甲骨文能流存至今,吉光片羽彌足珍貴。出土文獻的性質,决定了要對甲骨文不斷進行整理,才能逐步恢復其本來面目,以利研究。甲骨補合便是甲骨文整理工作的一種。

同一片甲骨常有多個拓本,需要通過校重發現重片。但是校重並不是終點,不同拓本如果各有優劣,通過甲骨補合來取長補短才是完整的整理工作。20世紀在《甲骨文合集》和《甲骨文合集補編》(以下簡稱《合集》《合補》)這兩部甲骨集成著作的編撰過程中,前人都曾進行過補合工作,如《合集》“凡例”四“極少數拓片,在數種著録裏各有長處者,則分别擇優,按原部位加以‘補合’”,《合補》“凡例”九“個别拓本部分清晰部分模糊而各有優劣者,則采取‘補合’辦法,優勢互補”。比較來看,《合集》的定義更側重於甲骨破損,需要更完整的拓本進行補合;《合補》的定義側重於甲骨拓本品質不佳,需要文字更佳的拓本進行補合。

囿於當時的條件,《合集》《合補》所做的補合,數量比較有限,效果差强人意。導致這種情形的原因主要有兩方面:一方面紙質補合代價太大。没有數字化的拓本,只能以原拓進行補合,剪切後就將拓本破壞了。很多原拓都是獨一份的資料,補合後便無存了。另一方面紙質補合的效果也不佳。不能進行數字化處理,不同拓本補合在一起效果差異大,有些像是“硬凑”在一起。而且只能大塊地補合,無法實現精細到字的補合。與此同時,補合的工作量又相當浩大,需要先進行詳盡的重片整理,再細緻地比較拓本間的細微差别,然後才能進行補合,直可謂“勞而少功”。因此,在《合集》《合補》之後,補合工作基本上就處於停滯狀態。

得益於數字化和智能化技術的進步,現在我們可以進行新型的甲骨補合工作了。本書通過智能化比對和數字化加工,無論從效率上還是效果上,都有了很大的提升,讓這項中斷的工作能够重開新局,對“數智時代”的甲骨文整理提出新的思路。本書所收的三百則補合,有些可以算是對之前補合工作的一個直接補充,比如以下三種情况:

一是在《甲骨文合集來源表》中已經標注了“補合”,最終却没有實施,我們這次進行了補合。例如本書第10則、第63則、第70則。二是在《甲骨文合集來源表》中已經標注了所選用拓片“不全”,却没有進行補合,我們這次找到了可用於補合的拓本,進行了補合。例如本書第5則、第53則、第131則。三是《合集》重片整理不完備,導致没有進行補合。例如本書第4則、第25則、第42則,都是《合集》内拓本的補合。

需要補合必定是因爲拓本之間各有優劣,而導致拓本各有優劣的原因有多種,可以從拓本和甲骨兩方面進行分析,按照時間先後分爲早晚期,據此可將補合方式分爲以下四類:

一、晚期甲骨已經破缺,以早期拓本補充拓面。有些甲骨在流傳過程中,不斷出現破缺,這是甲骨出土後所受到的二次傷害。破缺的部分常常都遺失了,只有利用早期拓本來復原甲骨原本的樣貌。例如本書第2則、第3則、第11則。本書中這種情况非常多。

二、早期拓本不全(被剪切/部分拓印),以晚期拓本補充拓面。早期的甲骨自然應該更完整,但因爲當時著拓有時只拓印有字部分,或者裁剪掉無字部分,所以拓本反倒會不全。例如本書第5則、第7則、第8則都是這樣情况。本書有一大部分都是對這種拓本的補合。

三、早期拓本品質不佳,以晚期拓本補充文字。有些早期甲骨拓本的著拓水平不高,導致文字效果不佳。例如本書第59則、第67則、第71則。這種情况數量其實很多,但如果全部進行補合,數量會非常大。本書只選擇了很少一部分對文字形體辨識影響較大的進行了補合。

四、晚期甲骨已經破裂(變成兩個著録號/甲骨已裂開),以早期拓本恢復拓面。有些甲骨在出土後或流傳過程中,因各種原因發生破裂,原本完整的甲骨變成了兩塊甚至多塊,各自擁有不同的著録號。利用早期保存較爲完好的拓本,可以來補合這些破裂甲骨的原始形態。例如本書中第17則、第32則、第63則。這種情况也有一些。

在實際的補合工作中,以上四種類型常常是混合出現的,也就導致了所謂的各有千秋,需要互相取長補短的情况。

我們在整理過程中看到,需要補合的拓本是非常多的,除了極少部分毫無優點的拓本,各種版本的拓本總會有自己優點。在本書編製過程中,我們整理出很大一批各有優劣的拓本,但不可能都收入本書。本書所選取的主要是這幾種情况:首先是存在文字差異的那部分。如果補合能補充文字内容,即使只是一些筆畫,也有補合價值。其次是反映了形態信息的那部分。比如反映了甲骨部位的盾紋、齒紋信息,也具有補合價值。再次是比較大的拓面差異。通常是一大塊甲骨的補充,即使上面没有文字,但是會讓拓本樣貌發生比較大的改變,對於甲骨綴合有很大的作用。

限於篇幅,本書只是通過一些典型的示例説明補合的價值。實際上,應該對所有的甲骨拓本都進行補合,一加一的效果會大於二,一片甲骨的各種版本拓本都應該通過數字補合的方式疊加在一起,如果有新的拓本出來,就再疊加到原來的補合圖上去。這樣就能把一片甲骨的各個拓本的作用都發揮出來。

補合所涉及的拓本資源是非常豐富的。我們在整理過程中利用了114種拓本材料,有的是著録書,有的是還未結集出版的拓本集。就具體補合的圖像來説,本書所補合的很大一部分都是“歷拓”“歷藏”這種類型的拓本,這種拓本是《合集》《合補》編撰者“凡有實物可見即新行墨拓”而得,即使有些已經破缺也都被選用了。但如果未經補合,這類材料都容易存在瑕疵。

就具體的補合過程而言,從甲骨校重到製作疊壓圖、補合圖,計算機技術都發揮了很大的輔助作用。所有圖像都是機器批量生成,然後再由人工進行復核的。由於拓本並非一時一人所拓,圖像風格常常有很大差異,如果只是簡單拼凑在一起,會顯得非常生硬。通過數字智能技術處理,可以將不同風格的拓本統一,使得圖像起到復原甲骨面貌的作用。通常拓本上的文字位置關係應該是不變的,但是由於著拓者的差異,有一部分拓本上文字的位置關係還是存在變化,我們通過人工的方式又進行了一些微調。

與甲骨綴合相比,新補合出來的部分通常不會很大,但補合具有其他整理工作無法取代的作用。現在有很多收藏單位的甲骨重新整理出版,照拓摹三位一體的著録方式無疑比過去更爲先進,但隨着甲骨儲藏時間日久,也不可避免會不斷出現破裂、破缺、表層剥落的情况,所以過去的拓本圖像有時還是會具有新拓本不具有的優勢,這也是補合工作不可替代的意義所在。

補合工作通過復原甲骨原貌,爲商代語言文字、歷史研究都提供了更佳的材料,這方面價值自不待言。我們覺得補合還有另一個方面的作用,那就是能對理清各種拓本的著拓時間先後起到作用。一般情况下,先出版的著録書拓本應該更完整。但有時出版時間和墨拓時間並不一致,也存在出版時間晚拓本却更完整的情况。近年來新出版的一些著録書,拓本就是很早之前著拓的。在補合過程中,通過比對拓本的“破裂”“破缺”情况,就能够對部分拓本的先後順序進行判别。而通過確定幾片甲骨的時間順序,我們也可以推論出一本著録書的大體情况。在本書“説明與考釋”部分,我們結合具體的例子,對這類情况進行了討論。

甲骨補合是對甲骨的一種整理方式,在這種整理過程中,能够深切地感受到,甲骨在出土之後,便在無可挽回地一步步破損。很多需要補合的甲骨,原本都是完整的,在流傳過程中破裂、破損、遺失,補合的過程也見證了這一變遷。雖然這一過程最終無法改變,但是通過補合,希望這種遺憾能更少一些吧!



凡  例

一、本書收録補合成果共300則,按照《合集》的先後順序進行排列。

二、本書用並集符號“∪”表示前後拓本相補合,用加號“+”表示前後拓本相綴合。

三、本書由“補合圖版”“説明與考釋”和“附録”三部分組成。

四、“補合圖版”部分遵循以下條例:

(一)每則補合包括“原圖”“疊壓圖”“補合圖”三張圖像。“原圖”是補合之前的《合集》圖像。如用於補合的圖片也來自《合集》,則“原圖”用編號靠前的《合集》圖像;“疊壓圖”是兩張或多張拓本疊壓在一起的圖像,通過不同透明度的設置,可以看到不同拓本間的差異;“補合(及綴合)圖”是利用智能化數字處理技術,綜合各拓本的優點所形成的合成圖像。

(二)基本相同的圖像,從中選擇一張用於補合,其餘未參與補合的重片在“説明與考釋”部分進行説明。

(三)排版時,儘量將三張圖像排在一頁上。受版面所限,有些圖版縮小尺寸,在頁面上標注比例。

五、“説明與考釋”部分遵循以下條例:

(一)關於《合集》來源的信息,依據了《〈甲骨文合集〉材料來源表》(中國社會科學出版社,1999年,以下簡稱《來源表》),信息有誤之處進行了説明。

(二)同一片甲骨的不同圖像之間,統一用“還見於”進行説明,有需要時再具體説明完整度、清晰度、綴合等情况。

(三)通過“未拓全”“被剪切”“已破缺”“已破裂”四方面來分析拓本的完殘情况。“破缺”表示部分甲骨已經缺失,“破裂”表示部分甲骨已經裂開。

(四)著録書刊布時間與拓本製作時間有時並不一致,我們通過比較圖像“破裂”“破缺”方面的完整度差異,對各著録書間拓本的形成先後進行分析,書名後括注出版時間。主要分析拓本先後順序不太明確的那些情况,首次出現時加以分析,後續不再重複。

(五)如果補合後對釋文有影響,則重新撰寫釋文。如果補合後不涉及文字内容改變,則不再重新撰寫釋文。

六、本書引用甲骨著録書通用簡稱,書名後標記出版時間。書末附有《引用甲骨著録書簡稱表》備查。

七、本書用繁體字排印。卜辭釋文一般用寬式。卜辭釋文,缺一字者用“□”表示;所缺字數目不詳者用“〼”表示;依據殘字或文例擬補的字,外加“[ ]”表示;異體字、假借字一般隨文注明,正字和本字,外加“( )”表示。



後  記

2021年9月,我和武智融研究員開始合作,嘗試利用人工智能技術進行甲骨校重。在經歷了從有監督學習向無監督學習的模型轉變後,“校重助手Diviner”效果有了很大的提升。2022年11月,通過對20多萬張的甲骨拓本集中進行比對,“校重助手Diviner”新發現了一大批新重片。甲骨補合是校重工作的深化。通過生成拓本疊壓圖的方式,“校重助手Diviner”能清晰展示出重片之間的各種差異。因此,有一類重片引起了我們的特别關注,那就是各有優劣的重片拓本。對於這樣的拓本,發現重片關係僅僅是整理工作的開端。武博士表示,運用現在的數字化圖像處理技術,能讓各個拓本取長補短,生成一張最優的圖像。在智能化技術和數字化技術的雙重加持下,《甲骨補合集》便提上了日程。經過兩年多時間的整理,我們找出了一批需要補合的拓本,並從中選出三百組最爲典型的例子進行加工,最後便有了此書。從智能校重到智能補合,很多人給我們提供了幫助和鼓勵。感謝黄天樹師,他引導我進入甲骨學領域,培養了我對學科的熱愛,對我們的校重工作給予了很大的鼓勵,並欣然同意爲本書作序,推動了本書的出版。感謝吴振武先生,他在2017年就提出古文字與人工智能結合的設想,指引了我們的工作。吴先生通過他的文章和講話,使我們得到了寶貴的啓示和巨大的鼓舞。在《甲骨補合集》編撰過程中,他一直給予我們極大的鼓勵,並欣然同意爲本書題簽。感謝王子楊、蔣玉斌兩位先生,他們爲“校重助手Diviner”書寫了熱情洋溢的推薦意見,推進了補合工作的前進。感謝碩士畢業生鞏詩晨,項目的前期材料整理工作主要都是她負責的。感謝博士生白艷,碩士生丁澤佳、李涵琪和本科學生李昆霖等幫助整理材料。同事劉影老師和李愛輝老師也組織她們的學生參與了部分材料的整理,深表感。感謝微軟亞洲研究院郭百寧先生爲本書撰寫序言,感謝孫麗君、王婧雯、張津三位女士在項目開展中的協助。還要感謝上海古籍出版社顧莉丹、許佳瑩兩位編輯爲本書付出的努力,没有她們的幫助,本書不可能這麽快和大家見面。我的父親和母親,以及妻子和兩個女兒一直都期盼着本書早日出版,爲此他們主動承擔了許多我分内的家務。感謝他們,希望本書的出版能成爲他們默默付出的一點回報。人工智能與古文字的結合還處在早期進程,重起爐竈的甲骨補合工作仍處於一個摸索階段,肯定還有很多需要進一步完善之處,祈請讀者能給我們批評指正。

莫伯峰 

2025年10月30日



内頁展示



左右滑動查看