莫伯峰教授正在辦公。本報記者 于晴 攝
□本報記者 馬愿 河南日報社全媒體記者 李向華
10月25日上午,記者走進首都師范大學甲骨文研究中心莫伯峰教授的辦公室。不到20平方米的房間,一側是滿墻書架,除了包括甲骨文、金文等在內的古文字類圖書外,其中一個書架上是《神經網絡與深度學習》《信息檢索與深度學習》《人工智能:人臉識別與搜索》等涉及人工智能技術的諸多書籍。
莫伯峰的研究主要圍繞“甲骨刻辭字體分類”展開,即根據字體把甲骨文細分為幾十個類型,這是他在甲骨學領域的專長。目前他的研究又增加了“人工智能在古文字研究中的應用”類的題目,這是他近年來重點關注的領域。熟悉他的人認為他是甲骨文研究領域最懂AI(人工智能)的,他則幽默地說:“其實我是甲骨文研究領域踢足球最好的,只是現在沒那么多時間踢球了。”
用AI解放生產力
“識別是當下甲骨文研究的基礎問題。”莫伯峰介紹,全球約有16萬片甲骨,按每一片有10個字計算,就是160萬字,目前還有三分之二的甲骨文字未破解。
“甲骨綴合是將本屬同版的甲骨碎片,依據形態(tài)、卜辭等信息拼接在一起,盡可能恢復其本來面貌。”莫伯峰說,以前都是由甲骨學家手工綴合,全憑個人經驗和腦力記憶,耗費大量時間和精力。
2019年,莫伯峰提出用計算機綴合甲骨作為“甲機會”的實驗項目,2020年與河南大學聯合研發(fā)軟件“綴多多”,在甲骨學歷史上首次實現了人工智能批量綴合甲骨。
莫伯峰表示,AI能夠與專家綴合的方法互補,這是這項工作最有價值之處。專家主要通過甲骨上文字內容進行綴合,而AI可根據甲骨斷裂處特征性邊緣形狀進行綴合,這是專家很難實現的。未來,隨著AI的發(fā)展,可以實現結合文字內容來進一步提升智能化綴合的水平和效率。
甲骨“拓本”圖像是研究甲骨文的基礎。從甲骨文首次發(fā)現至今,因為收藏、流轉,大部分甲骨都留下了多個版本的拓本。這些拓本被稱為重片,梳理重片的工作被稱為校重。甲骨的拓本數量遠遠大于甲骨的數量,需要對這些重片進行系統整理,才能理清這筆“糊涂賬”。因此,校重是甲骨學一項重要的基礎性整理工作,耗費了甲骨學者大量時間。
莫伯峰教授團隊與微軟亞洲研究院合作開發(fā)了基于自監(jiān)督學習的甲骨文校重助手Diviner,系統比對了18萬幅拓本,輔助甲骨學家在上百個甲骨文數據庫中發(fā)現了大量甲骨重片,而且經過初步整理,已經發(fā)現超過300組未被前人發(fā)現的校重新成果。該軟件可以讓專家徹底擺脫這項繁重的整理工作。
校重也體現了AI與專家的方法互補。甲骨學者校重,主要基于拓本上的文字內容,準確性非常高。但這種方法需要憑借對文字內容的存儲和記憶,效率很低。而且由于種種原因,在甲骨拓本中的文字并不都很清晰,這也限制了這種方法的應用范圍。AI校重模型不受文字信息的限制,也不受圖像數量的限制,直接運用圖像比對就可以迅速完成圖像校重,雖然沒有甲骨學家準確性那樣高,但勝在效率非常高。AI的結果再經過甲骨學者的審核,就能實現又快又準了。
跨學科提升新質生產力
“集圖像和語言于一體的多模態(tài)模型,將成為AI發(fā)展的主要方向。”莫伯峰認為,AI和甲骨文的結合仍處于初級階段。隨著AI技術的不斷進步,甲骨文研究將會迎來更多可能。
甲骨文本身具有多模態(tài)屬性,既是一種圖像,又是一種語料,人工智能在甲骨文研究中的應用,未來將匯集在統一的多模態(tài)大模型中。莫伯峰判斷,未來的多模態(tài)大模型可以同時處理圖像和語言。
AI以后將會成為“學術小助手”,對甲骨文破譯等研究發(fā)揮重要的輔助作用。
另外,AI對大數據的處理能力遠超人類,甲骨文研究可以借助AI的數據挖掘技術,更好理解和掌握甲骨文的發(fā)展演變規(guī)律、結構和特征等方面的重要信息,從而推動甲骨文研究不斷深入和發(fā)展。
“研究者要了解AI的基礎運行規(guī)律和技術發(fā)展狀況,我們和AI是共同成長的關系。”莫伯峰說,“學術的研究往往同國家的經濟、科技發(fā)展水平密切相關,國內AI的蓬勃發(fā)展,為我們提供了極大研究便利。”
“隨著AI技術與古文字研究結合逐步深入,學術界的研究方法和思維模式將隨之轉變。AI的運用使得人文學科不再是孤立的學術小圈,而是一個與技術深度融合的開放平臺。”莫伯峰認為,甲骨學一直有著多學科協同的傳統,現在更應該被看作是一門新型交叉學科。相信隨著AI技術的不斷進步,會有更多的跨學科研究參與,共同提升甲骨文研究的新質生產力,助力更多成果的產生。
免責聲明:凡本網注明“來源:XXX(非駐馬店廣視網、駐馬店融媒、駐馬店網絡問政、掌上駐馬店、駐馬店頭條、駐馬店廣播電視臺)”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,作品版權歸原作者所有,如有侵犯您的原創(chuàng)版權請告知,我們將盡快刪除相關內容。凡是本網原創(chuàng)的作品,拒絕任何不保留版權的轉載,如需轉載請標注來源并添加本文鏈接:http://cndedutech.com/showinfo-33-337742-0.html,否則承擔相應法律后果。