在安陽師範學院甲骨文信息處理教育部重點實驗室,博士張展正在給學生們展示甲骨綴合。河南日報社全媒體記者 趙阿娜 攝
7月12日,記者獲悉,前不久在上海舉辦的世界人工智能大會上,“數字甲骨共創中心”宣佈將全球最大的甲骨文多模態數據集正式開源。
該數據集包含10000片甲骨拓片、摹本,以及甲骨單字對應的位置、字頭、隸定字以及辭例分組、釋讀順序等數據。研究人員可根據該數據集開發甲骨文檢測、識別、摹本生成、字形匹配以及釋讀等方向的智慧演算法,助推甲骨文研究加速數字化和智慧化。
據介紹,數字甲骨共創中心成立於5月28日,由安陽師範學院甲骨文信息處理教育部重點實驗室、騰訊SSV數字文化實驗室、中國社會科學院考古研究所安陽工作站、鄭州大學漢字文明研究中心等單位共同發起建立,吸納了國內外眾多高校和研究機構的專業科研力量支持。
會上,數字甲骨共創中心發佈甲骨文AI破譯需求,期待與有技術儲備、有意願共創、致力於AI助力甲骨文破譯的科研機構共同形成解決數字文化演示方案,助力甲骨文破譯。經過最終遴選評審的合作夥伴將獲得20萬元資助,一起共創甲骨文AI考釋破譯的新演算法、新工具、新方法。
甲骨文是迄今為止中國發現的年代最早的成熟文字系統,但其研究存在諸多難點。近年來,隨著AI技術的快速發展,探索AI與甲骨文研究相結合,成為研究人員的解題思路。“高品質的AI演算法非常依賴高品質的甲骨文數據集。”安陽師範學院甲骨文信息處理教育部重點實驗室負責人劉永革説。
此次開源的甲骨文多模態數據集集合了甲骨文數字化研究的最新成果,吸收了當前業界最先進的甲骨文研究資料,AI相關技術的應用也為數據集的信息豐富提供了支撐。
“甲骨文研究不僅有助於揭示中國上古信史,還能為現代漢字由來和漢語研究提供標誌性依據。AI技術應用有望加快甲骨文探析進程,解決長期困擾學界的疑難問題。”中國社會科學院學部委員宋鎮豪表示,希望更多的科研機構和專家學者加入這一偉大事業,共同拓展甲骨文研究工作新天地。(記者 楊之甜)