吉首大學4月20日宣佈,由該校陳炳權教授團隊研發的國內首個系統性秦簡數據庫正式建成。該數據庫歷時6年攻關,整合湖南、湖北等5省市出土秦簡資源,收錄17269張高清文本圖像,標注115996個字符,涵蓋2847個古文字類別,首次實現秦簡文獻的標準化數字集成。
針對秦簡字跡模糊、殘損等研究瓶頸,團隊開發專業標注系統,突破通假字、異體字智慧識別技術。數據庫採用現代漢字聲母排序體系,構建類《新華字典》智慧檢索功能,支持通過拼音聲母精準定位文字圖像及上下文語義。目前已系統完成裏耶秦簡、雲夢秦簡等全國主要出土文獻的數字化處理,並與考古機構、出版社建立“邊建邊發佈”協同更新機制,數據經人工採集、專家校準等7道標準化流程驗證。
秦簡作為記錄秦代政治經濟的一手文獻,其數字化長期受制于文字辨識困難。該數據庫通過深度學習技術對模糊字跡進行圖像增強與語義重建,經第三方檢測,字符釋讀準確率達專業研究標準,已支撐國家自然科學基金項目2項、發明專利7項,並培養12名文博數字化骨幹人才。(湖南日報全媒體記者 楊元崇)
1、“國際在線”由中國國際廣播電臺主辦。經中國國際廣播電臺授權,國廣國際在線網絡(北京)有限公司獨家負責“國際在線”網站的市場經營。
2、凡本網註明“來源:國際在線”的所有信息內容,未經書面授權,任何單位及個人不得轉載、摘編、複製或利用其他方式使用。
3、“國際在線”自有版權信息(包括但不限于“國際在線專稿”、“國際在線消息”、“國際在線XX消息”“國際在線報道”“國際在線XX報道”等信息內容,但明確標注為第三方版權的內容除外)均由國廣國際在線網絡(北京)有限公司統一管理和銷售。
已取得國廣國際在線網絡(北京)有限公司使用授權的被授權人,應嚴格在授權範圍內使用,不得超範圍使用,使用時應註明“來源:國際在線”。違反上述聲明者,本網將追究其相關法律責任。
任何未與國廣國際在線網絡(北京)有限公司簽訂相關協議或未取得授權書的公司、媒體、網站和個人均無權銷售、使用“國際在線”網站的自有版權信息産品。否則,國廣國際在線網絡(北京)有限公司將採取法律手段維護合法權益,因此産生的損失及為此所花費的全部費用(包括但不限于律師費、訴訟費、差旅費、公證費等)全部由侵權方承擔。
4、凡本網註明“來源:XXX(非國際在線)”的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,豐富網絡文化,此類稿件並不代表本網贊同其觀點和對其真實性負責。
5、如因作品內容、版權和其他問題需要與本網聯繫的,請在該事由發生之日起30日內進行。