運(yùn)用基于人工智能、信息處理、模式識別等自動化科技對尚未破譯的甲骨文單字進(jìn)行多學(xué)科聯(lián)合攻關(guān)|光明網(wǎng):甲骨文研究進(jìn)入智能時(shí)代,新技術(shù)讓冷門絕學(xué)“活”在當(dāng)下
【ZiDongHua之人文化天下關(guān)鍵詞摘要:甲骨文 自然語言處理 自動化科技 人工智能 模式識別 圖像識別 信息處理自動化 安陽 人機(jī)協(xié)同 河南 】
光明網(wǎng):甲骨文研究進(jìn)入智能時(shí)代,新技術(shù)讓冷門絕學(xué)“活”在當(dāng)下
甲骨文,又稱“契文”“甲骨卜辭”。它的發(fā)現(xiàn),將有文字記載的中華文明史向前推進(jìn)了一千多年。時(shí)至今日,距離甲骨文首次被發(fā)現(xiàn)已經(jīng)過去了120余年,但人們對甲骨文的了解仍較為有限。很多人好奇,在這些充滿趣味卻又晦澀難懂的甲骨文里,究竟蘊(yùn)藏著古人怎樣的文化秘密?
識別與釋讀是甲骨文研究的核心問題。在已發(fā)現(xiàn)的甲骨文單字中,大部分未獲識別。從20世紀(jì)初開始,一代又一代的專家學(xué)者們將甲骨文研究接續(xù)傳承,著述不輟,并讓這門古老的學(xué)問不斷推出新的成果。在此期間,甲骨文破譯之路也開始越走越寬。
近日,話題“破譯一個(gè)未釋讀甲骨文單字獎(jiǎng)勵(lì)10萬元”一度沖上熱搜,這是甲骨文釋讀工作課題責(zé)任單位——中國文字博物館,于2016年10月28日發(fā)表在《光明日報(bào)》上的公告。這則面向社會發(fā)出的“懸賞令”,一經(jīng)發(fā)出便引起眾多讀者的注意。其中提出了“鼓勵(lì)甲骨文研究者運(yùn)用大數(shù)據(jù)、云計(jì)算等現(xiàn)代技術(shù)手段與傳統(tǒng)研究手段相結(jié)合,形成原創(chuàng)性研究成果”。
在大數(shù)據(jù)、云計(jì)算飛速發(fā)展的今天,如何有效利用這些現(xiàn)代科技手段,助力甲骨文研究工作,是各界一直在思考和努力的方向。
地處甲骨文發(fā)源地的安陽師范學(xué)院,擁有國內(nèi)唯一的甲骨文信息處理教育部重點(diǎn)實(shí)驗(yàn)室和甲骨文信息處理人才創(chuàng)新團(tuán)隊(duì),建有甲骨文大數(shù)據(jù)平臺“殷契文淵”、甲骨文活化利用中心和漢字文化體驗(yàn)館等專業(yè)平臺,是全國甲骨文研究的重要單位和學(xué)術(shù)中心。
研究工作的積累,促進(jìn)了甲骨文信息處理學(xué)科建設(shè)。安陽師范學(xué)院計(jì)算機(jī)與信息工程學(xué)院院長、甲骨文信息處理教育部重點(diǎn)實(shí)驗(yàn)室主任劉永革介紹,目前實(shí)驗(yàn)室已建立四個(gè)研究方向支撐的學(xué)科體系:甲骨學(xué)與殷墟科技考古、甲骨文語言計(jì)算、甲骨文識別與字形分析、甲骨文大數(shù)據(jù)平臺。同時(shí),運(yùn)用大數(shù)據(jù)和人工智能等技術(shù)對尚未破譯的甲骨文單字進(jìn)行多學(xué)科聯(lián)合攻關(guān),在甲骨文考釋、甲骨綴合等方面實(shí)現(xiàn)新突破,取得了豐碩成果。
2019年,實(shí)驗(yàn)室向全球發(fā)布了“殷契文淵——甲骨文大數(shù)據(jù)平臺”。該平臺集甲骨文著錄庫、文獻(xiàn)庫、字形庫于一體,是世界上現(xiàn)有資料最齊全、最規(guī)范、最權(quán)威的甲骨文數(shù)據(jù)平臺,從上線之日起便面向全世界免費(fèi)開放,為甲骨文研究插上了科技的翅膀,也標(biāo)志著甲骨文研究進(jìn)入“云時(shí)代”。
截至目前,平臺數(shù)據(jù)庫中共收錄甲骨著錄152部,種類數(shù)量為世界最多;收錄甲骨圖像23萬多幅,甲骨文研究論著3萬余篇,平臺瀏覽量超過100萬次。“通過這個(gè)平臺,能讓甲骨文能被更多人所看到,并且還可以借助‘人機(jī)協(xié)同’的方式,通過智能化信息提取,幫助專家破譯未釋讀的甲骨文。”劉永革說。
“以前甲骨碎片都是靠記憶和手工一片一片地拼合。數(shù)字化介入以后,可利用人工智能圖像技術(shù)進(jìn)行自動綴合,團(tuán)隊(duì)據(jù)此研發(fā)了甲骨文自動綴合系統(tǒng),目前已綴合37組甲骨碎片,這37組是人類專家還沒有綴合出來的。”劉永革表示,實(shí)驗(yàn)室的未來目標(biāo)是實(shí)現(xiàn)甲骨文“圖形檢索”,破譯出一個(gè)新的甲骨文字,即用計(jì)算機(jī)人工智能圖像識別系統(tǒng),直接檢索甲骨文拓片上的甲骨文,“這將為全球的甲骨文研究學(xué)者及愛好者的甲骨文資料查詢帶來極大便利,我們正在一步步向這個(gè)目標(biāo)靠近”。
甲骨文信息處理教育部重點(diǎn)實(shí)驗(yàn)室
以甲骨文為代表的“古老絕學(xué)”,一度因?yàn)檠芯康娜颂?,而略顯冷門。近年來,為推動甲骨文走向大眾,讓甲骨文從“絕學(xué)”變“顯學(xué)”,做到“絕學(xué)”不絕,“冷門”不冷。在劉永革的支持下,安陽師范學(xué)院開設(shè)了《甲骨文信息處理》特色課程,還舉辦了計(jì)算機(jī)編程選拔比賽,為學(xué)生提供實(shí)驗(yàn)室工位以便于研究,大大提升了學(xué)生的學(xué)習(xí)和科研興趣。
實(shí)驗(yàn)室科研助理劉夢婷日常負(fù)責(zé)的就是甲骨文論著信息錄入工作。“因?yàn)闊釔奂坠俏?,想到能為甲骨文整體研究貢獻(xiàn)一點(diǎn)自己的力量,同時(shí)也能學(xué)到更多相關(guān)知識,就不會覺得枯燥無味。”劉夢婷說。
一片甲骨驚天下,百年研究氣象新?,F(xiàn)代科技為保護(hù)文物、研究甲骨文開辟了新的空間,而未來如何做好傳承,利用好人工智能技術(shù)助力甲骨文破譯,講好甲骨文的故事,還有一段路需要走。但我們相信,這一天,并不遙遠(yuǎn)。
評論排行