華南理工大學(xué)發(fā)布新成果 AI不僅能譯古文還會(huì)斷句

  來源:科技日?qǐng)?bào)葉青,華軒2023-11-07
打印本文
核心提示:科技日?qǐng)?bào)訊 (記者葉青 通訊員 華軒)古籍文獻(xiàn)是中國傳統(tǒng)文化的載體,,但由于語言的演變,,理解古籍文獻(xiàn)的難度較大。11月4日,,記者從華南理工大學(xué)獲悉,,該校電子與信息學(xué)院金

科技日?qǐng)?bào)訊 (記者葉青 通訊員 華軒)古籍文獻(xiàn)是中國傳統(tǒng)文化的載體,,但由于語言的演變,理解古籍文獻(xiàn)的難度較大,。11月4日,,記者從華南理工大學(xué)獲悉,該校電子與信息學(xué)院金連文教授所在的“深度學(xué)習(xí)與視覺計(jì)算實(shí)驗(yàn)室”近日發(fā)布了通古大模型,、古籍文檔分析與識(shí)別系統(tǒng),、彝文文檔分析識(shí)別系統(tǒng)等多項(xiàng)成果,借助人工智能(AI)技術(shù)讓古籍更易讀懂,,為中國古籍文物數(shù)據(jù)挖掘,、知識(shí)發(fā)現(xiàn)、智能化開發(fā)與利用提供了技術(shù)支撐,。

據(jù)介紹,,團(tuán)隊(duì)?wèi){借在古籍領(lǐng)域長期積累的豐富大數(shù)據(jù)資源,加以自動(dòng)生成的對(duì)話模板,,通過大模型指令微調(diào)技術(shù)訓(xùn)練,,構(gòu)建出數(shù)字人文模型“通古大模型”,。該大模型可智能實(shí)現(xiàn)文白翻譯、句讀標(biāo)點(diǎn)和古籍檢索等功能,,有助于讓大眾更便捷地了解中華傳統(tǒng)文化,。

團(tuán)隊(duì)還開發(fā)出古籍文檔分析與識(shí)別系統(tǒng),該系統(tǒng)集成了團(tuán)隊(duì)自主研發(fā)的古籍句讀和文本翻譯兩大功能,。用戶只需提供一張古籍圖片,,系統(tǒng)就能自動(dòng)定位并識(shí)別其中所有的文本,將識(shí)別出的文本按照正確的閱讀順序排序,,隨后為其添加標(biāo)點(diǎn)符號(hào)并將之翻譯為白話文,。

“我們進(jìn)行了算法優(yōu)化,使古籍文檔分析與識(shí)別系統(tǒng)能夠應(yīng)對(duì)現(xiàn)實(shí)場景中古籍文檔可能出現(xiàn)的諸如書本彎曲,、傾斜,、文字密集以及圖片分辨率低等各種挑戰(zhàn)?!苯疬B文介紹,,該系統(tǒng)兼具實(shí)用性和穩(wěn)健性,為推動(dòng)古籍?dāng)?shù)字化工作提供了有力支持,。

此外,,團(tuán)隊(duì)還開發(fā)了彝文文檔分析識(shí)別系統(tǒng),該系統(tǒng)能自動(dòng)精確定位并辨識(shí)圖片中的彝文文字,。該識(shí)別系統(tǒng)采用的彝文編碼,,基于團(tuán)隊(duì)今年早些時(shí)候與上海大學(xué)、上海合合信息科技股份有限公司聯(lián)合發(fā)布的業(yè)界首個(gè)古彝文基礎(chǔ)編碼數(shù)據(jù)庫打造,。

(編輯:月兒)


華南理工大學(xué)發(fā)布新成果 AI不僅能譯古文還會(huì)斷句

 

免責(zé)聲明:

1,、本網(wǎng)內(nèi)容凡注明"來源:315記者攝影家網(wǎng)"的所有文字,、圖片和音視頻資料,版權(quán)均屬315記者攝影家網(wǎng)所有,,轉(zhuǎn)載,、下載須通知本網(wǎng)授權(quán),不得商用,,在轉(zhuǎn)載時(shí)必須注明"稿件來源:315記者攝影家網(wǎng)",,違者本網(wǎng)將依法追究責(zé)任,。
2、本文系本網(wǎng)編輯轉(zhuǎn)載,,轉(zhuǎn)載出于研究學(xué)習(xí)之目的,為北京正念正心國學(xué)文化研究院藝術(shù)學(xué)研究,、宗教學(xué)研究,、教育學(xué)研究、文學(xué)研究,、新聞學(xué)與傳播學(xué)研究,、考古學(xué)研究的研究員研究學(xué)習(xí),并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),。
3,、如涉及作品、圖片等內(nèi)容,、版權(quán)和其它問題,,請(qǐng)作者看到后一周內(nèi)來電或來函聯(lián)系刪除。