記者日前從南京農(nóng)業(yè)大學(xué)了解到,該校信息管理學(xué)院王東波教授團(tuán)隊(duì)與中華書局古聯(lián)公司研發(fā)的古籍大語言模型近日上線。
“我們請它以‘金陵’為主題,生成一首詩。”王東波演示模型的智能作詩功能,輸入指令后,模型不久就給出了反饋。除了智能作詩、斷句翻譯,該模型還能實(shí)現(xiàn)詞法分析、實(shí)體識別、關(guān)系提取、文本摘要等功能。
“普通讀者想閱讀古籍文獻(xiàn)并不容易,要克服繁體、豎版、沒有句讀等困難。”王東波說,團(tuán)隊(duì)自2013年起為《四庫全書》等古籍添加人工標(biāo)注,積累了規(guī)模超過20億字的精加工語料數(shù)據(jù),這為該古籍大語言模型提供了語料數(shù)據(jù)基礎(chǔ)。
據(jù)了解,該古籍大語言模型是國家社科基金重大項(xiàng)目“中國古代典籍跨語言知識庫構(gòu)建及應(yīng)用研究”的重要成果。下一步,南京農(nóng)業(yè)大學(xué)與中華書局古聯(lián)公司計(jì)劃將模型的應(yīng)用場景推廣到古籍整理、數(shù)字文娛等領(lǐng)域。
“期待模型能進(jìn)一步推動古籍智能化研究與跨學(xué)科人才培養(yǎng)有機(jī)結(jié)合,讓公眾既能接觸到前沿的人工智能技術(shù),又能積累傳統(tǒng)文化知識。”王東波表示。(記者秦華江、陳席元)