跳至正文

OCR技术

荀子古籍大语言模型2.0正式上线

网站链接: https://xunziallm.njau.edu.cn/ 近日,面向古籍智能处理的荀子大模型正式通过国家生成式人工智能服务备案,并免费向公众提供对话服务界面(https://xunziallm.njau.edu.cn/ ),欢迎古籍从业人员和广大古籍爱好者使用! 荀子古籍大语言模型由南京农业大学王东波教授团队主导研发,是江苏省首个以高校为主体完成国家生成式人工智能服务备案的大语言模… 阅读更多 »荀子古籍大语言模型2.0正式上线

古籍文献中人名实体信息的提取方法及实现研究

 基础设施 陈逸云 / 搜韵网 吴 怡 / 四川大学中华文化传承与全球传播数字融合实验室 摘 要:人名广泛存在于古典文献中,提取人名实体对构建古典文献知识图谱至关重要。然而,称呼的多样性、高重名率、与地名和常用词汇的易混淆性、因前文而称呼从简、因交往亲近而称呼从简、因诗句长度而称呼从简、因文献缺失而难以推断,凡此等等,使得人名实体的提取困难重重,而且在甄别出某个字符串… 阅读更多 »古籍文献中人名实体信息的提取方法及实现研究

方志类古籍地名识别及系统构建

江西地名研究 关注我们,获取更多地名资讯 关注 摘要:以地方志资料汇编《方志物产》(广东分卷)为语料,设计并构建了古籍地名识别系统。采用规则与统计相结合的命名实体识别方法,实现了物产地名的自动识别。分析了命名实体识别技术在中国方志类古籍整理中的应用前景,为方志类古籍进行数字化整理、挖掘物产分布、物产引进和传播等相关研究提供了新的途径。 关键词:地名识别;方志;命名实体;古籍数字化;古籍整理。 作为… 阅读更多 »方志类古籍地名识别及系统构建

数字人文在古籍整理领域的应用路径及发展策略

数字人文在古籍整理领域的应用路径及发展策略 李明杰1,2,郑翔3,关思雨1,2 (1.武汉大学信息管理学院  2.武汉大学文化遗产智能计算实验室  3.郑州大学信息管理学院) 摘要:数字人文在古籍研究、古籍推广、古籍整理领域都有应用价值,但从结果来看,在古籍整理领域更具实用性和广泛性。与传统古籍整理范式相结合,数字人文在古籍整理领域的应用路径有二:一是传统古籍整理方法的数据化再… 阅读更多 »数字人文在古籍整理领域的应用路径及发展策略

古文智能处理系列成果之二 | 中国古代典籍实体自动识别模型和工具

中国古代典籍实体自动识别模型和工具 刘江峰,冯钰童,王东波,胡昊天,张逸勤 【研究背景】 近年来,深度学习技术日益成熟,诸如LSTM、BERT模型及其变体在命名实体识别领域均有很多成功的应用。但由于语法上的独特性且与现代汉语、英语存在较大差异,汉语古文语料的分词、词性标注、命名实体识别难度较大。2018年Google发布基于双向Transformer编码器表征的语言模型(BERT)。在BERT模型… 阅读更多 »古文智能处理系列成果之二 | 中国古代典籍实体自动识别模型和工具