共查询到20条相似文献,搜索用时 93 毫秒
1.
基于标注语料库的有指导学习方法是词义消歧取得性能最好的方法,优于无指导学习方法和基于词典的方法.它的准确率极大地依赖于标注语料库的规模,而目前人工标注语料库数量极少,缺乏标注语料就成为制约词义消歧发展的瓶颈,如何生成大规模标注语料成为词义消歧研究热点.自举是解决上述问题的重要方法,它以小规模标注语料作为种子,运用机器学习算法生成大规模标注语料.本文对自举在词义消歧中的应用和关键问题进行介绍.首先对自举进行算法描述,然后分别从中英文词义消歧领域介绍自举的应用情况,最后对自举应用涉及的初始种子、自举参数、未标注语料集的选择和互联网应用等几个关键问题进行总结. 相似文献
2.
在深入分析NSTL篇级元数据特点的基础上,结合模糊匹配算法,提出一种适合NSTL现有数据的人名消歧规则集,并给出基于该规则集的人名消歧算法。通过对实际数据集的实验,该算法在准确率、召回率等指标方面都有良好的表现,具备较好的消歧效果。 相似文献
3.
本文针对英文专利发明人姓名的字符串匹配问题,利用USPTO发明人姓名的数据集,探索现有字符串匹配算法的适用性。对指向同一发明人不能精确匹配的姓名字符串,分别用10种常用的字符串匹配算法进行处理。比较匹配结果发现:Jaro-Winkler算法对同一发明人姓名字符串匹配效果最好,且结果稳定。通过回归分析可知,杰卡德算法对于发明人的识别效果最佳,基于q-gram的算法在发明人姓名消歧中有重要意义;在发明人消歧中,多种字符串匹配算法的组合运用效果更佳。 相似文献
4.
5.
基于网络协作标注的标签消歧方法述评 总被引:1,自引:0,他引:1
窦玉萌 《现代图书情报技术》2010,26(3):27-32
以网络协作标注中的标签为研究对象,调研标签消歧方法,并将其划分为基于数据挖掘方法消歧、基于统计分析方法消歧、利用相关知识组织工具消歧、引入控制机制消歧和开发可视化组件消歧5类。比较这5类消歧方法在用户参与度、消歧时机、消歧性质、实验与应用情况和发展前景5个方面存在的区别和联系。 相似文献
6.
7.
一个构造良好的查询是信息检索质量的基本保证,语义查询扩展技术解决了传统信息检索系统不能很好理解用户查询意图的问题,在提高检索查全率的同时保证了检索准确率。本文以查询关键字之间的语义关联为切入点,辅以隐式反馈技术获取消歧上下文,以WordNet本体库和WordNet Domains扩展库作为消歧数据源,使用基于局部上下文和基于图论的两类无导词义消歧方法进行查询关键字到本体概念的映射,最后基于概念词汇关联完成基于语义的查询扩展。综合WordNet本体库和WordNet Domains扩展库中的各项知识源对查询词义进行判定,保证了词义消歧的精度;采用无导词义消歧实现查询词义的快速判定,保证了信息检索的实时性;根据查询关键词的多寡分别提出两类消歧方法,满足了各种查询需求。 相似文献
8.
学者完整且准确的学术成果集为科学计量与科研人才评价等研究提供了重要的数据基础。在现有基于机器学习模型的作者姓名消歧方法尚未达到实用要求的背景下,本研究面向高层次科研人才,充分利用基于规则方法精确率高的优势,提出了“先面向精确率,后面向召回率”的“两步法”作者姓名消歧模型。得益于该群体易于从网络中搜集其履历、研究方向和代表作等信息,消歧模型可采用的特征更加丰富,从而保证了消歧模型的优异性能。本研究以国家杰出青年科学基金获得者为例对模型进行了验证,结果表明,本研究提出的高层次科研人才作者名消歧模型在精确率与召回率两个方面均表现良好,在两组不同特征集上的F1值分别达到了0.93和0.95,较基线模型有较大提升。 相似文献
9.
10.
11.
12.
Jacek Puchalski 《Slavic & East European Information Resources》2013,14(4):242-251
The article discusses the program “Registration of the Polish Collections Abroad,” conducted by the Department of Cultural Heritage of the Ministry of Culture and National Heritage of the Republic of Poland. Its goal is to create a register of the significant Polish collections outside Poland. 相似文献
13.
14.
韩建立 《图书馆工作与研究》2011,(12):91-93,128
一般认为《艺文类聚》的子目数量是727个,但是这个统计欠妥当。本文从类书体例、语义以及版本上,对第十六卷、第八十一卷、第八十八卷、第九十卷中几个子目详细考察,认定《艺文类聚》共有子目732个,细分之,则为正式子目726个,附目6个。 相似文献
15.
参考文献引用的学术评价作用 总被引:17,自引:7,他引:10
参考文献引用和著录具有学术评价功能,对促进学术交流、体现学术论文发表的学术价值都具有很重要的作用.按照表达方式可以将其划分为直接评价和隐含式评价2种形式;从评价内容看,参考文献引用的学术评价包括肯定性评价、否定性评价和商榷性评价3种类型. 相似文献
16.
论文对我国社会科学院网站的学术资源进行了统计和分析,包括学术期刊、数据库和研究资料、学术交流、科研项目、研究成果、出版信息、学人介绍、热点问题讨论、研究生培养、学术资源链接等内容,并指出了存在的问题,提出了合理的建议。 相似文献
17.
对英国北安普敦大学图书馆网络化信息资源开放获取、馆际合作、资源共享以及个性化服务中卓有成效的做法与措施进行了简要介绍,反映了英国大学图书馆界"以人为本"的文献信息服务理念. 相似文献
18.
从美国媒体报道看PNTR的通过 总被引:1,自引:0,他引:1
20 0 0年美国媒体对中美永久正常贸易关系 (PNTR)的报道 ,数量大、范围广、观点多。同时 ,围绕这一主题的报道 ,又体现出经济问题政治化、国际报道国内化的特点。总之 ,政府和工商界的影响 ,媒体自身的利益 ,推动了此次报道较以往对华负面报道的积极变化 ,促成了PNTR的通过。但美国媒体对PNTR的正面报道应看作是特例。 相似文献
19.
影响图书馆信息资源利用率的一个重要因素--析读者借阅过程中的信息不对称现象 总被引:4,自引:0,他引:4
薛民 《大学图书情报学刊》2004,22(3):82-83
文章指出图书借阅活动中存在的信息不对称现象严重影响了信息资源的利用率,分析了信息不对称现象的成因及危害,进而提出了抑制信息不对称现象的策略. 相似文献
20.
学术期刊责任编辑之责任所在 总被引:1,自引:0,他引:1
在深化文化体制改革、推动社会主义文化大发展大繁荣的背景下,中国学术期刊面临着许多挑战,其责任编辑的责任也被赋予许多新的内容。文章探讨学术期刊责任编辑如何实现作者队伍建设、审稿专家的正确选择和保护、服务读者、恪守职业道德、做好编辑加工、学术创新、期刊经营的责任。 相似文献