首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
基于标注语料库的有指导学习方法是词义消歧取得性能最好的方法,优于无指导学习方法和基于词典的方法.它的准确率极大地依赖于标注语料库的规模,而目前人工标注语料库数量极少,缺乏标注语料就成为制约词义消歧发展的瓶颈,如何生成大规模标注语料成为词义消歧研究热点.自举是解决上述问题的重要方法,它以小规模标注语料作为种子,运用机器学习算法生成大规模标注语料.本文对自举在词义消歧中的应用和关键问题进行介绍.首先对自举进行算法描述,然后分别从中英文词义消歧领域介绍自举的应用情况,最后对自举应用涉及的初始种子、自举参数、未标注语料集的选择和互联网应用等几个关键问题进行总结.  相似文献   

2.
在深入分析NSTL篇级元数据特点的基础上,结合模糊匹配算法,提出一种适合NSTL现有数据的人名消歧规则集,并给出基于该规则集的人名消歧算法。通过对实际数据集的实验,该算法在准确率、召回率等指标方面都有良好的表现,具备较好的消歧效果。  相似文献   

3.
本文针对英文专利发明人姓名的字符串匹配问题,利用USPTO发明人姓名的数据集,探索现有字符串匹配算法的适用性。对指向同一发明人不能精确匹配的姓名字符串,分别用10种常用的字符串匹配算法进行处理。比较匹配结果发现:Jaro-Winkler算法对同一发明人姓名字符串匹配效果最好,且结果稳定。通过回归分析可知,杰卡德算法对于发明人的识别效果最佳,基于q-gram的算法在发明人姓名消歧中有重要意义;在发明人消歧中,多种字符串匹配算法的组合运用效果更佳。  相似文献   

4.
付媛  朱礼军  韩红旗 《情报工程》2016,2(1):053-058
为应对日益严重的姓名歧义现象给提高搜索引擎查全率和查准率带来的挑战,同时给姓名消歧方法研究提供参考建议,对研究现状和主要成果进行总结.首先,介绍研究姓名消歧的目的和意义.其次,对国内外现有姓名消歧方法研究进展进行梳理,主要方法包括基于特征的、基于机器学习的、基于社会网络的、基于网络知识资源的姓名消歧等多种方法来解决姓名歧义问题.最后,文章分析各种方法的特征和不足,总结姓名消歧待解决的问题以及未来的研究方向.  相似文献   

5.
基于网络协作标注的标签消歧方法述评   总被引:1,自引:0,他引:1  
以网络协作标注中的标签为研究对象,调研标签消歧方法,并将其划分为基于数据挖掘方法消歧、基于统计分析方法消歧、利用相关知识组织工具消歧、引入控制机制消歧和开发可视化组件消歧5类。比较这5类消歧方法在用户参与度、消歧时机、消歧性质、实验与应用情况和发展前景5个方面存在的区别和联系。  相似文献   

6.
借鉴现代汉语词义消歧的研究成果,提出一种改进的向量空间模型词义消歧方法,即在古汉语义项词语知识库的支持下,将待消歧多义词上下文与多义词的义项映射到向量空间模型中,完成语义消歧任务。以中国农业古籍全文数据库为统计语料,对10个典型古汉语多义词,共29个义项、1 836条待消歧上下文进行义项标注的实验,消歧平均正确率达到79.5%。  相似文献   

7.
一个构造良好的查询是信息检索质量的基本保证,语义查询扩展技术解决了传统信息检索系统不能很好理解用户查询意图的问题,在提高检索查全率的同时保证了检索准确率。本文以查询关键字之间的语义关联为切入点,辅以隐式反馈技术获取消歧上下文,以WordNet本体库和WordNet Domains扩展库作为消歧数据源,使用基于局部上下文和基于图论的两类无导词义消歧方法进行查询关键字到本体概念的映射,最后基于概念词汇关联完成基于语义的查询扩展。综合WordNet本体库和WordNet Domains扩展库中的各项知识源对查询词义进行判定,保证了词义消歧的精度;采用无导词义消歧实现查询词义的快速判定,保证了信息检索的实时性;根据查询关键词的多寡分别提出两类消歧方法,满足了各种查询需求。  相似文献   

8.
沈喆  王毅  鞠秀芳  成颖 《情报学报》2022,(4):350-363
学者完整且准确的学术成果集为科学计量与科研人才评价等研究提供了重要的数据基础。在现有基于机器学习模型的作者姓名消歧方法尚未达到实用要求的背景下,本研究面向高层次科研人才,充分利用基于规则方法精确率高的优势,提出了“先面向精确率,后面向召回率”的“两步法”作者姓名消歧模型。得益于该群体易于从网络中搜集其履历、研究方向和代表作等信息,消歧模型可采用的特征更加丰富,从而保证了消歧模型的优异性能。本研究以国家杰出青年科学基金获得者为例对模型进行了验证,结果表明,本研究提出的高层次科研人才作者名消歧模型在精确率与召回率两个方面均表现良好,在两组不同特征集上的F1值分别达到了0.93和0.95,较基线模型有较大提升。  相似文献   

9.
吴丹 《图书情报工作》2009,53(13):120-81
查询翻译歧义性问题是影响跨语言信息检索结果的关键,因此针对查询翻译的消歧研究已成为信息检索领域的研究热点。在对现有研究与应用调研的基础上,详细分析四类自动消歧方法,分别是:对查询进行结构化处理、通过语言分析帮助消歧、借助机读化语言资源进行消歧以及通过人机交互消歧,以期为跨语言信息检索查询翻译提供较好的消歧方法。  相似文献   

10.
社会化标注系统中标签检索质量模拟研究   总被引:1,自引:0,他引:1  
社会化标注系统近年发展迅速,伴随出现的垃圾标注泛滥现象不容忽视。本文以社会化标注系统中标签检索质量为研究对象,细化普通用户标注行为,建立社会化标注模拟系统,明确定义系统内用户结构、标注规则、检索策略和检索质量算法,从实证角度评估用户规模变化、用户结构变化、用户标注量变化和垃圾用户的攻击策略选择对标签检索质量的影响。本文对于改善社会化标注系统中的标签检索算法以及提高用户体验具有重要意义。  相似文献   

11.
结合<长江蔬菜>多年的实际发行工作经验,阐明发行工作中要"最大限度"注意的8个问题;锁定和开发终端读者;发挥行业发展优势;发挥邮局主渠道作用;加大发行征订宣传力度;加大发行投入力度;强化发行服务意识;加强发行数据库建设;突破制约当前期刊发行的瓶颈.  相似文献   

12.
The article discusses the program “Registration of the Polish Collections Abroad,” conducted by the Department of Cultural Heritage of the Ministry of Culture and National Heritage of the Republic of Poland. Its goal is to create a register of the significant Polish collections outside Poland.  相似文献   

13.
探讨数字化时代科技期刊支持信息存在的必要性及其对科技期刊影响力提升的重要意义.以化学类期刊为例分析国内期刊支持信息的现状及合理利用,认为合理利用支持信息是提升科技期刊数字化水平及影响力的有效手段.  相似文献   

14.
一般认为《艺文类聚》的子目数量是727个,但是这个统计欠妥当。本文从类书体例、语义以及版本上,对第十六卷、第八十一卷、第八十八卷、第九十卷中几个子目详细考察,认定《艺文类聚》共有子目732个,细分之,则为正式子目726个,附目6个。  相似文献   

15.
参考文献引用的学术评价作用   总被引:17,自引:7,他引:10  
朱大明 《编辑学报》2005,17(5):324-325
参考文献引用和著录具有学术评价功能,对促进学术交流、体现学术论文发表的学术价值都具有很重要的作用.按照表达方式可以将其划分为直接评价和隐含式评价2种形式;从评价内容看,参考文献引用的学术评价包括肯定性评价、否定性评价和商榷性评价3种类型.  相似文献   

16.
论文对我国社会科学院网站的学术资源进行了统计和分析,包括学术期刊、数据库和研究资料、学术交流、科研项目、研究成果、出版信息、学人介绍、热点问题讨论、研究生培养、学术资源链接等内容,并指出了存在的问题,提出了合理的建议。  相似文献   

17.
对英国北安普敦大学图书馆网络化信息资源开放获取、馆际合作、资源共享以及个性化服务中卓有成效的做法与措施进行了简要介绍,反映了英国大学图书馆界"以人为本"的文献信息服务理念.  相似文献   

18.
从美国媒体报道看PNTR的通过   总被引:1,自引:0,他引:1  
20 0 0年美国媒体对中美永久正常贸易关系 (PNTR)的报道 ,数量大、范围广、观点多。同时 ,围绕这一主题的报道 ,又体现出经济问题政治化、国际报道国内化的特点。总之 ,政府和工商界的影响 ,媒体自身的利益 ,推动了此次报道较以往对华负面报道的积极变化 ,促成了PNTR的通过。但美国媒体对PNTR的正面报道应看作是特例。  相似文献   

19.
文章指出图书借阅活动中存在的信息不对称现象严重影响了信息资源的利用率,分析了信息不对称现象的成因及危害,进而提出了抑制信息不对称现象的策略.  相似文献   

20.
学术期刊责任编辑之责任所在   总被引:1,自引:0,他引:1  
杨弘 《编辑学报》2013,25(5):409-412
在深化文化体制改革、推动社会主义文化大发展大繁荣的背景下,中国学术期刊面临着许多挑战,其责任编辑的责任也被赋予许多新的内容。文章探讨学术期刊责任编辑如何实现作者队伍建设、审稿专家的正确选择和保护、服务读者、恪守职业道德、做好编辑加工、学术创新、期刊经营的责任。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号