首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 734 毫秒
1.
基于用户查询关键词的网页去重方法研究   总被引:2,自引:0,他引:2  
在研究传统的基于特征码去重算法的基础上,针对元搜索引擎中网页重复现象,提出一种基于用户查询关键词的网页去重方法,提高元搜索引擎检索质量,并且介绍算法的实现过程,通过实验验证算法的有效性。  相似文献   

2.
秦杰  谢蕙  王春云 《图书情报工作》2010,54(15):113-116
针对元搜索结果中的网页重复问题,把基于最长公共子序列(Longest Common Subsequence,简称LCS)的网页去重方法应用到元搜索引擎的去重中,提出基于SLCS(首字母S表示Summary)的元搜索去重方法。在获得网页文档摘要后,根据查询词在语句中出现的次数和语句长度,计算摘要语句集合中每个语句权重,提取权重最大的语句作为网页摘要特征语句,通过比较摘要特征语句间的LCS,计算出结果网页相似性,以提高元搜索引擎的检索质量,实验表明该方法具有较高的准确率。  相似文献   

3.
张锐 《晋图学刊》2014,(6):24-27
笔者研发的基于EXCEL的查新去重与格式整理小工具是针对中国知网、万方、维普、中国知识产权局专利检索与服务系统设计的。该工具能够读取各数据库不同格式的数据、对数据进行去重、最后按照查新格式导出。该工具相较于时下流行的文献去重软件(如Note Express和Note First),最主要的进步特点为:其不但整合了单个数据库不同格式的数据内容,且在去重时能够抽取不同数据库的内容进行整合,从而弥补单一数据库数据内容不完全的缺陷;同时还具有方便快捷、无需安装、操作简单易学等特点。  相似文献   

4.
文献跨库检索中去重方法研究与应用   总被引:1,自引:0,他引:1  
以作者和单位发文的统计需求为背景,分析作者和单位发文在跨库检索中产生数据冗余的特殊成因,在借鉴网页去重的基础上,设计中文跨库ID、英文跨库ID、DOI以及"标题+类型"4种文献跨库去重方法,解决中文库之间、英文库之间以及中英文库之间的冗余问题,并有效应用于专家发文和单位发文信息获取与统计工作中。  相似文献   

5.
电子出版物采访中应注意的几个问题 :1 协调好电子出版物与馆藏图书的关系。图书馆不能把电子出版物的采访作为一个独立的系统自我发展 ,而要同全馆其他类型的文献 (主要是馆藏图书 )进行协调。电子出版物虽然有许多独特的功能 ,但并不能取代馆藏图书 ,特别是目前大多数图书馆仍要以相当的力量去采购图书 ,这就有一个避免电子出版物与图书内容重复的问题。因此要把电子出版物的采访纳入文献资源建设统筹考虑 ,根据本馆的实际需要进行采访 ,力争使各种类型的文献在内容和功能上形成互补 ,避免重复和浪费。2 平时注意收集有关电子出版物的书…  相似文献   

6.
近几年来,随着国家对外开放政策的实行,不少图书馆为丰富自己的馆藏,最大限度地满足读者的需要,增加了对国外原版图书的订购,取得了一定的成绩。但是,科学技术的高速发展,使得科技文献的出版量也在以惊人的速度增长着。这种增长,一方面为图书馆的藏书搜集扩大了书源和选择余地,另方面由于这些文献在发行中存在着严重的重复征订,而绘图书馆的搜集工作带来了一些不可忽视的问题。例如,增加了图书订重可能性就是其中之一。一旦订重,不仅浪费,也影响藏书的质量。所以,应该尽力防止。各馆防止图书订重的措施,目前主要是加强选订时的查重和制订可行的工作细则,以堵塞  相似文献   

7.
高勇 《档案学研究》2007,21(6):27-30
现行档案存在重复,历史档案也存在重复,而且有的重复情况还很严重,这是我国各级档案馆馆藏历史档案存在的事实.本文对历史档案重复的不良后果与影响,造成历史档案重复及制约消重工作开展的因素进行了分析,提出了消除历史档案重复举措.  相似文献   

8.
藏书建设要符合本地区文献资源分布合理化的需要,这条已由实践经验证实的客观规律,是贯彻藏书建设实用性原则的重要保证,其核心内容是避免对专深文献各馆间平行重复采访,与分工协调原则密切相关,互为呼应。应该在相应的理论研究中得到反映;应该将这一研究成果充实到原有的理论基础中去。通过正确的理论观点以及准确、深刻的表述,达到有力地指导实践的目的。  相似文献   

9.
重复文献信息对人们学习研究的干扰和危害是很大的。由于种种原因,相当一部分同志在学术和科技上不负责任,造成大量的重复文献信息到处泛滥。虽然人人痛恨这种现象,但很多人又出于种种目的或无奈的原因还是做了和继续做着制造重复文献信息的事情。那么,到底是什么原因造成这种局面呢?能不能尽量消除甚至杜绝这种现象呢?作者在此作一些探讨。  相似文献   

10.
近年来,随着科学技术的发展,文献大量增长,出现了名目繁多的书目广告。这种现象给外文图书的采访工作带来了一定的困难,主要是经常发生重复订购问题。在实际工作中,造成重复订购的原因很多。现根据我们在日常工作中的一些体会,扼要地分析一下外文图书订重的原因,并提出几点解决的方法。一、发生订重的原因主观方面的原因,主要是工作中粗枝大叶,款目著录标目不划一、不标准。目前北京303信箱负责编制发行的光华版外文影印书籍编目卡,对图书著录的标准化无疑是一件有益的事,为今后馆际网络的形成和联机检索、资料共享提供了可靠  相似文献   

11.
张琪玉先生《情报语言漫笔》系列之十一,收录“教师数据库”、“两种同义词词典的结构和功能”、“关于书次号的标准化”、“文献去重”、“我的藏书的排架号”等5篇专题文章。  相似文献   

12.
研究了图书资料财产帐号重复的各种现象,分析了财产帐号重复的原因及其对文献资源的采集、整合、检索、开发、利用的影响,介绍了不同类型财产帐号重复问题的处理方法。  相似文献   

13.
为解决各引文数据库的检索方法、检索结果展示方式不一、引文著录不规范等问题,解放军医学图书馆采用 NET 框架作为系统的开发平台,采用 C/S 结构模式,在生物医学引文数据库的基础上构建生物医学文献引文集成检索整合平台,实现了统一平台一站式检索、自动去重、自动分组和便捷输出规范的引文报告等个性化功能,提高了生物医学文献查引效率。  相似文献   

14.
黑龙江省高校图书馆文献信息资源优化配置与建设研究   总被引:1,自引:0,他引:1  
黑龙江省高校图书馆文献信息资源具有以下特点:收藏广泛;文献购置费和文献购置比例相差悬殊;分布不均衡;工业、农业、医学类文献丰富;数字化程度普遍提高。但也存在重复订购、文献利用率低、集团采购力度不大、服务理念及服务意识淡薄等问题。因此提出以下对策:借助网络技术实现信息资源的充分共享;建立文献信息资源共知系统;共建特色数据库;协调采购,减少重复订购;实现馆际互借与文献传递服务;向社会开放,拓宽高校图书馆的服务范围;充分利用网络免费资源;提高读者的情报意识。  相似文献   

15.
专利信息「重复现象」浅析靳小青马建伟(青岛大学据统计,全世界每年出版的专利文献有100万件,居特种文献之首。但这100万件专利中有三分之二以上为重复专利。重复专利包括两种情况。其一是由于一件发明专利要先后经历公开、实审(公告)不同的审查程序所致。这要...  相似文献   

16.
报刊所涉及的内容极其广泛,报导迅速,是教学和科究必不可少的文献。搞好报刊预订工作是图书馆情报部门提高服务质量的前题和基础。报刊预订工作特点是时间紧,数量大,计算、统计和制表繁杂而且工作量大。长期以来,我馆的报刊预订工作都用人工去做,花很多时间在复核、计算等繁杂重复的劳动上。稍不小心,就会错抄报刊代号、计算错金额,造成漏订、错订或重订。今年我们利用BCM—Ⅲ微型电子计算机进行计算、统计和制表,避免了上述错误的发生,节省了大量的时间,顺利地完成了报刊的预订工作。利用微机辅助报刊的预订工作的研究,  相似文献   

17.
机读目录的重复著录与简化   总被引:2,自引:0,他引:2  
夏翠军 《图书馆论坛》2003,23(2):82-83,96
从两大方面分析了普通中文图书机读目录格式的重复著录:机读目录格式规定的数据重复和对文献的同一信息从不同角度多次进行描述而导致的重复著录,着重分析了后一种重复著录产生的原因和利弊,并提出了相应的简化措施。  相似文献   

18.
改进高校图书馆评估指标体系的探讨   总被引:1,自引:0,他引:1  
目前高校图书馆评估指标体系中存在重数量轻质量、重形式轻内容、重硬件轻软件等不合理的做法.针对这些问题,高校图书馆在硬件方面要全面评价馆藏资源,包括印刷型文献及电子文献;在软件方面也要重视对服务水平、服务质量、办馆效益、学术水平、馆员业务素质、文献分编质量等的测评.  相似文献   

19.
针对国内2000-2010年之间有关网页去重技术的研究成果进行计量分析,重点从网页结构、网页特征、网页内容、同源网页、元搜索等方面总结和分析去重技术的基本研究现状,并兼论基于布尔逻辑模型与傅立叶系数的网页去重以及网页去重技术在一些特殊领域的应用研究。  相似文献   

20.
现代医院图书馆文献资源建设与发展模式   总被引:1,自引:1,他引:0  
医院图书馆普遍存在文献资源分布不合理,重复订购导致大量资金浪费等现象.如何实现文献资源的合理建设与发展,文章通过探讨惠州医院图书馆文献资源建设的重要性,分析实现文献资源建设的可行性及存在的问题,提出了现代医院图书馆文献资源建设的发展模式及建议.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号