首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 875 毫秒
1.
叙词在网络环境中的应用   总被引:1,自引:0,他引:1  
叙述了叙词在网络环境下的三种应用模式 :用叙词直接标引和检索 ;在基于关键词检索的搜索引擎中实现检索式的扩展 ;通过叙词实现不同词表或分类法之间的兼容互换 ,以便交叉检索  相似文献   

2.
本文分析了搜索引擎和后控词表结合的可能性,探讨了网络后控词表的编制方式、词表结构、词表管理和新词推荐算法等理论。根据这些理论,结合网络资源和网络搜索引擎的特点,设计了一个网络后控词表系统。笔者使用Java语言实现了这一后控词表系统的功能。最后笔者通过实验对本系统进行了评价,并提出网络后控词表的研究方向。  相似文献   

3.
对科技论文依据《汉语主题词表》标引关键词问题的思考   总被引:3,自引:0,他引:3  
本文在论述关键词定义和《汉语主题词表》局限性的基础上,提出关键词是一种不受词表控制的自由词,它和主题词之间不是等同关系和属种关系,标引关键词不应受《汉语主题词表》控制。《汉语主题词表》更新慢,容量和专指度不足,不适合用于科技论文的主题标引,宜改用专业性叙词表或参考《中国分类主题词表》进行分类和主题的一体化标引。  相似文献   

4.
赵宗蔚 《图书馆论坛》2005,25(1):119-121
期刊论文必须标有关键词,关键词属未经规范的自然语言,利用关键词索引对查全率和查准率产生影响。为了提高关键词索引质量,采用自然语言与人工语言结合的后控制词表来提高期刊论文关键词标引质量。  相似文献   

5.
2.5后控制词表 为自然语言检索系统配备后控制词表,是提高其检索效率的有效 措施。 后控制词表的性质类似于人口词表,它是一种转换工具,是一种 扩检工具,是一种罗列自然语言检索标识供选择的工具。 后控制词表的特点在于:其中的控制词(也可以是分类号)并非直接用于标引,而是对作为文献检索标识的自然语言词进行控制(建立等同、等级。相关关系)。因此,在后控制词表中,标引一检索用词是自然语言,非标引一检索用词却是人工语言,这与在一般词表中的情形正好相反。 后控制词表必须在检索系统中实有的自然语言检索标识的基础上…  相似文献   

6.
本文通过对现有搜索引擎分析,提出搜索引擎的改进措施,包括两个方面:网络信息发布和信息采集的规范化:引入元数据;网络信息组织和检索方面的规范化控制:引入检索语言,重点讨论了词表和专业搜索引擎的结合问题。  相似文献   

7.
�ۺ���ƴʱ�   总被引:25,自引:2,他引:23  
本文阐述了后控制词表的控制机理、控制程度、编制特点、各种编制方式及其在控制上的差别,提出一种“分类词表+字顺/轮排表”的结构模式,并说明利用后控制词表检索文献的各种方法。  相似文献   

8.
本文对现阶段中文搜索引擎的两种主要搜索方式:目录式搜索(即分类搜索)与关键词搜索分别进行了介绍和分析,以网易搜索引擎为例阐述了网站信息标引的三种方式,并分析了网易搜索引擎特色及问题,国内搜索引擎发展前景的问题。 现阶段网络搜索引擎有两种主要搜索方式:目录式搜索(即分类搜索)与关键词搜索 目前因特网上的搜索引擎很明显地可分为两大类,一类是自由词或关键词检索搜索引擎(国外称之为索引搜索引擎Indexing),另一类是分类搜索引擎,即通过分类浏览来查询信息,(国外称之为目录服务Director Service)。 当然这两类搜索引擎的功能是互相借鉴和渗透的。目前的搜索引擎,尤其是中文搜索引擎有互相融合的趋势,关键词搜索引擎与分类搜索引擎通常是我中有你,你中有我,国内的关键词搜索引擎大多又建有一个分类库。一般来讲,我们将由网上机器人(Spider或Robot)自动收集网页建库,而检索又以全文检索为主的搜索引擎归入关键词搜索引擎,而将主要由人工维护建库,以分类导航或分类摘要查询为主的搜索引擎归入分类搜索引擎。以下将按关键词搜索引擎与目录式(分类)搜索引擎两大类型来分别进行一些分析。  相似文献   

9.
搜索引擎关键词和目录检索系统合并提高检索效率   总被引:3,自引:1,他引:2  
基于关键词搜索引擎和目录搜索引擎存在的不足,提出使两个搜索系统合并,开发网络书目控制搜索引擎的方案,提出构建纵横交错的网络信息知识链接地图的新观点,并例证说明关键词和目录检索系统合并如何提高检索效率。  相似文献   

10.
万维网搜索引擎研究新进展   总被引:3,自引:0,他引:3  
从万维网搜索引擎的定义、检索机制、检索规则、词表应用、分类研究、比较研究、网站信息资源评价、搜索引擎的评价和选择等方面综述了国内外搜索引擎(含医学搜索引擎)研究和开发应用所取得的新进展。  相似文献   

11.
索引性能是衡量搜索引擎优劣的一个重要指标。文章通过实验的方法,用TREC-4和WT10g数据集合分别对12种主流开源搜索引擎做了两组索引测试,记录了它们在索引不同大小数据集合时的时间开销和资源消耗情况,并根据实验数据对这些搜索引擎的索引性能进行了比较和评估。  相似文献   

12.
康艳  张虹  侯汉清 《图书情报工作》2007,51(10):139-142
随着网络信息技术的发展和搜索引擎的兴起,传统情报检索语言在网络环境下存在的必要性受到质疑。用网络信息检索的大量实践回答检索语言能否适应网络信息组织这个问题。首先列举分类语言和主题语言在国内外网络应用的大量实例,然后以其自身的优势来说明检索语言存在的必要性,并分析他们在网络环境下表现出的强大生命力。  相似文献   

13.
自动标引研究的回顾与展望*   总被引:3,自引:0,他引:3  
对自动标引的研究进行总结与回顾。对标引对象进行界定;分析自动标引研究的3个阶段,并列出50年研究历程中的代表性方法;详细描述自动标引研究路线图、并对抽词标引与赋词标引方法进行详细分类;最后指出自动标引中存在的问题,并对今后的自动标引研究和应用方向进行展望。  相似文献   

14.
为了便于用户浏览搜索引擎返回结果,本文提出了一种基于TFIDF新的文本相似度计算方法,并提出使用具有近似线性时间复杂度的增量聚类算法对文本进行多层聚类的策略。同时,提出了一种从多文本中提取关键词的策略:提取簇中的名词或名词短语作为候选关键词,综合考虑每个候选关键词的词频、出现位置、长度和文本长度设置加权函数来计算其权重,不需要人工干预以及语料库的协助,自动提取权重最大的候选关键词作为类别关键词。在收集的百度、ODP语料以及公开测试的实验结果表明本文提出方法的有效性。  相似文献   

15.
数字图书馆与数字化分类法   总被引:12,自引:0,他引:12  
数字化分类法不仅要能够适合传统文献的分类检索 ,也应能适应各种信息尤其是网络信息的分类和检索。它应借鉴搜索引擎构建多维的分类体系和多途径检索 ,吸收我国已有的信息分类编码成果 ,具有自动搜索、分析、标引和著录的智能性。参考文献 6。  相似文献   

16.
搜索引擎检索结果的组织技术   总被引:9,自引:0,他引:9  
赵荣  黄燕云  张露 《情报学报》2004,23(1):69-72
本文综合分析了几种主要的搜索引擎检索结果排序组织技术的原理及应用 ,包括关键词词频和位置原理、网页链接级别算法和结果分类组织等。  相似文献   

17.
中文期刊文献通用词标引分析   总被引:1,自引:0,他引:1  
通用因素是文献主题的构成因素之一,对主体因素起细分作用。通用词是指那些在专业领域没有独立检索意义的泛指词。在中文期刊文献标引的过程中,通用词的使用对其标引结果产生着重要的影响。文章讨论了通用词标引的一般规则,并以《中国期刊网》中的文献为例,进行抽样统计和实例分析,归纳了通用词标引的错误现象及其原因,并对期刊文献的通用词标引提出了几点改进意见。  相似文献   

18.
查贵庭  侯汉清 《情报学报》2002,21(3):273-277
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。  相似文献   

19.
科技期刊论文关键词标引的问题与对策   总被引:21,自引:3,他引:18  
王昌度  熊云  徐金龙  江源 《编辑学报》2003,15(5):349-351
鉴于在对科技期刊论文进行分类标引和关键词标引的看法和做法上,特别是关键词的标引,我国科技期刊界还存在分歧,对关键词标引的认识和标引准确性等方面存在的问题做了分析,对提高标引质量提出了对策。  相似文献   

20.
ABSTRACT

This study analyzed the search results of four main Internet search engines on three newly created digital collections at Texas Tech University Libraries, in order to assess the search engine indexing on metadata and PDF files of digital items that are published in the institutional repository. The exploratory study found that only one search engine discovered PDF files, while the others only discovered metadata. The results of the study also suggested that metadata and PDF files can supplement each other to facilitate discoverability of the digital collections on search engines, and revealed some findings that are contradictory to conclusions in previous research.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号