首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 629 毫秒
1.
Web概念挖掘中标引源加权方案初探   总被引:15,自引:3,他引:15  
通过对随机采集的1 800篇涉及经济、心理、文学、教育4个学科类别的网页进行人工自由标引、人工打分、词频统计,并进行统计数据的分析,得出网页内容主题与网页题名、文章标题、第一段首句、第一段尾句、第二段首句、第二段尾句、首段、尾段以及HTML标记等12个标引源的关系,分析中文网页的不同部位的主题表达能力,并为之设计加权标引时的适当权值。在我们的Web文本挖掘系统中,进行加权的对比实验表明,此权重方案优于前人的方案。  相似文献   

2.
本研究以逸仙时空BBS为舆情信息源,对需要关注的帖子进行情感倾向性分析的探索性研究,设计了主题帖自动标引和情感倾向性分析策略,并对主题帖自动标引结果、倾向性人工判断与自动分析的结果进行对比。  相似文献   

3.
中文期刊论文自动标引加权设计研究   总被引:7,自引:0,他引:7  
本次调查,通过对随机采集的1000篇涉及到图书情报、农业经济、环境、工业企业管理这四个学科的中文期刊论文进行人工自由标引、人工打分测评和词频统计,并进行统计数据的分析,旨在得出中文期刊论文内容主题与文章题名、文摘、关键词、首段、第二段、倒数第二段、尾段、以及参考文献等8个标引信息源之间的关系,分析测评期刊论文不同部位的主题表达能力,并为之设计自动标引时加权抽词标引的适当权值。以便为中文期刊论文自动标引提供参考数据。  相似文献   

4.
基于知识库的网页自动标引和自动分类系统的设计   总被引:15,自引:0,他引:15  
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。  相似文献   

5.
基于UCL的网页信息自动标引技术研究   总被引:1,自引:0,他引:1  
参照都柏林核心元数据规范构建网页信息的标引框架,提取网页特征信息,采用ADO技术实现网页信息的自动标引,实验结果表明,标引信息映射到网页的正确率为100%。最后,将标引技术应用到互补结构网络智能代理终端,验证UCL标引方法的有效性。实验结果显示,通过基于UCL的网页信息自动分类及标引技术能够实现信息的主动服务,满足用户的个性化需求。  相似文献   

6.
面对搜索引擎基于关键词全文检索导致检索准确度低和学科信息门户加工描述只到站点级别的问题,作者提出了将搜索引擎和学科信息门户结合构建智能学科门户搜索引擎的建议--在经过学科专家筛选的、学科信息门户目录中的高质量网站中自动收集网页,形成网页索引,利用自动标引与自动分类方法对收集到的网页进行标引和分类,最后通过分类浏览目录与主题词检索的方式,向用户提供学术资源网页的查找.文章重点介绍了智能学科门户搜索引擎的网页采集、网页自动标引与自动分类及用户接口的设计与实现,并对该搜索引擎存在的问题进行了分析和讨论.  相似文献   

7.
基于分类标注语料库的关键词标引知识自动获取   总被引:1,自引:0,他引:1  
基于大规模层级分类语料库,抽取网页上专家已经标引的关键词形成关键词表;针对关键词的领域不均匀性和邻界域两个特征,提出并模拟计算了关键词表征文本主题特征程度的主题度。以关键词及其主题度为领域知识,结合统计方法,完成了一个知识与统计相结合的关键词自动标引系统。  相似文献   

8.
使用基于《中图法》知识库的中文信息自动标引和自动分类系统,对中文图书进行自动标引与自动分类的实验,以测试该系统对图书的适用性。实验通过对中文图书进行计算机自动标引与自动分类、人工打分测评、测试结果统计分析,得出中文图书的各标引源主题表达能力依次为:书名、内容提要、两级目次、参考文献、一级目次,在此基础上对标引源进行加权设计,权值设为5:3:2:2。实验证明该系统用于中文图书的自动标引与自动分类是可行的。表6。参考文献9。  相似文献   

9.
一、分类标引的几个关键问题 分类标引是以分类号描述档案文件主题的过程,它与主题标引有许多不同。本文不谈分类标引的一般理论,只谈标引实践中认为是关键的几个问题。 (-)准确把握主题性质,才能赋予正确的类号。在分类标引中,一个条目一般只赋予一个检索标识。这就要在分类标引的主题分析时,必须对文件或案卷进行宏观的综合分析,准确地确定主题性质,用一个分类号从整体上描述主题。否则,主题性质把握不准,标引的类号也就错了。举例说明。  相似文献   

10.
一、标引、受控标引、自由标引 标引是指文献存贮时,对文献进行主题分析后给予检索标识的过程.依据标引的结果对文献进行整序并形成各种检索工具的过程称为文献存贮.  相似文献   

11.
本文分析研究了CIP主题标引中一些粗标、漏标等错误现象,以引起有关人员注意,从而达到正确地进行主题标引的目的。  相似文献   

12.
中文地图具有地域性、多主题性和应用广泛等特点。地图主题标引应遵守统一原则、地区和学科主题要分别标引原则、专指与泛指相结合的原则、全方位原则、新旧地名结合原则 ,等等。在标引实践中 ,应按步骤操作 ,对某些叙词的使用及一些特殊地图学科的主题标引应作出具体规定。参考文献 3。  相似文献   

13.
自动标引是现代信息检索研究工作的重点之一,论述了自动标引的整个过程中所应该注意的问题,并描绘了自动标引的流程图。  相似文献   

14.
韩宁  杨鸣放 《图书馆建设》2012,(3):47-48,51
在《文献主题标引规则》中,文献主题因素一般由主体因素、通用因素、空间因素、时间因素和文献类型因素构成。其中,文献类型因素是指文献主题中表示文献编撰形式、写作形式、内容深浅程度、用途等方面的概念。尽管文献类型因素只是文献标引的辅助标准,但对读者选择和利用文献具有重要的参考价值。在进行文献主题标引时,标引者应根据文献内容的深浅程度、阅读对象、编纂形式、写作形式、用途等具体情况选择恰当的文献类型表达形式。  相似文献   

15.
数字视频信息的索引研究*   总被引:4,自引:0,他引:4  
视频信息的分析、索引和检索是多媒体信息检索研究领域的难点和热点问题之一。本文分析了视频信息的索引对象、内容建模、索引结构和索引模型,并在此基础上对视频信息的结构化、视频文档的组织和索引中存在的问题进行了探讨。  相似文献   

16.
标引的一致性是衡量主题标引质量的重要指标。综述了计算机类献主题标引不一致的四种表现,分析了引起标引不一致的原因,在此基础上探讨了计算机类献主题标引一致性的方法。  相似文献   

17.
邢宁 《津图学刊》2003,(5):39-41
文章通过辨析标引概念,比较分析了与之相关的多个文献情报理论的基本问题,试图从理论本质和实践意义上澄清、说明标引理论的基本含义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号