共查询到17条相似文献,搜索用时 629 毫秒
1.
2.
3.
4.
基于知识库的网页自动标引和自动分类系统的设计 总被引:15,自引:0,他引:15
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。 相似文献
5.
基于UCL的网页信息自动标引技术研究 总被引:1,自引:0,他引:1
参照都柏林核心元数据规范构建网页信息的标引框架,提取网页特征信息,采用ADO技术实现网页信息的自动标引,实验结果表明,标引信息映射到网页的正确率为100%。最后,将标引技术应用到互补结构网络智能代理终端,验证UCL标引方法的有效性。实验结果显示,通过基于UCL的网页信息自动分类及标引技术能够实现信息的主动服务,满足用户的个性化需求。 相似文献
6.
学科门户智能搜索引擎的设计与构建——农业史门户搜索引擎的实验 总被引:1,自引:0,他引:1
面对搜索引擎基于关键词全文检索导致检索准确度低和学科信息门户加工描述只到站点级别的问题,作者提出了将搜索引擎和学科信息门户结合构建智能学科门户搜索引擎的建议--在经过学科专家筛选的、学科信息门户目录中的高质量网站中自动收集网页,形成网页索引,利用自动标引与自动分类方法对收集到的网页进行标引和分类,最后通过分类浏览目录与主题词检索的方式,向用户提供学术资源网页的查找.文章重点介绍了智能学科门户搜索引擎的网页采集、网页自动标引与自动分类及用户接口的设计与实现,并对该搜索引擎存在的问题进行了分析和讨论. 相似文献
7.
基于分类标注语料库的关键词标引知识自动获取 总被引:1,自引:0,他引:1
基于大规模层级分类语料库,抽取网页上专家已经标引的关键词形成关键词表;针对关键词的领域不均匀性和邻界域两个特征,提出并模拟计算了关键词表征文本主题特征程度的主题度。以关键词及其主题度为领域知识,结合统计方法,完成了一个知识与统计相结合的关键词自动标引系统。 相似文献
8.
9.
一、分类标引的几个关键问题 分类标引是以分类号描述档案文件主题的过程,它与主题标引有许多不同。本文不谈分类标引的一般理论,只谈标引实践中认为是关键的几个问题。 (-)准确把握主题性质,才能赋予正确的类号。在分类标引中,一个条目一般只赋予一个检索标识。这就要在分类标引的主题分析时,必须对文件或案卷进行宏观的综合分析,准确地确定主题性质,用一个分类号从整体上描述主题。否则,主题性质把握不准,标引的类号也就错了。举例说明。 相似文献
10.
11.
本文分析研究了CIP主题标引中一些粗标、漏标等错误现象,以引起有关人员注意,从而达到正确地进行主题标引的目的。 相似文献
12.
13.
自动标引是现代信息检索研究工作的重点之一,论述了自动标引的整个过程中所应该注意的问题,并描绘了自动标引的流程图。 相似文献
14.
在《文献主题标引规则》中,文献主题因素一般由主体因素、通用因素、空间因素、时间因素和文献类型因素构成。其中,文献类型因素是指文献主题中表示文献编撰形式、写作形式、内容深浅程度、用途等方面的概念。尽管文献类型因素只是文献标引的辅助标准,但对读者选择和利用文献具有重要的参考价值。在进行文献主题标引时,标引者应根据文献内容的深浅程度、阅读对象、编纂形式、写作形式、用途等具体情况选择恰当的文献类型表达形式。 相似文献
15.
数字视频信息的索引研究* 总被引:4,自引:0,他引:4
视频信息的分析、索引和检索是多媒体信息检索研究领域的难点和热点问题之一。本文分析了视频信息的索引对象、内容建模、索引结构和索引模型,并在此基础上对视频信息的结构化、视频文档的组织和索引中存在的问题进行了探讨。 相似文献
16.
标引的一致性是衡量主题标引质量的重要指标。综述了计算机类献主题标引不一致的四种表现,分析了引起标引不一致的原因,在此基础上探讨了计算机类献主题标引一致性的方法。 相似文献
17.
文章通过辨析标引概念,比较分析了与之相关的多个文献情报理论的基本问题,试图从理论本质和实践意义上澄清、说明标引理论的基本含义。 相似文献