首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
李纲  叶光辉 《图书情报工作》2013,57(21):104-111
语义网的发展为模糊语词转模糊概念检索提供了可能,鉴于词表在模糊检索系统中的主导地位,实现模糊概念检索必须先完成词表向本体的转换。在综合分析和评价已有转换方法的基础之上,提出综合转换法。该方法继承间接转换法规范的概念抽取及关联设计规则,又通过综合评议和词信息量、词间关联度、文档频率等参数的算法设计改变了直接转换法过于程式化的处理方式。最终将词词关联矩阵转换为概念矩阵,叙词表升级为本体库,并在现有检索算法的基础上设置了检索原子与概念的映射关系,以实现概念检索。  相似文献   

2.
分析了传统叙词表在网络信息检索系统应用中存在的不足之处,并提出了改进方案,即在传统叙词表的基础上构建一个包括核心词库、扩展词库以及两者间映射关系的扩展型叙词表,该词表可用于对用户检索词进行规范化处理,从而改善检索效果。  相似文献   

3.
叙词表中词间关系分为等同关系(EquivaLence Relationship)、等级关系(Hierarchical Relationship)和相关关系(Associative Relationship),词间关系的控制是叙词表编制的关键技术,文章主要针对叙词表词间的等级关系和相关关系,比较国际标准ISO2788、中国标准GB13190—91以及关国标准NISO Z39.19—2005对其的规定,分析异同,总结联系,从三个标准的实用性、检索效率等方面予以分析,并为中国叙词表编制标准提出改进建议。  相似文献   

4.
网络环境中汉语叙词表的自动构建研究   总被引:2,自引:0,他引:2  
为解决网络信息检索效率低的问题,需要把叙词表等控制机制引入到网络检索系统中,但传统词表编制方式已经不能满足网络信息检索的需要.本文制定了一种汉语叙词表自动构建方案,以财税领域为例,采用模式识别、词聚类、同现分析等自然语言处理技术实现自动识别词间等同关系、等级关系和相关关系,从而构建一部财税领域叙词表,最后对所构建的叙词表进行测评.相比传统叙词表编制方法,自动构建叙词表能降低编表专家的智力负担,而且编表时间短,费用低,时效性强,符合普通用户的检索习惯.但对词间关系的识别不如人工编表时精当可靠,所以需要人工辅助判定.  相似文献   

5.
叙词表已有的参照系统及几种图形显示形式在网络环境中显然不能动态地、全面地显示词间关系,不便于浏览和检索。本文分析了利用本体编辑工具Prot啨g啨实现叙词表可视化的必要性,并以《汉语主题词表》为例,利用Prot啨g啨的可视化插件,进行了叙词表等同关系、等级关系及相关关系可视化的实验,并讨论了整部关系和例举关系的可视化。  相似文献   

6.
叙词表已有的参照系统及几种图形显示形式在网络环境中显然不能动态地、全面地显示词间关系,不便于浏览和检索。在分析本体编辑工具Protg实现叙词表可视化的必要性基础上,以《汉语主题词表》为例,利用Protg的可视化插件TGVizTab,进行叙词表等同关系、等级关系和相关关系的可视化实验,并讨论了整部关系和例举关系的可视化。  相似文献   

7.
基于词表的情报检索系统JKJ/TMS   总被引:1,自引:0,他引:1  
传统的情报检索系统建立在一个共同的假设之上,即词独立性(term-independence)假设.这个假设是不恰当的.本文以词相关(term-devendence为前提,提出基于词表的检索系统,词表在此被看作一个反映词相关关系及词义的逻辑结构.分析讨论了词表在检索系统中的作用,描述了JKJ/TMS中的检索算法、词义分辨、自动扩展检索提问和扩检候选项的选择,以及组合主题检索算法.基于词表的检索系统利用词表中所反映的词间关系和词义知识改进检索系统的检索效果  相似文献   

8.
通过模糊集合检索模型的规范描述,本文首先定义了检索系统中检索效率和系统效率之间的函数关系,并应用该函数关系对比分析模糊集合检索系统和标准布尔检索系统的性能,指出模糊集合检索系统所面临的"囚徒困境":检索效率的提升引起了系统效率的下降.之后针对"囚徒困境",从词词关联矩阵方面来改进模糊集合检索策略,寻求到解决"囚徒困境"的思路和技术手段.最后借助SQL语言演示词词关联矩阵的两种构造策略,建立数学模型分析词词关联矩阵构造的最优时机,并确立该思路为一种新的系统开发模式.根据时机来合理选择词词关联矩阵构造策略有助于改善现有模糊集合检索算法的执行效率,实现检索效率和系统效率的双赢.  相似文献   

9.
基于聚类分析的自然语言叙词表的自动构建   总被引:1,自引:0,他引:1  
叙词表为信息标引和检索提供恰当的词汇选择及概念语义关系.手工编制词表费事费时,智力要求高,难以克服认知瓶颈.词表自动构建另辟蹊径,通过统计挖掘语料库中潜在的词汇语义关联.构建方法主要有合并现有词表、用户生成词表、通过语法分析自动构建词表、通过同现分析自动构建词表等.其中通过同现分析构建自然语言词表方法分为词汇收集、关联度计算、聚类分析三个阶段,该方法具有良好的应用前景,对中文信息检索系统具有重要的借鉴意义.  相似文献   

10.
基于Topic Maps的叙词表再工程   总被引:3,自引:0,他引:3  
利用主题图技术构建一个在线叙词表。在分析传统叙词表的词间关系及其不足的基础上,从现有叙词表中选取18个叙词作为研究样本,分析其词间关系并进行建模;最后结合新兴的主题图技术,用Ontopia公司提供的Ontopoly创建出主题图,并用Omnigator和Vizigator分别进行在线浏览和可视化呈现。  相似文献   

11.
汪丹 《图书情报工作》2009,53(11):109-113
在社会网络分析的桥连结算法基础上,结合齐美尔连结,提出适合于科学合作的知识媒介算法。使用知识媒介算法对科学计量学国际期刊Scientometrics的合作者数据进行实验分析。结果表明,相对于桥连结算法,该知识媒介算法有助于识别具有媒介作用的科学研究者。  相似文献   

12.
一种基于N-Gram改进的文本特征提取算法   总被引:3,自引:0,他引:3  
介绍一种改进的文本特征提取及匹配算法。该算法基于N-Gram算法思路进行文本处理和特征提取,设计了gram关联矩阵用于统计与合并特征词,从而在固定长度N-Gram算法的基础上能够提取出不同长度的特征词。实验证明,该特征提取算法能够更为准确地描述文本特征,可应用于文本检索、Web挖掘等信息处理领域。  相似文献   

13.
ABSTRACT

As an important part of art and culture, ancient murals depict a variety of different artistic images, and these individual images have important research value. For research purposes, it is often important to first determine the type of objects represented in a painting. However, the mural painting environment makes datasets difficult to collect, and long-term exposure leads to underlying features that are not distinct, which makes this task challenging. This study proposes a convolutional neural network model based on the classic AlexNet network model and combines it with feature fusion to automatically classify ancient mural images. Due to the lack of large-scale mural datasets, the model first expands the dataset by applying image enhancement algorithms such as scaling, brightness conversion, noise addition, and flipping; then, it extracts the underlying features (such as fresco edges) shared by the first stage of a dual channel structure. Subsequently, a second-stage deep abstraction is conducted on the features extracted by the first stage using a two-channel network, each of which has a different structure. The obtained characteristics from both channels are merged, and a loss function is constructed to obtain the classification result. This approach improves the model's robustness and feature expression ability. The model achieves an accuracy of 84.24%, a recall rate of 84.15%, and an F1-measure of 84.13% when applied to a constructed mural image dataset. Compared with the AlexNet model and other improved convolutional neural network models, the proposed model improves each evaluation index by approximately 5%, verifying the rationality and effectiveness of the model for automatic mural image classification. The mural classification model proposed in this paper comprehensively considers the influences of network width and depth and can extract rich details from mural images from multiple local channels. An effective classification method could help researchers manage and protect mural images in an orderly fashion and quickly and effectively search for target images in a digital mural library based on a specified image category, aiding mural condition monitoring and restoration efforts as well as archaeological and art historical research.  相似文献   

14.
王建雄 《图书情报工作》2012,56(21):114-118
在传统PageRank算法的基础上进行一些优化与改进,提出一种新的主题敏感的PageRank算法,通过计算超链接与领域向量的相似度来区分超链接对网页的贡献度,从而有效抑制主题漂移;同时为PageRank算法加入时间因子来防止PageRank偏重旧网页的问题,加入站内外区分因子来防止针对PageRank算法作弊的行为.改进算法弥补了原算法的不足,提高了主题搜索的效率.  相似文献   

15.
张欣  马瑞敏 《图书情报工作》2018,62(10):106-115
[目的/意义]核心专利的发现是技术创新的重要环节,对于技术改进和专利战略布局意义重大。[方法/过程]首先界定核心专利的概念,然后在对原始PageRank算法模型介绍的基础上,结合专利的被引次数和专利的年龄对原始的PageRank算法进行改进,提出PatentRank算法(简称PTR),并将其应用到OLED领域中来识别核心专利。[结果/结论]研究发现,相比被引次数,PTR不仅能将该领域的核心专利识别出来,而且还可以识别出一些重要性的基础性专利,为研究OLED相关技术提供追本溯源的研究思路;相比原始PageRank算法,PTR具有更高的值区分度,在局部改善了PR的排名。  相似文献   

16.
在智能多Agent系统(Multi-Agent)以及黑板协作机制的基础上,对用户Agent进行改进,并以此为核心,开发一种基于用户Agent的多介质知识源下的个性化信息检索系统。提出整个系统的框架结构,分析用户Agent黑板结构分区及数据格式,并给出任务分解、任务分区信息、通信信息分区的组织及监控机制的实现,最后对多Agent系统的协作机制进行讨论。  相似文献   

17.
用户画像技术作为实现精准营销及服务的有效工具,在很多领域已经得到广泛验证和应用,也为高校图书馆的精准服务提供了新的思路。文章以某高校图书馆的读者信息和行为数据为例,引入并改进客户细分领域中的RFM模型,对读者群体进行聚类细分,同时建立了具有不同行为特征的图书馆读者群体的用户画像。最后,提出了基于改进RFM聚类的高校图书馆用户画像构建方法,以期为高校图书馆用户描述和精准服务提供参考。  相似文献   

18.
针对粒子群优化算法早熟、易陷入局部收敛的问题,提出一种克服早熟的粒子群算法.该算法在标准粒子群算法基础上加入极值扰动和自适应调整系数,使其易于跳出局部最优.又分析了灰色GM(1,1)预测模型的局限性,提出了一种带极值扰动的自适应调整惯性权重的改进PSO优化灰色模型AdPSO-GM,并将此模型用于数据预测挖掘研究中.最后,通过一个实例对所提方法进行验证,结果表明,本文所给模型具有较高的预测挖掘精度.  相似文献   

19.
本文对三个多媒体数据模型MOAP模型、STORM模型、演员模型进行分析、比较、评价,分别指出其优势及其不足,并对其中一个较为成熟的MOAP模型进行了改进。  相似文献   

20.
客户流失数据是一类的非平衡数据集,如何有效地对其进行分类学习,其关键是要提高少数类(流失客户)的识别率,少数类是相对多数类而言的一类特殊的子样本,其错分的代价非常高,因此,有效地减少少数类的错分率是一个亟待解决的问题.本文在Veropoulous提出的采用不同惩罚因子数的支持向量机算法基础上,利用样本自身信息熵值来确定不同的惩罚因子,使模型更加倾向于提高少数类的识别精度,并在电信客户流失数据这一非平衡数据集中进行了验证,结果表明该方法较其他方法对流失客户(少数类)的识别率有很大的提高,具有很强的实际应用意义.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号