首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
用于改善web搜索的结构化数据抽取技术   总被引:1,自引:0,他引:1  
为了提高web文本搜索质量,提出了基于语义结构化数据的查询扩展方法.通过分析属性的语义特征(文档频率特征和辨识能力特征)将属性分为概念属性、背景属性和无用属性3类,并且提出了衡量属性语义相关度的标准.设计了trie-bitmap和pair pointer table数据结构来实现发掘属性语义特征和检测属性语义相关度的有效算法.通过使用合适的属性和它们的语义关系,可以为查询关键字生成扩展词并将它们嵌入到具有插值参数的向量空间模型中.实验使用IMDB电影数据库和真实文本数据集来比较所提方法和原始向量空间模型的性能.实验结果证明所提出的查询扩展方法可以有效地提高文本搜索性能,同时属性语义特征和属性语义相关度都具有良好的分类能力.  相似文献   

2.
查询扩展是信息检索领域重要研究内容。为了解决信息检索过程中用户提交查询时描述不准确以及查询词不匹配的问题,提出一种基于Word2vec的语义查询扩展方法。使用分布式神经语言概率模型Word2vec训练低维词向量,选取扩展词候选集,利用面向扩展词的查询向量生成方法过滤候选集,使选取的扩展词能更有效地体现整个查询的语义及语法相关性。实验结果表明基于Word2vec的语义查询扩展方法使查全率及查准率均有提高,因此该方法能很好地应用于查询扩展领域。  相似文献   

3.
基于内容自动扩展的多示例查询图像检索技术   总被引:1,自引:0,他引:1  
为了缩短基于内容图像检索存在的"语义鸿沟",提出了一种自动扩展的多示例查询技术.该技术将传统检索使用的单一查询图像自动扩展为多个查询示例,从而包含了更多的与语义相关的图像特征.对这些查询示例进行检索,并融合检索结果,可以获得更多相关图像.扩展主要利用了一般检索算法的查准率-查全率曲线特点,对原始查询结果的图像特征距离应用K-均值聚类算法,确定多个查询示例图像.实验结果表明该方法可以显著提高原有检索算法的查全率和查准率.  相似文献   

4.
人们在利用搜索引擎进行信息检索时,较少的检索词难以反映用户真正的检索意图,因此对用户输入的检索词进行扩展尤为必要。对传统的查询扩展进行了改进,通过建立领域本体,借助本体及本体的推理机制,将用户输入的检索词从直接和间接两方面扩展为语义联系的查询关键词集合,以提高信息检索质量和效率。  相似文献   

5.
《湘南学院学报》2020,(2):26-31
医学图像分类技术对于医学辅助诊断具有重要的意义.相比较于自然图像分类,医学图像分类更注重于局部内容之间的细微差别与局部空间关系信息,而目前流行的视觉词袋模型忽视了空间关系信息,深度学习方法则缺少语义特性.因此,本文提出一种新的空间共生词袋模型来刻画医学图像视觉单词之间的局部空间关系模式,并进一步与卷积神经网络特征融合,用于医学图像分类.实验结果表明,所提方法能够有效地挖掘医学图像的本质特征,取得高于目前流行方法的分类性能.  相似文献   

6.
采用用户历史查询词构建用户画像时,现有向量空间模型存在特征稀疏和上下文依赖性强的问题。针对该问题,通过引入 LDA 主题模型,首先提取查询词潜在主题,得到查询词对应的主题分布;然后将概率最大的主题对应的词扩充到原始特征空间中,丰富用户特征;最后采用 SVM 分类算法对用户基本属性进行分类,构建用户画像。实验表明,利用 LDA 模型对用户特征进行扩展比传统向量空间模型用户画像精度提高了 1.6%。  相似文献   

7.
通过分析XML文档转换成数据库文件存在的问题,提出基于扩展DOM树的XML Schema文档转换为数据库模式的算法。提出了扩展DOM树的概念。描述了由XML Schema文档生成扩展DOM树算法。说明了路径键的概念及其作用。实现了将扩展DOM树转换成数据库模式的算法。实现过程使用了反向扫描优化和特殊元素处理规则。  相似文献   

8.
为解决集中式服务发现结构存在的性能瓶颈问题,基于领域本体语义信息,提出一种能自适应地调整领域划分、分配系统资源的分布式web服务发现体系结构,并分析了该结构的可扩展性、自组织性和自适应性.具体描述了该结构下的语义web服务发现算法的2个阶段:语义注册中心定位和基于输入输出的服务匹配.在注册中心组成的平衡树拓扑结构中,注册代理能够快速将请求转发至目标注册中心,避免产生性能瓶颈.然后,通过引入一种新的基于语义距离的服务匹配算法来进行服务查询效果优化.模拟实验结果表明:提出的服务发现方法具有高可扩展性的优点;与其他服务查询算法相比,服务匹配算法具有更高的查全率和查准率.  相似文献   

9.
词汇学习是包含搭配、语义、语境、语用等信息的综合的动态学习过程,词汇掌握直接影响英语学习者的综合运用能力。文章从交际主题和语义出发,以《欧洲共同语言参考框架》为标准,利用在线语义词网WordNet的资源.以和语义相关的关键词为节点将二者有机链接,实现主题和语义之间的双向查询,构建一种基于主题和语义的、开放的、动态的词汇拓展框架。  相似文献   

10.
针对传统检索模型局限于语法层次上关键词匹配的特点,以领域本体为知识组织方式,提出了一种基于领域本体的语义检索模型,同时给出了该模型中的查询语义扩展算法和相似度计算算法。  相似文献   

11.
密码创建规则中包含多种多样的个人身份信息组合方式,不仅文法结构规范特殊,而且语义内容丰富.对于文本处理方法,传统的基于概率上下无关文法模型会导致文本特征表示稀疏、语义信息或丢失的问题,因此提出利用深度学习DNN算法.通过对个人身份信息数据进行特征提取,构建语义分类表示的深度神经网络,并为该模型设计训练方法来进行广泛的训练.最后通过实验表明深度学习DNN算法能够提高个人身份信息语义识别的性能,在一定程度上优于已有的一些密码攻击方法.  相似文献   

12.
语义查询扩展是提高信息检索质量的常用方法之一,针对语义查询扩展容易出现扩展过度的现象,综合多个因素计算语义相似度,考虑用户自定义关系计算语义相关度,引入Sigmoid权重函数计算综合关联度,提高查询扩展的精确度。最后,通过实验表明扩展效果良好。  相似文献   

13.
近年来,随着WebGIS的发展和广泛使用,如何在数据库中处理空间查询问题已成为热点之一。传统的地理信息系统通常使用基于树的索引(如 R-树、四叉树等)进行空间索引,但如果数据量很大,则操作成本很高。介绍了一种将经纬度坐标转换为类URL简短字符串的GeoHash算法,该算法通过对比字符串的前缀重合度实现周边查询,提高了数据处理效率与查询精度,降低了操作成本,为周边查询及用户推荐提供了一种新思路。  相似文献   

14.
图像语义分割作为AI领域的重要分支,是计算机视觉技术中的重要环节,同时也是深度学习算法的重要应用。介绍深度学习应用于计算机视觉技术之前图像处理中语义分割传统算法,并探讨语义分割问题中基于不同神经网络结构模型的深度学习算法及性能,如FCN、U-net算法。最后针对当前图像语义分割算法应用,总结展望未来研究方向。  相似文献   

15.
传统句子相似度算法没有全面考虑句子结构与语义特征,影响相似度计算准确性,对此提出一种基于句法块向量的句子相似度计算方法。该方法综合考虑句子的语义信息与结构信息,首先构建两句子的语义依存关系树,然后进行一些被动转换等操作,最后根据词向量构建各个句法块向量并通过余弦值计算句子相似度。在常规句子对中进行测试实验,结果表明,综合句子结构与语义信息可提高相似度计算准确性。一般句子相似度计算正确率达到92%,比传统方法提高8%~10%。  相似文献   

16.
本文从HNC理论的两个重要假设入手,通过“空间”和“概念”的讨论,论述了从语言信息处理理论研究延伸至语言处理研究的意义,阐述了词汇平面的延伸方式,即将HNC概念表达式与“词群-词位变体”理论的词义基元结构式进行对接。并认为这种延伸在工程上表现为面向语言信息处理技术的语义网建设,在理论上可概括为“概念基元空间到词汇语义基元空间的映射”。  相似文献   

17.
词块是语法、语义、语用及语境的统一体。在词块信息输入过程中,二语学习者既要习得词块的语义信息,也要深化语法机制的分析,更要顺应语境要求,提高词块提取的效率。因此引入语境动态顺应的概念,可以加强二语习得者的结构分析意识,拓展单一词块的生成空间,提供真实的语言环境,切实提高词块应用的流畅性和地道性。  相似文献   

18.
在分析R-树空间索引结构的基础上,采用聚类分析的方法,对R-树空间索引进行研究,提出一种基于聚类分析的R-树节点分裂算法,提高了空间查询效率,并通过仿真实验,验证该算法的有效性。  相似文献   

19.
为了获得较高的译文质量,提出了一种基于网络搜索的中文未登录词的翻译方法。该方法首先利用词典对未登录词进行扩展,然后将扩展查询词提交搜索引擎,从获取的中英文混合摘要中采用频度变化信息算法抽取译文候选,最后采用表层模板和频度右距离模型对译文候选进行排序。实验结果表明通过本方法进行中文未登录词译文挖掘是有效可行的。  相似文献   

20.
在分析R-树空间索引结构的基础上,采用聚类分析的方法,对R-树空间索引进行研究,提出一种基于聚类分析的R-树节点分裂算法,提高了空间查询效率,并通过仿真实验,验证该算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号