首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
杨立波 《太原大学学报》2011,12(1):111-113,116
基于CFN的相似度计算是一种相似度计算算法、将此算法与实例机器翻译联系,通过语法,语义两个角度对句子进行观察和分析,并经过CFN标注汉语句子,从两个层面进行相似度计算,并建立实例相似度计算模型,使基于CFN的相似度的计算方法更为简便。  相似文献   

2.
在中文信息处理中,句子相似度计算是一项基础而核心的研究课题,长期以来一直是人们研究的一个热点和难点.句子相似度计算在实际中有着广泛的应用,它的研究状况直接决定着其他一些相关领域的研究进展,如信息检索的相似句子匹配、自动问答的问题匹配与答案抽取等,句子相似度计算都是非常重要的环节.本文提出了一种基于依存关系匹配的句子相似度计算方法,利用词语内在概念和词语相互依存关系计算句子之间的相似度.结果表明,该算法能显著提高返回结果的准确率.  相似文献   

3.
传统句子相似度算法没有全面考虑句子结构与语义特征,影响相似度计算准确性,对此提出一种基于句法块向量的句子相似度计算方法。该方法综合考虑句子的语义信息与结构信息,首先构建两句子的语义依存关系树,然后进行一些被动转换等操作,最后根据词向量构建各个句法块向量并通过余弦值计算句子相似度。在常规句子对中进行测试实验,结果表明,综合句子结构与语义信息可提高相似度计算准确性。一般句子相似度计算正确率达到92%,比传统方法提高8%~10%。  相似文献   

4.
跨语言文本相似度计算在跨语言信息检索、数据挖掘、抄袭检测等领域有着重要应用,但是跨语言文本相似度计算因为不同语言文法、结构等问题,在空间映射、特征选择上与单语言文本相似度计算有很大差异。为解决上述问题,采用一种基于文本加权词共现关系的跨语言文本相似度计算方法,通过平行语料库构建跨语言词共现关系模型,使用该模型进行跨语言文本映射,对不同语言的文本进行相似度计算。该模型实际反映了某种语言中某些关键词共同出现时映射成另一种语言时的关键词概率分布。实验表明,该方法对跨语言文本排序的计算更接近人工评判标准。  相似文献   

5.
百度知道中用户提出问题较短,采用常规基于空间向量的 TF-IDF 句子相似度计算、基于语义依存关系的句子相似度计算等方法往往很难较好完成其相似度计算。鉴于此,基于长度较短问句的特点,引入问题元和词模思想,对用户问题进行分解,并与传统相似度计算方法相融合,提出新的相似度计算方法。对于长度低于20 个词的问句,与传统 TF-IDF 方法相比,F1 值提高了 12%。  相似文献   

6.
在对传统的术语相似度计算方法和模型的研究基础上,提取出最能够影响语义本体相似度因素。然后,在综合传统相似度计算方法的优缺点的基础上,提出了一种被证明是能有效改进相似度计算效果的模型。  相似文献   

7.
安玲 《林区教学》2014,(9):91-93
提出了一种基于测地距离的多文档摘要方法。该方法首先利用可以揭示高维向量相似度的测地距来代替传统的向量夹角作为句子相似度的对比基础,然后通过TextTiling算法进行分割文本,利用基于Wordnet的概念向量空间模型消歧计算段落相似度来构建"文本关系图"产生文摘。在DUC上的实验结果表明,该算法能够有效地生成非受限领域的多篇文档摘要并全面反映文档的主要内容并能有效地提高文档摘要的质量。  相似文献   

8.
协同过滤算法是最常用、最经典的个性化推荐算法之一。在算法计算中相似度计算是影响算法质量的关键因素,该算法中相似度计算根据用户评分差值作为距离来衡量,忽略了项目自身特征属性对相似性计算的制约。因此提出一种基于项目特征的协同过滤推荐算法(IFCF),结合项目评分相似度,利用Logistic二分类算法思想将用户对项目的偏好分为喜爱与不喜爱两类,再利用贝叶斯概率原理将用户对各项目特征的喜爱程度差值作为相似度调整度,以达到提高项目相似性度量准确度的目的。实验结果表明,该算法能够有效提高推荐算法的精度。  相似文献   

9.
本文针对教务管理系统学生选课自动问答系统,提出一种语句相似度计算方法.该方法先采用基于布尔型VSM掩码的方法实现问题的初分类,再采用改进的编辑距离算法计算句子相似度来判断FAQ库的匹配,从而使系统返回问题的答案.实验结果表明该方法可行.  相似文献   

10.
基于《知网》语义知识资源,提出一种基于问句相似度计算的问答社区问题去重方法。通过计算已有问题集合中问题间的语义相似度,将其中重复度较高的问题进行筛选并去除,从而提高用户获取所需信息的效率,改善用户体验。在“爱问知识人”的真实问题集上的实验结果表明:该方法获得了较好的去重效果。  相似文献   

11.
提出了一种基于用户兴趣及标签相似度的混合推荐算法,构建基于标签的用户兴趣模型,通过计算与资源相似度完成推荐,同时融合时间因素研究用户兴趣变化,提高了基于内容的推荐中相似度计算的准确率;根据用户兴趣相似度聚类用户,通过兴趣协同推荐减少对评分矩阵的依赖,一定程度上解决了协同过滤中推荐数据缺失问题;同时,结合用户基本信息有望缓解冷启动问题。实验表明该算法具有一定的有效性及可行性。  相似文献   

12.
依据所给的数据,通过计算发现三种比较稳定的特征是痕迹的线条数量、宽度和截线,因此将这三种特征作为比对特征,并给出了基于数字图像处理和边界约束的提取方法;将痕迹分为前区、中区和后区,分别计算三种特征在各区中的相似程度,得出尾区的比对效果最好;提出了加权相似度比对的方法,并给出完整的比对方案  相似文献   

13.
从基于"知网"的句子相似度计算的角度出发,研究了文字类主观题批阅的自动阅卷系统,并用文中阐述的理论观点实现了这个系统,达到了预期的目标。  相似文献   

14.
针对当前临床诊断知识库融合过程中,领域概念相似度计算所存在的语义融合不充分且计算方法复杂等不足,提出一种改进的基于语义综合加权的概念对相似度矩阵生成算法.根据概念在概念格中的层次结构来确定概念属性特征集合,从概念节点属性信息量、节点层次以及概念非对称性等三个方面对语义距离度量进行扩展,通过引入横向节点透明度算子、纵向节点深度算子以及非对称算子,使最终语义相似度度量结果更精确.并通过使用一个标准的临床诊断知识库概念对该模型进行实验验证,实验结果表明该方法具有可行性和有效性.  相似文献   

15.
基于近邻的协同过滤算法是目前最为成功的个性化推荐算法之一,相似度计算方法是其核心内容.然而,该算法通常存在冷启动,数据稀疏性以及在相似度计算的时候只能使用共同评分之类的问题.为了有效改善上述算法推荐质量不高的问题,本文介绍了巴氏系数(BhattacharyyaCoefficient),结合修正余弦相似度、杰卡德相似度和皮尔森相关系数的优点,提出一种考虑了项目全局评分信息和局部评分信息的多重相似度融合的协同过滤算法(CFSI).在数据集MovieLens上的实验表明,CFSI在一定程度上有效缓解了数据稀疏性和冷启动问题,并且提高了推荐质量.  相似文献   

16.
针对传统检索模型局限于语法层次上关键词匹配的特点,以领域本体为知识组织方式,提出了一种基于领域本体的语义检索模型,同时给出了该模型中的查询语义扩展算法和相似度计算算法。  相似文献   

17.
采用本体概念映射方法,研究概念间相似度计算问题并提出本体图驱动的概念相似度算法。该算法将概念映射到本体结构图上,通过计算概念的语义、结构及属性相似度得到综合相似度。其中,结构相似度通过语义辐射圆计算模型得到,属性相似度通过概念重心向量夹角余弦得到。通过实验对比证明,该算法在一定程度上提高了相似度准确性,为数据挖掘提供了一定依据。  相似文献   

18.
采用加权处理的方法,讨论了一种基于人眼视觉特性和结构相似度图像质量评价方法,将图像划分并计算出每个分块的结构相似度,根据每个分块的亮度,纹理细节和分块空间位置对人眼视觉的影响,确定每个分块的权值,计算出加权平均的结构相似度作为图像质量的评价指标.经实验验证,评价结果与主观评价结果一致.  相似文献   

19.
根据文本相似计算模型,设计软件实现了对待测文本的分词、词频统计、向量空间模型(VSM)计算,得出相似度值.系统可以对DOC,TXT格式文本进行比较,比较方式为1:1模式和1:n(1对多)模式.软件采用基于MVC模式的三层体系结构设计完成.  相似文献   

20.
聚类问题的关键是把相似的事物聚集在一起,因此相似度计算是进行文档聚类的首要问题.XML模式是XML文档结构的体现,对XML文档的聚类可以通过XML模式的聚类来实现.本文提出一种基于XML模式元素的文档聚类方法,通过计算XML模式元素间的相似度来对文档进行聚类,综合考虑了XML模式中元素的结构和语义信息,进一步提高了计算相似度的精度,提高聚类的准确性,并且易于提取聚簇的通用XML模式.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号