首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
文本聚类中基于本体的相似性测度   总被引:1,自引:0,他引:1  
介绍了一种综合各层级分类类目和对应关键词来构造概念体系并用于改进信息检索系统效果的方法.为了改进文本聚类的效果,提出了将领域知识本体和文本关键词词频相结合的基于余弦向量的文本相似性测度方法.该本体面向特定领域,将关键词以不同权值对应于各分类类目,通过其语义知识来改进文本相似性测度以及信息检索系统的效果.进一步给出了对基于本体的相似性测度方法进行效果评价的2种策略以及该方法与经典余弦向量测度方法的比较结果.  相似文献   

2.
提出了一种基于投影寻踪改进KNN中文文本分类方法,与现有的中文文本分类算法相比,该方法具有较高的计算效率。给出了具体实现过程并将其用于文本分类中,实验证明了该算法用于文本分类的有效性及其高效率。  相似文献   

3.
特征降维是文本分类的关键步骤之一.传统互信息特征选择方法只关注了文档频,未考虑词频因素,并且忽视了负相关特征对文本分类的重要作用,导致其在不平衡语料集上的分类效果较差.针对传统互信息方法存在的不足,提出一种改进的互信息特征选择方法,综合考虑词频因素及正、负相关特征对文本分类的影响,引入平均词频率和绝对值最大因子,克服传统互信息倾向于选择低频词、忽视负相关特征的缺陷.在不平衡语料集上的实验结果表明,改进的互信息能够有效提高文本分类性能.  相似文献   

4.
基于Web超链接结构信息的网页分类技术研究   总被引:1,自引:0,他引:1  
充分利用相邻网页(包括链人和链出)的相关信息,提出一种基于Web超链接结构信息的网页分类改进方法.其方法分为5步:(1)预处理训练集,提取文本信息和超链接结构信息;(2)抽取特征向量和训练一个Web页面的全文本分类器;(3)根据网页的各个人口的锚点文本和扩展锚点文本创建虚文档,用虚文档代替Web页面全文本训练一个虚文档分类器;(4)利用Naive Bayes方法协调两个分类器得到初步分类结果;(5)利用链出网页对初步分类结果进行修正,得到最终分类结果.根据改进方法实现了网页自动分类原型系统,并进行分类实验,实验表明该方法有效提高了分类性能.  相似文献   

5.
针对传统的特征选择方法在非平衡数据集中分类效果不理想的问题,提出了一种适合非平衡数据分类的改进特征选择方法.该方法将集中度和分散度相结合,同时考虑到在文本长短不一时词频对文本分类的作用,得到一种新的词频归一化方法,实现了对传统特征提取方法的改进.另一方面,将三支决策思想引入到朴素贝叶斯算法,得到了NB-三支决策分类算法,并将该算法应用到非平衡数据集的分类.通过两组实验对比结果表明:改进特征选择方法较CHI和IG方法,处理非平衡度高的数据集分类效果较好;选取相同的特征选择方法和数据集,NB-三支分类器比NB-分类器的分类效果好.选用本文提出的改进特征选择方法和NB-三支分类器,在处理非平衡度高且文本长短不一的数据集时,分类效果有一定提升.  相似文献   

6.
朴素贝叶斯文本分类模型是一种简单而高效的文本分类模型,但是它的独立性假设属性使其无法表示现实世界属性之间的依赖关系,从而影响它的分类性能。这里提出一种改进的基于贝叶斯定理的文本分类模型——“树桩网络(Stump Network)”,并将该方法与朴素贝叶斯文本分类器和TAN(Tree Augmented Naive Bayes)文本分类器进行实验比较,结果表明,在大多数数据集上该文本分类方法具有较高的分类正确率。  相似文献   

7.
在情感分析领域,仅依靠文本等单一模态进行情感分析,限制了从多模态数据中提取多样化特征的能力,限制了情感分析结果的准确度和鲁棒性。为此,提出了融合音频分析网络和文本分析网络的多模态情感分析方法。其中,利用预训练卷积神经网络(CNN)和迁移学习技术进行基于Mel频谱图的音频情感分类,通过改进的XLNet模型执行歌词文本的特征提取和情感分类任务。CNN和XLNet输出包含概率权重和不同情感值的情感预测矩阵,最后使用堆叠集成方法合并不同模态的输出结果,完成多模态情感分类。在自建民族音乐数据集的消融实验证明,多模态方法具有良好的互补性,在情感识别任务中的性能显著优于单模态方法。公开数据集结果表明,所提方法的分类准确度达到83.75%,优于其他先进方法。  相似文献   

8.
传统的舆情分析多采用文本聚类和分类技术,但是由于自然语言自身表达的复杂性和灵活性,文本聚类和分类技术很难从根本上反映话题评论人员对待话题的真实态度。针对文本聚类和分类技术的局限性,设计了应用于公司舆情分析的改进概念图算法。改进的概念图能表示部分概念节点的倾向性,利用改进的概念图计算每条评论的健康度,可有效地从语义分析角度计算评论语句的健康度。研究结果表明,应用于公司舆情分析的改进概念图算法,其正确率普遍高于基于文本聚类和分类技术的舆情分析方法。  相似文献   

9.
文本分类是文本数据挖掘领域的重要技术之一。从分类算法对文本语义信息的利用程度这一角度出发,将文本分类划分为基于词形的算法和基于语义的算法两类,对每类算法进行了描述,并对当今文本数据的多样性及文本分类算法改进的可选方向进行了研究。  相似文献   

10.
通过对Web数据的特点进行详细的分析,在基于传统的贝叶斯聚类算法基础上,采用网页标记形式来有效地弥补朴素贝叶斯算法的不足,并将改进的方法应用在文本分类中,是一种很好的改进思路。最后实验结果也表明,此方法能够有效地对文本进行分类。  相似文献   

11.
日语中有男性用语和女性用语的区分,女性用语主要产生于平安时代,后受到女性文学的影响而逐渐得到发展。第二次世界大战后,由于日本男女的社会地位日趋平等,女性用语亦出现了衰退现象。但当前,男女语言的表达习惯仍有不小差别。女性用语在用词和语言表达形式上有别于男性用语和一般用语,其特点是含蓄、委婉、优雅。该文将对女性用语的历史变迁以及各方面的特征进行分析。  相似文献   

12.
词语修辞的层面探视   总被引:1,自引:0,他引:1  
词语修辞研究的领域无限宽广 ,其研究的基本点在多学科交叉的边缘上。在语 (词 )形、语义、语用、语表、语里、文化、审美诸层面尚有许多未探及的丰富多彩的内容值得研究。词语修辞被作为一种符号行为、语境行为、互动行为、社会行为和审美行为 ,有其独特的个性。汉语一方面依靠各种修辞手法不断创造新词语 ,丰富词汇宝库 ;另一方面 ,丰富的词语又为语言使用者提供了极其广阔的艺术表现空间 ,使其创造出更多更妙的修辞手法。  相似文献   

13.
形式和意义是一个统一的整体,有什么形式就有什么意义,就有什么功能。用这一理论探讨术语的翻译原则和方法,对于术语的翻译具有较强的理论意义和实用价值。文章较系统地探讨了术语翻译的基本原则及其对术语意义的影响,提出了不同类型的术语翻译方法。  相似文献   

14.
从香港译名与内地译名差异看香港翻译(英文)   总被引:1,自引:0,他引:1  
孙敏 《海外英语》2011,(8):202-203
一直以来香港对一些英语名称的翻译和内地存在较大差异,这在一定程度上阻碍了两地的政治、经济和文化交流。为了深入地了解这一现象,文章搜集了两地在多个领域中使用的不同译名,通过比较的方法分析了香港译名的翻译特点,发现香港译名具有本土化、人性化和商业化的特点。形成这种现象的原因是两地在翻译过程中采用了不同的目标语和翻译方法,另外,不同的生活方式和文化背景也是原因之一。  相似文献   

15.
中国现代文学充斥着一股挥之不去的革命情结,这导致现代文学无法绕开革命,许多作家由于各自不同的主体性,投身革命洪流中时,他们在文学创作上与革命文学形成了不同的关系形式。老舍的小说在这方面具有典型性,它在讽刺的维度、情感基调上与革命文学存在差异,同时它在民族性批判及文学的大众化上与革命文学又有着潜在结合点。  相似文献   

16.
1991年苏联解体以来,俄罗斯高等教育结构体系发生了且正在发生着深刻变革,已经远远走出我们所熟悉的苏联时期的轮廓:在层次结构上,它逐渐改变技能专家—研究生两级结构,越来越走向国际通用的学士—硕士—研究生/副博士结构;在形式结构上,改变清一色国立高等教育局面,私立高等教育异军突起,形成国立和私立共同发展的双轨型办学形式结...  相似文献   

17.
自上个世纪七十年代至今,性别角色类型的差异研究一直为广大学者所关注,并围绕哪一种性别角色对个体的发展更具有优势展开了讨论。本研究通过对308名在校大学生进行调查,从而探讨不同性别角色的大学生在个人评价上的差异。通过对调查数据进行分析,结果表明:(1)未分化和女性化类型者在个人评价总分上表现出最自信,双性化者最不自信;(2)在个人评价各维度表现上,不同性别角色的人各有优势。  相似文献   

18.
称谓是社会关系的反映.由于不同的文化背景,各民族称谓语的数量和指称范围各有特色.汉语拟亲属称谓纷繁复杂,而英语中虽然也有拟亲属称谓,但并不多见,这就给汉英翻译带来了困难.本文作者以<狼图腾>中"孩子"和"阿爸"两个词的翻译为切入点,探讨拟亲属称谓语的翻译,提出在不同语境下根据人物不同的情感,对同一拟亲属称谓可以采用直译,意译,音译等多种方法来传达拟亲属称谓的内涵.  相似文献   

19.
The main challenge of e-learning systems is to provide different courses to different students with different learning abilities. Such systems must also be efficient and adaptive. However, adaptivity can be accomplished by improving the ability to select dynamically an appropriate learning object for a specific learner. a framework for individualized learning object selection, called Eliminating and Optimizing Selection (EOS) was proposed by Liu and Greer (2004). In this paper, the EOS framework is further analyzed, implemented and experimented. As a result, a formalization for this framework has been suggested. The computational results of this approach have been compared to the selection results done by other specialists. Comparisons have shown its superiority in terms of producing more optimized selection of learning objects. Moreover, this approach has demonstrated its competitiveness in terms of the selected sequences of learning objects for different learners with different needs.  相似文献   

20.
公正是一个含义丰富且用法不一的概念。从政治伦理的角度区分 ,公正有三层涵义。从政府权能讲 ,公正就是正义 ,正义作为一种法理精神体现了制度安排的合理性 ;从社会伦理而言 ,公正就是公平 ,公平主要体现为一种社会利益的分配原则 ;从个体德性讲 ,公正就是正直。三者是一个有机整体 ,共同构成官德建设的灵魂  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号