共查询到18条相似文献,搜索用时 250 毫秒
1.
基于粒子群的模糊C均值文本聚类算法研究 总被引:1,自引:0,他引:1
2.
聚类有效性指标用于评价聚类质量和确定最佳聚类数,针对包含大小和密度差异性较大数据类的数据集,在分析了传统模糊聚类有效性指标不足的基础上,提出了一个同时考虑紧致性、重叠度和分离性的聚类有效性指标COS.类内紧致性用一定阈值内的隶属度之和与最大类内距离之比表示,一定阈值内各样本同属于两个类的隶属度差异反映了这两个类的重叠度,类间分离性的度量为最小类间距离,使COS指标值最大的聚类数即为最佳聚类数.在四个人工数据集和iris真实数据集上利用模糊C均值算法进行聚类实验的结果表明,COS指标可以有效发现小类和低密度类. 相似文献
3.
提出了一种新的模糊竞争神经网络聚类模型NFCNNC,并将其应用到文本聚类中。NFCNNC将模糊中心聚类(FCC)算法得到的模糊聚类中心向量作为神经网络的权值,通过比较隶属度值得到获胜神经元。网络中仅两个神经元同时调节权值。隶属度值最大的神经元以较大的学习率调整权值,隶属度次大的神经元以较小的学习率调整权值,其他神经元权值不变。按照FCC算法调整模糊聚类中心向量值(即权值)和神经元的隶属度,当网络稳定时,即可确定聚类数。与传统模糊神经网络模型相比,本文的模糊神经网络模型具有结构简单、运行效率高、聚类精度高的优点,同时克服了传统算法需预先指定聚类数的局限性。通过对文本聚类的实验验证,本算法取得了良好的效果。 相似文献
4.
5.
通常用于评论性文本极性挖掘的方法是采用有监督的学习算法完成的,但有监督的学习算法需要大量人工标注的训练集,而且其在处理文本集时还会面临维数灾难、稀疏向量、高时空复杂度、低召回率和精确率等问题而无法用于海量的文本极性分类任务。经典的K-means均值聚类算法是聚类分析中使用最为广泛的算法之一,其具有诸多的优良特性和不足。针对上述情况,本文将语义引入经典K-means均值聚类算法中,构造了专门针对中文评论文本极性判断的极性词语义词典,提出了一种基于语义准则函数的K-means均值聚类算法。这项研究是运用基于语义的聚类方法对汉语主观性文本处理的一次探索。实验结果显示总平均召回率达到了80.70%,总平均精确率达到了67.75%,说明该算法是可行和有效的。 相似文献
6.
本文详细介绍了模糊聚类算法的产生过程以及应用模糊聚类算法进行模糊分析的ASP代码,最后通过一个具体的实例,对模糊聚类算法进行了验证。 相似文献
7.
K-means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题.本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K-means改进算法.该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类.算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K-means算法的初始聚类中心.第二步聚类则依据文献内容实现K-means算法.实验通过与经典K-means算法和基于凝聚层次聚类算法的改进K-means算法的对比,证明了本文提出的改进的K-means算法具备更优的聚类效果. 相似文献
8.
文章在对DBSCN与K-means两种经典聚类算法分析研究基础上,结合中文文本数据的特点,对这两种方法进行结合与改进,提出了一种中文文本聚类方法:DKTC。该算法能自动产生簇的个数,且对“噪声”或异常数据不敏感,对数据的输入顺序不敏感,另外,与DBSCAN相比,该算法有更高的处理效率。实验表明,DKTC算法不仅能对中文文本进行聚类,且与传统DBSCN与K-means法相比,聚类效果都有一定程度的改善。 相似文献
9.
大数据下竞争对手识别模式发生了显著转变,催生了新型竞争对手识别研究范式。本文以该新范式为导向,借鉴企业生态位理论与互联网下的顾客价值理论,对传统经典陈明哲竞争分析框架进行拓展,提出了基于大数据下的市场共通性和资源能力优势度的竞争对手识别指标体系框架。该框架整合了行业与市场双元视角下的财务、专利、产品、客户等多方跨域信息源,使用模糊C均值聚类构建模型,并以新能源汽车行业为例开展仿真实验研究。结果表明,基于跨域多源信息融合的模型可有效提高竞争对手识别的准确性和全面性。 相似文献
10.
传统的聚类算法直接用于文本聚类这一应用上,存在的突出问题就是传统的聚类算法只负责将对象进行聚类,不负责对聚类后生成的类簇进行概念描述和解释.标注文本集合聚类后生成的类簇被称为聚类描述问题.聚类描述可以帮助用户迅速确认生成的文档类别与其需求是否相关,它是文本聚类应用中一项重要并富有挑战性的任务.针对文本聚类结果可读性较弱问题,本文提出了一种增强聚类结果的可理解性与可读性的算法,即基于支持向量机的文本聚类结果描述算法.实验结果表明基于支持向量机的聚类描述算法所取得的效果要优于常规的聚类结果描述方法. 相似文献
11.
科技查新工作绩效评价模型的构建及应用 总被引:2,自引:0,他引:2
12.
信息共享空间(IC)作为一种新型的服务模式正逐步被各高校图书馆所采纳,其服务评价也日益引起人们的重视。根据笔者建立的图书馆信息共享空间评价指标体系结构,本文试图运用模糊聚类分析法建立IC评价的数学模型,对国内外六所高校的信息共享空间进行调查、实例分析与评价比较,得出信息共享空间的评价结果,为组织机构、专家学者、用户以及工作人员准确评价IC与推广IC提供了一种新的理念和方法。 相似文献
13.
信息检索的模糊聚类分析模型 总被引:8,自引:0,他引:8
本文在对信息检索的模糊性进行论证的基础上 ,采用基于模糊等价关系的动态聚类方法对信息检索结果进行聚类分析 ,建立了信息检索的动态聚类分析模型 ,并给出了算例 ,使情报用户可以更加充分合理的利用各种信息资源。 相似文献
14.
[目的/意义]随着微信在我国社会影响力的不断提升,很多新型智库在建设中越来越重视将微信平台作为提高智库影响力和进行智库成果传播的重要媒介,对新型智库微信平台构建效果的生态性评价成为当前智库微信平台建设发展中的重要问题。[方法/过程]基于"信息、信息人、信息技术和信息环境"和谐发展的信息生态视角,构建新型智库微信平台生态性评价指标。以我国党政、科研院所和社会机构的10家新型智库机构微信平台为样本,利用层次分析法确定各评价指标权重,结合模糊综合评价法对10家典型新型智库的微信平台生态性进行评价。[结果/结论]数据结果表明,所构建的评价指标具有一定的实用性和可操作性,可为新型智库微信平台生态性建设提供一定的理论和方法指导。 相似文献
15.
[目的/意义] 构建短视频传播效果评价模型,为后续短视频传播效果的实证评价研究提供理论基础。[方法/过程] 依据全信息情感理论和超级IP理论,从多维角度分析用户偏好与内容特征,结合文献综述和德尔菲法分析总结影响短视频传播效果的因素,并利用模糊集理论-DEMATEL模型对二级指标进行关键影响因素的筛选,构建传播效果评价模型和评价指标体系。[结果/结论] 确定11项短视频传播效果的关键影响因素,其中官方认证这一因素最为关键,由此构建的短视频传播效果评价模型和评价指标体系为短视频传播效果研究提供一定程度的决策支持。 相似文献
16.
樊红侠 《现代图书情报技术》2008,(8)
针对传统信息检索模型对不确定性知识处理的不足,提出一种基于粗糙集的信息检索改进模型,并以粗糙集技术为支撑,结合模糊集合理论,对查询进行泛化以提高查询性能,同时给出该模型的关键实现算法及性能评估方法。该模型能够提高信息检索的效率,具有较高的理论及应用价值。 相似文献
17.
樊红侠 《现代图书情报技术》2008,3(8):53-57
针对传统信息检索模型对不确定性知识处理的不足,提出一种基于粗糙集的信息检索改进模型,并以粗糙集技术为支撑,结合模糊集合理论,对查询进行泛化以提高查询性能,同时给出该模型的关键实现算法及性能评估方法。该模型能够提高信息检索的效率,具有较高的理论及应用价值。 相似文献
18.
[目的/意义] 针对现有移动电子商务服务质量评价指标不客观的问题,重点研究移动电子商务环境下评价服务质量的模型及方法,为消费者科学选择电商服务提供参考,为企业改善服务质量提供建议。[方法/过程] 引入群决策理论中的对语言评价信息的处理方法,首先将7粒度短语评价信息转化为三角模糊数,然后收集用户给出的语言短语形式评价信息,计算各个评价指标的质量评价值,最后计算评价值与三角模糊数之间的相似度,相似度最高的语言短语即为其对应的服务质量评价等级。[结果/结论] 以手机淘宝服务质量为评价对象进行实证分析,验证了基于语言评价信息的移动电子商务服务质量评价方法的科学性和有效性。 相似文献