共查询到20条相似文献,搜索用时 250 毫秒
1.
2.
本文将潜在语义索引理论与支持向量机方法相结合,对文本向量各维与文本的语义联系进行特征抽取,建立了完整的基于潜在语义索引的支持向量机文本分类模型,分析了该方法与分词的维数以及SVM惩罚因子选择之间的关系.并在NN-SVM分类算法的基础上,通过计算样本点与其最近邻点类别的异同以及该点与其k个同类近邻点在核空间的平均距离来修剪混淆点,提出了一种改进的NN-SVM算法:KCNN-SVM算法.利用该算法对降维后的训练集进行修剪.实验表明,用新的模型进行文本分类,与单纯支持向量机相比,受到文本分词维数以及支持向量机惩罚因子的影响更小,其分类正确率更高. 相似文献
3.
提出了一种基于预抽取支持向量机及模糊循环迭代算法的改进的支持向量机(Support Vector Machines,SVM)的两类文本分类方法, 与传统的SVM相比, 该方法具有高得多的计算效率。文中给出了具体算法并将其用于文本分类中,实验表明了本算法用于文本分类的有效性及其高效率。 相似文献
4.
个性化服务中基于支持向量机的用户兴趣挖掘分析 总被引:2,自引:1,他引:1
用户兴趣的准确获取是保证个性化服务质量的关键;分析用户所浏览的网页集,捕获用户兴趣、建立用户兴趣挖掘模型是目前个性化服务研究的一个重要方向.本文首先比较支持向量机与其他分类算法的性能,分析了基于支持向量机进行用户兴趣挖掘的可行性;然后在介绍支持向量机分类原理和分析分类预测理论模型的基础上构建了用户兴趣挖掘模型;最后选取中文网页分类训练集和特定用户的网页浏览记录,主要从支持向量机分类器的构造和用户兴趣预测两个方面进行了模型的实现研究. 相似文献
5.
基于机器学习的自动文本分类模型研究 总被引:2,自引:0,他引:2
基于机器学习的方法是自动文本分类中非常重要的一大类方法。本文先给出了形式化的定义,提出了自动文本分类的流程模型,然后选取了支持向量机(Support Vector Machine,SVM)算法作为一个典型例子进行分析,最后作者通过一个中文文本分类实验评价了该算法的效果。 相似文献
6.
支持向量机根据VC 维理论和结构风险最小化原则,是一种建立在统计学习理论基础之上具有新颖、功能强大特点的机器学习方法.它具有全局最优、结构简单、推广能力强等优点,近年来越来越引起关注.但支持向量机是一种小样本机器学习方法,自身的复杂性和多重共线性成为其处理大规模数据时的"瓶颈"问题.岭回归方法是一种修正的最小二乘估计法,是一种专门用于复共线性数据分析的有偏估计方法,当自变量系统中存在多重相关性时,它可以提供一个比最小二乘法更为稳定的估计.本文将岭回归-支持向量机结合,用于数据挖掘方法之一--文本分类中,实验结果表明:本方法可以提高支持向量机分类的训练速度和分类精度. 相似文献
7.
文章提出了基于支持向量机的短时用水量预测模型,对城市用水量本身固有的非线性、复杂性和不确定性进行综合考虑。结合实例数据,对基于支持向量机的预测模型和基于BP神经网络的预测模型进行比较。结果表明,基于支持向量机的预测模型在精度、收敛时间、泛化能力、最优性等方面均优于基于BP神经网络的预测模型。 相似文献
8.
对小样本集进行分类技术研究 总被引:2,自引:0,他引:2
随着网络信息的迅猛发展 ,信息处理已经成为人们获取有用信息不可缺少的工具 ,文本自动分类系统是信息处理的重要研究方向。本文介绍了当今世界上较先进的“变换支持向量机”(TSVM ,transductivesupportvectormachines)技术 ,它与普通的“支持向量机”(SVM)相比 ,TSVM方法所需的样本量大大降低 ,它能有效地对小样本数据集进行分类 ,同时重点分析了实现它的关键技术、算法及其实现过程 相似文献
9.
施洁斌 《现代图书情报技术》2004,20(7):27-29
提出了将支持向量机应用于文本自动分类的研究,与常用的K-最邻近法相比,无论是对训练数据集还是测试数据集均具有一定的优势,而且不同特征选择方法对支持向量机的影响要比K-最邻近法小。此外,从研究中的不同特征选择的评价函数来看,它们对分类有一定的影响,应用X2统计进行特征选择的分类正确率最高,其次是文本证据权,而期望交叉熵的效果最差,说明特征选择在文本自动分类中也是相当重要的。 相似文献
10.
11.
统计频率算法在文本信息过滤系统中的应用 总被引:1,自引:0,他引:1
12.
13.
以学者们编撰的纳西族东巴经书目著作为基础,把书目的发展过程分为滥觞期、发展期和成熟期,提出书目应兼收文字经和口诵经、经书类别编排依东巴教作法仪式为主、著录项目全面详细有特色,实现以书目来总结经书研究成果,由书目来了解东巴经研究的基本格局与发展趋势的目的。 相似文献
14.
高校图书馆书商书目对比研究 总被引:4,自引:2,他引:2
15.
基于BP人工神经网络的知识管理战略选择研究 总被引:1,自引:1,他引:0
16.
17.
18.
19.
在现有法律框架基础之下,从宏观、微观层面寻求突破,通过成立专门机构对信息分类管理与分级传播、建立知识共享许可机制以及参与国际图书馆信息共享体系等多种途径,为图书馆信息资源开放共享争取更大的发展空间,实现知识和信息传播的社会效益最大化。 相似文献
20.
学术博客交流网络的核心-边缘结构分析实证研究 总被引:4,自引:1,他引:3