共查询到20条相似文献,搜索用时 31 毫秒
1.
《科技通报》2016,(3)
研究多源语义特征分层数据库中的大数据聚类方法,实现数据的分类识别。多源语义特征分层数据库中由于路由冲突,在链路负载较大的情况下,不能有效实现对大数据语义特征的并行搜索。提出一种基于增广链同态解析的链路分流方法避免路由冲突,实现增广链修复下大数据并行搜索聚类。构建大数据聚类的语义相似度融合模型,基于跨层链路分流算法实现增广链路分流,进行语义本体模型构建,选择采用高阶贝塞尔函数累积量作为增广链修复检验统计量,确定节点数据包的置信度,确立置信区间,在进行缓冲区溢出修复时,进行功率谱幅度特征提取,实现大数据的并行搜索聚类,进行语义本体模型构建,为离群点新建一个簇,依次对每个文档的主题词集进行处理,将每个主题词自动添加入形式背景的属性集中,采用并行搜索算法实现对语义大数据的优化聚类算法改进。仿真结果表明,采用该算法进行大数据聚类,契合度较高,误分率较低,性能优越。 相似文献
2.
3.
《科技通报》2016,(8)
二阶锥规划是在有限个二次锥的笛卡尔空间仿射变换交集上的极小化和极大化线性函数,采用修正的二阶锥规划模型,结合二阶锥的凸优化条件,进行大数据聚类算法改进,提高数据的聚敛性。传统方法中对大数据聚类的二阶锥规划模型采用线性对偶锥规划方法,对数据聚类的路径跟踪性能不好。提出一种基于修正的齐次二阶锥规划模型的大数据聚类算法。进行数据的特征挖掘和信息流模型构建,从大量的、有噪声的、模糊的数据中进行大数据的功率谱密度特征提取,采用粗糙概念格方法对大数据信息流进行二阶锥规划模型构建,结合齐次二阶锥规划模型算法有限收敛性,对每一数据聚类样本进行可靠性衡量,实现数据聚类中心的准确搜索。对聚类误差函数求最优解,使得误差收敛到零。仿真结果表明,该算法进行数据聚类的精度较高,收敛性较好,避免了出现局部最优解,性能优越于传统算法。 相似文献
4.
《科技通报》2015,(10)
通过挖掘生物信息大数据,从生物信息大数据库中提取感兴趣的数据特征,分析生物信息大数据集的细节结构,提高对生物信息的采集、处理、存储、传播,分析能力。传统的生物信息大数据挖掘模型采用基于小波多窗谱提取的生物信息挖掘算法,由于生物特征的属性权重需求各异,数据挖掘精度不高,提出一种基于梯度采样局部收敛的生物信息大数据挖掘模型。首先构建生物信息大数据库模型和生物信息特征挖掘实体模型,采用提取采样局部收敛方法实现对数据挖掘模型的改进,通过求解最优输入控制序列以及索引系统最优目标函数,实现系统的控制输入和预测,使用梯度采样局部收敛的方法进行生物信息大数据挖掘检测,得到生物信息大数据的梯度采样局部收敛属性集合。仿真结果表明,能实时准确地实现对生物信息的储存、检索和分析,提高数据挖掘能力,收敛精度较高。 相似文献
5.
《科技通报》2015,(8)
对大数据的分层建树聚类,提高对大数据的检测和大数据应用系统的故障分析能力。传统方法中对大数据的分层聚类采用K-Means聚类算法,容易陷入局部收敛,聚类效果不好。提出一种基于核向量机的数据的分层建树聚类。采用四叉树算法对多维数据进行数据预处理,进行KNN中心区域的聚类中心扩展处理,针对大数据的类域交叉性进行了一次核向量机差分比较,得到KNN模糊划分矩阵,根据所属类别的不同对已知样本进行分层,得到一维差分分层建树模型和二维差分分层建树模型,计算数据核向量之间的相似度特征,实现矩阵的数据点数模糊集合贴近度填充,实现聚类算法改进。仿真结果表明,该算法具有优越的大数据聚类性能,收敛性好,应用到网络在线故障诊断中,实现对故障信号的和恢复跟踪,提高了故障诊断效益,展示了较好的应用价值。 相似文献
6.
7.
研究高效进行数据聚类,提高数据聚类能力的问题。传统的模糊C均值算法具有对初始值和噪声极为敏感和遗传算法在局部极值点收敛的缺陷。基于模糊c均值聚类算法,提出一种改进的优化聚类算法。利用混沌序列的均匀遍历特性和差分进化算法的高效全局搜索能力,对模糊c均值算法进行改进,利用Logistics混沌映射对聚类算法进行优化搜索,把混沌扰动量引入到进化种群当中,弥补了模糊C均值算法的缺陷。采用改进的Logistics映射扰动搜索聚类算法,以目标识别为案例,综合4类目标特征参数为研究对象,开发了一套有价值的目标识别专家系统软件。仿真实验表明,改进的数据聚类算法,具有优越的数据聚类性能,聚类判断准确率提高明显,设计的专家系统软件对目标识别特征分类具有较好的准确性和可靠性,具有一定的应用价值。 相似文献
8.
提出基于半监督混合模型的海量入侵数据检测方法。利用蚁群算法进行入侵数据的特征选择,在结合半监督的混合模型分类方法进行入侵数据的分类,利用混合模型对数据样本空间的聚类分布进行描述,利用数据函数将聚类的信息与分类算法相结合,进行数据分类时对没有标示的数据样本进行考虑,对入侵数据进行检测。克服传统方法存在的弊端,提高了分类器的泛化能力,保证数据分类的效果,提高了入侵数据检测的准确性,完成对大数据环境下网络主动入侵海量数据检测的研究。实验的结果表明,利用本文方法能有效地提高入侵数据检测的准确性。 相似文献
9.
10.
为了提高农网物资储备点的优化管理和调度能力,需要对农网物资储备点的需求趋势进行优化预测,提出基于关联规则调度和模糊自适应聚类的农网物资储备点需求趋势优化预测方法,构建农网物资储备点需求趋势的统计序列分布模型,采用大数据挖掘方法进行农网物资储备点需求趋势的大数据统计信息建模,提取农网物资储备点需求趋势的关联规则特征量,采用模糊聚类方法对需求趋势大数据进行自动聚类处理,建立农网物资储备点需求趋势预测的优化迭代模型,结合自适应寻优算法实现农网物资储备点需求趋势优化预测。仿真结果表明,采用该方法进行农网物资储备点需求趋势预测的自适应性较好,预测精度较高,提高了农网物资储备点的自适应调度和管理能力。 相似文献
11.
针对传统的混合蛙跳聚类算法在差分进化时,随着迭代次数的增加,聚类中心矢量向模糊边缘贴近,导致搜索精度不高,陷入局部最优的问题。提出一种基于最小二乘算法的混合蛙跳优化聚类算法,引入模糊集合贴近度运算,对聚类中心矢量执行全局更新,避免模糊边缘的局部最优解贴近。仿真测试采用合成的二维数据进行数据聚类实验并应用到软件故障预测模型中,实验结果表明,采用该算法进行目标数据聚类,具有更好的寻优进化性能,聚类精度提高明显,在数据分类识别等领域具有很好的应用价值。 相似文献
12.
《科技通报》2015,(8)
通过对文本数据库的优化索引提高信息检索功能,传统的数据库索引方法采用单层文本特征聚类方法,聚类特征不一致时,存在非法聚类和非法结果输出的安全问题。提出一种基于虚拟数据加速分布重组的数据库索引技术,首先构建虚拟数据加速分布重组模型,改进数据库的分布模型,提高对文本数据的索引能力,把需要的文档集经过预处理后,构建文本数据库,算出各个候选扩展词的权重后,需要根据各个词与原查询词的相关度,构成数据库文本扩展词集合,采用相关规则挖掘的规则词作为扩展,得到了虚拟数据的加速分布系统状态函数,构建规则库,从中提取与原查询相关的扩展词,进而实现查询扩展,实现数据库索引算法改进。仿真结果表明,该算法进行文本数据库索引的收敛性好,检索精度和有效连接数较高,执行时间短,展示了其优越性。 相似文献
13.
14.
15.
[目的/意义] 为了探索位势梯度、情感共轭与圈层扩散之间动态影响机制,对网络空间中的信息进行分类和定级,实现危机信息的差异化监控与治理。[方法/过程] 本文采用向量自回归、状态空间模型及时间序列模型对位势梯度、情感共轭及圈层扩散之间关系进行分析。[结果/结论] 研究发现:1)位势梯度及情感共轭的每次冲击对圈层扩散产生滞后性影响,在整个过程中呈现右偏态分布特征。2)位势梯度及情感共轭对圈层扩散波动的贡献率均较大。3)位势梯度与情感共轭对圈层扩散的边际影响变化呈倒U形抛物线特征,且均较大。4)位势梯度、情感共轭与圈层扩散之间的相互影响效应在不同人口统计学群体间存在差异。 相似文献
16.
《科技通报》2015,(8)
需要对语义主题树特征进行聚类算法设计,提高对语义特征的搜索和语义泛化能力。传统的语义特征聚类算法采用基于本体映射的语义特征聚类算法,建立异构的本体模型之间的语义等价映射关系,导致聚类性能和语义泛化能力不好。提出一种基于语义覆盖度融合的I/O映射聚类算法,利用领域知识和模式匹配,建立本体之间语义映射关系,考虑三种与语义信息相关的学习知识,得到语义相似度函数,利用统计TF-IDF的方法计算词语的特征权值,通过语义主题树特征匹配,实现搜索引擎的覆盖度I/O映射聚类改进。仿真实验表明,采用该算法能提高对语义的覆盖度融合能力,具有更好的数据聚类性能,较好地完成语义映射任务,语义信息检索查准率提高为98.7%。 相似文献
17.
18.
《科技通报》2015,(10)
设计网络流量预测数学模型,实现对网络流量的准确预测和评估。传统的流量预测算法采用包络特征子空间聚类的流量序列分析方法,对随机大数据网络流的聚类和预测效果不好。提出一种随机阵列向量模型的流量预测算法。首先进行了网络流量预测的时间序列模型构建,采用平均互信息算法和伪最近邻点法求解最优化网络流量序列重组空间异构参数,得到一个高密度流量数据分形区域,创建流量序列的概率分布曲线,在随机阵列相空间中形成新的映射采用统计学数学方法对流量序列的随机分布特征进行分布式计算,随机阵列向量模型构建方法进行流量预测算法改进。仿真结果表明,采用该算法进行流量预测,能有效提高预测精度,具有较好的流量特征分析能力,性能优越。 相似文献
19.
《科技通报》2015,(8)
对云计算系统中的漂移数据中心分类区的准确确定,可以提高云计算系统的扩展能力和缓存能力。传统方法采用线性差分智能群识别方法实现中心分类区的确定,导致漂移数据的群辨识效果不好。提出一种基于粒子群聚类的云计算系统中数据中心分类区的确定算法模型,并进行仿真实现。构建云计算系统网络激励传播机制,实现资源负载均衡,把云计算系统的存储数据结构定义为一个四叉树,构建云计算网格环境下空间资源调度框架体系,进行云计算系统的漂移数据特征提取,使得资源负载均衡达到最优值,实现算法改进。实验得出,模型对云计算系统的漂移数据中心分类区确定准确,数据融合精度较高,聚类性好,云计算系统的扩展指数提高13%,缓存执行能力提高20.5%,展示较好的性能。 相似文献
20.
《科技通报》2015,(10)
在云计算环境下,针对K-means对初始聚类中心敏感和易陷入局部最优的缺点,进行K-means聚类中心优化求解,提高对海量数据的聚类处理能力。传统方法采用动态干扰信任感推荐方法进行数据聚类中心求解,聚类中心对初始值敏感性较强,数据聚类效果不好。提出一种基于粒子群密度最大距离凹函数构建和边界隶属度特征分析的云计算中K-means聚类中心优化求解方法。通过云计算处理,对数据聚类余下样本点按照与聚类中心的相似程度来划分成k类,对原始变量数据的差异化特征进行降维处理,通过搜索空间中的粒子,每一个粒子自身都有速度、位置和适应度,通过迭代找到最优解,进行数据规范化预处理,数据预处理包括选择数量,类型和特征的标度,进行边界隶属度特征分析,实现云计算数据的聚类改进。仿真结果表面,该算法对云计算数据的聚类性能优越,聚类中心求解准确,克服了传统的K-means对初始聚类中心敏感和易陷入局部最优的缺点,应用价值较大。 相似文献