首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
通过研究近似邻近查询算法,提出了一种基于随机化思想的KANN(K-approximate nearest-neighbor algorithm)算法,改进相似性搜索的速度和精度。算法在两个阶段采用了随机思想:一是在编码时,结合谱哈希算法和随机矩阵逼近法得到数据点的二进制编码。二是在查询时,为降低搜索时间成本,先对原数据集进行初次阈值筛选得到一个查询点的一个近似类别集。由于近似类别中存成对距离很小,采用基于距离搜索算法精度下降。本论文提出采用统计秩的思想,保留距离排序的信息,在近似类别的数据集进行多次抽样排序,得到k个近似邻居。本文提出的近似邻近检索框架采用多环节过滤数据,并控制搜索误差,在速度和精度上得到了改进。  相似文献   

2.
翁勍力  施水才  赵捧未 《情报杂志》2007,26(9):114-116,119
针对目前搜索引擎返回结果的海量性和无结构性,构建一个基于元搜索的聚类挖掘引擎,旨在利用元搜索引擎返回的结果,提高搜索结果聚类效率,快速有效地为用户提供一个搜索结果结构视图,从而进行进一步的知识发现。介绍了搜索引擎和挖掘引擎的主要功能及差别,应用向量空间模型对元搜索结果进行处理。介绍当前主要的聚类算法-K—means划分法和层次凝聚聚类法,并在此基础上提出基于元搜索结果将两种聚类算法相结合的聚类方法。  相似文献   

3.
提出了一种基于双目立体视觉的玉米叶片三维重建方法。该方法利用两个平行且位置相对固定的摄像机,组成双目立体视觉系统。运用改进的张正友平面标定法进行摄像机标定,采用一种改进的Harris算法,通过快速预筛选和多阈值角点提取方法,对获取的图像采集Harris角点以提取玉米叶片特征,通过计算搜索窗口内对应点的相关系数和阈值的比较实现特征点匹配,依据视差原理,计算得到玉米叶片的三维点云信息,对预处理后的玉米叶片点云进行双三次B样条曲线插值,重构叶片的三维网格曲面。仿真实验表明:所提方法能够高效、准确地实现玉米叶片三维重建,对玉米叶片边缘起伏和褶皱等细节可完整保留,三维重建精度较高。  相似文献   

4.
为了提高云计算环境下网络资源访问和调度能力,需要增强网络资源的活跃度,传统方法采用源信息系统最小方差粒子群优化算法实现资源活跃度增强调度,直接交互式多源信息的缺陷,导致信息访问的滞后和时延。提出一种基于粒子群(PSO)递阶进化的多出口网络资源活跃度增强算法,构建多出口网络资源调度和网络系统结构,粒子群进化按照属性的数据波动进行递阶分层,得到一个资源数据聚类的高密度区域,使得每一个初始种群中的个体都应有一个解,在多波束搜索PSO空间中实现粒子群PSO递阶进化,提高网络资源访问的活跃度。仿真实验表明,采用该算法,能避免粒子群在进行网络资源搜索调度过程中陷入局部最优,有效提高控制搜索精度,运行时间较短,能有效增强多出口网络资源的活跃度,进而提高了资源搜索成功率。  相似文献   

5.
在云计算环境下,针对K-means对初始聚类中心敏感和易陷入局部最优的缺点,进行K-means聚类中心优化求解,提高对海量数据的聚类处理能力。传统方法采用动态干扰信任感推荐方法进行数据聚类中心求解,聚类中心对初始值敏感性较强,数据聚类效果不好。提出一种基于粒子群密度最大距离凹函数构建和边界隶属度特征分析的云计算中K-means聚类中心优化求解方法。通过云计算处理,对数据聚类余下样本点按照与聚类中心的相似程度来划分成k类,对原始变量数据的差异化特征进行降维处理,通过搜索空间中的粒子,每一个粒子自身都有速度、位置和适应度,通过迭代找到最优解,进行数据规范化预处理,数据预处理包括选择数量,类型和特征的标度,进行边界隶属度特征分析,实现云计算数据的聚类改进。仿真结果表面,该算法对云计算数据的聚类性能优越,聚类中心求解准确,克服了传统的K-means对初始聚类中心敏感和易陷入局部最优的缺点,应用价值较大。  相似文献   

6.
针对DCF聚类描述法存在的问题,提出一种基于组合策略的聚类描述方法,即综合利用"先描述、后聚类"和"先聚类、后描述"的优点,解决聚类描述的可理解性问题.实验结果表明该方法的有效性,将该方法用于搜索结果聚类这一应用中.  相似文献   

7.
三维煤层精确建模受地下断层、岩层、地势起伏等因素的影响,建模精度不高。为提高三维煤层建模的精度,提出一种基于伪点剔除与四域样条插值的三维煤层精确建模算法,通过伪点剔除方法对建模点进行预处理,筛选出其中的孤立点,进行剔除,其余非孤立点用于基本模型建立和基于映射的模型重构,采用四域样条插值方法对非孤立点进行建模,在建模中,将建模域分为起始域、延伸域、稳定域、收敛域共四个域,在不同域中,对不同的建模点进行匹配加权插值处理,经过四域联合滤波,实现四域样条插值,对建模效果起到平滑滤波作用,从而大大提高三维建模精度。仿真实验表明,新算法对于外界断层、岩层、地势起伏等具有很好的鲁棒性,三维建模精度提高,并且计算量明显较少。  相似文献   

8.
CLIQUE是一种基于密度和基于网格的混合聚类方法。在高维空间中,它能够有效地进行聚类,并且能够发现嵌套在高维数据空间子空间中的聚类。但是,CLIQUE算法存在着很多的局限性,主要有以下两点:首先是子空间的剪枝;其次是CLIQUE算法追求方法简单化。针对CLIQUE算法的局限性,采用基于约束条件的聚类技术、自适应网格技术和边界调整技术来对CLIQUE算法进行改进,提出了基于约束条件和自适应网格的CAG-CLIQUE算法。  相似文献   

9.
利用空间坐标和属性特征的有机结合,定义了3种曼哈顿空间距离,用matlab编程给出了基于该空间距离的ACA—Cluster聚类算法,并对山东省生态环境质量进行了聚类分析和类型分区。实验表明,该方法可以较好地反映出空间位置邻近和属性特征相似的空间聚类要求。  相似文献   

10.
赵海发  李小伟 《科技通报》2012,28(10):34-36
空间插值算法是一种通过已知点的数据推求同一区域其它未知点数据的计算方法.本文利用插值算法的原理,将空间插值算法应用到了城市用水量预测中.实验表明,该方法能够有效地提高预测精度,具有一定的实际应用价值.  相似文献   

11.
姜灵敏 《科技管理研究》2005,25(11):217-219
爬山法一般得不到全局最优分类,k-均值法等常规动态聚类方法对初始聚类中心的选择非常敏感且聚类结果依赖样本的输入次序,结合遗传算法的全局搜索能力和爬山算法的局部搜索能力改进常规动态聚类方法,可以有效地解决这些问题,通常可保证能在有限的迭代次数内搜索到全局最优解。  相似文献   

12.
王华秋  王重阳  聂珍 《现代情报》2016,36(2):129-134
图像聚类为数字图书馆图像管理提供了新的技术支持,能够在大量图像数据中发掘使用户感兴趣的信息。传统应用于图像聚类的特征提取算法往往忽略图像颜色的空间分布信息,且适应性较差。通过等面积矩形环对图像进行划分并计算各空间区域的相关性,并根据空间区域相关性计算各区域的重要性,将空间信息与颜色信息进行融合。同时对快速搜索密度峰值聚类算法的截断距离进行了合理改进,在保证聚类精度的同时提高收敛速度。最后将该密度聚类算法应用于数字图书馆图像检索之中。通过实验验证,本文提出的方法是可行的、有效的。  相似文献   

13.
二阶锥规划是在有限个二次锥的笛卡尔空间仿射变换交集上的极小化和极大化线性函数,采用修正的二阶锥规划模型,结合二阶锥的凸优化条件,进行大数据聚类算法改进,提高数据的聚敛性。传统方法中对大数据聚类的二阶锥规划模型采用线性对偶锥规划方法,对数据聚类的路径跟踪性能不好。提出一种基于修正的齐次二阶锥规划模型的大数据聚类算法。进行数据的特征挖掘和信息流模型构建,从大量的、有噪声的、模糊的数据中进行大数据的功率谱密度特征提取,采用粗糙概念格方法对大数据信息流进行二阶锥规划模型构建,结合齐次二阶锥规划模型算法有限收敛性,对每一数据聚类样本进行可靠性衡量,实现数据聚类中心的准确搜索。对聚类误差函数求最优解,使得误差收敛到零。仿真结果表明,该算法进行数据聚类的精度较高,收敛性较好,避免了出现局部最优解,性能优越于传统算法。  相似文献   

14.
研究高效进行数据聚类,提高数据聚类能力的问题。传统的模糊C均值算法具有对初始值和噪声极为敏感和遗传算法在局部极值点收敛的缺陷。基于模糊c均值聚类算法,提出一种改进的优化聚类算法。利用混沌序列的均匀遍历特性和差分进化算法的高效全局搜索能力,对模糊c均值算法进行改进,利用Logistics混沌映射对聚类算法进行优化搜索,把混沌扰动量引入到进化种群当中,弥补了模糊C均值算法的缺陷。采用改进的Logistics映射扰动搜索聚类算法,以目标识别为案例,综合4类目标特征参数为研究对象,开发了一套有价值的目标识别专家系统软件。仿真实验表明,改进的数据聚类算法,具有优越的数据聚类性能,聚类判断准确率提高明显,设计的专家系统软件对目标识别特征分类具有较好的准确性和可靠性,具有一定的应用价值。  相似文献   

15.
对于具备空间特性的数据来说,基于引力的聚类方法是一种基本且行之有效的聚类技术.尽管现有很多基于引力的空间聚类算法和技术,但是这些算法多数都假设数据分布于平滑空间.本文的目的在于探讨一种新的基于引力的流形空问聚类,即基于弯曲空间的算法.同时给出了性能分析和实验测试.  相似文献   

16.
为了提高模糊支持向量机在入侵检测数据集上的训练效率,提出了一种基于聚类的模糊支持向量机入侵检测算法.该方法可以对训练数据进行剪枝,有效地减少远离分类面的聚类边缘点的数量,同时在分类面附近保持较多的样本点,以靠近判别边界的聚类中心集合作为有效的训练样本集合对模糊支持向量机进行训练,减少了样本的训练时间,提高了算法的效率.实验结果表明该方法提高了模糊支持向量机的训练效率,而且对入侵检测是非常有效的.  相似文献   

17.
因特网是一个巨大的,分布广泛的、全球性信息中心.为了提高Web信息查询的质量,目前有很多将Web搜索结果再进行聚类的方法.本文提出了一种基于二分网格的对Web搜索结果进行聚类的方法,有效地提高了Web查询的效率.  相似文献   

18.
针对传统的混合蛙跳聚类算法在差分进化时,随着迭代次数的增加,聚类中心矢量向模糊边缘贴近,导致搜索精度不高,陷入局部最优的问题。提出一种基于最小二乘算法的混合蛙跳优化聚类算法,引入模糊集合贴近度运算,对聚类中心矢量执行全局更新,避免模糊边缘的局部最优解贴近。仿真测试采用合成的二维数据进行数据聚类实验并应用到软件故障预测模型中,实验结果表明,采用该算法进行目标数据聚类,具有更好的寻优进化性能,聚类精度提高明显,在数据分类识别等领域具有很好的应用价值。  相似文献   

19.
基于马尔可夫模型的图书馆用户聚类分群方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
吴艳玲  孙思阳 《情报科学》2021,39(11):167-172
【目的/意义】针对图书馆用户群体聚类分群不稳定且错误率较高的问题,提出基于马尔可夫模型的图书馆 用户聚类分群方法,提升图书馆用户聚类分群精准度。【方法/过程】采用一阶马尔可夫混合模型构建用户动作序列 模型,通过模型产生用户行为聚类,体现用户动作的动态性,采用自适应自然梯度算法,依据用户行为分离状态自 适应调整自身步长,优化模型参数学习中模型自动选择问题,实现最佳图书馆用户聚类分群。【结果/结论】通过实 验结果能够证明,实际聚类数量小于L值时,提出方法能够实现参数学习过程中模型的自动选择。提出方法的分群 数量最多,能够划分出最大的取值区间,聚类错误率最低为0.22%,聚类性能比较稳定,分群结果更加精准,达到了 设计的预期。【创新/局限】采用一阶马尔可夫混合模型实现了图书馆用户聚类分群。后续将进一步研究可考虑用 户序列间关联的高阶马尔可夫分量模型,以提高分群算法的准确性和稳定性。  相似文献   

20.
一种基于DASOM的两阶段中文文本聚类方法   总被引:2,自引:0,他引:2  
朱红灿  唐毅 《情报杂志》2007,26(9):101-104
研究了一种基于动态自组织神经网络(The Dynamic Adaptive Self-Organizing Map Neural Network简称:DA-SOM)的两阶段中文文档聚类方法,第一阶段对中文文本向量进行DASOM训练,第二阶段对虚拟的坐标集聚类。该算法动态地组织DASOM,由文本的内容来决定模型的结构;与直接聚类相比,降低了计算时间;与基于静态SOM文本聚类相比,减少了输出层节点数,改善了聚类效果。通过数值实验对比表明该方法对中文文本聚类具有有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号