首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 328 毫秒
1.
在图书销售或图书馆建设过程中积累了大量的图书信息数据,面对庞大的数据量,如何处理这些数据和如何深入其内部获取有用的信息,将是本文讨论的重点。我们将依据APRIORI算法和OLAP的关联规则,设计出能够很好利用这些数据为后期的分析做准备的系统。  相似文献   

2.
文章设计了一种简单高效地数据预处理方法,通过数据清理、用户识别、会话识别及路径补全等步骤,并在各步骤中采用一定的规则与算法以提高处理准确性,获得了一个完整的数据预处理过程。经实验证明,该方法有效缩减了数据大小,提高了数据质量,具有良好的可靠性。  相似文献   

3.
大数据是近年来兴起的新概念,借助大数据,能够分析、处理海量数据,在无关数据中寻找关联,提取出有作用的信息,对社会生产的各个领域,都产生了深刻影响。本文针对大数据技术的优势进行了详细分析,并探讨大数据技术在跨境电商领域中的应用方式。  相似文献   

4.
提出了利用单纯形法对含噪音的数据的处理,讨论了原理,给出了算法,通过对多组数据的拟合,证明了单纯形调优法的可行性和优越性.  相似文献   

5.
关联规则广泛应用于网络入侵检测,以Access2003数据库为基础,实现了关联规则挖掘apriori算法,成功挖掘出网络数据特征项与入侵类型之间的关联规则,能有效地对网络入侵数据进行关联规则分析。  相似文献   

6.
可逆数据隐藏是继密码学、传统的数据隐藏算法之后的又一项重要技术,主要应用在军事、医学等特殊领域。近几年可逆数据隐藏算法层出不穷,但数据嵌入的核心思想大同小异,算法优劣的比较不是很明显。针对这一问题,文章提出了一种新的关于可逆数据隐藏的算法比较方案,实验证明该方案能够较好地分析出可逆数据隐藏算法的优劣,具有一定的实用价值。  相似文献   

7.
数据增量更新是数据仓库应用领域的重要问题。设计增量数据的获取方式。对增量数据的冗余问题进行了重点研究,提出了预处理方法并设计了相应算法,该方法实现了增量数据的压缩,提高了增量数据的质量及ETL过程的处理效率。给出了增量ETL过程的具体实现。  相似文献   

8.
传统数据并行挖掘算法忽略了对数据特征的聚类,数据边界特征点无法得以融合,导致数据挖掘收敛性较差、精度偏低。文章提出基于并行挖掘的多云协同构架云数据分区挖掘算法,建立多云协同构架云数据的特征数据聚类模型,采用边界特征点融合和阈值分割方法,实现多云协同构架云数据的信息融合和聚类处理。  相似文献   

9.
缺失数据填充是数据分析处理领域的一个重要研究课题。特别是在采集数据量较少的情况下,缺失数据填充的难度极大。针对这个问题,提出一种基于改进神经过程模型的缺失数据填充算法,该算法可有效提升小数据集背景下的缺失数据填充性能。首先,将观测到的时间序列进行单一表示,由神经网络得到各自的表征向量;其次,通过神经过程模型获得数据的分布函数,并在训练阶段引入修正系数α,从而根据数据缺失率更加精确地确定训练数据的采样率;最后,加入填充过程,通过训练好的模型估计数据缺失值。为检验算法性能,在海洋表面温度数据集以及北京PM2.5含量数据集上进行仿真实验,结果表明该算法在小数据集背景下具有良好的填充效果。与其他算法相比,所提算法在高缺失率的情况下具有更低的均方根误差。  相似文献   

10.
文章提出了一种基于过程化考核的学生学习过程数据关联分析方法,即通过对高校学生学习过程数据的关联分析和分类算法的阐述,并运用数据挖掘技术分析学生过程化考核教学数据之间的关联规律,从而为高等院校的教学改革提供重要参考。  相似文献   

11.
从XBRL维度数据处理的角度,研究大规模半结构化数据处理技术,提出一种基于Map/Reduce并行编程模型的XBRL维度数据解析算法. 该算法在Map/Reduce编程模型和StAX流式解析技术的基础上,针对XBRL财务报告中各XML文件之间较复杂的数据引用关系,以整份XBRL财务报告为处理的最小单位,结合并行技术提取维度事项所包含的数据,再处理业务语义数据,从而实现复杂XBRL维度数据的解析. 性能比较分析表明,该算法在大规模XBRL数据处理方面具有显著优势.  相似文献   

12.
针对CMAR算法存在的不足,提出了层次频繁模式树的概念,并在此基础上实现了关联分类数:。据挖掘算法.实验数据表明,该方法比CMAR算法具有更高的效率与数据库覆盖面.  相似文献   

13.
集中并行可视化与远程可视化的优点,提出远程数据抽取与并行可视化分析诊断方案. 针对地学研究对象具有多尺度的特点,借助于多尺度、多分辨率数据抽取工具,建立了超大规模地学数据多尺度抽取算法以及并行实现算法;并以海啸数据为例,基于VTK软件实现海啸数据的多尺度显示.  相似文献   

14.
设计一种高效的大矢量数据Union算法. 首先,研究Union功能并分析属性数据和图形数据特点,以图形数据为主,属性数据为辅;分别对属性数据和图形数据设计不同的算法. 然后,对进行Union操作的输入要素建立四叉树索引. 最后,采用多线程并行计算运行该算法. 测试结果表明,该大矢量数据Union算法的效率超过ArcGIS10.0平台.  相似文献   

15.
针对当前船舶自动识别系统(automatic identification system,AIS)数据存在大量错误和缺失的问题,通过匹配AIS数据丢失时间制定完备AIS数据库,采用改进的Hausdorff距离公式融合轨迹空间相似度与船舶航行速度相似度,采用相似轨迹作为最小二乘支持向量机(least squares support vector machine,LSSVM)算法的输入样本,通过数据训练得到的回归模型对AIS数据进行修复。采用实际数据进行验证。结果显示,本文提出的基于粒子群优化(particle swarm optimization,PSO)的LSSVM算法能够准确还原AIS数据。结果可以提高AIS数据的连续性和完整性。  相似文献   

16.
针对现有入侵检测技术的不足和目前关联规则算法的研究,结合网络的特点,提出了一种适合入侵检测的数据挖掘算法一基于矩阵结构的模糊关联规则数据挖掘算法。该算法使数据挖掘技术和入侵检测技术融合在了一起,由于矩阵结构的模糊关联规则可以有效地减少关联规则在生成频集的过程中产生过多候选集,从而提高了入侵检测的效率。  相似文献   

17.
为将在算法上具有信息处理共性特点的数据挖掘和综合评价两个不同的信息处理手段结合应用,通过两组算法实例比较分析,考查数据挖掘和综合评价算法的共性与特性,提出利用数据挖掘方法对综合评价理论改进的算法,设计以用户为中心的基于层次分析法(Analytic Hierarchy Process,AHP)的属性组合降维算法,将评价理论的研究思想和成熟算法应用于主动式数据挖掘.该研究对数据挖掘和综合评价两个学科的共同提高和发展、促进智能信息处理技术的发展具有一定的借鉴作用.  相似文献   

18.
为解决船舶自动识别系统(automatic identification system, AIS)数据挖掘不够充分,对航路辨识分析不够全面等问题,提出一种基于改进谱聚类算法的数据挖掘方式。利用Sliding Window算法对船舶轨迹AIS数据进行压缩,减少数据冗余提高聚类效率。改进亲和距离函数,提出新的亲和矩阵的标准,提高聚类的稳定性,进一步对数据去噪,减少噪声敏感。通过优化初始中心对k均值算法进行改进,优化全局搜索能力,缓解初始值的选取对聚类效果的影响。以天津港AIS数据为样本进行算法验证。结果表明,该聚类算法能准确提取和划分某水域船舶主要航迹段,算法消耗系统资源少,计算速度快。改进后的算法可为航路辨识、分道通航制定等提供理论支持。  相似文献   

19.
针对机载双天线InSAR系统实用化测图问题,提出一种将目标定位至数据获取几何的成像算法.该算法可以高效结合自配准处理.相对于将目标定位至零多普勒几何的传统算法,该算法优势在于减少了后续干涉处理过程三维定位的计算量,且成像算法效率与传统算法一致.该算法尤其适用于实用化机载双天线InSAR系统.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号