共查询到20条相似文献,搜索用时 359 毫秒
1.
针对电网数据来源多、维度高、体量大的特点,提出云环境下大规模电网数据相似重复记录并行检测算法MP-MATCH;首先,引入海明距离、倒排索引算法和狄利克雷抽屉原理对Sim Hash算法改进,解决相似重复记录检测精度和效率缺失的问题;其次,基于MapReduce模型设计改进的Sim Hash算法的并行执行策略,实现云环境下大规模电网数据相似重复记录并行检测;最后,在Hadoop平台上进行实例对比分析,结果表明了算法的高效性和精确性,并具有良好的伸缩性和加速比,适用于大规模电网数据的相似重复记录并行检测。 相似文献
2.
在数据装入数据仓库之前,应该对数据进行数据清洗.而数据清洗的核心工作就是清洗近似重复记录.聚类是将相似度高的数据对象聚集到一个类中,于是我们提出将该技术用于近似重复记录的发现上.本文主要介绍如何将SOM网络聚类强大的学习功能及良好的自组织性、自适应性和鲁棒性应用到数据清洗中。 相似文献
3.
4.
针对图像自相似或具有对称性SIFT匹配稳定性不高的问题,提出了改进的Harris算法与SIFT算法相结合的图像匹配方法,用稳定的SIFT算法检测提取尺度空间极值点作为特征候选点,根据灰度的"相似度"的原则进行Harris特征提取,使候选点数量更少,特征点更稳定,使得匹配的效率更高,准确性更高。 相似文献
5.
6.
7.
邹亚会 《内蒙古科技与经济》2011,(14):77-78
提出了一种基于信息增益选择排序属性的消除汉语相似重复记录的方法。其中,记录之间的匹配方法考虑了汉语的缩写和输入错误。实验证明,该方法是有效的。 相似文献
8.
9.
由于简单的结构化查询语言(SQL)语句可对聚类规则、特征规则进行创建,所以在在数据挖掘算法中,SQL常被用于表明特征规则,尤其是聚类规则。将应用软件与SQL语句相结合,可有效提高创建d-加权、t-加权能力,尤其是特征规则中的归一化能力,d-加权、t加权分别用于衡量数据记录的差异性和典型性。从聚类分析的概念、算法原理出发,详细分析了SQL选择语句在数据挖掘中的聚类分析方法。 相似文献
10.
本文针对采用fuzzing测试技术来检测SQL注入漏洞的方案,提出一种改进的构造fuzzer的方法--"支持文法的变异样本"法。并以此为基础实现了一个基于fuzzing的自动化Web应用程序漏洞检测工具。 相似文献
11.
经过充分的实践证明,在分析高校科技创新绩效考虑其产出总量的同时,另外还应考虑到其产出效率。本文基于数据包络的评价指标体系,开展了包括"创新投入"及"创新产出和效益"和"创新资源"等三部分分析模型构建内容的研究与探讨,在对高校科技创新绩效开展评价和实证分析的理论基础上,获得利用非DEA有效决策单元在有效决策单元组成的生产前沿面投影上进行高校科技创新绩效改进的定量分析法,通过数据包络法的实证结果来证明该方法的有效性、可行性以及科学性。当前,高校持续性的投入与教育经费短缺的矛盾非常突出。本文利用数据包络分析法对全国部分211高校的绩效评价进行技术效率分析。通过研究发现,教育建设并非投入越多越好,而要以应用为本。以应用促进投入,促使教学设备发挥最优效率才是打赢绩效战之关键。 相似文献
12.
"加强供电质量和供电服务水平,实现供电管理系统可视化、精细化、深层化"是电力部门工作方向总体方针。三维仿真电网设备模型是实现管理可视化、精细化的基础,如何更好更快速的建立高仿真电力设备模型是电力部门一直在研究的课题。本文以"基于GIS的激光扫描建模"和"精细化模型与GIS可视化数据深层应用"两个方面讨论广州供电局供电可视化、精细化管理解决问题的方法;从广州局三维GIS系统建设现状出发,探讨解决建立高仿真三维模型的困难。通过现有科技手段,提出实施办法,建立高仿真三维模型库,完善集成各电网系统的数据接口,为广州供电局供电信息化管理提供科学的方法。 相似文献
13.
14.
在分析现行两种编目工作模式利弊的基础上,为综合两者之长且避其短,提出了新的编目工作模式——“提问——解答/讨论”式一条龙作业,即在现行的一条龙作业模式中增加“提问——解答/讨论”环节。编目数据审校人员在对编目数据进行审核时,依据“提问——解答/讨论”工作记录对编目员的工作进行量化,督促编目员保证编目数据质量,加强编目员之间的交流、探讨,促进编目员的业务水平的整体提高。“提问——解答/讨论”记录还可作为本馆编目规则制定和修改的依据。 相似文献
15.
现代高等教育,已不再是简单的教会学生某项专业知识,而是通过教育为国家、为社会培养高素质的综合性人才。时下的教育体制正在不断改革和创新,有关资料显示,高校“两课”教育教学方法并没有进行充分与时俱进的改革,其质量与教学目标的完成存在现实意义的问题。因此如何紧跟时代进步,不断深入变化和发展,改善教育方法,这是高校“两课”教学必须面对和重视的问题。本文将针对高校“两课”教育教学方式,进行深入分析。 相似文献
16.
多年的教学实践表明院分析化学中定量分析实验教学中主要存在的是学生对“量”的概念认识不清的问题,故提出了注重实验每一细小的环节,重视实验结果的有关数据的读数、记录以及计算等环节,在定量分析实验教学中渗透“量”的概念,让学生真正明白“量”的概念。 相似文献
17.
本文论述了服务型统计的概念。尽管统计服务对象是多元化的,但“用数据说话,用数据服务”依然是统计工作的主题,从而通过论述当前对统计数据要求的新挑战和统计应对工作的重点,尝试提高数据质量、融合资源、增强匹配、充分应用数据资料、拓宽服务领域应对统计数据来自环境、需求、匹配、责任等方面新挑战。 相似文献
18.
发展农村体育是推动农村文化发展和农村人力资本跃迁的重要途径,但发展农村体育不等于农村体育设施的“硬件化”。本文立足既有的调研资料,采用文献资料法认为农村体育硬件化的思想根源在于原有研究视野比较重视物质层面的研究,而忽视了非物质层面的研究,忽视了农村体育发展的乡土性和非现代性的“土壤”。在进一步解析农村体育的乡土性和现代体育“竞技性”冲突的基础上,认为农民需要才是农村体育发展的基础,充分发挥以非物质文化遗产形式广泛存在的农村民间体育形式是较好实现农村体育发展的重要路径。 相似文献
19.
主要阐述了银行搭建统一基础数据平台的必要性和深度挖掘"客户效益"所起的作用,对构建企业级数据仓库平台及实现银行反洗钱系统按层作了的详细的设计。 相似文献
20.
“麦可思”报告对学院的总体运行情况做了比较客观的评价,从而也对高职院校的班主任工作提出了新的要求..本文针对“麦可思”报告的相关数据,有目的性、针对性地提出具有可执行性的措施,切实提高高职学生的就业竞争力。 相似文献