首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
抽样方法在大数据研究中发挥着重要作用,子抽样作为其中之一可以非常高效地解决数据量大的问题,无论是线性回归模型还是Logistic回归模型都有相应的子抽样方法。本文使用大数据下基于二元Logistic模型的两种子抽样方法,分别是普通子抽样方法和两阶段最优子抽样方法,并利用实际数据评估了算法的优良性,得出以下结论:基于两阶段子抽样算法建立的Logistic回归模型在估计精度上优于基于普通子抽样建立的模型;基于L最优准则下的子抽样虽然比基于A最优准则下的子抽样估计精度略低,但耗费的运算时间更短。  相似文献   

2.
基于数据空间的网格数据管理   总被引:1,自引:0,他引:1  
为了更好地管理和应用数据网格中大量分布异构的数据,在对网格技术发展现状进行深入研究基础上,提出基于数据空间概念的网格数据的管理架构.在此基础上,实现了一个网格数据空间管理原型系统,系统中将现有的一些数据空间技术如数据模型iDM、查询语言iTrails等与网格数据访问中间件OGSA-DAI相结合,使用OGSA-DAI工作流来完成数据空间管理系统的数据访问、抽取、数据索引、服务管理和查询回复等一系列工作.实验表明数据空间管理机制在网格环境下是可行的,数据空间管理系统屏蔽了网格数据的分布性和异构性,且能够适应网格数据动态特性,因此满足了对网格数据的管理要求.所提出的网格数据空间架构为网格数据管理提出了新的方法.  相似文献   

3.
人口密度是识别人口空间分布特征的重要视角,基于网络覆盖数据进行人口分布研究是一个新的方向突破,有利于更加精细化刻画城市人口分布.基于西安市宽带覆盖数据,运用地理分析方法对西安市主城区人口空间特征进行分析,并通过研究得出以下结论:(1)人口空间格局中,西安市各等级人口密度表现出显著连片式空间分布格局,人口分布具有较强的向心性.(2)西安市人口分布具有显著的空间分异特征,不同区县、街道人口空间密度分布差异较大,人口高密度区主要集中在古城墙外围附近.(3)经济、政策因素对西安市异常人口高密度点密切相关,影响了内部人口分布.综上所述,通过对西安主城区人口空间分布特征及其影响因素的研究,对于优化西安城市空间布局具有重要理论和实践意义.  相似文献   

4.
《宜宾学院学报》2017,(6):67-73
稀疏子空间聚类是把子空间聚类问题松弛为凸优化问题,但这种凸近似需要满足较强的非相干性条件,且用观测数据本身作为字典进行子空间表示时,观测数据中所含的噪声、缺损、奇异样本等会增加子空间表示的误差.为解决上述问题,提出一种基于?_p范数(0相似文献   

5.
“生活中的数据”这一章所介绍的知识与我们的日常生活有着非常密切的关系.我国即将在全国进行1%人口抽样调查,下面我们就以1995年全国1%人口抽样调查的已有数据为资料,一起学习这次抽样渊查中将会用到的与本章有关的知识.  相似文献   

6.
为适应高速网络的发展,入侵检测系统从传统架构向分布式架构的转换势在必行。本文分析构建了一个分布式入侵检测系统框架模型,提出用数据概化的方法将大量松散数据内聚,来评估计算机网络的安全,并用数据探查的方法追踪在概化数据中显示的不安全因素。使用数据概化和探查可以提高控制中心的处理效率。  相似文献   

7.
甘蔗遭受冻灾后,会出现尾叶变枯 、蔗茎冻死、糖分下降,给人民群众财产造成重大损失。针对传统灾情调查方法现势性差、时效性弱的缺点,为快速、有效地进行灾后救援工作提供数据支撑,最大限度地降低损失,以来宾市兴宾区为例,基于多源卫星影像数据、行政区边界矢量数据、地面调查数据及1∶10万土地利用数据,结合ERDAS和ArcGIS软件提取冻灾发生前后两个时段的甘蔗种植分布,确定这两个时段甘蔗尚未收割的面积。实验证明评估结果与实际调查数据基本一致,该方法适用于甘蔗大范围冻灾快速评估。  相似文献   

8.
本文利用1999-2014年中国31个省市的空间面板数据,基于房价上涨的视角,运用空间探索性数据分析法(ESDA)和空间计量模型研究了中国半城镇化率的空间分布特征与半城镇化率持续上升的成因。研究发现:(1)中国人口半城镇化具有显著的空间正相关性和空间异质性,并且存在向东部沿海地区集聚的特征;(2)房价上涨显著推升了本省人口半城镇化率,而对周边省市影响不显著,本省房价上涨1%,本省半城镇化率上升约0.077个百分点;(3)推升人口半城镇化率的主要是住宅价格,其次是工业用房价格。研究表明,房价快速上涨不利于农业转移人口市民化。  相似文献   

9.
人地关系是地理学研究的主题,因此综观诸多地理学研究成果,均将区域人口数量作为重要的人文因素来考查.以行政界线为口径的人口密度统计方法无论是理论上还是在实践中,已显现出诸多局限性,社会经济发展亟需更为精确表述人口密度的一种新方法.人口数据空间化就是在GIS环境下,根据相关理论和实际的应用需求,把人口数据展布于地理空间上.本文通过收集大量已有的文献资料,进行整理归纳、分类总结得出:以往研究多集中于宏观尺度的区域人口密度模拟和微观尺度以及城市内部人口密度模拟方面,较少涉及生态环境脆弱、人口密度稀少的牧区人口密度模拟研究.研究牧区人口密度空间分布对社会经济数据进一步空间模拟的先导和基础,为合理组织牧区社会经济空间结构提供科学依据,为同类区域人口密度模拟研究提供方法上的参考.  相似文献   

10.
提出了一种基于数据质量进行控制的ETL技术,在传统的ETL操作流程中增加脏数据处理模块及抽样数据质量评估模块,并将数据质量控制思想融入到ETL的操作流程设计中,控制ETL过程的数据质量。实验表明,带有质量控制的ETL算法设计优化了ETL工作流程,提高了进入数据挖掘中数据的质量。  相似文献   

11.
随着工业化和城市化步伐加快,我国人口空间分布不断变化,各地区人口分布也存在着较大差异。基于人口普查数据及统计年鉴等数据和资料,采用变异系数、集中指数等方法,对我国人口与经济分布的时空特征进行分析,从空间视角研究人口数量、结构和经济发展的分布差异。结果表明:20世纪90年代以来,我国人口增速逐渐下降,地区人口总量和密度差异较大,经济空间差异与人口空间差异的相关关系明显,经济集中程度高于人口集中程度,人口与经济分布不均衡,但偏离程度不大,生产向经济发达地区集中,人口却未发生相应的集中,从而造成生产与人口、就业分布失衡及地区差距。  相似文献   

12.
基于淮河流域2002—2010年水资源利用数据,应用基尼系数对淮河流域水资源空间利用结构的定量化研究。计算结果表明:淮河流域水资源与耕地空间基尼系数、与城镇的空间基尼系数、与农村人口的空间基尼系数分别为0.32、0.47、0.20。表明城镇人口的空间分布最不均衡,而农村人口的空间分布则较为分散。淮河流域水资源空间基尼系数为0.34,空间安全程度一般。  相似文献   

13.
本文以2010-2019年云南省的人口与国民生产总值为数据基础,以16个州市为研究对象,运用人口—经济增长弹性、标准差椭圆法、全局空间自相关模型等方法对云南省人口与经济的增长协调关系、时空演变、空间分布方向性及空间相关性进行分析.结果表明:(1)人口-经济弹性指数为0.04,经济每增长1%,人口增长0.04%,经济增长对人口规模的拉动作用较弱;(2)人口与经济集聚相对协调的地区占总量的62.5%,空间分布的不一致性情况有所改善;(3)人口空间变化不大,重心略向东北方向移动,经济空间集聚有所弱化,重心向西南方向移动;(4) Moran's I值较低,空间关联性较小,多数城市呈现高-高(H-H)和低-低(L-L)分布,实现区域人口经济协调发展仍任重道远.  相似文献   

14.
基于云南省2000、2005、2010、2015年的人口与经济指标和云南125个县(市)的空间矢量数据,借助空间分析技术(GeoDa和ArcGIS),运用Moran I指数、Moran I散点图及LISA集聚图,揭示云南各县(市)人口与经济空间分布形态、集聚特征以及时空演变规律。结果表明:云南各县(市)人口与经济的空间分布具有较明显的空间自相关性,即存在较强的空间集聚特征。其中,人口空间格局的演变总体上变化不大,滇中地区、滇东北部分地区为高-高型,滇西北、滇西南地区为低-低型;经济空间格局与人口分布大致吻合。基于人口、经济的双变量分析表明,人口与经济发展存在明显的地域不均衡性,最终以人口、经济发展的协调程度把云南省划分为高-高型、低-低型、低-高型、高-低型4类,并提出了不同类型区域人口—经济结构形态的优化对策。  相似文献   

15.
Web2.0应用与大数据交易平台共同促生数据匿名化技术。欧盟发布的《关于匿名化技术的意见》与《通用数据保护条例》对数据匿名化技术的使用做出了规定,内容涉及匿名数据概念界定、法律标准认定、去匿名化技术、整个数据处理过程的风险评估、技术规制等多个方面。我国目前并未出台专门的数据匿名化规范,为实现信息数据利用与隐私保护之间的平衡,应借鉴吸收欧盟经验,填补我国数据匿名化规制的法律空白。  相似文献   

16.
李斌 《广西教育》2013,(35):190-192
介绍大数据产生背景,详细剖析大数据的基本概念及其特征,同时提炼了大数据的五种关键技术.指出大数据与云计算、物联网和数据空间相结合的发展趋势,以揭示需要研究的关键内容,为大数据的相关研究者提供参考。  相似文献   

17.
知识发现中的数据离散化处理   总被引:1,自引:0,他引:1  
主要讨论了基于粗集的数据挖掘的连续数据离散化处理过程.  相似文献   

18.
基于第六和第七次人口普查数据,结合人口重心、不均衡指数和空间自相关分析方法,探究黄河流域人口分布特征和影响因素.研究发现:近10年来黄河流域人口重心向东南方向移动,人口不均衡趋势加剧.人口分布东南高西北低,并存在显著的空间集聚特征,下游地级市形成人口密度高的高集聚区,上游位于高原和沙漠的地级市为人口密度低的低集聚区,随着时间推移,人口密度空间趋同趋势减弱.自然因素奠定人口分布基本格局,经济发展水平对人口变化具有较强的正向牵引作用,其次是居民收入水平,而产业结构对人口变化具有负向影响.  相似文献   

19.
基于"互联网""大数据"视角,信息技术、移动通信技术以及大数据技术已经在教学中得到广泛应用"。大数据"为教师的精准教学提供了有益支撑。基于"大数据"的视角,教师可以进行知识、学情、操作等的精准分析。基于"大数据"的精准化教学能丰富目标分类维度,能发展高层认知智能,能优化反馈评价机制。作为教师,要瞄准知识系统、学情系统和操作系统,实施精准化教学。  相似文献   

20.
《现代教育技术》2018,(4):114-119
文章基于空间的视角,认为在大数据的助推下,城乡义务教育空间实现了由二元对立的物理空间认知向一体化的流动空间认知的转型,城乡义务教育一体化对正义的追求也从起初的分配正义转向空间正义。基于制度伦理在流动空间中无法发挥应有的规范作用的问题,文章认为城乡义务教育一体化应加强"数据新政"伦理规范和德性伦理规范的建设,保障数据安全流动与共享,避免在流动空间中人的内在德性失落或边缘化。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号