首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
Web数据挖掘技术是当前的热点研究之一.但Web数据本身具有半结构化、组织性差的特点,使得Web数据挖掘工作变得十分困难.而XML的出现为面向Web的数据挖掘带来了便利.本文提出了一种基于XML的Web数据挖掘模型,并通过实例演示其实现步骤.  相似文献   

2.
web数据挖掘技术是当前的热点研究之一。但web数据本身具有半结构化、组织性差的特点,使得web数据挖掘工作变得十分困难。而XML的出现为面向web的数据挖掘带来了便利。本文提出了一种基于XML的Web数据挖掘模型,并通过实例演示其实现步骤。  相似文献   

3.
提出一种基于最大熵功率谱估计的Hadoop云平台下网络音视频数据特征挖掘方法,实现对数据信息的高速访问。构建数据挖掘Hadoop云平台和数据挖掘访问模型,设计最大熵功率谱特征提取算法,采用分段思想将同一时间段的视音频数据进行群体分割,分段提取最大熵功率谱特征。将提取的特征信息进行维度匹配分箱和溯源处理,实现信息恢复,最终完成高速数据访问。仿真测试表明,该算法能有效地实现对网络音视频数据的特征挖掘,提高访问效率,访问响应时间较当前方法缩短明显。  相似文献   

4.
李翔  王晓佺 《内江科技》2006,27(7):129-130
Web数据挖掘已经成为当前被广泛研究的课题。Web上半结构化的数据结构给Web数据挖掘带来了诸多困难,XML的出现为面向Web的数据挖掘带来了便利。本文介绍了XML语言的特点,及其在Web的数据挖掘中的作用。  相似文献   

5.
Web信息复杂程度不断加深,多维度、高复杂度的信息越来越多,信息中的错误信息特征在海量复杂数据属性中表述越来越困难,造成信息挖掘耗时过长,挖掘效果不好的问题。为了解决这一问题,提出了一种距离信息模糊信息权值分类的Web错误数据挖掘算法。在Web特征表述过程中,运用距离描述Web数据的错误数据特征,运用模糊信息熵,对错误数据特征进行距离分类,保证数据分类的准确性,最大程度的完成错误数据高效挖掘。实验结果表明,该算法能有效减少错误数据信息在海量信息中的挖掘时间,提高了挖掘的准确性,取得了满意的效果。  相似文献   

6.
针对传统的细菌觅食算法限于梯度信息优化,对非线性特征数据挖掘效果不好的缺陷,提出一种基于趋化繁殖算法的细菌觅食种群寻优方法,并有效应用海量非线性特征数据挖掘中。首先根据现有细菌觅食算法,引入细菌趋化算子和细菌繁殖算子,设计一种新的个体编码方式及进化模式。然后通过设计种群的自适应调整因子增强个体活力,并融合禁忌搜索算法,提高种群搜索寻优能力,克服算法易于陷入过早收敛和限于梯度信息优化的不足,提高对非线性特征数据挖掘性能。仿真实验表明,新算法可以搜索到种群最优组合,非线性特征数据挖掘跟踪曲线表明,算法具有较好的预测和数据挖掘能力,特征数据挖掘准确率提高显著,收敛速度高。  相似文献   

7.
基于XML的网页数据挖掘   总被引:1,自引:0,他引:1  
随着Internet的迅速发展,使得数据丰富而信息贫乏这对矛盾显得日益突出,数据挖掘技术正是应了这一需求而结合了机器学习、模式识别、统计学、人工智能、神经网络等多学科而出现的一项新技术,基于Web的数据挖掘是数据挖掘技术在网络信息处理中的应用。本文叙述了Web数据挖掘的概念、分类、技术等,重点讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。  相似文献   

8.
针对Web数据奇异特征挖掘时,信道对奇异特征具有卷积效应,影响特征挖掘精度。提出一种脉冲响应不变解卷积算法,实现对奇异特征对的盲解卷积,提高奇异特征挖掘性能。利用Web数据奇异特征的时间可预测性作为盲解卷积的解卷测度,采用脉冲响应不变算法对基于该测度的代价函数进行优化求解,从而成功得到解卷积滤波器系数,实现对Web数据奇异特征的盲解卷积。仿真实验表明,采用该算法挖掘Web数据的奇异特征,对于奇异特征信号具有很好的盲解卷积效果,所挖掘的奇异特征相关系数和重构信噪比均较高,特征挖掘聚类性好。  相似文献   

9.
提出一种基于变维Kalman滤波的Web海量数据流抗干扰挖掘算法。构建Web环境下的海量数据挖掘数据流信息模型和噪声干扰模型,结合现代信号处理方法,设计变维Kalman滤波算法进行海量数据流信号滤波预处理,把Web海量数据流映射为一组非线性宽带调频信号模型,采用信号检测算法实现Web海量数据的抗干扰挖掘。仿真结果表明,采用该算法进行Web海量数据信息的抗干扰挖掘,具有较高的数据检测精度和准确挖掘性能,具有较高的抗干扰性和鲁棒性。  相似文献   

10.
Web挖掘过程和元数据的运用   总被引:1,自引:2,他引:1  
刘俊熙 《情报杂志》2004,23(2):30-31,33
当数据挖掘的对象完全由Web这种数据类型组成时 ,这个过程就称为Web挖掘。面向Web挖掘必须以半结构化模型和半结构化数据模型抽取技术为前提。所以寻找和定义一个半结构化的数据模型是Web挖掘的关键 ,通过元数据来清晰地描述Web半结构化的数据结构 ,为Web挖掘提供基本条件。  相似文献   

11.
近年来,大数据浪潮兴起,大数据产业保持高速发展态势,大数据应用推进势头良好。政府数据作为价值密度高、涉足广度宽的数据资源,已成为各国争相创新开发的重要资产。但是长期以来,关于政府数据开发利用的理论研究却被忽视,如何科学有效地进行政府数据开发和利用已成为当前需要迫切关注的问题。文章系统总结了当前主要发达国家政府数据开发利用的政策措施和探索实践,以及通过梳理分析我国政府数据开发利用的政策体系和发展现状,尝试构建政府数据开发利用的过程机制模型,并提出:加强顶层立法,落实制度保障;扩大数据来源,提升数据质量;统一汇聚开放,深化行业应用;确立认证许可,明晰授权机制;创新开发模式,明确收益分配;推动试点先行,探索可行经验;强化技术支撑,保障数据安全等政策建议,以期为进一步推动政府数据开发利用提供决策参考。  相似文献   

12.
社会发展中日渐增长的巨量信息(大数据)引起了人们的极大兴趣和关注,已成为当今IT界研究的热点,是继云计算、物联网之后IT产业面临的又一次颠覆性的技术革命。但目前大数据还处在发展初期,相关的研究和应用都还停留探索研究阶段。为充分利用好大数据,发挥其在社会发展中的应有作用,文章对大数据发展现状和相关问题进行梳理分析,提出相关意见建议,为大数据发展提供参考与指导。  相似文献   

13.
[目的/意义]科学数据安全是国家信息安全的组成部分,随着数据科学研究的兴起,高校科学数据安全的政策研究有待深入。[方法/过程]采用网络调查的方法,对美国U.S.News前50名大学的科学数据管理内容进行分析,从“涉及对象”“保护方法”和“科学数据生命周期”等角度梳理政策重点和空白点。基于科学数据生命周期,从“制度层”“基础设施层”“数据素养层”和“实施层”四个主要层次,构建了高校科学数据安全的内容框架,并分别讨论了科学数据生命周期不同阶段与科学数据安全相关的各个主体的职责。[结果/结论]高校科学数据安全内容贯穿科学数据生命周期,相关主体包括制度层、基础设施层、数据素养层、执行层。  相似文献   

14.
张学文 《情报杂志》2022,41(2):176-181,189
[研究目的]数据经济的迅猛发展,进一步突显了数据的财产权属性和商业化价值。因此,“商业数据”的类型提出和权属确认便对数据出境的法治化运行及安全责任的具体化落实具有重大意义。[研究方法]以“商业数据”的概念廓清与权属分析为切入,通过数据企业的“应然权利”为视角正向解析现有数据出境中限制性规定的规范边界和实践运行。[研究结论]数据权属是数据跨境规则建构的逻辑起点,数据企业基于数据劳动、数据生产而将数据自复杂的权益诉求中剥离时,理应享有法律所确认的数据权利而不受自由干预。据此,强调个人数据、重要数据“安全性”的同时,理应强化经由数据剥离后商业数据的“自由性”,以实现数据保护和数据开放的结构平衡。  相似文献   

15.
通过对电视灯光数据来源与特性的理解,阐述数据管理对灯光工作的作用与意义,以期引发业内人士对电视灯光数据管理的重视与思考。  相似文献   

16.
首先对大数据做简要诠释;其次重点阐述大数据在国内外各个领域的应用现状,以此来对大数据产业的发展、社会定位以及价值实现途径进行探索;最后分析我国大数据产业发展当中存在的主要问题并给出相关建议。  相似文献   

17.
开放科研数据环境下科研人员的数据伦理框架研究   总被引:1,自引:0,他引:1  
[目的/意义]为推动开放科研数据的发展,国内外除了已有的实践内容,包括数据政策颁布、数据基础设施建设等外,各国也均积极探索如何帮助科研人员克服与数据伦理有关的障碍,以辅助科学界实现预先设想的开放理念。[方法/过程]文章通过文献综述和网络调研的方法,分析了开放科研数据的实践进展,提出了数据伦理的概念和面向科研人员的数据伦理框架。[结果/结论]开放科研数据背景下数据伦理的框架主要由4个要素构成:利己主义因素、功利主义因素、利他主义因素及实用主义因素。  相似文献   

18.
元数据以其对科学数据的描述与解释,为用户发现数据和再利用数据提供了方便。详细分析科学数据元数据的功能与内容,重点讨论用户在数据发现、数据评价过程中所关注的元数据内容,并对科学数据元数据内容的改进与完善提出展望。  相似文献   

19.
现有"大数据观"是在先入为主的情况下形成的,存在一些偏差或错误,有必要加以辨析、纠偏。从大数据概念角度分析,不能将数据规模的大小作为衡量大数据的标准,不必强调大数据与小数据之间的区分与对立,而应该推动不同数据的多元融合。从大数据功能角度分析,"让大数据发声""大数据革命""数据为王"等表述,夸大了大数据的作用,关于大数据功能的定位也不准确;其实,大数据同样存在缺陷和不足,它的功能是有限的,甚至还可能会带来危害。  相似文献   

20.
【目的/意义】对高校科研数据展开治理,是提升数据价值,优化决策能力,节约科研成本的有效途径,而实施治理行为的重点之一是构建高校科研数据治理模型,从而在理论上指导治理行为。【方法/过程】研究以协同治理理论辅以数据生命周期理论和利益相关者理论为基础,在探明已有数据治理模型逻辑路线后,通过半结构化访谈法,对国内外高校人员就科研数据治理认知进行深度沟通,最终利用NVivo 11软件对访谈结果进行质性分析,提炼模型构建要素。【结果/结论】据此分模块构建高校科研数据治理模型,拟为高校科研数据治理提供理论模型,同时也为提升高校科研数据治理服务水平提供借鉴。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号