共查询到20条相似文献,搜索用时 109 毫秒
1.
2.
3.
提出一种基于最大熵功率谱估计的Hadoop云平台下网络音视频数据特征挖掘方法,实现对数据信息的高速访问。构建数据挖掘Hadoop云平台和数据挖掘访问模型,设计最大熵功率谱特征提取算法,采用分段思想将同一时间段的视音频数据进行群体分割,分段提取最大熵功率谱特征。将提取的特征信息进行维度匹配分箱和溯源处理,实现信息恢复,最终完成高速数据访问。仿真测试表明,该算法能有效地实现对网络音视频数据的特征挖掘,提高访问效率,访问响应时间较当前方法缩短明显。 相似文献
4.
Web数据挖掘已经成为当前被广泛研究的课题。Web上半结构化的数据结构给Web数据挖掘带来了诸多困难,XML的出现为面向Web的数据挖掘带来了便利。本文介绍了XML语言的特点,及其在Web的数据挖掘中的作用。 相似文献
5.
Web信息复杂程度不断加深,多维度、高复杂度的信息越来越多,信息中的错误信息特征在海量复杂数据属性中表述越来越困难,造成信息挖掘耗时过长,挖掘效果不好的问题。为了解决这一问题,提出了一种距离信息模糊信息权值分类的Web错误数据挖掘算法。在Web特征表述过程中,运用距离描述Web数据的错误数据特征,运用模糊信息熵,对错误数据特征进行距离分类,保证数据分类的准确性,最大程度的完成错误数据高效挖掘。实验结果表明,该算法能有效减少错误数据信息在海量信息中的挖掘时间,提高了挖掘的准确性,取得了满意的效果。 相似文献
6.
针对传统的细菌觅食算法限于梯度信息优化,对非线性特征数据挖掘效果不好的缺陷,提出一种基于趋化繁殖算法的细菌觅食种群寻优方法,并有效应用海量非线性特征数据挖掘中。首先根据现有细菌觅食算法,引入细菌趋化算子和细菌繁殖算子,设计一种新的个体编码方式及进化模式。然后通过设计种群的自适应调整因子增强个体活力,并融合禁忌搜索算法,提高种群搜索寻优能力,克服算法易于陷入过早收敛和限于梯度信息优化的不足,提高对非线性特征数据挖掘性能。仿真实验表明,新算法可以搜索到种群最优组合,非线性特征数据挖掘跟踪曲线表明,算法具有较好的预测和数据挖掘能力,特征数据挖掘准确率提高显著,收敛速度高。 相似文献
7.
基于XML的网页数据挖掘 总被引:1,自引:0,他引:1
随着Internet的迅速发展,使得数据丰富而信息贫乏这对矛盾显得日益突出,数据挖掘技术正是应了这一需求而结合了机器学习、模式识别、统计学、人工智能、神经网络等多学科而出现的一项新技术,基于Web的数据挖掘是数据挖掘技术在网络信息处理中的应用。本文叙述了Web数据挖掘的概念、分类、技术等,重点讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。 相似文献
8.
针对Web数据奇异特征挖掘时,信道对奇异特征具有卷积效应,影响特征挖掘精度。提出一种脉冲响应不变解卷积算法,实现对奇异特征对的盲解卷积,提高奇异特征挖掘性能。利用Web数据奇异特征的时间可预测性作为盲解卷积的解卷测度,采用脉冲响应不变算法对基于该测度的代价函数进行优化求解,从而成功得到解卷积滤波器系数,实现对Web数据奇异特征的盲解卷积。仿真实验表明,采用该算法挖掘Web数据的奇异特征,对于奇异特征信号具有很好的盲解卷积效果,所挖掘的奇异特征相关系数和重构信噪比均较高,特征挖掘聚类性好。 相似文献
9.
10.
Web挖掘过程和元数据的运用 总被引:1,自引:2,他引:1
当数据挖掘的对象完全由Web这种数据类型组成时 ,这个过程就称为Web挖掘。面向Web挖掘必须以半结构化模型和半结构化数据模型抽取技术为前提。所以寻找和定义一个半结构化的数据模型是Web挖掘的关键 ,通过元数据来清晰地描述Web半结构化的数据结构 ,为Web挖掘提供基本条件。 相似文献
11.
近年来,大数据浪潮兴起,大数据产业保持高速发展态势,大数据应用推进势头良好。政府数据作为价值密度高、涉足广度宽的数据资源,已成为各国争相创新开发的重要资产。但是长期以来,关于政府数据开发利用的理论研究却被忽视,如何科学有效地进行政府数据开发和利用已成为当前需要迫切关注的问题。文章系统总结了当前主要发达国家政府数据开发利用的政策措施和探索实践,以及通过梳理分析我国政府数据开发利用的政策体系和发展现状,尝试构建政府数据开发利用的过程机制模型,并提出:加强顶层立法,落实制度保障;扩大数据来源,提升数据质量;统一汇聚开放,深化行业应用;确立认证许可,明晰授权机制;创新开发模式,明确收益分配;推动试点先行,探索可行经验;强化技术支撑,保障数据安全等政策建议,以期为进一步推动政府数据开发利用提供决策参考。 相似文献
12.
13.
[目的/意义]科学数据安全是国家信息安全的组成部分,随着数据科学研究的兴起,高校科学数据安全的政策研究有待深入。[方法/过程]采用网络调查的方法,对美国U.S.News前50名大学的科学数据管理内容进行分析,从“涉及对象”“保护方法”和“科学数据生命周期”等角度梳理政策重点和空白点。基于科学数据生命周期,从“制度层”“基础设施层”“数据素养层”和“实施层”四个主要层次,构建了高校科学数据安全的内容框架,并分别讨论了科学数据生命周期不同阶段与科学数据安全相关的各个主体的职责。[结果/结论]高校科学数据安全内容贯穿科学数据生命周期,相关主体包括制度层、基础设施层、数据素养层、执行层。 相似文献
14.
[研究目的]数据经济的迅猛发展,进一步突显了数据的财产权属性和商业化价值。因此,“商业数据”的类型提出和权属确认便对数据出境的法治化运行及安全责任的具体化落实具有重大意义。[研究方法]以“商业数据”的概念廓清与权属分析为切入,通过数据企业的“应然权利”为视角正向解析现有数据出境中限制性规定的规范边界和实践运行。[研究结论]数据权属是数据跨境规则建构的逻辑起点,数据企业基于数据劳动、数据生产而将数据自复杂的权益诉求中剥离时,理应享有法律所确认的数据权利而不受自由干预。据此,强调个人数据、重要数据“安全性”的同时,理应强化经由数据剥离后商业数据的“自由性”,以实现数据保护和数据开放的结构平衡。 相似文献
15.
通过对电视灯光数据来源与特性的理解,阐述数据管理对灯光工作的作用与意义,以期引发业内人士对电视灯光数据管理的重视与思考。 相似文献
16.
首先对大数据做简要诠释;其次重点阐述大数据在国内外各个领域的应用现状,以此来对大数据产业的发展、社会定位以及价值实现途径进行探索;最后分析我国大数据产业发展当中存在的主要问题并给出相关建议。 相似文献
17.
开放科研数据环境下科研人员的数据伦理框架研究 总被引:1,自引:0,他引:1
[目的/意义]为推动开放科研数据的发展,国内外除了已有的实践内容,包括数据政策颁布、数据基础设施建设等外,各国也均积极探索如何帮助科研人员克服与数据伦理有关的障碍,以辅助科学界实现预先设想的开放理念。[方法/过程]文章通过文献综述和网络调研的方法,分析了开放科研数据的实践进展,提出了数据伦理的概念和面向科研人员的数据伦理框架。[结果/结论]开放科研数据背景下数据伦理的框架主要由4个要素构成:利己主义因素、功利主义因素、利他主义因素及实用主义因素。 相似文献
18.
元数据以其对科学数据的描述与解释,为用户发现数据和再利用数据提供了方便。详细分析科学数据元数据的功能与内容,重点讨论用户在数据发现、数据评价过程中所关注的元数据内容,并对科学数据元数据内容的改进与完善提出展望。 相似文献
19.
20.
【目的/意义】对高校科研数据展开治理,是提升数据价值,优化决策能力,节约科研成本的有效途径,而实施治理行为的重点之一是构建高校科研数据治理模型,从而在理论上指导治理行为。【方法/过程】研究以协同治理理论辅以数据生命周期理论和利益相关者理论为基础,在探明已有数据治理模型逻辑路线后,通过半结构化访谈法,对国内外高校人员就科研数据治理认知进行深度沟通,最终利用NVivo 11软件对访谈结果进行质性分析,提炼模型构建要素。【结果/结论】据此分模块构建高校科研数据治理模型,拟为高校科研数据治理提供理论模型,同时也为提升高校科研数据治理服务水平提供借鉴。 相似文献