首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
随着大数据信息技术的发展,数据在线监测和数据挖掘成为计算机信息领域研究的热点。通过对Web热点数据分割挖掘,提高信息热点追踪和Web数据分类能力。传统算法采用非结构化数据挖掘算法,无法有效对Web热点数据进行准确定位和分层挖掘。提出一种基于半结构化分割的Web热点数据挖掘算法。采用半结构化数据进行特征分割,基于优秀基因位进行差分进化,使寻优曲线不断趋于平缓,在多个节点上并行的运行比较脚本,采用半结构化分割,使得Web热点特征挖掘实现自适应寻优,得到Web热点数据的分配因子,提高了挖掘性能。仿真结果表明,该算法获得了良好的效率和精度,提高了Web热点数据挖掘的自适应寻优能力。  相似文献   

2.
[目的/意义]以经济学、政治学、社会学为例,探索非调查数据在社会科学研究中的使用特征,为此类重要新型数据的管理与应用提供参考。[方法/过程]以2011—2020年118本国内核心期刊中使用非调查数据的论文为样本,对数据特征、评估与分析特征、研究者与文献特征进行内容分析。[结果/结论]我国社会科学研究者对非调查数据的使用呈上升趋势,多数研究者将使用非调查数据视为创新点,但也认识到其不足。在使用方法上,研究者多将非调查数据纳入调查数据研究范式。数据类型与非调查数据使用行为差异显著相关,研究者更偏好非结构化数据,但对其使用也更为谨慎。综合来看,使用标准和评估技术的缺乏制约了非调查数据价值的发挥。[局限]样本量较小,或无法覆盖使用非调查数据的所有论文。  相似文献   

3.
传统的大数据中价值信息提取方法采用基于模糊学习理论的数据融合处理方法,将预定学习序列输入神经网络,通过模糊启发,对预定序列进行多模型映射,此方法模型复杂,且启发率低。提出一种大数据子集特征遗忘启发的价值信息提取方法,对大数据进行非线性映射归一化,使每个子集实现并行运算,通过混沌方法提取子集特征,并建立混沌模型下的子集特征遗忘启发链,针对不同子集中的价值信息,依据遗忘启发链实现启发,提取价值信息。采用一组大数据下的伪随机价值信息进行提取测试,仿真实验表明,本文价值信息提取方法的提取率达到了98%,对于大数据下的价值信息提取具有很好的指导意义。  相似文献   

4.
在分析大数据环境下商业银行审计非结构化数据特点的基础上,结合当前大数据领域处理和分析非结构化数据的主流技术,提出商业银行审计云平台构建过程中在非结构化数据应用分类、采集存储、处理分析等方面的数据规划标准,为大数据环境下规范商业银行非结构化数据审计提供参考。  相似文献   

5.
目的:通过多元影响因素的比较,证实公开存取期刊的质量.方法:统计SCI收录的公共卫生领域的公开存取与非公开存取的期刊,采用多元数据提取,并用T检验进行比较.结果:显示公开存取期刊的数量在JCR中所占比例较小,但在引用次数上公开存取期刊高于非公开存取期刊,在影响因子与特征因子的比较中无显著差异.结论:NOAJ的数量比OAJ多,但在影响力方面没有显著差异.  相似文献   

6.
提出一种基于多分簇系统级联融合的安全访问方法,首先对所有的访问数据进行多级分簇,依照数据的访问特性,将不同的数据分配到不同的簇结构,然后对各个簇的特征进行融合处理,提取簇数据的深度特征,从而区分正常访问数据与异常攻击数据。最后采用一组正常数据加异常数据联合访问进行测试,结果显示,采用基于多分簇系统级联融合的安全访问控制,即使是在攻击数据率很高时,系统也能很好的分辨出正常数据与异常攻击,具有很好的应用价值。  相似文献   

7.
大数据环境下微信公众平台非结构化数据融合研究   总被引:1,自引:0,他引:1  
微信公众平台具有开源、发布及时的特点,目前它已经成为各机构发布信息的重要渠道。但这类数据又具有非结构化、无语义描述的特点,如何将微信公众平台从非结构化数据转化为可分析、判断的结构化数据,成为一个亟须解决的问题。针对该问题,本文提出一个对微信公众平台结构化数据监测的层次体系。这一方法将通过数据融合方式,从平台资源中抽取数据,构建结构化数据库,进行权重比较,判断情报价值,进而实现对研究领域的态势监测。  相似文献   

8.
数字经济时代,数据正成为助推企业快速发展的重要战略资源,数字原生企业作为数字经济大陆上“土生土长”的新型商业形态,创业伊始就天然地基于数字逻辑设计其商业模式,最大限度地激发数据价值,挑战传统企业价值创造范式。依据数字原生企业实践,运用案例研究方法系统探索了其数据价值激活过程。研究发现:数据价值积累阶段,数字原生企业通过数据引流和结构化存储,接入数据并解决数据质量参差不齐的问题;数据价值挖掘阶段,数字原生企业通过数据加工和价值洞察,完成对数据关联性可视化的呈现与溯源,明晰了数据预期可实现的价值类型;数据价值输出阶段,从数据融合到要素转化,数据最终实现了从非结构化的低价值数据要素向结构化的高价值数据资产的转变。本文构建了数字原生企业数据价值激活的过程模型,实现了对数字原生企业这种新型商业形态理论规律挖掘的新尝试与新探索。  相似文献   

9.
云计算中大量的并发访问或数据流量分担到多台节点设备上,设备分配随机性很强,一旦多节点数据同时分配到同一数据终端,将造成云计算中的处理拥塞.由于无法避免多节点数据同时分配到同一数据终端造成的云计算处理拥塞的缺陷,导致云计算环境下的相关设备负载均衡性降低.本文提出了一种基于兴趣区域搜索的云计算设备均衡负载方法.通过计算获取兴趣特征权值系数,提取兴趣特征分量,计算兴趣区域相似度,从而实现云计算的均衡负载.实验结果表明,这种方法能够合理调节云设备负载,提高了云设备负载的均衡性.  相似文献   

10.
本文阐述了利用XML将半结构化Web数据转化为结构化的XML数据,介绍了目前Web数据抽取的最新技术及特点,并对无监督学习网页重复模式发现网页内在模板抽取方法进行了深入的研究和探讨。  相似文献   

11.
王志丽  孙宝 《现代情报》2009,29(3):87-89
针对数字图书馆中的图像、视频、音频等无结构化数据的集成问题,提出了语义对象模型的概念,实现无结构化数据的统一全局对象表示。在此基础上,提出了一种以XML数据模型为基础的无结构化数据集成方法。  相似文献   

12.
多源遥感数据在植被识别和提取中的应用   总被引:4,自引:0,他引:4  
高晓岚  汪小钦 《资源科学》2008,30(1):153-158
不同类型的遥感数据有着自己独特的优势,如果综合应用,可以实现信息的互补,提高地物的识别精度。本文以福建省漳浦县为研究区域,利用SPOT5、ASTER和CBERS等多源遥感数据对植被的识别和提取方法进行研究,建立了基于多源遥感数据的专题信息提取流程。首先设计了基于不同植被专题信息自动提取的专家库,对单一遥感数据进行专题提取,然后基于专家知识进行决策级植被信息融合。多源遥感数据所提供的信息的优越性在于可以将不同传感器的光谱信息和时相特征进行互补,利用不同植被在不同遥感数据上的特征和专家知识,建立隶属度函数,判剐每个像元的归属,完成研究区不同植被类型的专题提取。结果表明,与单一传感器数据的结果相比,综合利用多源遥感数据能较大程度地提高植被的提取精度。  相似文献   

13.
云计算数据预取算法设计是实现云平台环境下通信链路优化和任务调度均衡分配的基础技术。在传统的云计算据查询模式下,当由于缓存空间不足而导致新的缓存数据无法进入缓存时,导致数据预取拥堵,性能不好。提出一种基于Monte Carlo熵权决策的云计算数据预取算法,构建云计算数据查询模板模型,进行Hybrid缓存置换数据预取前置处理,采用Monte Carlo熵权决策方法,把云计算预取信号从缓存域变换到波束域,构建置换函数,实现了对算法的改进。仿真实验研究得出,该算法通过熵权特征提取,进行云计算数据预取决策,提高了云计算数据预取性能,大数据访问延迟率降低,云计算数据存取和调度效率提高,保真率较好。  相似文献   

14.
介绍了为实现网络办公自动化,使用数据库开发工具PowerBuilder处理基于关系数据库的传统结构化数据和以文件、报表、信函等形式为载体的非结构化的复合文档数据的开发实例。  相似文献   

15.
提出了一种基于模糊理论的非确定信息的表示方法,该方法通过引入历史的相似的决策信息改进了传统的模糊隶属度的计算方法,减少了人为的误差,提高了非结构化决策问题的结构化程度,从而可以利用结构化决策问题的理论进行求解非结构化决策问题。  相似文献   

16.
介绍了为实现网络办公自动化,使用数据库开发工具PowerBuilder处理基于关系数据库的传统结构化数据和以文件、报表、信函等形式为载体的非结构化的复合文档数据的开发实例。  相似文献   

17.
提出了基于前缀编码的模型映射改进方法,实现了XML半结构化数据到关系数据库的映射,从而为将半结构化数据管理转化为传统关系数据库管理奠定了基础。  相似文献   

18.
将NoSQL数据库在非结构化大数据应用上的优势与空间数据以及GIS相结合,能极大提高GIS对大数据的读取与查询效率。本文利用主流NoSQL数据库和GIS平台,尝试将存储在NoSQL数据库中的大数据量的非结构数据以空间数据的方式进行显示和查询。  相似文献   

19.
浅析大数据     
说明了什么是大数据和大数据的重要性,介绍了大数据的可视化分析,并从数据准备、结构化数据和非结构化数据等3方面介绍了大数据的处理。  相似文献   

20.
文本中实体关系的确定可以使计算机清楚文本中实体间的联系,进而可以通过其中一个实体和关系得出另一个实体,关系抽取技术用于抽取文本中实体之间的关系.随着互联网技术的发展,文本数据越来越庞大.关系抽取作为信息抽取的子任务,帮助人类从海量数据中获取有用的信息,实现将非结构化、半结构化的自然语言文本转化为结构化数据.在介绍关系抽取发展状况的基础上,将其按照不同的实现方式进行分类分析概括,如有监督关系抽取、半监督关系抽取、无监督关系抽取、联合抽取等.并通过实验数据进行对比,总结各种实现方式存在的不足及优势.最后,针对目前关系抽取的发展状况,指出了关系抽取面临的主要挑战以及未来的发展趋势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号