首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
大数据环境下微信公众平台非结构化数据融合研究   总被引:1,自引:0,他引:1  
微信公众平台具有开源、发布及时的特点,目前它已经成为各机构发布信息的重要渠道。但这类数据又具有非结构化、无语义描述的特点,如何将微信公众平台从非结构化数据转化为可分析、判断的结构化数据,成为一个亟须解决的问题。针对该问题,本文提出一个对微信公众平台结构化数据监测的层次体系。这一方法将通过数据融合方式,从平台资源中抽取数据,构建结构化数据库,进行权重比较,判断情报价值,进而实现对研究领域的态势监测。  相似文献   

2.
在分析大数据环境下商业银行审计非结构化数据特点的基础上,结合当前大数据领域处理和分析非结构化数据的主流技术,提出商业银行审计云平台构建过程中在非结构化数据应用分类、采集存储、处理分析等方面的数据规划标准,为大数据环境下规范商业银行非结构化数据审计提供参考。  相似文献   

3.
本文阐述了利用XML将半结构化Web数据转化为结构化的XML数据,介绍了目前Web数据抽取的最新技术及特点,并对无监督学习网页重复模式发现网页内在模板抽取方法进行了深入的研究和探讨。  相似文献   

4.
非结构化数据随着信息时代的发展呈现爆炸式增长,非结构化数据存取的难点在于数据没有非常统一的规律便于系统查询和访问。传统的非结构化数据存取方法沿袭了结构化数据存取的方法,通过建立相应的特征关键字进行存取,由于非结构化数据的模糊特征性,对大量数据的兼容性很差。提出了一种非结构化数据的多牵度分配存取实现方法,将数据特征提取,根据特征将数据存储在不同的牵度区域,在数据合成时,通过牵度索引,建立不同的数据拼接顺序,从而实现很好的数据恢复。通过实际的海量数据进行测试实验,结果显示,采用多牵度分配存取的方法,非结构化数据的存取速度大大提高,具有很好的应用价值。  相似文献   

5.
非结构化面试的标准化评估   总被引:2,自引:0,他引:2  
谷峰 《科技通报》2011,27(2):166-170
为了提高非结构化面试的效度,提出了一个标准化评估方法,给出了标准变换公式.该方法将非结构化面试测评数据转换为一个后验确定参数的正态分布,后验地修复由测评题差异和测评标准差异以及其他测评环境因素引起的测评数据分布异常波动,使标准化的测评数据处于同一平台,并最大限度地提高标准化分数的区分度,使标准分数分布更接近测评对象能力...  相似文献   

6.
本文以国家科技计划经费管理信息系统的应用实践为背景,提出多样性电子数据的采集及储存管理等技术,结合XML应用、文档处理、PDF合成等结构化数据与非结构化数据的转换研究,提高了数据采集效率,改善了电子数据的处理方式,从而满足电子政务对多样数据内容管理的处理要求。  相似文献   

7.
提出了基于前缀编码的模型映射改进方法,实现了XML半结构化数据到关系数据库的映射,从而为将半结构化数据管理转化为传统关系数据库管理奠定了基础。  相似文献   

8.
浅析大数据     
说明了什么是大数据和大数据的重要性,介绍了大数据的可视化分析,并从数据准备、结构化数据和非结构化数据等3方面介绍了大数据的处理。  相似文献   

9.
提出了一种基于半结构化P2P拓扑的流媒体直播模型,该模型兼有中心结构化拓扑与分布式无结构化拓扑的优点,可以快速进行流媒体的分发。提高了流媒体直播的网络利用效率并减少了部署成本。  相似文献   

10.
随着大数据信息技术的发展,数据在线监测和数据挖掘成为计算机信息领域研究的热点。通过对Web热点数据分割挖掘,提高信息热点追踪和Web数据分类能力。传统算法采用非结构化数据挖掘算法,无法有效对Web热点数据进行准确定位和分层挖掘。提出一种基于半结构化分割的Web热点数据挖掘算法。采用半结构化数据进行特征分割,基于优秀基因位进行差分进化,使寻优曲线不断趋于平缓,在多个节点上并行的运行比较脚本,采用半结构化分割,使得Web热点特征挖掘实现自适应寻优,得到Web热点数据的分配因子,提高了挖掘性能。仿真结果表明,该算法获得了良好的效率和精度,提高了Web热点数据挖掘的自适应寻优能力。  相似文献   

11.
蔡皎洁 《现代情报》2014,34(11):39-43
本文从对多结构化客户数据集成和预处理的成效不足、挖掘过程缺乏语义情景和上下文的支撑,从而所获取的客户知识模式质量不高等问题出发,提出了一种基于语义集成的客户知识挖掘模型.该模型充分利用了本体、语义集成等方法和技术,提高对数据语义分析和处理的能力,实现智能化客户知识挖掘过程,从而获取高质量的客户知识模式.  相似文献   

12.
文章从全球视野下的智慧城市规模化发展、国内智慧城市建设的试点与信息壁垒、大数据时代的战略诉求与技术挑战、新一代信息技术助力"三元"世界融合四个方面分析了信息视角下的智慧城市运行管理发展态势;对智慧城市大数据管理的内涵和边界进行了界定;从人、地、事、物、组织、领域、时间七个维度提出了智慧城市运行管理的信息分类标准,并在此基础上,从信息的启动、流转和到达三个阶段构建了智慧城市运行管理的信息协同总体框架;针对已有信息的信息共享和实时感知信息的接入转发两个方面详细阐述了智慧城市运行管理的信息流转模式,重点研究了城市系统下的信息流转自适应优化过程;最后从科学决策的视角提出了面向大数据的多维协同体系。  相似文献   

13.
数据挖掘已成为情报学的研究热点,而传统的数据挖掘过程是在数据仓库的基础上,面向结构化的数据进行分析,这在很大程度上限制了数据挖掘的作用范围和效果。在充分分析数据挖掘和领域本体等相关理论后,提出了一个面向领域本体,应用语义相似度匹配的数据挖掘模型。该模型在理论上解决了用户的目标发现和挖掘对象选择的问题,同时也在数据挖掘算法上引入了本体概念,使得系统能快速识别用户需求,高效的选择相应算法,在很大程度上提高了数据挖掘处理异构、分布式数据的能力。  相似文献   

14.
向禹  吴世明 《现代情报》2014,34(6):75-78
通过建设双层PDF全文数据库、创建索引和全文检索等实现过程来阐述相关技术的研究和运用。以建设全文数据库为基础,研究结构化信息与非结构化数据的合并管理,对目录数据和全文数据的同步索引,基于Lucene技术,实现档案管理系统的一站式智能化档案全文检索,提升档案查全率。  相似文献   

15.
为研究绿色技术进步对全要素绿色能源效率的影响,以中国30个省(市、自治区)为研究对象,考虑非意向产出情况下,运用非参数数据包络的全局DEA—SBM模型、Malmquist-Luenberger?生产率指数,分测算全要素绿色能源效率和绿色技术进步指数,并运用全面FGLS方法进行实证研究。研究结论表明,全国及三大地区的全要素绿色能源效率差异显著,绿色技术进步与全国及三大地区全要素绿色能源效率均有正向影响,且都通过1%的显著性水平的检验。最后,从提高绿色技术水平等方面提出相关对策建议。  相似文献   

16.
面向服务的架构思想的深入以及Web服务技术的推广为高校系统目前面临的各种异构的底层数据问题提供了有效的解决方案,其中的服务数据对象为异构数据提供了统一的数据应用开发框架。通过使用服务数据对象独特简约的数据模型,高校各应用程序摆脱了使用多种应用程序接口和框架进行数据访问的复杂工作,从而使软件开发人员只需了解其中一种API便可操作各种异构数据,从而实现数据集成。  相似文献   

17.
胡钢  曹兴 《科研管理》2014,35(9):98-105
以知识观理论为出发点,研究动态能力对企业多元化的作用,并建立二者关系的结构方程模型。以制造业为研究对象,利用调查问卷收集数据,并进行实证检验。结果显示,动态能力对于基于创新的多元化有着显著的正向影响,知识整合能力对基于复制的多元化有显著正向影响,知识吸收与知识创造能力对多元化的影响部分是通过对知识整合能力间接起作用。特别的,知识吸收与知识创造能力对基于复制的多元化没有直接作用,必须通过知识整合能力对基于复制的多元化起作用。  相似文献   

18.
【目的/意义】分散分布状态下,科研课题申请书资源的智能分析与价值实现受到严重制约,为此需要推进 面向智能分析的科研课题申请书资源整合。【方法/过程】首先对科研课题申请书资源的特点进行了分析,为资源整 合思路设计提供支撑;在此基础上,构建了面向智能分析的科研课题申请书资源整合模型,提出了资源整合推进模 式建议。【结果/结论】面向智能分析的科研课题申请书资源整合中,首先需要实现申请书的数据化,将非结构化文 档转变为可以进行知识计算的结构化数据,进而实现异构申请书资源的集成及科研实体的关联,并面向科研过程 管理与资源配置中的需求,进行基于智能化分析的服务功能设计,为科研管理与决策提供支持。在实施推进中,需 要采用物理与逻辑整合相结合的模式。【创新/局限】本文创新之处在于提出了面向智能分析的科研课题申请书资 源整合模型与推进模式,但偏向于理论性分析,后续研究需要在实证方面加强。  相似文献   

19.
自柏拉图以来,著名的“非存在之谜”一直吸引着哲学家们为之绞尽脑汁。那么,非存在存在吗?到底有没有非存在对象呢?如果有非存在对象,那么它们是什么类型的对象呢?它们能被描述吗?有可能提供有关非存在对象的统一理论吗?这样的理论的解释力又如何呢?在当代哲学研究、尤其在心灵哲学意向性等问题的研究中,非存在问题是不可回避的。对象属性策略体现了非存在问题的传统哲学解决方案的现代拓展,语言策略体现了非存在问题的语言学研究的当代趋向,可能世界策略则向我们提供了一种更精细的逻辑论证思路。  相似文献   

20.
在分析生物信息学领域已有数据库、整合平台的基础上,归结了目前生物学数据库融合的两种模式:交叉引用模式和集成模式,并总结了目前系统的不足及数据库融合面临的困难,为进一步研究序列库与文献库的整合打下基础.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号