共查询到20条相似文献,搜索用时 125 毫秒
1.
大数据环境下微信公众平台非结构化数据融合研究 总被引:1,自引:0,他引:1
微信公众平台具有开源、发布及时的特点,目前它已经成为各机构发布信息的重要渠道。但这类数据又具有非结构化、无语义描述的特点,如何将微信公众平台从非结构化数据转化为可分析、判断的结构化数据,成为一个亟须解决的问题。针对该问题,本文提出一个对微信公众平台结构化数据监测的层次体系。这一方法将通过数据融合方式,从平台资源中抽取数据,构建结构化数据库,进行权重比较,判断情报价值,进而实现对研究领域的态势监测。 相似文献
2.
3.
本文阐述了利用XML将半结构化Web数据转化为结构化的XML数据,介绍了目前Web数据抽取的最新技术及特点,并对无监督学习网页重复模式发现网页内在模板抽取方法进行了深入的研究和探讨。 相似文献
4.
非结构化数据随着信息时代的发展呈现爆炸式增长,非结构化数据存取的难点在于数据没有非常统一的规律便于系统查询和访问。传统的非结构化数据存取方法沿袭了结构化数据存取的方法,通过建立相应的特征关键字进行存取,由于非结构化数据的模糊特征性,对大量数据的兼容性很差。提出了一种非结构化数据的多牵度分配存取实现方法,将数据特征提取,根据特征将数据存储在不同的牵度区域,在数据合成时,通过牵度索引,建立不同的数据拼接顺序,从而实现很好的数据恢复。通过实际的海量数据进行测试实验,结果显示,采用多牵度分配存取的方法,非结构化数据的存取速度大大提高,具有很好的应用价值。 相似文献
5.
非结构化面试的标准化评估 总被引:2,自引:0,他引:2
为了提高非结构化面试的效度,提出了一个标准化评估方法,给出了标准变换公式.该方法将非结构化面试测评数据转换为一个后验确定参数的正态分布,后验地修复由测评题差异和测评标准差异以及其他测评环境因素引起的测评数据分布异常波动,使标准化的测评数据处于同一平台,并最大限度地提高标准化分数的区分度,使标准分数分布更接近测评对象能力... 相似文献
6.
本文以国家科技计划经费管理信息系统的应用实践为背景,提出多样性电子数据的采集及储存管理等技术,结合XML应用、文档处理、PDF合成等结构化数据与非结构化数据的转换研究,提高了数据采集效率,改善了电子数据的处理方式,从而满足电子政务对多样数据内容管理的处理要求。 相似文献
7.
提出了基于前缀编码的模型映射改进方法,实现了XML半结构化数据到关系数据库的映射,从而为将半结构化数据管理转化为传统关系数据库管理奠定了基础。 相似文献
8.
9.
10.
随着大数据信息技术的发展,数据在线监测和数据挖掘成为计算机信息领域研究的热点。通过对Web热点数据分割挖掘,提高信息热点追踪和Web数据分类能力。传统算法采用非结构化数据挖掘算法,无法有效对Web热点数据进行准确定位和分层挖掘。提出一种基于半结构化分割的Web热点数据挖掘算法。采用半结构化数据进行特征分割,基于优秀基因位进行差分进化,使寻优曲线不断趋于平缓,在多个节点上并行的运行比较脚本,采用半结构化分割,使得Web热点特征挖掘实现自适应寻优,得到Web热点数据的分配因子,提高了挖掘性能。仿真结果表明,该算法获得了良好的效率和精度,提高了Web热点数据挖掘的自适应寻优能力。 相似文献
11.
本文从对多结构化客户数据集成和预处理的成效不足、挖掘过程缺乏语义情景和上下文的支撑,从而所获取的客户知识模式质量不高等问题出发,提出了一种基于语义集成的客户知识挖掘模型.该模型充分利用了本体、语义集成等方法和技术,提高对数据语义分析和处理的能力,实现智能化客户知识挖掘过程,从而获取高质量的客户知识模式. 相似文献
12.
文章从全球视野下的智慧城市规模化发展、国内智慧城市建设的试点与信息壁垒、大数据时代的战略诉求与技术挑战、新一代信息技术助力"三元"世界融合四个方面分析了信息视角下的智慧城市运行管理发展态势;对智慧城市大数据管理的内涵和边界进行了界定;从人、地、事、物、组织、领域、时间七个维度提出了智慧城市运行管理的信息分类标准,并在此基础上,从信息的启动、流转和到达三个阶段构建了智慧城市运行管理的信息协同总体框架;针对已有信息的信息共享和实时感知信息的接入转发两个方面详细阐述了智慧城市运行管理的信息流转模式,重点研究了城市系统下的信息流转自适应优化过程;最后从科学决策的视角提出了面向大数据的多维协同体系。 相似文献
13.
数据挖掘已成为情报学的研究热点,而传统的数据挖掘过程是在数据仓库的基础上,面向结构化的数据进行分析,这在很大程度上限制了数据挖掘的作用范围和效果。在充分分析数据挖掘和领域本体等相关理论后,提出了一个面向领域本体,应用语义相似度匹配的数据挖掘模型。该模型在理论上解决了用户的目标发现和挖掘对象选择的问题,同时也在数据挖掘算法上引入了本体概念,使得系统能快速识别用户需求,高效的选择相应算法,在很大程度上提高了数据挖掘处理异构、分布式数据的能力。 相似文献
14.
通过建设双层PDF全文数据库、创建索引和全文检索等实现过程来阐述相关技术的研究和运用。以建设全文数据库为基础,研究结构化信息与非结构化数据的合并管理,对目录数据和全文数据的同步索引,基于Lucene技术,实现档案管理系统的一站式智能化档案全文检索,提升档案查全率。 相似文献
15.
为研究绿色技术进步对全要素绿色能源效率的影响,以中国30个省(市、自治区)为研究对象,考虑非意向产出情况下,运用非参数数据包络的全局DEA—SBM模型、Malmquist-Luenberger?生产率指数,分测算全要素绿色能源效率和绿色技术进步指数,并运用全面FGLS方法进行实证研究。研究结论表明,全国及三大地区的全要素绿色能源效率差异显著,绿色技术进步与全国及三大地区全要素绿色能源效率均有正向影响,且都通过1%的显著性水平的检验。最后,从提高绿色技术水平等方面提出相关对策建议。 相似文献
16.
17.
18.
【目的/意义】分散分布状态下,科研课题申请书资源的智能分析与价值实现受到严重制约,为此需要推进
面向智能分析的科研课题申请书资源整合。【方法/过程】首先对科研课题申请书资源的特点进行了分析,为资源整
合思路设计提供支撑;在此基础上,构建了面向智能分析的科研课题申请书资源整合模型,提出了资源整合推进模
式建议。【结果/结论】面向智能分析的科研课题申请书资源整合中,首先需要实现申请书的数据化,将非结构化文
档转变为可以进行知识计算的结构化数据,进而实现异构申请书资源的集成及科研实体的关联,并面向科研过程
管理与资源配置中的需求,进行基于智能化分析的服务功能设计,为科研管理与决策提供支持。在实施推进中,需
要采用物理与逻辑整合相结合的模式。【创新/局限】本文创新之处在于提出了面向智能分析的科研课题申请书资
源整合模型与推进模式,但偏向于理论性分析,后续研究需要在实证方面加强。 相似文献
19.
自柏拉图以来,著名的“非存在之谜”一直吸引着哲学家们为之绞尽脑汁。那么,非存在存在吗?到底有没有非存在对象呢?如果有非存在对象,那么它们是什么类型的对象呢?它们能被描述吗?有可能提供有关非存在对象的统一理论吗?这样的理论的解释力又如何呢?在当代哲学研究、尤其在心灵哲学意向性等问题的研究中,非存在问题是不可回避的。对象属性策略体现了非存在问题的传统哲学解决方案的现代拓展,语言策略体现了非存在问题的语言学研究的当代趋向,可能世界策略则向我们提供了一种更精细的逻辑论证思路。 相似文献