首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
【目的/意义】针对多组时间序列的海量数据集和以预测为目标的信息分析方法,提出了基于数据挖掘技术 的预测模型,在大数据环境下,提高了预测精度,以期在其他领域的信息分析和情报预测能有所借鉴。【方法/过程】 以集装箱海运价格预测为例,提出集装箱海运价格预测模型,设计自适应的网格搜索策略,高效准确地确定数据挖 掘算法中的超参数组合,提出基于时间序列留出法的评估方法,降低了集装箱运价这种多组时间序列数据集在数 据挖掘结果上的泛化误差,针对海量运价信息,对GBDT算法进行并行计算设计和预排序后的损失函数迭代计算 优化策略,提高了算法在大数据环境下的计算效率。【结果/结论】模型和算法运行结果仿真显示:对于传统的时间 序列问题,基于数据挖掘方法的预测模型取得了比传统时间序列方法更优的结果。  相似文献   

2.
【目的/意义】互联网成为网民情感宣泄的平台使得网络舆情影响力剧增,构建模型对网络舆情的发展进行 预测具有现实意义。【方法/过程】针对网络舆情趋势预测及时性的需求,以事件标签确定待选历史数据,通过模糊 理论的模糊逻辑构建模糊时间序列预测模型,同时构建BP神经网络预测模型,以组合预测的方式提高整体的预测 精度。【结果/结论】通过实验分析结果表明,预测模型可以在一定程度将预测的时间区间前置,实现“早期”预测。  相似文献   

3.
何晓庆  蔡娜 《软科学》2013,27(1):141-144
组合方法首先选取支持向量机预测算法和一阶指数平滑法对经济时间序列分别进行预测,来建立模糊自适应变权重组合预测模型。为对比模糊自适应变权重的经济时间序列组合预测模型的预测效果,选取了两种定值加权组合预测模型:平均加权模型、误差平方和最小组合预测模型。通过实验比较分析:模糊自适应变权重组合预测可以综合利用各单项预测方法的优点,比单一模型预测结果精度有了很大提高,且优于定值加权组合预测,在经济时间序列的预测方面有较高的应用价值。  相似文献   

4.
李蛟  孟志强 《情报科学》2022,40(11):133-138
【目的/意义】图书借阅数据的预测对于图书馆的资源建设和精准服务具有重要的指导意义。本文收集了 中国东北地区某双一流高校图书馆管理系统十年的借阅数据,并分别按图书类别、借阅者所属学院分类,对未来的 借阅趋势进行了预测。【方法/过程】本文使用一种基于时间序列的混合预测模型进行图书借阅数量的预测,其中混 合预测是一元时间序列预测与多元时间序列预测的结合。【结果/结论】实验结果表明,时间序列算法用于高校图书 馆借阅数据预测,2008 年到 2017 年借书数量由 300 左右增加到近 4000,2018 年到 2021 年 C、D、G、J、S、U、I类图书 中,D类、S类图书的借阅数量下降幅度最大,U类图书借阅数量下降幅度最小,T类、E类借阅量的上升幅度最大,Q 类、X类的误差率较大,研究结论供高校图书馆管理工作参考。【创新/局限】学界上针对图书馆馆藏资源建设和服务 创新研究较多,但以一元时间序列与多元时间序列预测角度进行研究的相对较少,本文弥补了此方面的不足。  相似文献   

5.
林萍  吕健超 《情报科学》2023,41(2):135-142
【目的/意义】提出基于Stacking集成学习的问答信息采纳行为识别策略,促进在线健康社区问答的精准化推送、助推数字化医疗服务高质量发展。【方法/过程】构建以集成学习方法和非集成学习方法为基学习器、以逻辑回归算法(LR)为元学习器的Stacking集成学习模型,比较单预测模型、同类预测模型组合、不同类预测模型组合的Stacking集成学习模型预测精度,选取“寻医问药”平台的慢性病问答构建数据集验证模型的优越性,并选取“快速问医生有问必答120”平台数据验证模型的可移植性。【结果/结论】Stacking集成模型相比于单预测模型能够更精准识别被采纳问答信息,模型具有较强的泛化性,可以适用于不同的在线健康社区。【创新/局限】本文基于Stacking集成思想构建两阶段预测模型,并借助机器学习构建最佳预测模型组合,显著提高在线健康社区问答信息采纳识别精度,但伴随问答信息积累,在线健康社区问答模式不断发展变化,考虑结合历史数据和每日更新数据的动态预测方法是未来研究工作重点。  相似文献   

6.
【目的/意义】筛选出质量高的评论,优化电商平台的推荐智能排序机制,节省消费者搜寻时间。【方法/过 程】以评论信息有用性为研究对象,使用七种目前比较常用的机器学习算法,构建网络评论信息有用性预测模型。 【结果/结论】评论信息有用性预测模型为非线性模型,随机森林和决策树算法的预测准确率比较理想,其中评论回 复是预测模型中最重要的影响因素。  相似文献   

7.
郭勇  罗敏  幸芮 《情报科学》2023,41(2):95-100
【目的/意义】挖掘药物筛选工作中的隐性知识,借助机器学习的预测能力替代生物实验方法,减少制药流程的研发时间和经济成本。【方法/过程】提出一种面向知识发现的ADMET情报预测理论框架,以4种传统机器学习方法和2种集成学习方法,分别构建6种分类预测模型,提取药物的隐性知识,比较不同模型的优越性,评估最优模型的经济价值。【结果/结论】以药物分子描述符信息预测ADMET具有可行性,6种模型性能表现综合排序结果为随机森林、梯度提升决策树、Logistic回归、支持向量机、K近邻、高斯朴素贝叶斯。前沿信息技术能够有效应用于药物知识发现,信息经济学分析可预见创造可观收益,是未来制药工艺降本增效的重要手段。【创新/局限】未来应融合专家知识、追加试验验证、丰富参考指标。  相似文献   

8.
可靠的径流预测能使人们最大限度的协调水资源利用中出现的各种用水矛盾,为及时采取措施进行统筹安排做指导,以便获取最大的效益。对于月径流时间序列的非平稳特性,将小波变换与LSSVM相结合,利用Mallat算法中的db4小波进行3尺度分解及重构,提取出细节信号序列和逼近信号序列,LSSVM分别对每个系数序列预测,针对LSSVM模型参数选择费时费力这一问题,将全局寻优的粒子群算法引入到LSSVM的参数优化中来,构成小波PSO-LSSVM组合预测模型,实例仿真表明,该组合方法的预测精度比PSO-LSSVM模型的高,且参数寻优效果好。  相似文献   

9.
王思培  韩涛 《情报科学》2020,38(5):120-125
【目的/意义】为了支持高价值专利培育工作开展,面向潜在高价值专利预测的需求,提出基于随机森林算法的潜在高价值专利预测方法。【方法/过程】梳理现有研究,选择用于潜在高价值专利预测的指标,构建基于随机森林算法的潜在高价值专利预测模型。使用“语音信号识别”领域的19647条专利进行实证分析,模型预测准确率达96.01%。【结果/结论】目前适于从海量早期申请中发掘潜在高价值专利的方法研究较少,本方法能够在专利申请早期发挥作用,同时具有预测准确率高、处理数据量大、模型可解释性好的优点。  相似文献   

10.
水质的时间变化趋势预测是进行水环境管理的前提,预测模型在很大程度上决定了预测精度的高低,如何选取有效的时间序列水质预测模型是目前的研究热点之一。以平西湖为研究对象,根据2009-2011年间TN、TP和CODMn月监测数据,提出了一种基于ARIMA和RBF-NN的组合模型,该模型能同时反映水质的渐变性和非线性变化的特点,最后用5个精度评价指标对组合模型的预测结果进行了评价,并和基于ARMMA和时间序列神经网络预测模型的预测结果进行了比较。结果表明,大部分指标显示ARIMA/RBF-NN组合模型对受内生变量影响较大的TN、TP的预测效果最好,ARIMA模型对受外生变量影响较大的CODMn的预测效果最优。  相似文献   

11.
【目的/意义】当前全球信息化时代下信息过载问题日趋严峻,在深度挖掘信息的基础上,结合用户行为特 征进行智能匹配显得尤为重要。【方法/过程】本文在基于潜在因子模型的个性化推荐算法的基础上,构建了结合时 间序列的语义信息挖掘及匹配模型。通过引入用户历史行为的时间序列语义信息,提高已有模型预测用户偏好的 准确性,结合因子分解机的思想实现对扩展模型的构建,并通过 movielens数据集对该方法的有效性进行验证。【结 果/结论】实验结果表明,新模型能够有效提高已有推荐模型预测用户偏好的准确性,从而实现了良好的数据挖掘 及匹配效果。  相似文献   

12.
田亚丹 《情报科学》2021,39(6):123-133
【目的/意义】针对现有主题演化方法难以满足预测目的的需求,本文从知识动态发展的角度出发,构建知 识主题演化预测模型,为探究科学领域发展脉络与研究趋势提供方法。【方法/过程】通过Lda模型抽取知识主题,利 用马尔可夫和隐马尔可夫构建主题稳态与主题热度的演化预测模型。【结果/结论】以云计算领域的科学文献作为 实证分析对象,结果表明本模型可以根据历史数据来预测知识主题稳态分布情况与未来热度趋势,且在热度预测 精度上较灰色模型更高。【创新/局限】本文只考虑了横向主题内部的热度高低变化,没有进行纵向维度上各知识主 题间的对比。  相似文献   

13.
顾洪涛  王筠 《现代情报》2013,33(2):162-165
运用回归分析预测法和时间序列分析法两种模型,以文献计量学为例,对近年来相关文献量的统计数据进行拟合与预测,并对两种预测模型的结果进行对比分析。结果表明,时间序列预测模型对文献计量学研究的模拟预测效果较好。两种预测模型不仅适用于文献计量学发展研究,对于其他领域也同样适用。针对不同领域的学科发展趋势,在进行数据模拟和分析预测时要根据统计数据的多少和分布情况,选取一种相对效果更好并且方便可行的预测方法。  相似文献   

14.
【目的/意义】网络舆情的发展是复杂非线性的变化过程,建立有效的数理模型对网络舆情发展趋势做出准 确的预测具有重要的意义。【方法/过程】首先选用网络舆情事件的百度指数构建发展趋势的时间序列指标,经过几 何平均弱化缓冲算子处理后建立改进的灰色Verhulst 模型预测,最后采用马尔可夫对改进的灰色Verhulst 模型预测 结果进行修正。【结果/结论】选取“罗一笑事件”进行案例分析,验证了本文提出的改进的灰色马尔可夫模型在网络 舆情预测中的有效性。  相似文献   

15.
以金融时间序列(1990年~2014年上证指数)为研究对象,金融时间序列数据本身带有较大的波动性,有高频和低频的数据情况贯穿于整个时间序列。小波分析对于数据降噪较于传统的降噪方式有着明显的优势,分析对比小波变换在处理两种不同波频情况下的优势和方法。采用其适合小波分析和神经网络相结合的组合模型对其进行分析和预测,其思想是,先将时间序列进行小波分解,得到各级小波变换序列和尺度变换序列。根据不同级小波变换系数的情况,选择合适的神经网络训练函数建立预测模型,得到各级小波变换序列和最后一层尺度序列,运用小波重建技术得出原时间序列的预测值。最后和常规的BP神经网络比较预测效果。  相似文献   

16.
裴佳音  单鹏 《情报科学》2019,37(3):112-118
【目的/意义】解决舆情趋势影响因素存在的冗余和不确定性的问题,从特征选择上进一步提高预测模型的 预测效果和泛化能力。【方法/过程】采用基于粗糙集的特征约简方法,从众多影响因素中生成可以有效预测微博舆 情趋势的最佳微博特征集合。【结果/结论】实验结果表明,采用本研究提取的粗糙集最小约简特征集合,可以在不 降低建模精度和预测能力的前提下简化所建模型的复杂性,提高微博舆情趋势预测的准确度。  相似文献   

17.
【目的/意义】突发事件类网络舆情演化情况的掌握对舆情监管部门而言至关重要。鉴于此,本文致力于构 建能够准确预测舆情演化的模型,此预测模型的建立可拓宽舆情预测的渠道,为舆情参与主体和监管部门及时掌 握舆情演化态势提供方法依据。【方法/过程】基于随机森林(RF)算法建立突发事件网络舆情演化预测模型,以微博 和第三方舆情监测平台作为变量数据来源,以R语言为操作环境,然后进行模型的训练与预测。【结果/结论】实验 表明,较之其它方法,本文构建的模型有更高的拟合度和更低的误差值。从结果来看,本模型的预测输出值与真实 值最为接近,较好地实现了对舆情演化的预测,将RF算法应用在舆情预测的研究中具有一定的先进性。  相似文献   

18.
【目的/意义】将时间序列分析方法引入情感分析,可以对微博突发事件衍生舆情作出科学预测,为政府掌 握舆情情感走势,从而根据舆情发生的不同阶段采取相应的导控策略提供合理的意见与指导。【方法/过程】结合 突发事件衍生舆情的特点,采用词集合并法、SO-PMI、PMI-IR等方法构建了微博突发事件衍生舆情专属情感词 典,随后利用该情感词典和时间序列分析方法对“6.22”杭州保姆纵火案衍生舆情事件进行实证分析。【结果/结论】 对该事件的日均情感值进行计算,与实际情感值拟合程度较好,证明了建立的衍生舆情情感词典及时间序列模型 较为科学,可以为政府选择相应的策略及应对时机提供一定的参考。  相似文献   

19.
朱凡  王印琪 《情报科学》2021,39(7):83-90
【目的/意义】基于机器学习算法对信息进行聚类及预测引起了广泛关注,本文将以航空公司客户信息为对 象构建出k-means,BP神经网络模型,对航空用户进行聚类及预测,实现用户的精准营销。【方法/过程】首先,对航 空公司的客户信息进行预处理,并根据信息聚类和信息预测理论,构建出k-means客户聚类模型与BP神经网络的 流失预测模型。【结果/结论】实证结果表明,在聚类模型上,k-means算法将客户聚为五类,实现了不同价值客户的 差异化识别;在客户预测模型上,BP神经网络的准确性更高。【创新/局限】本次研究将LRFMC模型引入到用户聚 类模型的实验中,使得模型泛化能力上存在了一定的局限,但也为该问题的未来研究提供了新的方式。  相似文献   

20.
【目的/意义】网民对社会现象及问题表达意见、态度使得网络舆情对社会的影响力越来越大,构建模型对 网络舆情的发展进行预测具有现实意义。【方法/过程】通过信息熵理论控制种群初始化,利用遗传算法较强的全 局搜索能力和粒子群算法的局部搜索能力实现对BP神经网络权值的优化,构建混合算法优化的BP神经网络的网 络舆情预测模型并进行实证分析及对比实验。【结果/结论】结果表明,该模型在预测性能上具有更好的优越性及 稳定性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号