首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
【目的/意义】自然界中时间序列信号具有非线性、非稳定变化的特点。对时间序列信号实现准确预测,不 仅能够提高风电机组的输出功率,并且有助于调控风电场的运行维护,保障电力系统的安全运行。【方法/过程】本 文基于集合经验模式分解和变分模态分解两种时间序列分解的方法,并将其与RBF神经网络相结合提出RBF直 接预测模型和EEMD-RBF 和VMD-RBF 两种组合预测模型。利用某风电场的原始风速时间序列信息,通过 MATLAB 软件进行编程,进行案例分析。【结果/结论】预测结果表明组合预测模型优于RBF 直接预测模型,且 VMD-RBF组合预测模型的预测结果最为精确。  相似文献   

2.
【目的/意义】当前全球信息化时代下信息过载问题日趋严峻,在深度挖掘信息的基础上,结合用户行为特 征进行智能匹配显得尤为重要。【方法/过程】本文在基于潜在因子模型的个性化推荐算法的基础上,构建了结合时 间序列的语义信息挖掘及匹配模型。通过引入用户历史行为的时间序列语义信息,提高已有模型预测用户偏好的 准确性,结合因子分解机的思想实现对扩展模型的构建,并通过 movielens数据集对该方法的有效性进行验证。【结 果/结论】实验结果表明,新模型能够有效提高已有推荐模型预测用户偏好的准确性,从而实现了良好的数据挖掘 及匹配效果。  相似文献   

3.
林萍  吕健超 《情报科学》2023,41(2):135-142
【目的/意义】提出基于Stacking集成学习的问答信息采纳行为识别策略,促进在线健康社区问答的精准化推送、助推数字化医疗服务高质量发展。【方法/过程】构建以集成学习方法和非集成学习方法为基学习器、以逻辑回归算法(LR)为元学习器的Stacking集成学习模型,比较单预测模型、同类预测模型组合、不同类预测模型组合的Stacking集成学习模型预测精度,选取“寻医问药”平台的慢性病问答构建数据集验证模型的优越性,并选取“快速问医生有问必答120”平台数据验证模型的可移植性。【结果/结论】Stacking集成模型相比于单预测模型能够更精准识别被采纳问答信息,模型具有较强的泛化性,可以适用于不同的在线健康社区。【创新/局限】本文基于Stacking集成思想构建两阶段预测模型,并借助机器学习构建最佳预测模型组合,显著提高在线健康社区问答信息采纳识别精度,但伴随问答信息积累,在线健康社区问答模式不断发展变化,考虑结合历史数据和每日更新数据的动态预测方法是未来研究工作重点。  相似文献   

4.
【目的/意义】基于互联网海量评论数据进行情报分析,挖掘出影响客户服务评价和满意度的关键因素,了 解客户差评背后的原因,对提升企业客户关系管理水平具有重要意义。【方法/过程】通过词云图、语义网络特征关 联分析、LDA主题模型的特征分析以及基于语义的情感词典方法,基于百度口碑中十家快递企业的客户评论数据 进行了情感计算与分析。【结果/结论】影响客户情感倾向的主要因素为:物流速度、服务态度、电话服务、投诉处理、 物流信息更新、时效性以及收费价格。基于上述结果提出了对策与建议。【创新/局限】基于现实世界真实数据,采 用数据挖掘方法分析客户情感倾向,为客户情感关键影响因素识别提供了数据科学的研究范式。  相似文献   

5.
闫永君 《情报科学》2021,39(8):126-131
【目的/意义】当前的信息用户行为特征挖掘方法无法将数据统一整合,且无法准确计算出时间序列内滑动 窗口内的数据均值,导致特征挖掘精度偏低。为此,提出了基于时间特性的信息用户行为特征挖掘方法。【方法/过 程】计算时间序列内滑动窗口内的数据均值,得出起始序列向量,再将用户行为划分成若干等值的时间片,通过取 样统计各种用户群体,得出用户的行为状态定性。以平均查询频率作为标准,观察用户的查询行为特征,输出信息 挖掘结果。【结果/结论】实验结果表明:所提方法挖掘出夜晚用户行为信息多于白天,休息日比工作日多,且在网络 波动下,虽然耗时增加,不过处于合理范围内。与传统方法相比,所提方法具有更低的挖掘误差,应用性较强。以 上实验结果证明了基于时间特性的信息用户行为特征挖掘研究能获取更准确的用户行为意向,提高用户兴趣预测 准确度,优化网络服务效果。【创新/局限】为进一步提高网络信息特征挖掘的效率,后续将重点研究多个网络用户 行为的并行分析,使该方法更适用于网络海量信息处理。  相似文献   

6.
李蛟  孟志强 《情报科学》2022,40(11):133-138
【目的/意义】图书借阅数据的预测对于图书馆的资源建设和精准服务具有重要的指导意义。本文收集了 中国东北地区某双一流高校图书馆管理系统十年的借阅数据,并分别按图书类别、借阅者所属学院分类,对未来的 借阅趋势进行了预测。【方法/过程】本文使用一种基于时间序列的混合预测模型进行图书借阅数量的预测,其中混 合预测是一元时间序列预测与多元时间序列预测的结合。【结果/结论】实验结果表明,时间序列算法用于高校图书 馆借阅数据预测,2008 年到 2017 年借书数量由 300 左右增加到近 4000,2018 年到 2021 年 C、D、G、J、S、U、I类图书 中,D类、S类图书的借阅数量下降幅度最大,U类图书借阅数量下降幅度最小,T类、E类借阅量的上升幅度最大,Q 类、X类的误差率较大,研究结论供高校图书馆管理工作参考。【创新/局限】学界上针对图书馆馆藏资源建设和服务 创新研究较多,但以一元时间序列与多元时间序列预测角度进行研究的相对较少,本文弥补了此方面的不足。  相似文献   

7.
王思培  韩涛 《情报科学》2020,38(5):120-125
【目的/意义】为了支持高价值专利培育工作开展,面向潜在高价值专利预测的需求,提出基于随机森林算法的潜在高价值专利预测方法。【方法/过程】梳理现有研究,选择用于潜在高价值专利预测的指标,构建基于随机森林算法的潜在高价值专利预测模型。使用“语音信号识别”领域的19647条专利进行实证分析,模型预测准确率达96.01%。【结果/结论】目前适于从海量早期申请中发掘潜在高价值专利的方法研究较少,本方法能够在专利申请早期发挥作用,同时具有预测准确率高、处理数据量大、模型可解释性好的优点。  相似文献   

8.
【目的/意义】筛选出质量高的评论,优化电商平台的推荐智能排序机制,节省消费者搜寻时间。【方法/过 程】以评论信息有用性为研究对象,使用七种目前比较常用的机器学习算法,构建网络评论信息有用性预测模型。 【结果/结论】评论信息有用性预测模型为非线性模型,随机森林和决策树算法的预测准确率比较理想,其中评论回 复是预测模型中最重要的影响因素。  相似文献   

9.
【目的/意义】互联网成为网民情感宣泄的平台使得网络舆情影响力剧增,构建模型对网络舆情的发展进行 预测具有现实意义。【方法/过程】针对网络舆情趋势预测及时性的需求,以事件标签确定待选历史数据,通过模糊 理论的模糊逻辑构建模糊时间序列预测模型,同时构建BP神经网络预测模型,以组合预测的方式提高整体的预测 精度。【结果/结论】通过实验分析结果表明,预测模型可以在一定程度将预测的时间区间前置,实现“早期”预测。  相似文献   

10.
朱凡  王印琪 《情报科学》2021,39(7):83-90
【目的/意义】基于机器学习算法对信息进行聚类及预测引起了广泛关注,本文将以航空公司客户信息为对 象构建出k-means,BP神经网络模型,对航空用户进行聚类及预测,实现用户的精准营销。【方法/过程】首先,对航 空公司的客户信息进行预处理,并根据信息聚类和信息预测理论,构建出k-means客户聚类模型与BP神经网络的 流失预测模型。【结果/结论】实证结果表明,在聚类模型上,k-means算法将客户聚为五类,实现了不同价值客户的 差异化识别;在客户预测模型上,BP神经网络的准确性更高。【创新/局限】本次研究将LRFMC模型引入到用户聚 类模型的实验中,使得模型泛化能力上存在了一定的局限,但也为该问题的未来研究提供了新的方式。  相似文献   

11.
蔡瑶  吴鹏 《情报科学》2022,40(6):160-168
【目的/意义】个人违约信用风险是网络借贷平台所面临的主要风险之一,引起了金融机构的广泛重视。传 统的P2P网络借贷违约风险预测模型通常使用历史数据建模,而模型的对象主要为历史履约和违约因素,由此带来 的因素选择偏差问题会影响模型的泛化能力和风险预测能力。【方法/过程】本文引入面部特征大数据分析方法,利 用深度学习技术自动抽取人脸面部特征变量,将其作为一个新的维度融入以历史借贷数据为核心的信用风险评价 系统,建构新型信用风险预测模型。【结果/结论】论文基于南京某互联网金融公司提供的数据集进行实验与实证分 析,结果表明本文提出的模型优于传统的违约风险预测模型。【创新/局限】本研究的创新点为一方面基于大数据分 析方法挖掘了真实借款人面部特征在预测互联网信贷背景下的贷款违约中的作用,为互联网信贷的信用风险预测 模型提供了新的数据维度,另一方面为使用深度学习方法自动识别和提取大规模图片数据集中的面部特征提供了 新的思路。  相似文献   

12.
【目的/意义】数据分类是数据挖掘研究的重要内容之一。数据分类时,由于单一分类算法分类性能的差异 性,使其不能很好地解决大部分的分类问题,探讨一种基于多类型分类器装袋技术的数据分类方法具有重要理论 意义和应用价值。【方法/过程】基于分类性能评价的准确率,使用五种不同类型的分类算法作为分类器,随机抽取 训练集后分别训练得到若干个弱分类器,然后采用自动优化加权方式,组合构建一个强的分类器。通过实验对五 种分类算法和装袋算法的分类准确率均值和标准差分别进行对比,得出各分类算法在四种数据集上分类性能的优 劣和稳定性。【结果/结论】在四个UCI数据集上的实验结果表明,与五种不同类型的分类算法相比,装袋算法不仅 在大部分数据集上都表现出很好的稳定性,而且具有更好的泛化能力。  相似文献   

13.
参数的优化选择对支持向量机回归算法(SVR的预测精度和泛化能力影响显著,提出混沌粒子群优化算法(CPSO优化选取支持向量回归算法中参数c和g信息粒化是进行海量数据挖掘和模糊信息处理的有效工具。在此基础上利用上证指数数据建立上证指数开盘数预测模型,研究结果表明,混沌粒子群优化的SVR信息粒化时序回归预测模型克服了传统时间序列模型仅局限于线性系统的缺点,速度快,预测精度高,且实用性强。  相似文献   

14.
【目的/意义】数据挖掘是从庞大数据中挖掘出有潜在价值信息的信息处理技术,它包括神经网络、遗传算 法、粗糙集、支持向量机和决策树等多门技术,其中神经网络法具有良好的自学习和含联想储存功能,能够高速寻 找优化解,有效提高需求预测准确率。【方法/过程】本文利用BP神经网络具有的优异非线性逼近能力,以我国天然 气需求量预测为例,对需求量数据进行训练并采用L-M算法进行改进,最终提高对天然气需求量的预测精度。【结 果/结论】实验结果证明,利用数据挖掘中的BP神经网络非线性预测优势能准确捕捉天然气需求预测的变化趋势, 为精准预测需求提供了一种有效的工具。  相似文献   

15.
李欣 《情报科学》2018,36(4):95-99
【目的/意义】关联数据发现与个性化信息推送是未来智慧图书馆建设的核心内容。大数据环境下,为了提 高图书馆推送信息的精准度,本文把适合个性化信息推送服务的强关联规则挖掘技术引入到高校图书馆智慧化信 息服务中,研究在图书馆集成管理系统的基础上实现图书的智能查询和个性化信息推送。【方法/过程】在具体的研 究中,由于经典关联规则挖掘需要多次扫描数据库,生成大量的冗余关联规则信息,因此需要重新定义领域内强关 联规则和频繁项目集,提出处理海量数据需要的强关联规则算法。【结果/结论】将改进的算法应用到图书借阅和信 息查询数据的分析中,以减少图书频繁项集的产生,避免冗余规则的挖掘和生成,从而实现关联图书信息的高效挖 掘和个性化推送。  相似文献   

16.
【目的/意义】突发事件类网络舆情演化情况的掌握对舆情监管部门而言至关重要。鉴于此,本文致力于构 建能够准确预测舆情演化的模型,此预测模型的建立可拓宽舆情预测的渠道,为舆情参与主体和监管部门及时掌 握舆情演化态势提供方法依据。【方法/过程】基于随机森林(RF)算法建立突发事件网络舆情演化预测模型,以微博 和第三方舆情监测平台作为变量数据来源,以R语言为操作环境,然后进行模型的训练与预测。【结果/结论】实验 表明,较之其它方法,本文构建的模型有更高的拟合度和更低的误差值。从结果来看,本模型的预测输出值与真实 值最为接近,较好地实现了对舆情演化的预测,将RF算法应用在舆情预测的研究中具有一定的先进性。  相似文献   

17.
【目的/意义】微博传导热点的影响力大、信息扩散速度快,且隐蔽性较强,因此成为了网络舆情管理研究领 域的难点和瓶颈。【方法/过程】针对这些情况,基于复杂网络分析理论与技术,设计了微博传导热点预测算法 TPCN。TPCN算法将复杂网络中的信息路由节点模型扩展为微博传导节点模型,从而对传导子网进行划分;最终 以传导信息序列的热密度功率谱为依据,对传导节点的传导空间进行测度,从而判断其信息影响趋势,并实施传导 热点预测。【结果/结论】微博传导热点监测实验表明,较之 SNSM算法,TPCN算法具有较高的热点预测率、较低的 误报率以及良好的预测精确度。  相似文献   

18.
赵月华  朱思成  苏新宁 《情报科学》2021,39(12):165-173
【 目的/意义】解决获取虚假网络医疗信息数据集时专业知识不足的问题,帮助在小样本领域构建虚假网络 医疗信息识别模型。【方法/过程】本文提出一种基于权威辟谣信息转化提取构建网络虚假医疗信息数据集的思路, 并依次构建传统机器学习模型、CNN模型和BERT模型进行分类识别。【结果/结论】结果表明,基于辟谣信息能够 实现以较低成本、不依赖专家标注构建虚假医疗信息数据集。通过对比实验发现,基于微博数据预训练的 BERT 模型准确率为 95.91%,F1值为 94.57%,相比于传统机器学习模型和 CNN模型提升分别接近 6%和 4%,表明本文构 建的基于预训练的BERT模型在网络虚假医疗信息识别任务上取得了更好的效果。【创新/局限】本文提出的方法能 以较低成本建立专业领域的虚假信息数据集,所构建的BERT虚假医疗信息识别模型在小样本领域也具有实用价 值,但在数据集规模、深度学习模型对比、模型性能评价指标等方面还有待拓展与延伸。  相似文献   

19.
吕信恩  陈慧灵  蔡振闹 《情报科学》2019,37(10):108-113
【目的/意义】大数据环境下通过对大量的信息进行分析,梳理出影响人际关系、精神状态、行为轨迹、各种 奖惩统计、微博微信活跃度、宗教信仰等个性问题,挖掘大数据背后蕴含着的大量不同主题内容的数据模块。主动 掌握个性行为发生的规律和特点,并据此做出研判和预测。【方法/过程】本文提出了一种有效的智能预测模型,使 其能够用于寻找影响人际关系问题的关键因素。通过对个性行为数据的分析,首次提出一种基于混沌正余弦优化 的模糊k近邻模型,使其能否对大数据环境下的个性行为做出智能预测。【结果/结论】此模型能够深度挖掘个性行 为和心理问题,帮助管理者进行宏观决策,辅助教学生产安全管控,实现预警指标模型、预警信息产生、预警信息推 送等一系列的预警功能。  相似文献   

20.
郭雪梅 《情报科学》2020,38(2):68-74
【目的/意义】为了提高信息服务的质量,文章融合“用户-标签-资源项”关系模型以及时间因素对于用户 标注资源的影响,提出了一种个性化推荐方法。【方法/过程】首先建立起“用户-标签-资源项”三者之间的关系模 型,分别计算用户对标签的偏好程度以及资源与标签的相关程度,以此为基础进行用户相似性和资源项相似性的 度量;然后,考虑标签使用的时间因素对用户兴趣偏好的影响结合基于用户标注行为的用户相似性以及资源项相 似性度量方法提出了改进的个性化推荐方法。【结果/结论】提出了一种综合标签和时间因素的推荐算法,该方法利 用标签使用频率描述用户偏好,并结合标签使用的时间因素动态更新用户偏好,提高推荐精度。该方法应用于医 学信息服务应用场景之中,并收集实验数据,最后将提出的方法与其他基于标签信息的协同过滤推荐方法在实验 数据集进行比较,实验结果发现该方法在推荐效果上优于对比方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号