共查询到20条相似文献,搜索用时 31 毫秒
1.
基于用户访问网页的不同序列反映了用户特定的兴趣,提出了Web日志中用户存取模式的聚类算法。利用传统的Leader算法只扫描数据集一遍的优点,以及粗糙理论在处理含有不确定信息问题上的优势,给出了结合粗糙理论的改进Leader算法对用户存取模式进行聚类方法,使得同一类中的用户存取模式尽可能的相近或相似,不同类中的模式尽可能的相异。实验结果表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效聚类。 相似文献
2.
对农产品价格时序挖掘实践证明,其依据时间序列是一组有序的随着时间改变的序列值。文中给出一个同类别多条金融时间序列的数据挖掘模型,针对长时间序列,利用一种能快速发现序列中时序模式的检索方法,通过该时序模型利用挖掘出来的知识对时间序列的趋势进行分析。有效地利用模型找出价格随时间、空间的分布规律,从而提供给用户对价格趋势的判断,具有现实指导意义。 相似文献
3.
介绍SNS开放平台及其应用的相关概念,分析开放平台应用现状和运营模式,基于国内此类软件的统计数据,采用DTW算法度量变长时序数据的形状相似性,使用一维序列变换改进K中心点聚类的簇中心计算方法,并对数据进行时间序列聚类挖掘,最后使用产品生命周期理论分析聚类结果。 相似文献
4.
5.
针对图书馆读者借阅事务中存在的序列特征,提出一种基于序列模式挖掘的读者借阅行为分析方法,其思想是通过将借阅事务转化为序列数据库,基于PrefixSpan算法来识别读者借阅行为序列模式。以某高校图书馆读者借阅事务数据为例,通过序列模式挖掘实验表明,此方法可有效获取读者借阅行为的时序规律,其结果在图书馆信息服务中具有一定的应用价值。 相似文献
6.
汉语文本结构的自动分析 总被引:5,自引:1,他引:4
本文试图运用向量空间模型来确定文本段落之间内容的相关性,从而实现文本主题的自动分析,找出构成文本大主题的各个小主题,从这些小主题入手来实现自动文摘,可为自动文摘技术探索一条新途径。另一方面,通过文本结构的自动分析,可确定文本结构的类型,也为全文检索等信息处理技术提供一些有用的信息。 相似文献
7.
8.
9.
[目的/意义]作为科学学预测的重要组成部分,学科主题热度预测旨在揭示学术前沿和发展趋势,辅助学者发现前沿选题,支持科研管理机构科学立项。[研究设计/方法]提出基于期刊影响因子的学科主题热度计算指标(TP-JIF),构建基于LSTM神经网络的学科主题热度预测模型(TPP-LSTM),并以LIS领域数据为例,通过时间切片的形式抽取、计算学科主题的热度序列,检验不同长度时间序列下模型的各项误差。[结论/发现]相对于RBF-SVM、Linear-SVM、KNN、Naive Bayesian等模型,TPP-LSTM预测模型可有效表征学科主题热度时间序列的特性,当时间序列长度为4年时预测效果相对较好。[创新/价值]提出的基于期刊影响因子的学科主题热度计算指标,能够有效刻画不同学术刊物对学科影响的差异,规避了单纯依据频率计算热度的弊端;构建的学科主题热度预测模型,有效表征了学科主题的时间序列变化规律,减小了各项预测误差,预测效果较好。 相似文献
10.
在我们生活的周围有很多的数学问题,我们现实生活中,购物、估算、计算时间、确定位置和买卖股票等等都与数学有关。通过学习一些初、高中基本数学知识,有利于生活中的某些细节和实际案例的处理。 相似文献
11.
图书借阅流量行为季节预测模型 总被引:2,自引:0,他引:2
指出图书借阅流量行为预测是图书借阅行为学的一个重要研究方向,常规的借阅流量预测大多采用的是ARIMA时间序列模型,但普通时间序列预测模型的参数难以估计并且模型较难处理非平稳时间序列问题。基于时间序列的神经图书借阅模型研究是,根据图书借阅流量行为的季节性特点,提出季节型神经图书借阅模型。用模型对图书借阅流量行为的预测分析表明,该模型预测效果较好,结果合理,对进行图书借阅实时监控及图书借阅管理都具有一定的理论和实践价值。 相似文献
12.
13.
大多数传统的数据挖掘算法,通常是在二进制值的事务数据库中在单一层次上发现属性之间的关联关系即关联规则,但是大多数的数据库包含有大量量化的值。通常人们采用分区的方法处理量化值,然而这种处理方法带来分区过硬的问题。本文使用模糊的方法从Web日志中发现模糊泛化的Web网页之间的关联规则,它们能够体现出带模糊浏览时间的网页之间的关联关系。通过实例分析表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效的模糊泛化关联规则的提取。 相似文献
14.
读者借阅行为的时间序列统计模式实证分析与对策思考 总被引:1,自引:1,他引:0
针对图书馆信息管理系统中积累的大量读者借阅行为数据,提出利用时间序列统计模式进行读者需求和馆藏利用实证分析,结合实例,阐述发现读者行为中隐藏的时间序列变化规律,并提出相应对策和建议,为文献资源建设和管理提供数据支撑。 相似文献
15.
竞争情报是经过筛选和分析加工后的信息。在企业竞争情报的运作中,至为关键的一环是对所搜集并分析后的信息进行情报评级。文章试图运用模糊综合评判法来评定竞争情报的级别。首先,通过对竞争情报活动的分析,确定评定竞争情报级别的指标;然后使用模糊数学中的隶属函数方法对这些指标进行定量分析,并建立模糊综合评判模型;最后通过综合评判运算,获得计算结果,并根据计算结果确定竞争情报的级别。 相似文献
16.
提出一种基于内容规则的网页净化算法。包含两部分,先提出一种同层表间的比较迭代算法,通过迭代的方式对于网页中的噪声内容进行层层剥离。为进一步判断网页中锚文本与网页主题的相关性,又提出一种基于修正的编辑距离的计算锚文本的主题相似性的算法,在一定程度上考虑了网页的语义因素。该算法具有更高的准确度,同时具有很低的时间复杂度。实验结果表明,在对海量网页进行净化处理时,算法具有良好的效果。 相似文献
17.
文章阐述了网络环境下高校图书馆预测工作在各业务流程中的作用,对几种主要的时间序列预测方法进行了分析及比较。最后通过实例说明时间序列预测方法在高校图书馆预测工作中的应用。 相似文献
18.
[目的/意义] 科研评价中指标权重计算的合理性将直接影响科研机构评价结果的客观性和准确性,本文提出利用信息论方法来计算指标权重,为指标权重计算提供一种新的思路。[方法/过程] 基于DBpedia数据集,利用信息论方法计算出的指标权重和上海交通大学世界大学排行榜已有的指标权重,同时对榜单前100名大学机构进行排名,并将排名结果进行对比分析。[结果/结论] 实验发现利用本文提出的权重计算方法得出的机构得分结果与上海交通大学已有指标权重的得分结果皮尔逊相关性为0.980,斯皮尔曼相关性为0.939,并且其排名顺序和上海交通大学给出的排名顺序皮尔逊相关性和斯皮尔曼相关性均为0.939。以上两个排名结果的得分相关性和排名相关性极强,证明本研究中关联数据的权重计算方法的有效性。 相似文献
19.
探讨了音乐旋律特征的匹配检索,通过将检索过程分解为三个步骤:字符串匹配检索、相似度计算和相关度计算来对旋律轮廓中的不同特征进行相应的计算处理,得到最终的检索结果并总结了音乐旋律特征的匹配检索模型。 相似文献
20.
异常检测是高光谱遥感的一项重要任务。目前应用最广泛的探测器,如RX,仅利用原始的光谱特征,可是缺乏信号增强和噪声抑制能力。提出了基于子特征方差分组改进的分数阶傅里叶熵的高光谱异常目标检测方法。第一,选取高光谱图像的多个光谱子特征作为检测输入信息。第二,采用分数傅立叶变换进行处理,通过空频表示获得原始光谱与互补强度的傅立叶变换之间的中间域特征。接着确定最优的分数变换阶数,将信号与背景和噪声区分开。第三,在最优分数域上实现异常检测方法并引入二进制累加,通过累加每组检测结果来提高异常检测算法的鲁棒性。第四,在三个真实高光谱图像数据集上的实验结果表明,所提出的方法具有较好的检测性能。 相似文献