首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
最近邻协同过滤常用的计算用户访问行为相似程度的距离函数仅是测定访问者对象在所有测试属性空间上的平均测定,而在属性集的子维空间上的相似模式并没有有效地挖掘出来,用户评分数据稀疏等问题使其推荐质量下降。针对这些问题,提出一种基于用户模式聚类的协同过滤推荐算法,该算法采用基于用户模式相似的子空间聚类方法产生聚类,并且利用模式相似度改进协同过滤,从而对用户产生个性化推荐。实验结果表明,该方法改善了推荐系统的效率和精度。  相似文献   

2.
基于模糊商空间的模糊C-均值算法(QFCM)是在模糊商空间和模糊模糊C-均值(FCM)的基础上提出的。通过引入相似函数并构造出归一化距离,得到模糊商空间的分层递阶的结构,在此基础上提出了基于粒度思想的准则函数并选择出一个最佳层次,从而确定聚类的个数,并选择具有相似度高的样本作为初始聚类中心,结合鲁棒性统计观点运用归一化距离来替代FCM目标函数中的欧式距离度量,提出了QFCM算法。实验证明与传统的算法比较,QFCM算法能够自动确定最佳聚类数目,发现大小不均的聚类,迭代次数少,有效地消除了传统FCM算法对初始值敏感,提高了算法的稳定性和准确率。  相似文献   

3.
在分析folksonomy概念空间构建的可行性的基础上,对基于向量空间模型的传统聚类方法和概念空间模型的标签聚类方法进行比较,提出了基于概念空间模型的folksonomy聚类方法,并使用学术资源标注网站CiteUlike的真实标签数据集进行试验.  相似文献   

4.
王华秋  王重阳  聂珍 《现代情报》2016,36(2):129-134
图像聚类为数字图书馆图像管理提供了新的技术支持,能够在大量图像数据中发掘使用户感兴趣的信息。传统应用于图像聚类的特征提取算法往往忽略图像颜色的空间分布信息,且适应性较差。通过等面积矩形环对图像进行划分并计算各空间区域的相关性,并根据空间区域相关性计算各区域的重要性,将空间信息与颜色信息进行融合。同时对快速搜索密度峰值聚类算法的截断距离进行了合理改进,在保证聚类精度的同时提高收敛速度。最后将该密度聚类算法应用于数字图书馆图像检索之中。通过实验验证,本文提出的方法是可行的、有效的。  相似文献   

5.
王恬宇 《情报杂志》2005,24(4):108-109,112
信息检索在信息飞速增长的今天具有十分重大的意义。作为信息检索的一个重要的部分,图像检索得到了广泛的研究。由于基于文本的图像检索的种种不利因素,基于内容的图像检索成为目前的主流方向,本文提出一种基于空间聚类的方法,用图像的颜色特征来计算图像之间距离,采用DBSCAN算法对图像聚类,得到检索结果。  相似文献   

6.
技术创新中的供需对接加权k-平均聚类   总被引:1,自引:0,他引:1  
以加权k-平均聚类方法为工具,对技术创新中的供需对接进行聚类,促进技术转化.由实际应用环境,构造抽象空间中两点的加权距离函数,通过计算空间中每个点与k个簇中心距离进行聚类,并且讨论了不同参数组合对聚类结果的影响.仿真实验表明,所建模型具有合理性和求解过程的可行性.  相似文献   

7.
文章提出了一种基于高斯核的KSOFM聚类算法,通过核函数将输入空间中的样本映射到高维特征空间中,并在特征空间中进行聚类。核函数的应用使得在原空间中未曾体现的信息得以展现并被聚类算法所运用,使得聚类算法在性能上有较高的提升。  相似文献   

8.
为了提高文本聚类的质量和效率,本文提出了一种基于本体图的文本聚类模型。该模型一方面利用本体图表示文本,获取更多、更深的文本语义信息特征,提高文本表示的准确性;另一方面从语法结构和语义内容两个角度综合衡量文本间的相似程度,增强计算的精确性和全面性。实验结果表明,该模型明显优于现有的文本聚类模型,获得了很好的聚类效果,提高了文本聚类的质量和效率,降低了聚类的时间复杂度和空间复杂度。  相似文献   

9.
由于向量空间模型在文本聚类中的应用,而必须对文本特征进行降维。本方法首先利用特征的概率分布计算特征之间的相似度,在此基础上对特征进行聚类;然后在文本聚类的结果上计算各个特征的信息增益值;最后在各个特征类上取出一定比例的最重要的特征达到特征选择的目标。实验表明,该改进算法在聚类的准确度方面较以前的方法有所提高,可以有效地用于文本自动聚类。  相似文献   

10.
较为系统的综述了当前空间聚类算法的相关研究。依据这些算法的特点,将它们归纳为两类:划分聚类算法、层次聚类算法。针对划分聚类算法,重点分析了PAM、CLARA和CLARANS算法。针对层次聚类算法,重点分析了BIRCH、CURE算法。比较了这些算法的复杂度,并介绍了相关应用。  相似文献   

11.
中国省际能耗强度的影响因素及其空间关联性研究   总被引:2,自引:1,他引:1  
余华义 《资源科学》2011,33(7):1353-1365
过去文献对于中国能耗强度的探讨大都基于宏观角度,缺乏对中国地区能耗强度地区差异和空间关联性的分析。本文首先利用空间统计学方法研究了中国地区能耗强度的分布,结果显示中国各地区能耗强度具有明显的空间相关性,且呈现东、西部分块集聚的特征;其次,利用空间面板计量方法对中国30个省级区域能耗强度的影响因素进行估计,发现交通基础设施、市场化程度和科技投入对能耗强度有显著的负向影响,重工业比重和能源丰裕程度对能耗强度有显著的正向影响,而对外贸易和外商直接投资的回归系数不显著;最后,对中国地区能耗强度的空间溢出和收敛性进行了检验,结果表明东、西部间有明显的溢出效应,控制空间效应后仍呈β收敛趋势,且交通基础设施、市场化程度和科技投入的改善有利于地区能耗强度的收敛。并在理论和实证分析基础上提出了如何降低中国能耗强度的政策建议。  相似文献   

12.
地产价格梯度研究进展   总被引:2,自引:1,他引:1  
于伟  饶烨  李雪  宋金平 《资源科学》2012,34(12):2265-2273
国外大量研究通过估算地产价格梯度来解析城市空间结构的特征与发展,2004年以来国内城市的相关研究也得到关注。本文回顾了地产价格梯度研究的主要方法、基本假设与模型改进。研究中主要采用了特征价格模型与重复销售模型两种方法,其中特征价格模型使用频率最高,非参数估计、样条函数等能够揭示价格梯度复杂特征的新方法也得到了应用。城市空间结构预设主要包括单中心假设、非单中心或多中心假设和无中心预设三种,单中心模型中,欧式距离变量应用最普遍,使用交通花费、交通时间或虚拟变量取代或改进距离变量,能够取得更优的估计结果。空间自相关带来的异方差问题容易导致模型估计的无效,如何检验和修正空间自相关得到了广泛的探索。最后从样本选取、变量设置、空间预设和模型应用方面展望了国内研究的方向。  相似文献   

13.
农地细碎化度测度指数计算的改进   总被引:3,自引:1,他引:2  
沈陈华  冯电军  王旭姣  陈轩昂 《资源科学》2012,34(12):2242-2248
为了使得农地细碎化度的测度指数更加符合实际,论文采用概括和理论分析的手段,改进了测度指数的计算方法。首先,从农地细碎化的概念出发,从农地完整性视角,研究了农地完整度与细碎化之间的关系,认为完整度可以描述农地细碎化程度。其次,在不考虑地块空间邻近相互作用的情况下,用泰勒公式展开了农地细碎化度的测度指数函数,利用边界条件,给出了测度指数的计算公式。之后,在考虑地块在空间邻近相互作用的情况下,引入空间邻近矩阵,建立基于地块间空间相互作用的测度指数计算公式,分析该测度指数的相关特征。最后,用改进的农地细碎化度的测度指数计算方法,计算了江苏省仪征市新集镇的农地细碎化指数,对方法进行了验证。  相似文献   

14.
对空间数据挖掘聚类技术及其在公共设施选址方面的传统应用方法进行了综述,分析了传统应用方法中有待解决的关键问题,对空间距离代价的表示问题和传统方法的算法时间复杂度进行了初步探讨,运用模拟退火算法和图论对传统方法进行了改进,实现了算法时间复杂度的降低和聚类结果的优化。  相似文献   

15.
土地质量上的管理是我国土地管理工作的重要方面,全面掌握和科学量化农用地的质量状况,能够为保护优质耕地、合理规划利用土地、实现土地数量质量双重管理提供科学依据。农用地分等工作是对农用地质量调查和评价的基础性工作,其成果包含了较为完备的土地质量信息和空间信息,是农用地质量定量化研究的数据基础。随着空间分析技术的不断发展,运用空间分析手段揭示空间位置之间隐含关系的应用越来越广泛,将农用地分等成果与空间统计分析相结合,能准确认识农用地质量在空间上的分布以及相互关系。基于海伦市农用地分等成果,对农用地质量的空间关联性进行分析评价,研究了海伦市农用地质量分布的空间集聚性特征,量化后与面积、质量属性相结合获得海伦市农用地各分等单元空间质量综合指数。评价结果表明,海伦市农用地质量呈现出明显的集聚现象,为基本农田保护区的划定、土地整理重点区域的划定以及建设用地的扩展方向提供了新思路。  相似文献   

16.
都市地价空间分析方法及其应用——以北京市为例   总被引:16,自引:1,他引:16  
都市出让地价,按用途可分为住宅、商业、综合和工业用地出让地价,具有较强的空间特征。对其进行空间分析,有助于了解各类土地供需关系和价格变动趋势。都市地价空间分析方法主要包括趋势面法、不规则三角网法、距离倒数法和克里格法。本文采用克里格法分析了北京市商业、住宅、综合和工业出让地价的空间分布格局:住宅出让地价水平存在内高外低、北高南低的趋势,且郊区化现象较为明显;综合地价高价位地价主要集中在中关村高科技园区,中等级地价主要分布在王府井和东单、金融街一带;商业地价总趋势是北城大于南城,地价重心略偏北东方向,高等级商业地价以旧城区为主,呈"凸"字形空间分布格局,中等级地价受北京市新的市级商业中心的影响,呈组团式分布;高等级的工业地价主要集中在海淀区,中等级的工业地价呈多个次中心分布。发现地价空间变异受随机因子影响较小,但四种出让地价具有较强的空间毗邻效应,且毗邻效应有效半径在7.79km--47.03km之间。这一发现对于引导地产投资及开发项目布局,有一定参考价值。  相似文献   

17.
晋江西溪流域洪水与暴雨时空分布特征的相关分析   总被引:2,自引:0,他引:2  
林木生  陈兴伟  陈莹 《资源科学》2011,33(12):2226-2231
基于东南沿海地区暴雨洪水特点,以流域面积2466km。的晋江西溪为例,应用1970年代30场暴雨洪水实测资料,统计分析反映暴雨时空变化特征的一系列要素;应用多元线性回归模型,分别建立洪峰流量和洪量,与暴雨时空特征要素之间的多元相关关系。结果表明:①适当选取场次暴雨时空变化特征的要素,可以比较好建立暴雨洪水特征的经验关系;(④次降雨量、暴雨相对中心、暴雨时间变差系数和暴雨历时对洪峰流量有显著影响。其中,暴雨相对中心这一指标比较好地揭示了洪峰流量对暴雨和流域产汇流特征空间变化的综合响应;从时间要素上看,暴雨时间变差系数和暴雨历时共同影响洪峰流量的大小;③洪量与次降雨量和起涨流量关系显著。  相似文献   

18.
唐承财  钟林生  陈田 《资源科学》2009,31(11):1825-1831
研究旅游资源空间分异特征,有助于构建科学合理的旅游资源开发模式,促进区域旅游与社会经济的健康持续发展.本文对三江源地区生态旅游资源空间分异特征进行研究,结果表明:①随着海拔的变化,整个区域生态旅游资源与部分单体呈现垂直地带性;②随着经纬度变化,自然与人文类生态旅游资源均表现出水平地带性空间分异;③较多生态旅游资源分布在交通干线与主要河流沿岸;④建筑与设施类旅游资源沿村镇及其周边地区呈现面状集聚与散点空间分异.基于空间分异特征分析结果,提出该区域旅游资源总体开发模式为空间梯度转移开发,并探讨了3类空间优先生态旅游资源类型的开发模式,分别为垄断性资源开发的独立景区模式、交通干线沿线资源开发的线路联动模式、城镇周边资源开发的设施依托模式,研究成果可为三江源地区及其它生态敏感区生态旅游资源的科学利用提供理论指导与经验借鉴.  相似文献   

19.
刘玉锋 《科技广场》2010,(3):177-179
伴随着IT技术的不断成熟,以及3S技术的不断进步,空间信息技术以及基于空间信息的服务、分析、辅助决策等在各领域得到广泛应用。本文结合传统数据库的构建方法,提出采用面向对象的空间数据模型组织空间数据和构建空间数据库,并在此基础上展望其未来的发展方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号