排序方式: 共有117条查询结果,搜索用时 15 毫秒
81.
82.
83.
84.
赵华茗 《现代图书情报技术》2011,(Z1)
针对传统的相似度计算方法在海量信息处理过程中暴露出的数据处理规模限制和性能不足等方面的瓶颈问题,以非结构化文档为研究对象,提出一种基于Hadoop分布式环境,结合Hive数据处理平台和PostgreSQL关系型数据库的文档相似度计算方法,并给出关键技术思路、具体实现步骤和实证研究,通过研究证明Hive SQL语言可有效简化分布式数据处理的复杂性,但实时性有待改进。 相似文献
85.
多媒体信息检索是根据相似性度量而不是精确匹配技术进行检索的。有效性是测量多媒体检索系统性能的一个主要参数,本文着重介绍了几种常见的有效性度量方法,讨论了各自的优点、缺点和适用性,并给出了一个新的有效性度量方法。 相似文献
86.
自我确认是人类肯定自我存在的一种意识行为。在地域规划设计中,设计的作品是否符合人们的观赏愿望,由观赏人群能否从设计作品中获取自我确认来决定。这种自我确证,很多时候成为地域规划的设计出发点与深化标尺。 相似文献
87.
从结构相似数看,贵州与上海的产业结构相似数低于全国平均水平,贵州与上海的就业结构相似程度极低;从就业弹性系数看,贵州第一产业对劳动力的依赖性很强,第二和第三产业增长对就业拉动作用较大;从比较劳动生产率看,贵州第二产业的比较劳动生产率大于第三产业,第三产业大于第一产业。 相似文献
88.
基于汉字聚类特征的中文字符串相似度计算研究 总被引:1,自引:0,他引:1
王静婷 《现代图书情报技术》2011,27(2):48-53
采用聚类分析的方法,对汉字的特征进行研究和分析,找出其内在规律,根据汉字具有“成簇性”的特点,对中文字符串进行精细化匹配,给出基于改进编辑距离的相似度计算模型。实验结果表明,该模型对中文字符串的相似度具有更为精细的体现。 相似文献
89.
直觉模糊集在处理模糊性、犹豫模糊性等不确定性方面比传统模糊集更灵活和实用,是模糊集的进一步推广。相似度是刻画两个(直觉)模糊集相似程度的工具,在直觉模糊多属性决策中有重要应用,但通过对现有文献中所采用的相似度方法进行分析,发现在某些情形下反映的相似度与实际相似度不符,为此给出一种新的相似度计算公式,据此提出基于直觉模糊相似度的逼近理想点排序(TOPSIS)法,并将其应用到多属性决策问题中,最后通过实例说明其合理性和有效性。 相似文献
90.
Metric space is a universal and versatile model of similarity that can be applied in various areas of non-text information retrieval. However, a general, efficient and scalable solution for metric data management is still a resisting research challenge. In this work, we try to make an important step towards such management system that would be able to scale to data collections of billions of objects. We propose a distributed index structure for similarity data management called the Metric Index (M-Index) which can answer queries in precise and approximate manner. This technique can take advantage of any distributed hash table that supports interval queries and utilize it as an underlying index. We have performed numerous experiments to test various settings of the M-Index structure and we have proved its usability by developing a full-featured publicly-available Web application. 相似文献