共查询到10条相似文献,搜索用时 31 毫秒
1.
2.
《西安文理学院学报》2016,(5)
传统的基于文本的检索方式无法精确地搜索图片,因此基于图像内容的检索技术应运而生.它利用图像哈希算法提取图像特征,通过量化压缩等方法产生一个标明图像指纹的哈希序列,对比哈希序列即可判定两张图像的相似度.主要从图像哈希算法的定义、原理、特点、应用等方面进行研究,并着重介绍和对比a Hash算法及p Hash算法. 相似文献
3.
针对专业搜索引擎的特点,对基于词频统计的网页去重算法进行了改进。改进后形成的基于专业搜索引擎的网页去重算法通过两步进行:首先,通过计算文档用词重叠度,判断文档中使用的专业关键词集合是否大致相同。第二步,在满足上一步判断基础上,进一步判断两篇文档在各专业关键词用词频率上是否相同。 相似文献
4.
海量数据的MapReduce相似度检测 总被引:1,自引:0,他引:1
张敏 《实验室研究与探索》2014,33(9):132-136
针对当前海量数据的相似重复问题,提出了MapReduce下通过SimHash算法检测相似文档的方法:即首先将存储在分布式文件系统的海量文档集进行分类,然后进行特征提取,由SimHash算法生成SimHash指纹和生成Sequence File;最后,计算相似度产生检测结果;通过实验测试可知,提出的检测方法和设计的相似度算法能很好适应海量数据相似检测,并能有效地提高工作效率。 相似文献
5.
6.
研究了基于Android平台的英文拼写检查工具的关键技术,拼写检查工具就是针对英文文档,可以帮助用户来检查编写的英文文档是否正确,并能够根据字符串相似性算法智能的针对错误给出相应的拼写建议,用户可根据给出的拼写建议来修改文档。Android平台的搭建过程以及在Android平台上编写程序应用的关键技术,及编写过程中出现的问题。 相似文献
7.
研究了基于Android平台的英文拼写检查工具的关键技术,拼写检查工具就是针对英文文档,可以帮助用户来检查编写的英文文档是否正确,并能够根据字符串相似性算法智能的针对错误给出相应的拼写建议,用户可根据给出的拼写建议来修改文档。Android平台的搭建过程以及在Android平台上编写程序应用的关键技术,及编写过程中出现的问题。 相似文献
8.
针对基于项目的协同过滤推荐算法(Item-CF)在处理高维项目评分数据时出现计算效率急剧下降的不足,提出一种将改进的多探寻局部敏感哈希算法(MPLSH)和Item-CF相结合的推荐算法。改进的MPLSH通过将待搜索哈希桶的探寻方式由原始的哈希值差异导向替换为由距离远近导向,从而减少MPLSH需要探寻哈希桶的个数,缩小了Item-CF中相似项目集合的查找范围。并利用MPLSH本身具有的高效数据降维特性,提高Item-CF在高维项目评分数据中寻找相似项目集合的速度,从而有效改善Item-CF在处理高维项目评分数据时计算效率下降的问题。通过在MovieLens电影评分数据集上进行实验和算法比较,验证了该算法的有效性。 相似文献
9.
本文详细分析几种字符串模式匹配算法如BF、KMP、BM。通过上机实验对这些算法的平均查找时间和匹配次数进行测试,结果表明在这些字符串模式匹配算法中BM算法是最快的算法。 相似文献
10.
对字符串模式匹配KMP算法的探讨 总被引:3,自引:0,他引:3
蒋文沛 《南宁师范高等专科学校学报》2001,18(2):72-74
本文通过对字符串模式匹配算法BF与KMP的分析 ,提出了改进KMP算法的方法 ,并通过复杂性分析和上机实验 ,得出在字符串模式匹配时 ,改进后的算法KMPA比算法KMP更有效 相似文献