首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
叶子 《学生电脑》2007,(12):I0019-I0019
每个人都有独一无二的指纹。而每一个文件,不论是圆片还是程序,也有一个独一无二的“指纹”哦。这个指纹叫做MD5码。 MD5其实是一种算法,把任伺二个又件通过MD5算法计算,都会得到一串32位的字符串,这个包含了数字和字母的字符串就是MD5码。  相似文献   

2.
传统的基于文本的检索方式无法精确地搜索图片,因此基于图像内容的检索技术应运而生.它利用图像哈希算法提取图像特征,通过量化压缩等方法产生一个标明图像指纹的哈希序列,对比哈希序列即可判定两张图像的相似度.主要从图像哈希算法的定义、原理、特点、应用等方面进行研究,并着重介绍和对比a Hash算法及p Hash算法.  相似文献   

3.
张艳 《教育技术导刊》2012,11(4):138-141
针对专业搜索引擎的特点,对基于词频统计的网页去重算法进行了改进。改进后形成的基于专业搜索引擎的网页去重算法通过两步进行:首先,通过计算文档用词重叠度,判断文档中使用的专业关键词集合是否大致相同。第二步,在满足上一步判断基础上,进一步判断两篇文档在各专业关键词用词频率上是否相同。  相似文献   

4.
海量数据的MapReduce相似度检测   总被引:1,自引:0,他引:1  
针对当前海量数据的相似重复问题,提出了MapReduce下通过SimHash算法检测相似文档的方法:即首先将存储在分布式文件系统的海量文档集进行分类,然后进行特征提取,由SimHash算法生成SimHash指纹和生成Sequence File;最后,计算相似度产生检测结果;通过实验测试可知,提出的检测方法和设计的相似度算法能很好适应海量数据相似检测,并能有效地提高工作效率。  相似文献   

5.
为了实现高效、快速的商标自动评审工作,提出将商标文字通过字形编码、拼音编码等方式映射为数字型字符串和字母型字符串的辨识算法。算法依照字形和拼音描述商标信息,配合改进后的Jaro Winkler distance算法计算出商标文字的字形相似度和拼音相似度,并根据相似匹配算法得出商标文字的相似程度。实验结果表明,该方法所得结果有更好的辨识率,符合常规人体视觉和逻辑判断。  相似文献   

6.
李顺 《电大理工》2013,(3):79-80
研究了基于Android平台的英文拼写检查工具的关键技术,拼写检查工具就是针对英文文档,可以帮助用户来检查编写的英文文档是否正确,并能够根据字符串相似性算法智能的针对错误给出相应的拼写建议,用户可根据给出的拼写建议来修改文档。Android平台的搭建过程以及在Android平台上编写程序应用的关键技术,及编写过程中出现的问题。  相似文献   

7.
李顺 《电大理工》2014,(3):79-80
研究了基于Android平台的英文拼写检查工具的关键技术,拼写检查工具就是针对英文文档,可以帮助用户来检查编写的英文文档是否正确,并能够根据字符串相似性算法智能的针对错误给出相应的拼写建议,用户可根据给出的拼写建议来修改文档。Android平台的搭建过程以及在Android平台上编写程序应用的关键技术,及编写过程中出现的问题。  相似文献   

8.
针对基于项目的协同过滤推荐算法(Item-CF)在处理高维项目评分数据时出现计算效率急剧下降的不足,提出一种将改进的多探寻局部敏感哈希算法(MPLSH)和Item-CF相结合的推荐算法。改进的MPLSH通过将待搜索哈希桶的探寻方式由原始的哈希值差异导向替换为由距离远近导向,从而减少MPLSH需要探寻哈希桶的个数,缩小了Item-CF中相似项目集合的查找范围。并利用MPLSH本身具有的高效数据降维特性,提高Item-CF在高维项目评分数据中寻找相似项目集合的速度,从而有效改善Item-CF在处理高维项目评分数据时计算效率下降的问题。通过在MovieLens电影评分数据集上进行实验和算法比较,验证了该算法的有效性。  相似文献   

9.
本文详细分析几种字符串模式匹配算法如BF、KMP、BM。通过上机实验对这些算法的平均查找时间和匹配次数进行测试,结果表明在这些字符串模式匹配算法中BM算法是最快的算法。  相似文献   

10.
对字符串模式匹配KMP算法的探讨   总被引:3,自引:0,他引:3  
本文通过对字符串模式匹配算法BF与KMP的分析 ,提出了改进KMP算法的方法 ,并通过复杂性分析和上机实验 ,得出在字符串模式匹配时 ,改进后的算法KMPA比算法KMP更有效  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号