排序方式: 共有86条查询结果,搜索用时 31 毫秒
61.
62.
将项目权值引入传统关联规则挖掘中是在项目属性上的扩展。本文分析项目权值对加权关联规则挖掘的影响,并对加权关联规则现有的算法进行总结,同时比较各算法的优缺点。最后对加权关联规则的未来研究发展方向进行探讨。 相似文献
63.
本地差分隐私(LDP)频率估计是数据挖掘领域的一个重要组成部分,目的是在满足LDP的前提下计算特定数据项出现的频率。在基于云服务的应用中,LDP频率估计实现了数据采集过程与数据分析过程的隐私保护,可应用于频繁模式挖掘、恶意攻击检测等。但是LDP频率估计存在随机化噪声较多、依赖数据量较大、高维数据分析准确性较低等缺点。介绍LDP频率估计过程及其存在的性能分析问题,详细讨论LDP频率估计算法,主要包括单值频率估计方法、泛化频率估计方法、集合数据频率估计方法,并对下一步研究方向提出建议。 相似文献
64.
运用图示法自动提取中文专利文本的语义信息 总被引:1,自引:0,他引:1
[目的/意义]提出利用图结构的表示法自动挖掘中文专利文本的语义信息,以为基于文本内容的专利智能分析提供语义支持。[方法/过程] 设计两种运用图结构的模型:①基于关键词的文本图模型;②基于依存关系树的文本图模型。第一种图模型通过计算关键词之间的相似性关系来定义;第二种图模型则由句中所提取的语法关系来定义。在案例研究中,借助频繁子图挖掘算法,对所建图模型进行子图挖掘, 并构建以子图为特征的文本分类器,用来检测所建图模型的表达性和有效性。[结果/结论]将所建的基于图模型的文本分类器应用于4个不同技术领域的专利文本数据集,并与经典文本分类器的测试结果相比较而知:前者在使用明显较少的特征数的基础上,分类性能较后者提升2.1%-10.5%。由此而推断,使用图结构的表达法并结合图挖掘技术从专利文本中所提取的语义信息是有效的,有助于进一步的专利文本分析。 相似文献
65.
杜永生 《济宁师范专科学校学报》2011,(6):76-78
针对CMAR算法存在的不足,提出了层次频繁模式树的概念,并在此基础上实现了关联分类数:。据挖掘算法.实验数据表明,该方法比CMAR算法具有更高的效率与数据库覆盖面. 相似文献
66.
67.
针对传统的Apriori算法需要产生大量的候选项目集和多次扫描数据库的不足,提出了一种新的基于内积运算的频繁项集生成算法。该算法对事务数据库布尔化表示,通过内积运算搜寻矩阵行向量直接生成频繁项集,打破了频繁项集必须从低次到高次的局限,当频繁项集可能是大项集时,大大提高了搜索效率。 相似文献
68.
随着国家对学前教育的重视,学前教育事业得到了空前发展。但相应地出现了较多问题,私立幼儿园的发展问题就是其中之一。而私立幼儿园教师的流动频繁问题在众多私立幼儿园办园问题中更为突出。本文就这一问题进行探讨,分析了私立幼儿园教师流动频繁的原因,在此基础上提出了相应的对策。 相似文献
69.
介绍了Web日志挖掘的模型,分析了使用关联规则挖掘Web日志时遇到的规则数量大且存在冗余等问题,提出了基于频繁闭项集的挖掘办法来减少规则数量.同时引入最小关联规则的概念,从而避免了冗余规则的产生.最后用实验验证了算法的有效性,并以周口师范学院校园网为例,对该网站日志数据进行分析,得到了有价值的规则,并对该网站提出了相应的建议和意见. 相似文献
70.