共查询到10条相似文献,搜索用时 15 毫秒
1.
2.
提出一个Ontology与CBR集成的Web智能信息检索框架,该框架利用Ontology对Web页面进行语义标注、设计案例库,并利用CBR的推理能力对Web页面进行基于内容的推理分析.以旅游为示例,给出系统实现方案. 相似文献
3.
基于序列模式的个性化Web页面推荐模型* 总被引:1,自引:1,他引:0
易明 《现代图书情报技术》2008,24(8):42-47
基于数据挖掘中的序列模式方法,提出一种个性化Web页面推荐模型。该模型首先利用Web使用数据预处理提取Web交易事务集,然后应用序列模式算法挖掘频繁(连续)序列,最后通过构建频繁(连续)序列树生成用户偏好视图以生成个性化Web页面推荐集。 相似文献
4.
Web使用挖掘下的Web页面层次分类技术研究 总被引:1,自引:0,他引:1
Web使用挖掘研究用户访问行为所体现的行为特征,Web站点结构分析对于Web使用挖掘具有重要意义.本文讨论如何结合Web站点内页面间的超链结构和关键页面分析技术实现对Web站点的链接结构分析,得到清晰的站点拓扑结构和页面层次分类,进而以此为Web页面进行层次编码,和Web用户行为向量的建立方法,为准确表述用户的访问行为提供数据支持;用一种新的方式进一步有效的挖掘用户的行为特征.最后,把它同一些重要的页面分类方法,从算法的计算效率和页面分类的准确率上进行了比较,试验数据的分析表明,该方法在效率和准确率上有一定提高. 相似文献
5.
提出一个Ontology与CBR集成的Web智能信息检索框架,该框架利用Ontology对Web页面进行语义标注、设计案例库,并利用CBR的推理能力对Web页面进行基于内容的推理分析。以旅游为示例,给出系统实现方案。 相似文献
6.
7.
基于本体和DOM相结合的Web信息抽取器 总被引:1,自引:0,他引:1
针对基于Web页面信息本体的信息抽取不能准确划定抽取区域的缺点,设计基于本体和DOM相结合的Web信息抽取器。利用DOM树设计对样本页面信息项路径进行归纳学习的算法,该算法能准确划定信息抽取区域,降低页面噪声,实现对Web页面的预处理。实验表明,改进后的抽取方法提高了Web信息的抽准率。 相似文献
8.
9.
本文针对互联网上信息的日益海量增长的情况,在评述前期算法的基础上,提出了一种关键资源页面判定树的增量式更新算法.新算法使用Web页面的链接分析方法,选择合适的Web页面属性,并基于反例的统计信息来构造判定树的测试属性值,采用ID5R算法来处理训练样本不断增长的关键资源页面判定的机器学习任务.同时设计了适合于该算法的剪枝策略,它通过引入并实时更新反例样本比率并在其值低于抑制因子时停止分裂的办法,避免了树的过度增长与抗嗓能力差、泛化情况糟糕的情况.实验表明增量式更新算法能更高效地生成关键资源页面判定树.最后讨论了该算法的应用领域. 相似文献
10.
基于ID3分类算法的深度网络爬虫设计 总被引:1,自引:0,他引:1
针对目前Web信息挖掘中存在的信息覆盖率较低的问题,对网络爬虫系统进行研究,提出一种针对深度网络的、基于ID3分类算法的Web页面收集方法。对Web页面的特征进行分析、处理和分类,提取包含深度网页的表单,通过自动提交这些表单来进行更深和更广的页面获取,实验表明该方法可以有效减少现有搜索引擎的盲区,改善搜索结果。 相似文献