首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
余润海 《考试周刊》2009,(24):181-181
本文首先介绍了Web结构挖掘技术在Web中的应用,其次陈述了Web结构挖掘技术中的经典链接分析算法PageRank,最后分析了PageRank在网页搜索中具体实现的方法。  相似文献   

2.
基于Web的网页信息抽取方法的研究   总被引:3,自引:0,他引:3  
WWW的迅速发展,使其日益成为人们查找有用数据的重要来源。本文介绍了一种基于Web的信息抽取的实现方法,能够按照规则模式重复地将半结构化网页中的信息自动抽取出来。  相似文献   

3.
Web社区是Web组织中非常重要的信息,将其用于信息搜索策略中可从本质上改善信息检索的结果,为用户提供潜在、及时、准确的信息;如何发现这些高精度的社区,进而快速从网上找到更多关于某一主题的网页是Web数据资源挖掘领域的热点.本文提出了一种多尺度语义Web社区提取算法,该算法很好的将语义信息融入到传统的社区模型中.实验表明,该算法提取的社区精度高,且漏检率较低,社区结构与其所对应的语义产生了较好的映射关系.它为信息检索的社区化奠定了重要的理论基础.  相似文献   

4.
重点研究了HITS算法,并且在原有算法的基础上对其进行了改进。对搜索出的信息利用改进的HITS算法确定了权威Web页面,有效地去除了无效网页。  相似文献   

5.
互联网的一个重要性质是网络中的网页信息随时发生着更新。在Web信息迅速增长的今天,网页更新的预测和确定成为了一个备受关注的课题。介绍了作为网页更新预测模型的泊松模型,并根据该模型的各种缺陷分析对网页更新预测算法的现状进行了阐述,同时对未来的研究方向进行了展望。  相似文献   

6.
基于Web超链接结构信息的网页分类技术研究   总被引:1,自引:0,他引:1  
充分利用相邻网页(包括链人和链出)的相关信息,提出一种基于Web超链接结构信息的网页分类改进方法.其方法分为5步:(1)预处理训练集,提取文本信息和超链接结构信息;(2)抽取特征向量和训练一个Web页面的全文本分类器;(3)根据网页的各个人口的锚点文本和扩展锚点文本创建虚文档,用虚文档代替Web页面全文本训练一个虚文档分类器;(4)利用Naive Bayes方法协调两个分类器得到初步分类结果;(5)利用链出网页对初步分类结果进行修正,得到最终分类结果.根据改进方法实现了网页自动分类原型系统,并进行分类实验,实验表明该方法有效提高了分类性能.  相似文献   

7.
提出了一种轻量级的Web站内检索系统及相关实现技术,给出了该系统的结构和相关实现细节,包括网页的获取、Web页面的分词和相似度的计算等.可以为指定的Web网站提供服务,根据关键字检索该网站内的相关网页.实验表明该系统性能良好,大大提高了用户信息获取的效率.  相似文献   

8.
在分析所有路径算法的研究现状基础上,通过两点间所有路径算法的设计与实现,把该算法封装在Web服务里面,结合百度地图的不足,介绍了两点间所有路径Web服务在校园旅游路线中的应用.调试的结果表明:该Web服务是一种软件中间件,网页设计者可以利用该Web服务进行网页开发,从而提高网页的开发效率.  相似文献   

9.
RB 《中学生电脑》2003,(3):18-18
WWW(World Wide Web),中通常称为万维网(或全球网)。创建WWW是为了解决Internet上的信息传递问题。随着本、图像、影像、声音和交互方式应用程序的统一.WWW已经成为信息交换的一种很有效的方式,WWW之所以如此流行.是因为它克服了Web浏览器出现之前许多应用程序的缺点。而Web站点提供信息的基础是网页.下面就是几种常见的网页语言。  相似文献   

10.
一种基于超级链接结构的WWW模糊聚类算法   总被引:2,自引:0,他引:2  
搜索引擎是目前最主要的WWW信息检索的工具,然而,用户对当前搜索引擎的检索效果并不满意。论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软)矣类算法HTSC。对HTSC算法进行了理论分析,并对其中的核心算法进行了初步的实验验证。该算法可对搜索引擎返回的结果进行模糊聚类,以方便用户从中找到真正需要的信息。  相似文献   

11.
作为垂直搜索的关键技术之一,网页结构化信息抽取近年来得到越来越多的关注.网页结构化信息抽取通过打碎网页,从中提取"精细化"、"条目化"的信息,存储在数据库中,通过对数据库的查询达到垂直搜索"精准"的目的.已有的方法大多是基于规则的模型和基于隐马尔可夫的模型,这些方法要么依赖特定网页结构,适用性差;要么依赖大量的训练样本,训练效率低.结合垂直搜索特定领域特征词数量有限的特点和统计方法,提出基于特征词统计的结构化信息抽取技术,解决了只能抽取特定HTML标记节点和单个信息块的问题,关键信息块的抽取平均准确率为97%.  相似文献   

12.
基于Web的多媒体课件是多媒体课件与Web技术相结合的产物.从页面下载优化、图形的优化处理、表格的优化处理、兼容性的优化等几个方面,介绍了在基于Web的多媒体课件开发过程中对课件页面进行优化的原则和方法.  相似文献   

13.
网页设计是计算机专业教学中一门实用性、综合性很强的课程,该课程理论与实践紧密结合,对学生的实践能力要求很高,因此上机课对学生掌握这门技术至关重要。针对学生在网页制作过程中如何妥善解决遇到的困难和问题,最终制作出优秀的网页,根据笔者多年的教学和实践经验,总结出教师在上机指导过程中需重点把握的几个问题。  相似文献   

14.
Web中存在着大量的、丰富的超链接.挖掘链接结构可以有助于提高Web信息检索的精度、发现潜在的Web社区.全面分析了基于Web链接结构的挖掘算法及其优缺点.并对挖掘算法在Web潜在社区发现中的应用作了探讨.  相似文献   

15.
国外网站易访问性研究综述   总被引:2,自引:0,他引:2  
网站易访问性是残疾人群和老年人群通过互联网(Internet)获取信息和进行学习的必要条件,在国际上网站易访问性的研究已经成为网站设计、开发、评价和维护的热点。本文介绍网站易访问性的相关概念和国外网站易访问性的相关法律、易访问性设计、评价标准,以期在我国网站设计和开发中引起重视。  相似文献   

16.
网络环境下教学与管理的有关问题探讨   总被引:5,自引:1,他引:5  
网络教育是实施教育终身化、教育大众化的有效途径和重要战略,制定切实可行的教学计划,使其具有适合网络教育特点并与当地经济发展的实际相联系是极其重要的。网络教育是一种新的教育方式,必须设计适合其特点的教学方案,这是网络教育顺利发展的基本的必要的条件;网络教育要以学生为中心,在教学管理中要明确:管理就是服务。  相似文献   

17.
在讨论Web使用挖掘在网络学习中的应用过程中,提出一种改进的基于向量的聚类算法.在算法中,首先以学习站点的URL为行、以UserID为列建立页面用户关联矩阵,元素值为学习者的访问次数,然后使用欧氏距离进行度量向量之间的相似性,对列向量进行相似性分析得到相似学习者群体,对行向量进行相似性度量获得相关Web页面.分析表明,Web使用挖掘在网络学习中的应用是可行、有效的.  相似文献   

18.
数据库驱动的Web站点根据查询产生的Web页结构布局都是极其相似的;现有的Web提取方法忽视或者忽略了这种相似性,因而在提取效率性能和通用性上都有较大的限制。本文提出一种基于标签树相似度的模板自动学习方法;进而根据模板来提取这类网页的数据;并利用Eclipse和开源HTML Parser对算法进行了实现;实验结果表明该算法具有较快的提取速度和较好的准确率。  相似文献   

19.
随着Internet的日益剧增,如何有效地对浩如烟海、形态各异的网页进行有效分类,以便人们能快速准确地获取所需的信息,已成为网络应用的一个重要的研究领域。本文在分析总结网页分类特征的基础上,提出了一种改进的基于特征选择的网页分类方法。该方法能够改善网页分类的精度,对此通过实验进行了验证。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号