首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
由于当前信息抽取系统因知识库结构和内容的不同带来的搜索质量问题,将本体引入信息抽取中,有助于信息抽取系统对领域内的概念和概念之间的联系的统一认识,为用户提供更有价值的信息。提出了基于本体的文本信息抽取算法,通过本体元素描述抽取的文本信息。最后,利用此算法对某领域样本Web页面进行抽取并分析。实验表明性能有所提高。  相似文献   

2.
基于URL路径的Web信息检索模型的研究   总被引:1,自引:0,他引:1  
Web的结构信息可以揭示许多蕴涵在Web内容之外的隐含的有用信息,如Web页面的URL可以反映页面的类型,也可以在一定程度上反映页面间在存储位置和内容方面的层次关系。详细介绍了一种基于URL路径的个性化Web智能信息检索模型以及实现方法。  相似文献   

3.
随着网络招聘的普及,求职者需要浏览和筛选的数据越来越多,如何从大量的、非结构化的网络信息中快速而准确地抽取需要的信息非常重要。基于VIPS视觉分割算法,利用网页所呈现出来的布局结构和视觉特征,对招聘页面进行视觉分割处理,在页面分割的基础上,抽取特定块内的文本信息,实现了关键词查找抽取感兴趣的视觉块内信息。实验结果表明,基于VIPS的职位信息抽取技术能够有效抽取出招聘页面内重要的文本信息,优化了信息抽取结果。  相似文献   

4.
基于Web超链接结构信息的网页分类技术研究   总被引:1,自引:0,他引:1  
充分利用相邻网页(包括链人和链出)的相关信息,提出一种基于Web超链接结构信息的网页分类改进方法.其方法分为5步:(1)预处理训练集,提取文本信息和超链接结构信息;(2)抽取特征向量和训练一个Web页面的全文本分类器;(3)根据网页的各个人口的锚点文本和扩展锚点文本创建虚文档,用虚文档代替Web页面全文本训练一个虚文档分类器;(4)利用Naive Bayes方法协调两个分类器得到初步分类结果;(5)利用链出网页对初步分类结果进行修正,得到最终分类结果.根据改进方法实现了网页自动分类原型系统,并进行分类实验,实验表明该方法有效提高了分类性能.  相似文献   

5.
Web网页作为巨大的数据资源,其页面信息的提取也成为研究的热点之一。通过对XML特点的分析,利用HTML Tidy将HTML文档转换成XML文档,讨论了基于XML的Web数据的提取方法,将其中有用的信息存储到数据库中,实现Web页面信息的提取。  相似文献   

6.
本文阐述了制作Web页面,创立Web服务器,包括应用ASP.NET(Active Sever Page)技术实现应用服务器和应用Access创立数据库,构建一个基于Internet的互动式电路实验教学平台。客户机的资源接受结构采用www的Web页面的形式实现,其架构是通过信息传递机制对话,由客户端发出请求,通过ASP程序将消息传送给服务器,服务器与数据库建立连接进行相应的处理,经传递机制将结果传回客户端,再以Web页面的形式显示出来。整个网站设计体现出在线学习,在线答疑,在线实验仿真分析与设计等特点。  相似文献   

7.
为了提高语义Web服务的发现性能,从Web服务描述上下文中抽取语义标注的约束信息并生成新的更精确的语义标注,从而减少语义标注与参数之间的语义偏差,精化Web服务的语义描述.首先,从本体定义中抽取概念的约束模板,并对Web服务的描述文本进行句法分析;然后,根据约束模板,从句法分析树中抽取语义标注的约束信息,并构造新的概念表达式作为对应参数的新的语义标注.最后,提出了一种新的语义相似度度量方法以度量概念表达式的相似度.实验结果表明:该方法能够提高语义Web服务发现的平均准确率,且计算代价相对较小.从描述文本中抽取概念的约束信息,能够减少标注的语义偏差,更精确地表达语义Web服务的语义,提高Web服务的发现性能.  相似文献   

8.
提出一个Web页面个性化搜索系统架构,给出了系统中用户个性化信息存储方法;设计了关键字个性化推荐和页面排名个性化算法。  相似文献   

9.
基于Web的多媒体CAI课件是多媒体CAI课件与Web技术的结合.它将成为网络教学多媒体CAI课件的主要形式.本文介绍了在基于Web的多媒体CAI课件开发过程中对课件页面进行页面优化的方法.  相似文献   

10.
引入一种新的基于词频的数据自动检索网页的模型,它结合Web页面使用了全新的特征词汇提取公式,在保持精确率的情况下同时获得较高回现率,为精确描述Web页面提供了依据.同时该模型还能减少检索中存在的一致性的问题,简化Web页面索引维护工作量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号