排序方式: 共有171条查询结果,搜索用时 17 毫秒
71.
72.
73.
乔建忠 《现代图书情报技术》2009,(Z1)
提出一种以动态知识库为指导的主题爬虫的设计方法,目的是克服传统的基于本体的主题爬虫的领域局限性和缺乏指导用户功能的不足;通过知识库的不断完善更好地指导爬虫找到相关网页.其中涉及的主要问题:构建动态知识库、计算网页相关度和判断相关链接. 相似文献
74.
《环境科学》旨在保护地球环境、支持可持续发展、维护生态平衡和改善人民生活质量。它与中国新时代的主要矛盾紧密相关,从生态环境建设层面解决人民对“美好生活需要”的问题,强化绿色发展的理念。因此,在本课程中引入新时代主流媒体中的重要素材,能够充实教师的教学素材,更好地启发学生的“爱国精神”。基于此,本文采用现代IT技术、整合ChatGPT工具和人工智能手段,从课程内容出发,提出了一种自动构建《环境科学》课程思政知识库的方法,解决该课程思政素材缺失的问题。该素材库通过与课堂整合,能有效提高学生的学习积极性和学习效果。 相似文献
75.
目前人类对于致病细菌、病毒的认识还停留在语义描述阶段,比较缺乏形象的、可视化的描述方式。因此也很难对病毒、细菌形成较深刻的印象。而且对于现有的致病性细菌、病毒也缺乏系统的可视化存储,这非常不利于人类对于致病性细菌、病毒的了解。在此需求下开发一个可视化基于内容的病毒检测系统可以很好解决上述问题。系统建设主要包括病毒图片获取、病毒图片特征提取、病毒库索引生成、病毒图片相似性分析对比、检索反馈及结果输出等功能模块。该系统可以通过爬虫等技术手段采集病毒图片,生成病毒库,从而对新型病毒或细菌进行基于内容的检索,从而有利于对病毒或细菌的种族、类型等进行研究和分析。 相似文献
76.
利用Python编程语言的Scrapy框架,为猫眼网站设计一个网络爬虫程序,对猫眼网页中《复仇者联盟4》的用户评论进行抓取。对抓取下来的网页信息进行信息提取,并将有用信息转换为dataframe格式存储到csv文件中;再将csv文件中的数据通过Pandas库进行提取排列,并利用Pyecharts库生成可视化图表的html页面;最后修改url中的setoff属性,通过改变starTtime的值,成功获取了更多评论。结果表明,比正常获取评论数的最大值990条多了16倍。 相似文献
77.
78.
刘东波 《濮阳教育学院学报》2014,(4):144-145
本文研究了远程教育个性化虚拟学习社区的设计与实现技术。该远程教育个性化虚拟学习社区核心功能模块主要有数字虚拟学习平台、综合门户和网络爬虫三个模块。学习者通过综合门户进入数字虚拟学习平台,通过可定制的网络爬虫掘取网上资源进行个性化学习。 相似文献
79.
由于现在Web上的信息量变得越来越大,单个的搜索引擎不可能包括整个网络的信息资源,网络爬虫的能力,索引数据库的大小,系统维护开销等,都限制了一个搜索引擎的查全率。因此,设计一个统一的搜索引擎查询界面,并能快速智能合并查询结果是一个挑战。针对现有单个引擎搜索的限制,提出了基于行块的正文摘要提取方法和基于词频的相似度模型实现了一个可扩展的多WEB源的网络爬虫,将现各搜索引擎上的网页信息进行抽取,过滤、去重、排序、信息重组,可以获得更全面更符合人们需要的、个性化的数据结果。系统的测试结果表明我们的方法是比较有效的。 相似文献
80.
仇明 《河北软件职业技术学院学报》2021,23(1)
教育关系到社会的每个群体,教育问题更容易引起社会的广泛关注。许多人习惯在一些热点论坛中进行教育类问题的咨询和留言,这些留言中包含了广大群众关注的热点。如果能够及时获取这些热点教育问题并做出相应的政策调整,将会极大地提高教育质量和效果。在实际工作中尝试通过爬虫程序获取某市寄语市长网站中近三年的教育类留言,统计出群众留言中的高频词语并绘制词云,获得社会关注的热点教育问题,从而为教育教学改革提供依据和参考。 相似文献