首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 500 毫秒
1.
HTML语言及其在图书馆中的应用   总被引:7,自引:0,他引:7  
本文简要论述了 HTML 语言、Homepage、HTML 的文件格式结构以及图书馆 Homepage 制作的内容、形式、方法和页面风格等等。  相似文献   

2.
杨郁霞 《编辑学报》2019,31(3):316-319
通过PC端对中国高校科技期刊研究会网站的438种中文会员期刊网站的HTML应用情况进行了调查,调查内容主要包括实行HTML的期刊数量,以及HTML界面形式、链接方式、扩展服务功能和使用量。结果表明:仅78种期刊实行HTML阅读模式;界面形式以三栏为主;链接内容的同质性较严重,且链接目标较单一;扩展服务功能不完善;多数期刊的HTML浏览量低于PDF下载量。从3个方面阐述提升HTML应用价值的策略,即提高期刊应用普及度、增强读者黏性、充分发挥各数据主体的作用。  相似文献   

3.
图书馆移动阅读服务的新契机:HTML5和CSS3   总被引:2,自引:0,他引:2  
针对移动阅读环境和用户需求的变化与现有移动Web标准规范如WAP、WML、XHTML-MP对移动Web发展的不适应,以及图书馆在旧的移动Web标准规范框架下的移动阅读服务在内容、应用架构、服务模式方面的诸多困境,用文献调研和实验验证的方法研究新的Web标准规范HTML5和CSS3的新特性和功能及其相对应旧标准的优点,从HTML5和CSS3对图书馆上游的数字出版领域和图书馆下游的用户需求的直接影响的角度,探讨HTML5和CSS3为图书馆移动阅读服务带来的新契机,得出HTML5和CSS3可使图书馆的移动阅读服务在内容、应用架构、服务模式方面得到提升和变革的结论。  相似文献   

4.
HTML到XML转换技术的研究与实现   总被引:2,自引:0,他引:2  
网络上大多数的信息都是用HTML写的,这种语言不能处理网络上的很多需求,因为它只是一种用于浏览信息的语言,不能表达数据本身,网络还没有形成一个良好的结构化文档的存贮,而只是一个可变的HTML页的聚集,我们迫切希望来自网络资源的信息以一种结构化的方式来存贮。XML和它的各种扩展功能如数据模型、查询语言等是实现结构化方式的一种,是一种元语言,可以弥补很多HTML的不足。未来的网页会使用具有很好结构化的XML语言,但是现在这一阶段是过渡阶段,必须思考一种方法来实现HTML到XML的转换.以更好地利用网络资源。本文提出了一种实现HTML到XML转换的方法。  相似文献   

5.
针对抽取中文网页正文的传统方法的不足,提出一种基于统计的中文网页正文抽取方法.该方法首先利用DOM树计算文本结点的文本密度,即文本长度与HTML源码长度之比,再利用贝叶斯判别准则计算密度区分阈值,最后根据文本密度与密度区分阈值的比较结果抽取正文,即大于密度区分阈值的结点就判定为正文文本结点,小于或等于密度区分阈值的结点则判定为非正文文本结点,将所有判定为正文文本结点的文本连接起来即为要抽取的网页正文.通过使用中文新闻类网页对该方法的有效性进行验证,结果表明:该方法虽然简单,但是抽取准确率极高且易于实现.  相似文献   

6.
SGML、HTML、XML的比较   总被引:2,自引:0,他引:2  
随着信息网络的飞速发展,相继产生了SGML、HTML和XML三种标记语言,了解和掌握它们之间的联系和区, 利于利用通用方式和元标识语言对电子文献的结构进行正确标记,实现对各类文献结构和内容的系统化标准化描述,从而建立起通用数字化文献。本文对三种标记语言SGML、HTML和XML的相同点和不同点进行了比较,指出XML是目前最易掌握和功能最强的标记语言。  相似文献   

7.
新闻链接     
《中国传媒科技》2004,(2):58-64
手机浏览器技术的研发将使手机真正成为网络终端摩托罗拉公司和挪威的Opera公司于近日宣布,它们将联合开发利用HTML和WAP二种技术的手机浏览器产品。据Opera公司的CEO斯蒂芬逊称,由摩托罗拉公司全球软件集团开发的WAP软件将与Opera公司的HTML浏览器软件整合。新开发的浏览器将运行在运营商现有的WAP基础设施上,同时还能够提供HTML内容。 Opera公司的HTML浏览器支持标准HTML和许多网站使用的非标准HTML,以及在移动装置中使用的基于WAP的XHTML标准、I-mode技术使用的cHTML标准。 斯蒂芬逊表示,摩托罗拉和Opera已经在该…  相似文献   

8.
一种基于网页分割的Web信息检索方法   总被引:2,自引:0,他引:2  
提出一种基于网页内容分割的Web信息检索算法。该算法根据网页半结构化的特点,按照HTML标记和网页的内容将网页进行区域分割。在建立HTML标记树的基础上,利用了的内容相似性和视觉相似性进行节点的整合。在检索和排序中,根据用户的查询,充分利用了区域信息来对相关的检索结果进行排序。  相似文献   

9.
[目的/意义] 针对当前非正式信息交流主题演化研究在分析层次和测度指标两方面存在的局限,提出一种具有通用性的演化分析方法,从微观和中观层面探究主题演化特征与规律。[方法/过程] 引入会话分析理论,以新浪微博和知乎为例,通过对主题和主题簇运行过程进行分析,从会话内容和讨论方式两个维度揭示非正式信息交流演化特征与规律。同时,设计主题持续性计算判定方法,丰富主题演化的衡量标准。[结果/结论] 主题演化分析结果显示新浪微博和知乎意见群体的发文主题存在明显偏重,且表明了意见群体参与社会焦点事件讨论中观点的主要切入角度;主题簇演化分析发现了新浪微博意见群体在一定范围内发散探索多元主题、知乎意见群体始终关注聚焦核心主题的讨论特点。两个社交媒体中意见群体在会话内容和讨论方式方面的区别,喻示了新浪微博和知乎在网络环境的非正式信息交流中主要承担的角色差异。  相似文献   

10.
HTML向XML转换的研究*   总被引:5,自引:0,他引:5  
分析HTML和XML的特点、论述了HTML向XML转换的必要性、介绍了转换的有关原理、方法和工具。  相似文献   

11.
利用web文档的半结构化信息,提出一种基于DOM的web文本分割算法。该算法充分挖掘web网页中控制网页内容结构和显示的HTML标签信息,构建HTML DOM树。首先通过改进传统的平面文本分割方法,使之适用于web文本分割;然后利用DOM树中的节点平滑平面文本分割的结果,初步实验表明该算法能有效提高web文本分割的精确度。  相似文献   

12.
DC与图书馆Web信息发布   总被引:8,自引:0,他引:8  
从网络信息资源查询存在的问题入手, 介绍了DC (Dublin Core 都柏林核心集) 产生的原因及发展状况, 分析了DC (都柏林核心集) 的内容及特点, 阐述了DC (都柏林核心集) 对于图书馆Web 信息发布的作用并给出在基于HTML 及XML 两种网络语言下DC 的描述方法。  相似文献   

13.
14.
HTML5 is the newest revision of the HTML standard developed by the World Wide Web Consortium (W3C). This new standard adds several exciting news features and capabilities to HTML. This article will briefly discuss the history of HTML standards, explore what changes are in the new HTML5 standard, and what implications it has for information professionals. A list of HTML5 resources and examples will also be provided.  相似文献   

15.
HTML5: a new standard for the Web   总被引:2,自引:0,他引:2  
HTML5 is the newest revision of the HTML standard developed by the World Wide Web Consortium (W3C). This new standard adds several exciting news features and capabilities to HTML. This article will briefly discuss the history of HTML standards, explore what changes are in the new HTML5 standard, and what implications it has for information professionals. A list of HTML5 resources and examples will also be provided.  相似文献   

16.
为了减少或根除新闻网站中大量非主题信息的干扰,提出一种新闻网页抽取方法,采用基于熵的计算和DOM树的知识,从新闻网页中抽取主题文档和相关链接。  相似文献   

17.
利用引文内容进行主题级学科交叉类型分析   总被引:1,自引:0,他引:1  
[目的/意义]针对学科交叉宏观研究不能刻画学科交叉主题,以及学科交叉微观研究仍处于主题挖掘研究阶段的现状,从内容层面解决主题学科交叉度计算问题,并构建学科交叉分类的量化标准。[方法/过程]首先,采集学术论文并解析引文内容;利用术语集获取术语和术语主题。然后,统计引文内容中的主题术语重复率。接着,计算学科间的主题学科交叉度。最后,基于主题学科交叉度分布熵,进行分类并分析。[结果/结论]研究结果表明:①六个学科难以与医学在实践应用知识层面进行学科交叉;医学的理论基础与六个学科有明显的学科知识交叉。②学科交叉存在三种类型分别为:界内交叉、工具型交叉和界外交叉。综上,通过引文内容中的术语可以有效地计算主题学科交叉度,定量地研究学科交叉类型。  相似文献   

18.
基于本体和DOM相结合的Web信息抽取器   总被引:1,自引:0,他引:1  
针对基于Web页面信息本体的信息抽取不能准确划定抽取区域的缺点,设计基于本体和DOM相结合的Web信息抽取器。利用DOM树设计对样本页面信息项路径进行归纳学习的算法,该算法能准确划定信息抽取区域,降低页面噪声,实现对Web页面的预处理。实验表明,改进后的抽取方法提高了Web信息的抽准率。  相似文献   

19.
Rich HTML可通过内容分析、知识标引,以及文字、图、表的结构化,实现碎片化条件下的深阅读。文章对Rich HTML的基本原理、特点及其在国内外医学期刊中的应用情况进行了研究,同时结合《检验医学》应用Rich HTML进行网络传播的实践,分析目前中文医学期刊在应用Rich HTML中存在的人员资金、链接版权、功能拓展等问题,以期为Rich HTML在医学期刊网络出版中的应用提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号