首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
电子政务主题词表是电子政务信息的组织和检索的重要语义工具。传统手工编制叙词表的方法耗费大量人力、物力,成本高、历时长,已不再适用于网络环境。本文拟以共青团电子政务词表为例,探讨用计算机自动构建叙词表的方法。主要技术要点包括:利用N-gram方法进行选词、结合Dice测度、相似度算法、模式匹配等多种技术来自动识别词汇的等同、等级和相关关系。最后评测了自动构建的电子政务主题词表的性能。  相似文献   

2.
网络环境中汉语叙词表的自动构建研究   总被引:2,自引:0,他引:2  
为解决网络信息检索效率低的问题,需要把叙词表等控制机制引入到网络检索系统中,但传统词表编制方式已经不能满足网络信息检索的需要.本文制定了一种汉语叙词表自动构建方案,以财税领域为例,采用模式识别、词聚类、同现分析等自然语言处理技术实现自动识别词间等同关系、等级关系和相关关系,从而构建一部财税领域叙词表,最后对所构建的叙词表进行测评.相比传统叙词表编制方法,自动构建叙词表能降低编表专家的智力负担,而且编表时间短,费用低,时效性强,符合普通用户的检索习惯.但对词间关系的识别不如人工编表时精当可靠,所以需要人工辅助判定.  相似文献   

3.
基于聚类分析的自然语言叙词表的自动构建   总被引:1,自引:0,他引:1  
叙词表为信息标引和检索提供恰当的词汇选择及概念语义关系.手工编制词表费事费时,智力要求高,难以克服认知瓶颈.词表自动构建另辟蹊径,通过统计挖掘语料库中潜在的词汇语义关联.构建方法主要有合并现有词表、用户生成词表、通过语法分析自动构建词表、通过同现分析自动构建词表等.其中通过同现分析构建自然语言词表方法分为词汇收集、关联度计算、聚类分析三个阶段,该方法具有良好的应用前景,对中文信息检索系统具有重要的借鉴意义.  相似文献   

4.
论文分析了叙词表在我国电子政务信息资源组织中的应用,比较了电子政务中的叙词表和本体的区别与联系,并探讨由电子政务叙词表向电子政务本体转换的可能性和具体方法.最后以<综合电子政务主题词表>为基础,运用Protege软件构建电子政务本体样本.  相似文献   

5.
������ʱ����峡�������   总被引:4,自引:0,他引:4  
通过对我国已出版的多部叙词表的调查分析,认为汉语叙词表语义场的构成有其一定的特点和规律,等同义场和相关义场的构造是汉语叙词表编制的薄弱环节。介绍自然语言叙词表的特点及计算机自动构造的三种方法,指出基于文本的叙词表自动构造方法与汉语的词法相结合,将有助于对汉语叙词表等同义场、等级义场和相关义场的构建。  相似文献   

6.
用传统分类法、叙词表编制机构Taxonomy 的实证研究   总被引:1,自引:0,他引:1       下载免费PDF全文
Information Studies Taxonomy的编制以新加坡南洋理工大学黄金辉传播与信息学院信息学系为实施机构,以杜威法和三部叙词表为结构库和词库,调查了杜威法和三部叙词表作为机构Taxonomy构建资源的充分性及其在主题分面编制中的作用,同时探讨了用传统分类法和叙词表编制机构Taxonomy类表的步骤与方法.该研究虽然在英文语境下进行,但所运用的思路与方法对于中文环境下机构Taxonomy的编制也是有借鉴意义的,其研究方法与研究结论对于在中文环境下用传统分类法、叙词表编制机构Taxonomy的研究也有推动作用.表2.参考文献7.  相似文献   

7.
指出网络化、数字化的信息环境影响着用户的信息需求,从而使叙词表的编制方法、技术和手段发生变革;合理、有效和灵活的叙词表编制体系将对网络信息的组织、检索等服务具有重要的支撑作用。阐述网络环境下叙词表的协同编制机制,分析网络环境下叙词表的基本特征,以此构建叙词表协同编制平台,对叙词表的编制系统进行优化。  相似文献   

8.
叙词表的主题规范控制在网络环境下依然不可或缺,编制标准对于促进叙词表编制的规范化和词表之间的数据交换与共享具有重要作用.我国叙词表编制最新标准GB/T 13190.1-2015《信息与文献叙词表及与其他词表的互操作第1部分:用于信息检索的叙词表》使用重新起草法,修改采用ISO25964-1:2011编制.新标准的实施将为我国传统叙词表的网络知识组织适应性改造和新叙词表的编制提供指南和方向,本文对该标准的修订背景、基本思路、编制风格和内容特点等进行梳理与分析.  相似文献   

9.
查贵庭  侯汉清 《情报学报》2002,21(3):273-277
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。  相似文献   

10.
介绍了中国和澳大利亚电子政务词表分类体系转换的试验。阐明了词表转换的现实意义和作用,并介绍了目前关于词表转换的研究成果和方法,以及方法选择的原因,分析了转换结果。  相似文献   

11.
数据驱动下,与日俱增的电子政务信息资源愈发表现出多源异构的特性,基于大规模语料设计一套电子政务领域内中文术语深度层次关系的自动化识别方案,不仅有利于从内容与结构层面弥补人工构建领域词表的不足,且对于我国政务信息资源的开放共享与后续应用更具有重大现实意义。因此,本文分别基于内容与结构双重视角识别电子政务主题词表内术语间的深层关联,通过谱聚类生成的基于内容的层次关系为初步框架,凭借形式概念分析生成的基于结构的层次关系为后期修正指导,以期构成兼顾关联术语召回率与准确率的电子政务领域术语本体。研究结果显示,电子政务术语本体的层次结构合理有效,且术语层次关系的评价结果表明知识本体具备良好的扩展性和延伸性。  相似文献   

12.
认为主题词表有利于信息的组织、信息的利用和信息的检索,传统的手工构建单语言主题词表的方法耗时且成本昂贵,难以满足用户对跨语言信息的处理和使用需求。目前在国内外,如何利用计算机技术,实现跨语言主题词表的自动构建功能是信息检索研究领域需要解决的一个关键问题。在对国内外研究现状进行分析的基础上,较为详细地阐述和分析跨语言主题词表自动构建技术的思想及其技术方法,并提出相关的研究建议。  相似文献   

13.
顾颖  何琳 《图书情报工作》2012,(19):109-113
认为中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。比较两种分类主题词表的编制模式,讨论机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。最后分析将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。  相似文献   

14.
对多语言信息进行语义层面的精确描述,为用户提供准确的跨语言信息资源,是当前多语言信息服务中必须面临和解决的实际问题。多语言主题词表正是解决这一问题的有效工具资源之一。文章首先介绍了国外三个常用多语言主题词表,然后对多语言主题词表在多语言信息自动标引和多语言信息检索两个领域中的应用情况进行了分析,说明多语言主题词表在多语言信息服务领域的潜在应用价值。  相似文献   

15.
指出现有综合电子政务主题词表在应用中的不足,将FAST主题词分面应用原理和理念移植到电子政务主题词表改造中,详细探讨改造过程中分面的界定、分面的设置等具体问题,在FAST 8个分面的基础上,提出7个共同组面;在对其进行分面式改造中,将相应主题词进行归属,以表明这7个组面构建的实际意义,旨在为构建一部完整的分面式电子政务主题词表奠定基础。  相似文献   

16.
叙词表的编制或维护,离不开收词这一基础性工作。随着计算机技术和网络的发展,叙词表正在由手工编制模式向网络环境机编模式转换,因此收词方式也必须改革和创新。为此,讨论几种面向网络词源的收词方法,包括网络数据库中的关键词、联网检字法词库、网站热点词、网络检索界面相关词显示、大众网站标注词和网络百科资源。对这6种收词方法的具体操作和性能进行介绍和分析,并逐一给出实例。  相似文献   

17.
多语叙词表是实现多语言信息组织和检索,满足日益增长的多语言信息需求的重要工具资源。首先介绍多语叙词表构建的研究现状和3种主要构建方法,并对基于翻译构建多语叙词表的方法及该方法的不足进行分析,然后从汉化方法、汉语词汇的选取原则、叙词表辅助汉化平台的构建及汉化结果评价4个方面对英语EI叙词表和日语JST叙词表的汉化工作进行介绍,最后探讨下一步的研究工作。  相似文献   

18.
This article aims to understand what determines the degree of e-government use for multiple purposes by analyzing the Government Online Survey data that the Pew Internet and American Life Project provide. Three main purposes of e-government use are identified as: service use, information use, and policy research. The degree of e-government use for a specific purpose is predicted by five sets of determinants: psychological factors of technology adoption, civic mindedness, information channels, trust in government, and socio-demographic and personal characteristics. Sociodemographic conditions influence usage level of various transactional services provided by e-government. Perceived ease of use facilitates the acquisition of general information through e-government. Civicness is a critical determinant of e-government use for policy research. Policy researchers who are more engaged with and concerned about society, neighbors, and government are emerging as a new class of e-government users.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号