排序方式: 共有72条查询结果,搜索用时 31 毫秒
1.
语言是科学交流的载体,科学交流的语言分布反映了全球科技话语权的格局,本文基于科学推文视角揭示了非正式科学交流中的语言分布,并与基于科技文献的正式科学交流语言分布做了对比分析。研究发现:①科学推文语言集中分布在英语(91%)、日语(24%)和西班牙语(17%),而科技文献语言集中分布在英语(942%)、中文(43%)和土耳其语(04%);②科学推文和科技文献的语言分布均存在学科差异,体现出不同语言作者对特定学科关注度的不同;③除了沙特阿拉伯之外,世界各国即使母语不是英语,均以英语科学推文占主导地位,母语科学推文屈居第二;④英语、德语、日语、法语等语种的科技文献获得科学推文最多,而科技文献量和质量名列前茅的中文和土耳其语文献获得的科学推文很少。结果表明,英语俨然已经成为非正式科学交流中的通用语,提高中文在科学交流中的国际影响力任重道远。图3。表3。参考文献15。 相似文献
2.
认为社会化标签多采取自由标引方式,部分标签并不能有效地揭示资源的内容或主题,于是产生许多低质量的标签,这些低质量标签干扰社会标注系统中资源组织的秩序,降低标签在应用场合中的质量和用户满意度。进行基于标签类型的社会化标签质量测评研究,开发标签质量测评网站,邀请志愿者在该网站上对博文标签、图书标签、图片标签、视频标签、音乐标签类型进行划分,得到标签类型分类用的训练数据集和测试集;同时,对标签质量进行打分,在此基础上进一步得到标签质量评估的训练数据集与测试数据集,为以后基于标签类型的标签质量评估提供数据支持。 相似文献
3.
对多语言信息处理中的文本表示问题进行阐述。在分析单语言文本表示的模型和过程的基础上,说明多语言文本表示的过程,详细分类并阐述其中的各种方法,对其进行比较分析。概括多语言文本表示的特点,指出尚存在的问题,并对多语言文本表示的发展趋势进行探讨。 相似文献
4.
随着社会化标注系统应用的普及,社会化标签为用户的信息检索和信息组织提供了便利的平台,而现有的对社会化标签的研究关注应用层面的较多,较少探讨用户标注内在机制问题,而通过对用户标注动机的探究,可以指导社会化标注系统更好的满足用户的需要.因此本文采用自行研制的用户标注动机量表,通过调查社会化标注系统中有过标注行为用户的标注动机,从不同性别、不同年龄、不同学历、不同职业、不同社会化标注系统使用时间以及使用次数、不同标注资料类型7个方面分析比较不同背景用户标注动机的差异,最后为增强用户的标注动机提出相应的建议. 相似文献
5.
适用于隐含主题抽取的K最近邻关键词自动抽取 总被引:1,自引:0,他引:1
众所周知,K最近邻方法作为机器学习领域的一个经典的方法,在很多领域都有出色的表现.本文利用K最近邻方法的思想,提出了一种基于K最近邻的关键词自动抽取方法.现有的关键词抽取技术仅仅是对正文词汇的抽取,不能抽取隐含主题.隐含主题的抽取是关键词自动抽取技术的难点,但是该方法可以有效抽取隐含主题.该方法首先对数据进行预处理,使用向量空间模型将文本表述为数学化语言;然后,以人工标注关键词的文献数据作为训练集,使用K最近邻方法构建新文献的关键词候选集;最后,根据关键词本身的特点对候选关键词做了有效的后处理.实验表明,该方法不仅可以提高关键词抽取的准确率和召回率,还可以有效抽取文章的隐含主题. 相似文献
6.
7.
针对信息检索中存在的词语排除关系问题,给出排除词的定义并说明排除词在信息检索中的作用。指出排除词实质上是最大准交集型歧义切分字段的伪歧义切分所导致的,描述排除词的识别方法,并给出识别的结果,并在实际的信息检索平台上对排除词词库进行应用测评。 相似文献
8.
9.
自动标引研究的回顾与展望* 总被引:3,自引:0,他引:3
章成志 《现代图书情报技术》2007,2(11):33-39
对自动标引的研究进行总结与回顾。对标引对象进行界定;分析自动标引研究的3个阶段,并列出50年研究历程中的代表性方法;详细描述自动标引研究路线图、并对抽词标引与赋词标引方法进行详细分类;最后指出自动标引中存在的问题,并对今后的自动标引研究和应用方向进行展望。 相似文献
10.
[目的/意义]社交媒体下非正式学术交流逐渐成为学者们学术交流的又一新天地,探索社交媒体下具有综合交叉学科性质的图书情报领域的跨学科特性,可以作为传统学术交流研究的一个补充与参考。[方法/过程]以科学网博客为代表,从用户好友关系、评论关系及推荐关系三个角度构造学科亲缘树,然后借用亲缘树的多样性指标分析了图书情报的跨学科特性。[结果/结论]通过本文研究,发现图情领域用户学科亲缘树与好友学科亲缘树之间存在强相关性,推荐对象的学科亲缘树与评论对象的亲缘树存在极强相关性;此外,本文还发现"计算机科学""管理科学与工程""宏观管理与政策"是社交媒体上图情领域用户最亲缘学科。 相似文献