共查询到20条相似文献,搜索用时 140 毫秒
1.
2.
[目的/意义]机构名称的数目多且较为繁杂,机构名称归一化可将同一机构的规范名称以及不同时段、不同表达形式的非规范名称汇集在一起,提高查询检索的查全率和查准率;有利于建立与其他系统之间的互操作,实现资源的共享。[方法/过程]在分析机构名称字符串的特点和基于K-means算法的基础上,利用编辑距离算法实现一级机构名称的初步聚类,然后利用初步聚类结果并基于TF-IDF算法计算机构名称各词项的权值,从而基于K-means算法将机构名称围绕聚类中心抱团聚簇,并对每一个簇的机构名称赋予唯一标识符。[结果/结论]该方法可实现同一机构实体不同形式的规范名称的归一,提高机构名称聚类的准确率,但对K取值、距离测度方法的选取仍有待优化。 相似文献
3.
[目的/意义]在网络百科中,用户之间的冲突已成为影响词条内容质量的重要因素。对这种冲突的研究,可以为提升网络百科内容质量提供新的角度和理论借鉴。[方法/过程]以"PX词条保卫战"为例,采用社会网络分析和文本分析方法,对比分析PX词条编辑过程的3个阶段。[结果/结论]用户协作是常态,冲突也是常态;用户冲突种类不唯一,并非都是由认知差异引发的;不同种类冲突的特征具有显著差异,例如冲突强度、冲突关系结构;应该对冲突进行管理,管理方法必须多样化。 相似文献
4.
[目的/意义]作者身份识别是语言文体学的重要研究方向,利用文本特征的身份识别也是文本挖掘的重要任务。在开放和虚拟网络环境下海量信息的作者身份或发布者的识别难题和传统作者身份识别方法在处理效率和成本等方面存在的问题有待解决。[方法/过程]将复杂网络理论引入该研究领域,在利用传统文体学特征识别作者身份方法的基础上结合文本词共现网络模型及其指标特征改进相关算法,使用文本文体学特征和文本网络模型度量指标构建作者风格特征集合,通过计算文本间风格相似度进行作者识别。[结果/结论]基于复杂网络模型的作者身份识别方法可以有效的利用作者风格特征,提高识别的精度,与其他算法的对比试验表明其识别结果的准确性更高。 相似文献
5.
[目的/意义] 提出一种新的词族识别方法,用于构建语义工具和辅助检索扩展,以降低编表专家的认知负担,提高语义工具构建和更新的效率。[方法/过程] 首先通过同现统计和相似度计算建立学科领域的概念语义网络,再利用社会网络分析中的Island算法进一步识别该网络中的词族。并以金融学科为例,比较该方法与层次聚类算法、“词素后方一致”方法识别词族的效果。[结果/结论] 结果发现,Island算法的效果优于层次聚类算法,并与“词素后方一致”方法各具优势,可以结合使用,取长补短。 相似文献
6.
[目的/意义] 通过构建二模复杂网络模型,揭示隐藏在海量文献中的隐性知识。[方法/过程] 通过NetworkX复杂网络工具包,依据任意两个节点的共现关系构建二模复杂网络模型;对网络模型中节点的共现关系进行加权,计算网络的拓扑信息并进行AP聚类,提取节点间的直接关系;采用AUC方法对AA、JC、加权改进的wAA和wJC等4种链路预测算法进行评价,遴选出最合适的预测算法,并对复杂网络的隐性关系进行预测分析。[结果/结论] 以潜在药物靶点挖掘为例进行的实证研究结果表明,wAA链路预测算法为最优的链路预测算法;二模复杂网络模型、指标和方法体系在美国化学文摘社数据库中的药物靶点挖掘中具有一定的有效性。下一步计划在其他数据库中或其他研究领域中进行尝试,以进一步验证该模型的通用性和有效性。 相似文献
7.
[目的/意义]构建情报学领域核心作者研究兴趣相似性网络,研究该网络的社群结构与社群隶属问题。[方法/过程]在CSSCI数据库以中图分类号为检索条件,下载该学科1998-2015年所有的论文数据,通过普莱斯定律识别核心作者。将作者研究兴趣用词袋模型表示,并计算作者间研究兴趣的余弦相似性,进而构建核心作者研究兴趣相似性网络。在此基础上进行社群划分并识别各社群研究主题,计算作者对各社群的隶属度与模糊熵。[结果/结论]研究发现,当前我国情报学研究可分为信息组织与检索、文献计量与科学评价、竞争情报与知识管理、情报学学科整体研究4个领域,大部分作者研究并不局限于单个领域,竞争情报和文献计量领域界限明显,较少有作者将彼此作为次要隶属社群。 相似文献
8.
《现代图书情报技术》2007,(7):67-67
ACRL(Association of College and Research Libraries)在巴尔的摩召开的一个关于Wikipedia的互动会议上提到:Wikipedia可能是广受批评的匿名用户创造的在线百科全书,但是很多图书馆并不是很在意这点。会议上当问到与会者上周是否使用了Wikipedia时,有1/2以上的人说用过,1/3的人向图书馆用户推荐Wikipedia,1/3的人表示与传统百科全书相比,更喜欢Wikipedia。大约1/4的人说图书馆应该在Wikipedia的编辑中起积极作用。 相似文献
9.
[目的/意义]解决学术期刊多属性评价方法众多、评价结果不一致问题。[方法/过程]提出一种基于聚类分析的多属性评价方法选取方法——聚类结果一致度筛选法。其原理是首先对原始评价指标进行聚类,然后采用可行的多属性评价方法进行评价并对评价结果进行二次聚类,最后根据评价结果聚类与原始指标聚类结果一致度的高低来选择评价方法,优先选取聚类结果一致度最高的评价方法。本文基于JCR2015数学期刊,选取11个指标,分别采用加权线性汇总、TOPSIS、VIKOR、主成分分析、调和平均进行评价,然后基于聚类结果一致度进行评价方法选取,发现调和平均的聚类一致度最高。[结果/结论]可以采用该方法对多属性评价方法进行选择;聚类种类设置对结果影响较小;该方法具有较高的稳健性。 相似文献
10.
[目的/意义] 基于高维矩阵稀疏降维的思想,提出一种利用惩罚性矩阵分解(Penalized Matrix Decomposition,PMD)实现共词分析的新方法。[方法/过程] 以"学科服务"为研究主题,根据PMD算法原理,在Matlab环境下分别实现特征词的提取、特征词的软聚类以及聚类效果的可视化。[结果/结论] 与传统的共词分析方法对比,PMD算法在共词分析中具有独特的优势:提取的特征词比较全面,聚类数目便于确定,聚类结果易于理解。 相似文献
11.
维基百科是在线协同编辑的代表性平台,其开放包容的特质一方面为多元对话和相互协商提供了可能,另一方面也可能加深不同人群之间的冲突,甚至出现群体极化的现象。本文以维基百科平台上具有争议性的"上海外来人口问题"条目为研究对象,揭示信息均衡语境下在线协同编辑的话语生产过程。研究发现,因为存在对抗性的编辑群体,话语交锋的结果不是增进了协商,而是强化了偏见。基于用户的社会网络矩阵,核心编辑运用表态性话语标记以及对引语的选择性运用强化了群体对立,加强了支持者和反对者的极化效应。 相似文献
12.
13.
[目的/意义]维基百科是众包模式应用的杰出范例,研究维基百科的检索系统有助于促进以众包方式编纂的同类网络百科全书的研究和发展。[方法/过程]通过对维基百科检索结构的系统描述,分析发现在众包编纂模式下维基百科检索系统的3个区别性特征。在此基础上,探讨维基百科检索系统存在的问题。[结果/结论]维基百科检索系统的区别性特征包括:检索系统功能的多样性、检索系统的开放性、编辑历史的可检索性;维基百科检索系统存在着超链接密度较高、网络文献问题频现、参见系统内容缺乏一致性等问题。未来的研究应在检索方式的设置和管理方面进行探讨。国内同类网络百科全书应在汲取维基百科先进经验的同时,结合自身检索系统设置的实际情况,不断完善各种检索途径的功能。 相似文献
14.
对科技期刊编辑的发展阶段进行归纳分析,认为:编辑的初级阶段为“编辑匠”;随着编辑能力的提升与经验的丰富,会成为资深编辑;少数热爱编辑工作的优秀资深编辑经过艰辛的努力能成为编辑家. 相似文献
15.
16.
从编者的角色定位以及在编辑活动中的作用和地位出发,倡导用编者的服务意识和换位思考的思维方式,平等、公正和理性地化解编辑过程中与利益关系人的矛盾和问题,构建和谐的交流模式,把理性、理解、服务、公开与公正贯穿于编辑活动过程的每个细节,营建编者与作者、编者与审稿者的紧密合作关系,共同维护期刊的品位和学术地位。 相似文献
17.
18.
19.
科技学术期刊编辑的编研结合是编辑成长的有效途径 ——博士后研究兼编辑及指导工作的体会 总被引:2,自引:0,他引:2
优秀学术编辑须具备深厚的编辑学理论知识和专业知识。笔者根据编辑结合编辑出版研究(简称"编研结合")的博士后及指导工作经历,体会到编研结合是学术编辑成长的有效途径。介绍近2年来的编辑工作及研究情况、研究工作重点,总结了编研结合工作的收获、体会及思考。作为一名新入门的编辑,快速、系统地掌握编辑知识是成长的关键,而编辑出版研究与编辑工作相辅相成,对保证期刊质量及编辑成长具有重要作用。笔者编研结合及指导工作经历说明,通过自身努力,编辑兼研究工作对编辑成长具有较好的促进作用。 相似文献
20.
论书刊出版的编校分合 总被引:4,自引:2,他引:2
从界定编辑与校对的职责出发,阐述编校分开的出版工作模式可以提高工作效率,降低出版成本,是书刊出版业发展的必然趋势.现阶段,由于书刊出版单位管理体制和市场方面的原因,部分期刊出版单位采取编校合一的出版工作模式仍具有合理性.从长远看,编校分工将不局限在书刊出版单位内部,而是在社会范围内实现. 相似文献