首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
以网络计量学领域的网站链接数为基础,研究网址入链分布规律。首先,通过研究中网站之间的链接关系,选定入链数作为研究对象,并获取原始数据;接着,利用最小二乘法、K-S检验算法以及M.L. Pao教授提出的指数不为2时的逼近c值的估计公式对数据进行洛特卡定律拟合,发现网络计量学领域的网址入链分布并不服从洛特卡定律。最后,讨论造成不服从洛特卡定律的原因。  相似文献   

2.
以网络计量学领域的网站链接数为基础,研究网址入链分布规律。首先,通过研究中网站之间的链接关系,选定入链数作为研究对象,并获取原始数据;接着,利用最小二乘法、K—s检验算法以及M.L.Pao教授提出的指数不为2时的逼近C值的估计公式对数据进行洛特卡定律拟合,发现网络计量学领域的网址入链分布并不服从洛特卡定律。最后,讨论造成不服从洛特卡定律的原因。  相似文献   

3.
以科学网博客信息为基础,研究网络学术信息作者分布规律。首先研究2007-2010年博文、博主的分布以及核心博主分布,然后利用最小二乘法、K-S检验算法对博文作者分布进行洛特卡定律拟合,发现博文作者分布并不服从洛特卡定律。最后讨论网络学术信息与传统学术信息的差异性,发现载体和环境的差异性是导致网络学术信息作者分布不服从洛特卡定律的主要原因。  相似文献   

4.
本文通过一个案例将非线性最小二乘估计问题转化为线性最小二乘解决,通过真实值与预测值之间的误差比较说明某些情况下线性最小二乘估计拟合效果较好。  相似文献   

5.
本文从现有的洛特卡定律参数n、c的估算方法出发,分析了以最小二乘法为基础的最优拟合概念,指出了回归分析的最优本质,及其与k—s检验最终要求的不一致性,从而提出了舍弃最小二乘法的新的参数n、c的估算方法,并给出严格的数学证明,同时用文献[1]及[6]中的数据进行验证。在上述工作的基础上,宽宏地讨论了它们的优劣。最后,在严格的意义下,指出了不应再使用旧法的缘由。  相似文献   

6.
最大似然估计法是概率与数理统计教材中的教学重难点,本文对最大似然估计的讲解作了一种新的探究和尝试。  相似文献   

7.
以中英维基百科为例研究网络引文的分布规律,分别选择中英维基百科的图书情报学类目,研究条目的参考文献.在规范性、内容质量、引文总量、篇均引文量方面,英文维基百科明显好于中文维基百科.两种维基百科中,期刊论文和图书类型的W-P引文比例最高,传统百科全书辞典和词典是重要的知识来源.两维基百科利用的网络资源呈现一定的聚集和离散分布,从引文网址的域名层次聚合,发现其W-W引文分布都符合幂律分布(洛特卡定律).  相似文献   

8.
基于字频向量的中文文本自动分类系统   总被引:15,自引:3,他引:12  
王梦云  曹素青 《情报学报》2000,19(6):644-649
本文提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类方法。该方法采用汉字字频向量作为文本的表示方法。它的显著特点是引入线性最小二乘方估计技术建立文本分类器模型,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习,实现了基于全局最小错误率的汉字一类别两个向量空间的映射函数,并用该函数对测试文本进行分类。  相似文献   

9.
本文采用布拉德福定律的理论和方法,利用2004年1月到2006年4月所有进入数据库的H类英文双语图书数据,得出此类书按其借阅次数的分布符合布拉德福文献分散定律,并以此来测定核心馆藏分布.  相似文献   

10.
何荣利 《图书情报工作》1997,41(3):25-27,43
据《中文核心期刊要目总览》中文摘法统计的数据,对我国45个学科科技论文在期刊中的分布进行探讨。结果表明,我国科技论文分布基本符合布拉德福的文献集中与分散定律。  相似文献   

11.
一个中文文本自动分类数学模型   总被引:9,自引:1,他引:8  
本文提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类模型。该模型采用汉字字频向量作为文本的表示方法。它的显著特点是引入线性最小二乘方拟合(LinearLeastSquareFit,LLSF)技术建立文本分类器模型,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习,实现了基于全局最小错误率的汉字———类别两个向量空间的映射函数,并用该函数对测试文本进行分类。  相似文献   

12.
汉英双语标注集的研究与实现   总被引:1,自引:0,他引:1  
标注集是任何自然语言处理研究中的知识表达基础。本文结合汉英双向机器翻译开发和双语语料库加工的实践,提出了建立标准的汉英双语标注集的必要性,探讨了该标注集设计过程中遇到的几个关键问题并给出了一个比较完备的汉英双语标注集解决方案。实践证明,该方案具有良好的开放性和兼容性,对于汉英双向机器翻译系统和汉英双语语料库研究都具有适用性。  相似文献   

13.
以文献标题中的英—中、中—英翻译为素材,对文献标题翻译概念信息传递中的单词术语与多词术语进行了比较和探讨。  相似文献   

14.
基于通过具体实验确定的Bisecting K-means聚类和Lemmatization形态变换算法,在汉英短语级人文社会科学平行语料基础上,尝试进行类别知识挖掘的实验。在中文社会科学引文索引(CSSCI)的类别和标题知识基础上,完成对汉英语料的预处理,并分析名词、动词和形容词的分布状况。在名词、动词和形容词等词性的组合基础上,对比不同词性组合的效果并确定最优的词性组合类别知识挖掘模型。  相似文献   

15.
曹雁  肖忠华 《编辑学报》2015,27(2):130-133
基于涵盖12个理工科学科的科技期刊英文摘要语料库,利用语料库方法对163个语言特征的频率进行因子分析,系统比较了中外科技期刊英文摘要的差异.结果显示,2类摘要在副词、第一人称代词、前置性修饰语以及被动语态的使用上存在显著的功能性差异.国内英文摘要多数不善于使用副词加强语气,有意规避第一人称代词,缺少与读者的交互,而过多的前置性修饰语和被动语态无形中增加了阅读困难,与国际学术界提倡的直接简洁的写作风格仍有偏差.我们分析了造成这些差异的可能原因,并对国内科技期刊英文摘要写作提出建议.  相似文献   

16.
文章结合李其港《普通中文图书排架号的合理选取》一文及作者所在馆的实践,探讨并商榷了几种图书排架的区分方式及处理方式,以期找到更为科学合理的排架方法,便于读者更好地利用馆藏资源。  相似文献   

17.
Power Laws are a characteristic distribution found in both natural as well as in man-made systems. Previous studies have shown that citations to scientific articles follow a power law, i.e., the number of papers having a certain level of citation x are proportional to x raised to some negative power. However, the distributional character of altmetrics (such as reads, likes, mentions, etc.) has not been studied in much detail, particularly with respect to existence of power law behaviours. This article, therefore, attempts to do an empirical analysis of altmetric mention data of a large set of scholarly articles to see if they exhibit power law. The individual and the composite data series of ‘mentions’ on the various platforms are fit to a power law distribution, and the parameters and goodness of fit are determined, both using least squares regression as well as the Maximum Likelihood Estimate (MLE) approach. We also explore the fit of the mention data to other distribution families like the Log-normal and exponential distributions. Results obtained confirm the existence of power law behaviour in social media mentions to scholarly articles. The Log-normal distribution also looks plausible but is not found to be statistically significant, and the exponential distribution does not show a good fit. Major implications of power law in altmetrics are given and interesting research questions are posed in pursuit of enhancing the reliability of altmetrics for research evaluation purposes.  相似文献   

18.
彭芹  张海峰 《编辑学报》2017,29(6):538-540
为深入了解岩土类论文英文表达的发展趋势,采用定量统计的方法,选择国内外6种岩土类顶级期刊上发表的文章建立英文摘要语料库,对英文摘要中的第一人称代词和语态进行对比分析.结果表明:国内岩土类期刊英文摘要中存在被动语态的过度使用现象,且第一人称代词鲜见使用;国外岩土类期刊偏爱主动语态,且大量使用第一人称代词复数主格(we).从期刊编辑部、审稿人、专业英语的授课教师与作者角度提出岩土类论文英文摘要的写作建议,以期提高我国岩土类期刊英文摘要的整体质量.  相似文献   

19.
基于汉英双语语料库的汉英词典编撰研究   总被引:5,自引:0,他引:5  
杨沐昀  刘晓月  李生 《情报学报》2003,22(3):310-314
汉英词典对于跨语言信息检索、计算机翻译等许多领域具有重要意义。为了利用双语语料库获取汉英词典 ,本文在对四种常见的基于共现信息的词汇对译计算模型进行研究之后 ,以对数相似性模型为基础 ,采用迭代策略实现了翻译词典获取。实验表明 ,该方法能够有效地提高词典获取的正确率 ,提高词典编撰效率  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号