排序方式: 共有276条查询结果,搜索用时 15 毫秒
211.
一种基于主题词表的快速中文文本分类技术 总被引:1,自引:0,他引:1
针对中文文本的自动分类问题,提出了一种新的算法.该算法的基本思路是构造一个带权值的分类主题词表,该词表采用键树的方式构建,然后利用哈希杂凑法和长词匹配优先原则在主题词表中匹配待分类的文档中的字符串,并统计匹配成功的权值和,以权值和最大者作为分类结果.本算法可以避开中文分词的难点和它对分类结果的影响.理论分析和实验结果表明,该技术分类结果的准确度和时间效率都比较高,其综合性能达到了目前主流技术的水平. 相似文献
212.
213.
范畴化是认知语言学探究的重要内容,与二语词汇习得紧密相连。可从基本层次理论和原型范畴理论的角度论证基本层次词汇的重要性,应积极探讨学生利用基本层次词汇习得语言、教师引导学生关注词汇之间的彼此关联及正确理解一词多义现象。 相似文献
214.
《生活大爆炸》是最近热播的情景喜剧,讲述四个情商极低的科学家和一个美女邻居之间的故事。试图运用范畴层次理论来阐释其特有的言语幽默。 相似文献
215.
以认知语言学为依托,用原型范畴化理论和意向图式分析方法对英语介词"out"的空间隐喻拓展进行认知研究。介词"out"以"空间"概念为原型,以隐喻为手段,利用家族相似性不断向外拓展和延伸意义范围,最终实现从空间概念到非空间概念的映射,即从空间域拓展到状态域、范围域、原因域、否定域以及其他域。 相似文献
216.
认知范畴对英文翻译的启示 总被引:1,自引:0,他引:1
范畴理论是认知语言学的基础理论。源语范畴和对应的译语范畴都有自己的范畴体系,二者之间并不存在着一一对应的情况。然而范畴的分级为翻译提供了合理的解释,在翻译过程中,无法找到或者不必找到与原文的对应物,可以在译语的其他层级上进行传译。由于翻译是在同一范畴内进行的,因而,原文的核心意义仍然得以保留。 相似文献
217.
Due to a large variety of noisy information embedded in Web pages, Web-page classification is much more difficult than pure-text classification. In this paper, we propose to improve the Web-page classification performance by removing the noise through summarization techniques. We first give empirical evidence that ideal Web-page summaries generated by human editors can indeed improve the performance of Web-page classification algorithms. We then put forward a new Web-page summarization algorithm based on Web-page layout and evaluate it along with several other state-of-the-art text summarization algorithms on the LookSmart Web directory. Experimental results show that the classification algorithms (NB or SVM) augmented by any summarization approach can achieve an improvement by more than 5.0% as compared to pure-text-based classification algorithms. We further introduce an ensemble method to combine the different summarization algorithms. The ensemble summarization method achieves more than 12.0% improvement over pure-text based methods. 相似文献
218.
许新 《河北体育学院学报》2015,29(2):23-25
基于2011年体育学科独立申报未能成功这一事件,对体育学科发展问题以及尚不能独立的缘由进行剖析。认为,因为存在对"体育"本身的概念界定还没有形成共识、学科内部分类不够清晰明确等问题,体育学科的独立之路还任重道远。指出只有结合国情不断进行论证研究,不断充实与深入学科内部研究的相关理论,才能在学科发展之路上更进一步。 相似文献
219.
220.
KNN分类算法改进研究进展 总被引:5,自引:0,他引:5
指出传统KNN(k-nearest neighbor)算法的两大不足:一是计算开销大,分类效率低;二是在进行相似性度量和类别判断时,等同对待各特征项以及近邻样本,影响分类准确程度.针对第一点不足,提出三种改进策略,分别为:基于特征降维的改进、基于训练集的改进和基于近邻搜索方法的改进;针对第二点不足,提出两种改进策略,分别为:基于特征加权的改进和基于类别判断策略的改进.对每种改进策略中的代表方法进行介绍并加以评述. 相似文献