首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
用于改善web搜索的结构化数据抽取技术   总被引:1,自引:0,他引:1  
为了提高web文本搜索质量,提出了基于语义结构化数据的查询扩展方法.通过分析属性的语义特征(文档频率特征和辨识能力特征)将属性分为概念属性、背景属性和无用属性3类,并且提出了衡量属性语义相关度的标准.设计了trie-bitmap和pair pointer table数据结构来实现发掘属性语义特征和检测属性语义相关度的有效算法.通过使用合适的属性和它们的语义关系,可以为查询关键字生成扩展词并将它们嵌入到具有插值参数的向量空间模型中.实验使用IMDB电影数据库和真实文本数据集来比较所提方法和原始向量空间模型的性能.实验结果证明所提出的查询扩展方法可以有效地提高文本搜索性能,同时属性语义特征和属性语义相关度都具有良好的分类能力.  相似文献   

2.
提出一种基于中心核对齐的模糊支持向量机(Centered kernel alignment-based fuzzy support vector machine, CKA-FSVM)算法并应用于中文农业文本分类.首先通过爬虫技术获取2 246个中文农业文本并进行数据预处理,然后进行文本向量化和特征处理,最后构建分类器模型,实现中文农业文本的自动分类.实验结果显示CKA-FSVM算法在中文农业文本分类上的平均准确率为91.69%,平均F1值为94.96%,比5个对比算法中的最好结果分别提升了0.04和0.24个百分点,表明该模型在中文农业文本分类领域具有较好的性能.  相似文献   

3.
随着互联网中网页数量的激增,网页自动分类已经成为互联网技术中亟待解决的问题。提出一种领域向量模型的设计与构建方法,设计并实现一种针对新闻网页的基于领域向量模型的网页分类TSC(Topic Sensitive Classify)算法,从新的角度解决网页自动分类问题。首先,对大量的新闻网页URL进行分析,提取新闻网页的URL特征;然后,设计一个领域向量模型,对特定领域的新闻网页内容特征进行提取;最后,结合新闻网页URL特征和内容特征对新闻网页进行自动分类。实验结果表明,TSC算法分类效果比传统SVM和ID3等文本分类算法更优。  相似文献   

4.
由于向量空间模型在文本聚类中的应用,而必须对文本特征进行降维。本方法首先利用特征的概率分布计算特征之间的相似度,在此基础上对特征进行聚类;然后在文本聚类的结果上计算各个特征的信息增益值;最后在各个特征类上取出一定比例的最重要的特征达到特征选择的目标。实验表明,该改进算法在聚类的准确度方面较以前的方法有所提高,可以有效地用于文本自动聚类。  相似文献   

5.
在传统聚类模型的基础上,提出一种基于向量空间模型的层次聚类算法,用于文本数据的挖掘。实验结果表明,基于向量空间模型的层次聚类算法从挖掘的准确率上更具有性能优势。  相似文献   

6.
文本素材资源的自动分类算法研究   总被引:2,自引:0,他引:2  
教育资源建设是教育信息化的基础,而教育资源的有效应用必须以资源的准确分类为基础。教育部远程教育标准化委员会在《教育资源建设技术规范》(征求意见稿)中提出了教育资源的元数据结构和分类体系。为了提高资源分类的自动化程度,简化对资源的手工分类工作,本文提出了一个文本素材资源的自动分类算法,该算法基于向量空间模型和位置相关性原理设计,提高了原有向量空间模型算法的准确性。  相似文献   

7.
一种基于向量空间模型的文本聚类方法   总被引:3,自引:0,他引:3  
研究了一种基于向量空间模型的文档聚类方法.提出了一个新的聚类模型,即在传统聚类模型的基础上增加一个文档特征向量调整模块;给出了一个特征评价函数用以进行特征提取;对一种基于相似度的平面划分聚类算法做了一些改进.实验结果表明本文提出的聚类模型是可行的.  相似文献   

8.
邢翠鹃 《文教资料》2014,(29):131-133
本文主要用向量空间模型(Vector Space Model,VSM)来分析女性文学代表作家的作品,通过TF-IDF计算文本特征项的权重,最后根据计算结果来分析这些女性文学作家作品的文本风格相似度。并以此证明同时代不同作家或不同时代同类作家(女性文学作家)的文本是同中有异,异中有同,此外还分析了部分特征词的分布情况。  相似文献   

9.
给出了一个网页自动分类系统的设计,讨论了预处理、批量训练、特征选择等模块的设计过程。本系统采用空间向量模型作为分类模型,在分类开始前对网页信息进行了预处理。  相似文献   

10.
分析了K均值聚类算法(K-means)存在的不足和改进遗传算法的全局优化能力,提出一种基于改进遗传算法的文本聚类方法,该方法将原始文档转化成用向量空间模型来描述的文本向量,首先随机产生若干个文档向量作为初始聚类中心形成遗传算法的染色体种群,经过改进遗传算法的选择、交叉、变异进化运算,得到较为优化的K均值聚类算法的初始聚类中心。实验表明该算法文本聚类提高了查准率和查全率,算法的高效性也得到了验证。  相似文献   

11.
作为詹姆斯?库珀所著《皮裹腿故事集》中最为知名的一部作品,《最后的莫西干人》描绘了18世纪中叶英法殖民者为了侵占美洲领土而展开的残酷掠夺.在小说中,主人公“鹰眼”和他的莫西干朋友钦加哥之间的友谊是作者描述的重点,而在1992年的电影版本中,导演描述的重点则转到了“鹰眼”与科拉的爱情上.《最后的莫西干人》从小说到电影的改编反映了文化背景的变迁.  相似文献   

12.
试论CMO、LMO、PAO和VB之间的关系   总被引:1,自引:0,他引:1  
离域分子轨道(CMO)、定域分子轨道(LMO)、杂化轨道(PAO)和价键法(VB)是结构化学的重要内容,本文通过CH4分子,对此之间关系进行较深入的讨论.  相似文献   

13.
论共和末叶至帝国初期罗马对行省的治理   总被引:3,自引:0,他引:3  
行省是罗马对被征服地区及其居民实行统治的主要管理形式。它对于罗马国家的稳定和罗马经济的发展都起了非常显著的作用。然而 ,罗马对行省的治理并不是一成不变的 ,更不是没有缺陷的。它是时代发展的产物 ,同时又随着时代的变化而有所变化。共和末叶至帝国初期正是罗马行省管理由不成熟走向成熟的关键时期 ,对其加以研究不仅能够进一步加深我们对罗马行省制度的理解 ,而且对于我们更加深入地了解罗马历史的发展也有相当重要的意义  相似文献   

14.
目前,中国票据市场的发展仍处在初级阶段,社会信用制度及法律制度的不健全、票据市场的不统一、票据功能的不完善制约着票据业务的开拓。因此,只有从中国的国情出发,在继续大力发展具有真实商品交易的交易性票据业务的基础上探索融资性票据的发行,才能进一步完善中国的票据市场,有效地促进国民经济的发展。  相似文献   

15.
多年来,“减负”问题一直倍受我国广大学校、家庭和社会各界人士的关注,如何正确认识“减负”以及由此涉及到的个体素质教育成为焦点所在。从对“减负”问题的起始点、逆转点、落脚点等一系列分析中,我们不难看出,“减负”需要切实变革相关制度,充分发挥教师主导作用,借鉴赞科夫的教学原则。对全体中小学生实施个体素质结构教育。  相似文献   

16.
大学中文系古代文学选修课程“《论语》导读”的核心目标是进一步培养学生全面、深入理解《论语》的阅读能力和对于传统文化的研究能力,追求教学内容的系统性与深度是它有别于高中语文选修课程“《论语》选读”的主要方面.为达此目标,教师在教学过程中应立足文本,注重教学内容的整体性、二元性与相关性.  相似文献   

17.
在一个社会里,只要存在阶级,就会存在阶级矛盾,它表现为利益双方的相互对立和依存.利益对立导致双方矛盾不可调和,便发生社会冲突,从而造成巨大的社会动荡;而利益依存凸显了矛盾双方合作的必要,双方可在一定的社会条件下以自己合法的方式获取自己的利益,双方相伴相生,相互依存,这就是阶级整合. 因此,阶级整合的关键就是要找到对立的边线--矛盾双方共同一致的利益,并随双方力量的消长而不断调整政策以适应边线的移动,这个边线就是构建和谐社会的基点.  相似文献   

18.
作为审美客体的散文文本,是创作主体的艺术创造变为社会性审美活动的中介,是创作主体与审美主体之间进行交流的依据.在接受主体眼里,它既是一种物化了的客观存在,又是一个亟待开发的审美存在,这与创作者追求的虚拟文本是不同的.本文从接受审美的视角,对文本的品质与层面,对不同类型、不同内质的文本的审美探求等问题进行了研究.  相似文献   

19.
马祖禅对自性、自身感悟的独特性的强调,以及随时著衣吃饭,任心自由的破除修行方式,对"吴中诗派"产生了影响,促使其文学创作表现出重心性、重主体的倾向,内容也趋向日常化、游戏化,体现了向元和诗风转变的趋势。  相似文献   

20.
我国《物权法》对遗失物权属的规定排除了拾得人取得遗失物之所有权可能。建立拾得人附条件取得遗失物所有权规则是权利与义务一致的要求,是公平与效率相协调的要求,在实践中应该依照过错与价值原则确定拾得人遗失物所有权。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号