共查询到20条相似文献,搜索用时 62 毫秒
1.
用于改善web搜索的结构化数据抽取技术 总被引:1,自引:0,他引:1
为了提高web文本搜索质量,提出了基于语义结构化数据的查询扩展方法.通过分析属性的语义特征(文档频率特征和辨识能力特征)将属性分为概念属性、背景属性和无用属性3类,并且提出了衡量属性语义相关度的标准.设计了trie-bitmap和pair pointer table数据结构来实现发掘属性语义特征和检测属性语义相关度的有效算法.通过使用合适的属性和它们的语义关系,可以为查询关键字生成扩展词并将它们嵌入到具有插值参数的向量空间模型中.实验使用IMDB电影数据库和真实文本数据集来比较所提方法和原始向量空间模型的性能.实验结果证明所提出的查询扩展方法可以有效地提高文本搜索性能,同时属性语义特征和属性语义相关度都具有良好的分类能力. 相似文献
2.
《赣南师范学院学报》2021,(6):57-61
提出一种基于中心核对齐的模糊支持向量机(Centered kernel alignment-based fuzzy support vector machine, CKA-FSVM)算法并应用于中文农业文本分类.首先通过爬虫技术获取2 246个中文农业文本并进行数据预处理,然后进行文本向量化和特征处理,最后构建分类器模型,实现中文农业文本的自动分类.实验结果显示CKA-FSVM算法在中文农业文本分类上的平均准确率为91.69%,平均F1值为94.96%,比5个对比算法中的最好结果分别提升了0.04和0.24个百分点,表明该模型在中文农业文本分类领域具有较好的性能. 相似文献
3.
随着互联网中网页数量的激增,网页自动分类已经成为互联网技术中亟待解决的问题。提出一种领域向量模型的设计与构建方法,设计并实现一种针对新闻网页的基于领域向量模型的网页分类TSC(Topic Sensitive Classify)算法,从新的角度解决网页自动分类问题。首先,对大量的新闻网页URL进行分析,提取新闻网页的URL特征;然后,设计一个领域向量模型,对特定领域的新闻网页内容特征进行提取;最后,结合新闻网页URL特征和内容特征对新闻网页进行自动分类。实验结果表明,TSC算法分类效果比传统SVM和ID3等文本分类算法更优。 相似文献
4.
由于向量空间模型在文本聚类中的应用,而必须对文本特征进行降维。本方法首先利用特征的概率分布计算特征之间的相似度,在此基础上对特征进行聚类;然后在文本聚类的结果上计算各个特征的信息增益值;最后在各个特征类上取出一定比例的最重要的特征达到特征选择的目标。实验表明,该改进算法在聚类的准确度方面较以前的方法有所提高,可以有效地用于文本自动聚类。 相似文献
5.
张浩 《温州职业技术学院学报》2013,(1):84-86
在传统聚类模型的基础上,提出一种基于向量空间模型的层次聚类算法,用于文本数据的挖掘。实验结果表明,基于向量空间模型的层次聚类算法从挖掘的准确率上更具有性能优势。 相似文献
6.
7.
一种基于向量空间模型的文本聚类方法 总被引:3,自引:0,他引:3
研究了一种基于向量空间模型的文档聚类方法.提出了一个新的聚类模型,即在传统聚类模型的基础上增加一个文档特征向量调整模块;给出了一个特征评价函数用以进行特征提取;对一种基于相似度的平面划分聚类算法做了一些改进.实验结果表明本文提出的聚类模型是可行的. 相似文献
8.
本文主要用向量空间模型(Vector Space Model,VSM)来分析女性文学代表作家的作品,通过TF-IDF计算文本特征项的权重,最后根据计算结果来分析这些女性文学作家作品的文本风格相似度。并以此证明同时代不同作家或不同时代同类作家(女性文学作家)的文本是同中有异,异中有同,此外还分析了部分特征词的分布情况。 相似文献
9.
给出了一个网页自动分类系统的设计,讨论了预处理、批量训练、特征选择等模块的设计过程。本系统采用空间向量模型作为分类模型,在分类开始前对网页信息进行了预处理。 相似文献
10.
11.
肖旭 《内蒙古师范大学学报(哲学社会科学版)》2013,(1):42-44
作为詹姆斯?库珀所著《皮裹腿故事集》中最为知名的一部作品,《最后的莫西干人》描绘了18世纪中叶英法殖民者为了侵占美洲领土而展开的残酷掠夺.在小说中,主人公“鹰眼”和他的莫西干朋友钦加哥之间的友谊是作者描述的重点,而在1992年的电影版本中,导演描述的重点则转到了“鹰眼”与科拉的爱情上.《最后的莫西干人》从小说到电影的改编反映了文化背景的变迁. 相似文献
12.
试论CMO、LMO、PAO和VB之间的关系 总被引:1,自引:0,他引:1
离域分子轨道(CMO)、定域分子轨道(LMO)、杂化轨道(PAO)和价键法(VB)是结构化学的重要内容,本文通过CH4分子,对此之间关系进行较深入的讨论. 相似文献
13.
论共和末叶至帝国初期罗马对行省的治理 总被引:3,自引:0,他引:3
杨共乐 《北京师范大学学报(社会科学版)》2001,(2):76-84
行省是罗马对被征服地区及其居民实行统治的主要管理形式。它对于罗马国家的稳定和罗马经济的发展都起了非常显著的作用。然而 ,罗马对行省的治理并不是一成不变的 ,更不是没有缺陷的。它是时代发展的产物 ,同时又随着时代的变化而有所变化。共和末叶至帝国初期正是罗马行省管理由不成熟走向成熟的关键时期 ,对其加以研究不仅能够进一步加深我们对罗马行省制度的理解 ,而且对于我们更加深入地了解罗马历史的发展也有相当重要的意义 相似文献
14.
目前,中国票据市场的发展仍处在初级阶段,社会信用制度及法律制度的不健全、票据市场的不统一、票据功能的不完善制约着票据业务的开拓。因此,只有从中国的国情出发,在继续大力发展具有真实商品交易的交易性票据业务的基础上探索融资性票据的发行,才能进一步完善中国的票据市场,有效地促进国民经济的发展。 相似文献
15.
多年来,“减负”问题一直倍受我国广大学校、家庭和社会各界人士的关注,如何正确认识“减负”以及由此涉及到的个体素质教育成为焦点所在。从对“减负”问题的起始点、逆转点、落脚点等一系列分析中,我们不难看出,“减负”需要切实变革相关制度,充分发挥教师主导作用,借鉴赞科夫的教学原则。对全体中小学生实施个体素质结构教育。 相似文献
16.
大学中文系古代文学选修课程“《论语》导读”的核心目标是进一步培养学生全面、深入理解《论语》的阅读能力和对于传统文化的研究能力,追求教学内容的系统性与深度是它有别于高中语文选修课程“《论语》选读”的主要方面.为达此目标,教师在教学过程中应立足文本,注重教学内容的整体性、二元性与相关性. 相似文献
17.
在一个社会里,只要存在阶级,就会存在阶级矛盾,它表现为利益双方的相互对立和依存.利益对立导致双方矛盾不可调和,便发生社会冲突,从而造成巨大的社会动荡;而利益依存凸显了矛盾双方合作的必要,双方可在一定的社会条件下以自己合法的方式获取自己的利益,双方相伴相生,相互依存,这就是阶级整合. 因此,阶级整合的关键就是要找到对立的边线--矛盾双方共同一致的利益,并随双方力量的消长而不断调整政策以适应边线的移动,这个边线就是构建和谐社会的基点. 相似文献
18.
祝德纯 《青海师范大学学报(哲学社会科学版)》2004,1(4):85-88
作为审美客体的散文文本,是创作主体的艺术创造变为社会性审美活动的中介,是创作主体与审美主体之间进行交流的依据.在接受主体眼里,它既是一种物化了的客观存在,又是一个亟待开发的审美存在,这与创作者追求的虚拟文本是不同的.本文从接受审美的视角,对文本的品质与层面,对不同类型、不同内质的文本的审美探求等问题进行了研究. 相似文献
19.
邹爽 《新疆职业大学学报》2014,(3):36-38
马祖禅对自性、自身感悟的独特性的强调,以及随时著衣吃饭,任心自由的破除修行方式,对"吴中诗派"产生了影响,促使其文学创作表现出重心性、重主体的倾向,内容也趋向日常化、游戏化,体现了向元和诗风转变的趋势。 相似文献
20.
陈凤贞 《湖南广播电视大学学报》2008,(3):82-84
我国《物权法》对遗失物权属的规定排除了拾得人取得遗失物之所有权可能。建立拾得人附条件取得遗失物所有权规则是权利与义务一致的要求,是公平与效率相协调的要求,在实践中应该依照过错与价值原则确定拾得人遗失物所有权。 相似文献