共查询到20条相似文献,搜索用时 62 毫秒
1.
提出了一种基于机器学习的Web文本自动分类的架构,提出了中文Web文档自动分类的主要技术问题。介绍了中文Web文档自动分类工具的总体设计,它主要包括网络蜘蛛、中文分词、特征选取和贝叶斯分类器等功能模块。最后对中文Web文档自动分类器进行了实验。 相似文献
2.
主要研究了文本分类精度问题。介绍了文本分类的基本过程,提出了一种改进的支持向量机文本分类技术,设计并实现了一个开放的中文文档自动分类系统。实验结果表明,提出的方法不仅具有较高的训练效率,同时也能得到很高的分类准确率和查全率。 相似文献
3.
介绍了一个建立在向量空间模型上的文档分类系统。该系统着重解决向量维数压缩和中文专有词汇获取等问题。在特征项的选取上,并不采用文档中出现的全部词汇,而是利用语料库统计信息生成的关键词汇。实验结果表明,较之以采用全体词汇作为特征项进行分类的方法,本方法能有效地进行向量维数压缩,同时也提高了分类准确率。 相似文献
4.
本文设计和实现了一个中文新闻主题追踪系统TDTsystem,采用构成新闻事件的四个要素“人物、地点、时间、关键词”作为文档/事件模型,并提出了一个基于信息增益的关联分类算法(ACBIG),结合信息增益与FoilGain来提高文字的分类有效性。实验分析结果表明,采用这种文档/事件模型和ACBIG分类算法的TDTsystem取得了超过90%的主题追踪准确率。 相似文献
5.
在文本自动分类中,目前有词频和文档频率统计这两种概率估算方法,采用的估算方法恰当与否会直接影响特征抽取的质量与分类的准确度。本文采用K最近邻算法实现中文文本分类器,在中文平衡与非平衡两种训练语料下进行了训练与分类实验,实验数据表明使用非平衡语料语料时,可以采用基于词频的概率估算方法,使用平衡语料语料时,采用基于文档频率的概率估算方法,能够有效地提取高质量的文本特征,从而提高分类的准确度。 相似文献
6.
7.
近年尽管针对中文本文分类的研究成果不少,但基于深度学习对中文政策等长文本进行自动分类的研究还不多见。为此,借鉴和拓展传统的数据增强方法,提出集成新时代人民日报分词语料库(NEPD)、简单数据增强(EDA)算法、word2vec和文本卷积神经网络(TextCNN)的NEWT新型计算框架;实证部分,基于中国地方政府发布的科技政策文本进行算法校验。实验结果显示,在取词长度分别为500、750和1 000词的情况下,应用NEWT算法对中文科技政策文本进行分类的效果优于RCNN、Bi-LSTM和CapsNet等传统深度学习模型,F1值的平均提升比例超过13%;同时,NEWT在较短取词长度下能够实现全文输入的近似效果,可以部分改善传统深度学习模型在中文长文本自动分类任务中的计算效率。 相似文献
8.
针对目前基于主题图的中文自动分类的空缺,文章在总结Ontopia对英文和挪威文自动分类的技术基础上,结合中文特殊性,构建了一个基于主题图的中文分类原型系统。该系统通过借助POI、PDF、SAX作为文档文本解析器提取文本,采用盘古分词对文本进行分析,以Java为系统实现主要语言,达到了基于主题图的中文自动分类的目的。 相似文献
9.
10.
11.
12.
13.
复杂科学的研究是当代科学研究的重要领域,尤其是复杂适应系统的研究更为人们所关注。本文首先论述了复杂系统的几个重要特征:开放性、复杂性、层次性及复杂适应系统的七个基本点,然后从其中的几个方面探讨了internet所呈现出的复杂适应系统特征;从而说明了internet是一个复杂适应系统。该系统所呈现的特征将为进一步研究其他复杂适应系统提供理论依据。 相似文献
14.
15.
群体性事件中的媒体报道的存在问题、成因与对策 总被引:2,自引:0,他引:2
曾凡斌 《科学.经济.社会》2011,29(3):151-158
我国发生的群体性事件呈现出数量增多、规模上升、范围扩大的态势。随着环境与社会的变迁,近几年媒体对群体性事件已开始有所报道,但是在面对手机与互联网等新媒介挑战,媒体的报道结果并不理想。媒体对群体性事件存在早期报道反应迟钝,后期报道戛然而止,报道质量上缺乏客观、公正,甚至出现假新闻等问题。群体性事件的风险性,政府、媒体、公众的博弈和法律制度三方面是目前群体性事件下的媒体报道的制约因素。群体性事件发生有着深刻的社会原因,其不仅具有负面功能,还具有正面功能。媒体需要发挥社会"安全阀"的作用,为此,我国需要扩展媒体在群体性事件中的报道空间,及增加媒体报道社会问题和社会矛盾的量和度。 相似文献
16.
知识与企业转型升级都是国内外学者研究的热点问题,大多数学者都从不同的角度对转型企业的内涵、动因、影响因素等方面进行了深入的研究。在前人研究的基础上,通过论述企业的知识基础论,提出转型的内涵本质上是企业原有知识存量、特征和组合的变革,转型的动因就是以知识认知为基础的环境的变化;最后提出基于知识的企业转型阶段模型。 相似文献
17.
通过相关数据分析房地产市场与宏观经济的相关性,研究证实房地产市场与宏观经济具有密切联系。在此基础上,研究房地产市场投资会对经济产生哪些影响。在房地产市场中众多影响经济的因素中,主要研究房地产市场的投资对宏观经济的影响。得出结论,房地产市场通过影响相关行业的投资与消费来影响经济,同时文章给出建议,国家对宏观经济的调控不仅要稳定房地产市场,还可以通过相关行业来稳定房地产市场达到稳定经济的作用。通过EXCEL、MATLAB软件进行数据的处理与分析,运用实证分析法证明房地产投资对经济具有推动作用。 相似文献
18.
设计作为技术和市场之外的第三种创新驱动力已开始得到越来越多的研究重视,但从顾客感知的视角来探讨产品设计如何对渐进性创新和根本性创新产生影响的经验研究尚不多见。基于"产品设计→顾客感知质量→顾客购买意愿和口碑传播"的理论模型,通过针对渐进性创新和根本性创新分别展开调查研究,实证分析结果显示设计驱动力的美学维度和功能维度对于渐进性创新和根本性创新的顾客感知与行为的影响并不一致,对渐进性创新来说,设计的美学维度和功能维度除了对于顾客购买意愿和口碑传播具有直接的正向影响,还通过顾客感知质量对其产生间接作用;对于根本性创新来说,设计的美学维度和功能维度均要完全通过顾客感知质量来间接作用于顾客购买意愿和口碑传播。此外,设计驱动力的象征意义维度对于渐进性创新和根本性创新的顾客感知与行为的影响具有一致性,即设计的象征意义维度对于两种创新类型的顾客购买意愿和口碑传播均有着直接的正向影响,但对于顾客感知质量的影响都不显著。 相似文献
19.
从沟通有效性决定团队生产力这个基本认识出发,透过信息有效传达和关系纽带对沟通有效性影响的深层关系,对团队沟通的概念界定、有效性的影响因素,及其在团队多样性领域中最新研究范式下的相关研究进行了综述与展望。 相似文献
20.
要培养面向未来,能参与竞争的各级各类人才,学校工作要体现以人为本的教育理念。注重教师的主体地位,充分发挥全体教师主人翁的作用,在学校创建有序而又自由、紧张而又宽松的工作氛围。践行以人为本的教育理念,这是教育现代化的必然方向。 相似文献