排序方式: 共有34条查询结果,搜索用时 15 毫秒
1.
2.
3.
4.
5.
针对中文短文本自身词汇个数少、描述信息弱的缺陷,引入特征扩展的方法辅助分类。借助网络知识库维基百科抽取相关概念,并采用统计规律与类别信息相结合的方式计算概念间相关度,建立语义相关概念集合,对短文本的特征向量进行扩展,从而有效补充短文本的语义特征。对比实验表明,基于维基百科的短文本分类方法能够提高短文本分类的效果。 相似文献
6.
据1998年版《中国广播电视年鉴》资料,截至1997年年底,全国县级以上电视台有923座,电视发射和转播台有41205座,电视覆盖率达到87.6%。全年生产电视剧391部3055集。随着电视进入千家万户,以新闻节目、娱乐节目、影视剧、广告文艺为载体的电视文化对人们的生活、思想及道德修养的影响越来越大。但是部分基层电视台在多台竞争经费严重不足的情况下,过分强调经济效益,以满足观众为由,擅自播放一些格调低下、社会效果差的节目,忽略了电视文化的社会责任感,走入了电视文化的误区。 误区一,置喉舌、引导功能于不顾,热衷于搞奇闻趣闻和有偿新闻。电视是党的重要舆论工具之一,宣传党的路线、方针、政策是其义不容辞的职责。但一些基层台站以满足观众的要求为由,滥发奇闻趣闻,对境外拍摄的毫无科学依据的所谓趣闻照本宣科;有的在播发恶性案件时,犯罪过程、犯罪情节十分详细,负面影响极大。 误区二,置精神文明建设于不顾,热衷于播放一些港台及外国暴力片,产生了不良的社会影响。电视剧是众多电视节目中收视率较高、最受观众喜爱的节目。好的电视剧确能寓教于乐,而一些电视剧则产生了不良的作用。在一些青少年犯罪中,模仿电视剧情节的并非个别。还有一些电视剧戏不够爱情凑,有时一家老小都在看电视,屏幕上突然 相似文献
7.
[目的/意义]作者身份识别是语言文体学的重要研究方向,利用文本特征的身份识别也是文本挖掘的重要任务。在开放和虚拟网络环境下海量信息的作者身份或发布者的识别难题和传统作者身份识别方法在处理效率和成本等方面存在的问题有待解决。[方法/过程]将复杂网络理论引入该研究领域,在利用传统文体学特征识别作者身份方法的基础上结合文本词共现网络模型及其指标特征改进相关算法,使用文本文体学特征和文本网络模型度量指标构建作者风格特征集合,通过计算文本间风格相似度进行作者识别。[结果/结论]基于复杂网络模型的作者身份识别方法可以有效的利用作者风格特征,提高识别的精度,与其他算法的对比试验表明其识别结果的准确性更高。 相似文献
8.
9.
10.
为解决社区问答系统中的问题短文本特征词少、描述信息弱的问题,本文利用维基百科进行特征扩展以辅助中文问题短文本分类。首先通过维基百科概念及链接等信息进行词语相关概念集合抽取,并综合利用链接结构和类别体系信息进行概念间相关度计算。然后以相关概念集合为基础进行特征扩展以补充文本特征语义信息。实验结果表明,本文提出的基于特征扩展的短文本分类算法能有效提高问题短文本分类效果。 相似文献