排序方式: 共有2条查询结果,搜索用时 718 毫秒
1
1.
文本分类是处理和组织大量文本数据的关键技术之一。为了更加有效地实现文本分类,本文提出了一种基于图模型的文本特征提取方法。该方法利用类别信息在训练数据集上构造邻接带权图及其补图,使得属于同一个类别的样本点的投影尽可能近,不属于同一个类别的样本点的投影尽可能远。这种方法既能够获得文本空间的全局结构信息又可以保留局部结构信息。最后,采用K近邻分类器在20Newsgroups标准数据集上进行训练和测试,并且与基于潜在语义索引的文本分类方法做了比较,文本分类的性能得到很大提高。实验结果表明,本文所提出的方法能够有效地提高文本分类的性能。 相似文献
2.
一个描述可视化语言上下文属性化的图文法框架 总被引:2,自引:0,他引:2
针对目前已有的上下文相关图文法的描述规范过于复杂或不太直观,提出了一个新的上下文相关图文法的形式框架:上下文属性化的图文法CAGG.该文法将产生式的上下文信息刻画成相关结点的上下文属性来解决嵌入问题.而且进一步分析了合流的CAGG产生式集合的基本特征,并基于此设计了合流产生式集合的判定算法,从而为构造高效的语法分析算法奠定了基础.通过与已有上下文相关图文法的对比分析可知,CAGG图文法的形式更为简洁和直观,因而更适于且更易于应用到可视化语言描述领域. 相似文献
1