基于信息度量与SVM的文本图像自动提取技术 |
| |
引用本文: | 程娟,平西建,童莉,杨洋.基于信息度量与SVM的文本图像自动提取技术[J].情报杂志,2006,25(4):69-70,73. |
| |
作者姓名: | 程娟 平西建 童莉 杨洋 |
| |
作者单位: | 解放军信息工程大学,郑州,450002 |
| |
摘 要: | 在网络文本图像的自动提取过程中,计算机难以直接实现基于高层语义特征的文本图像提取,因此文本图像提取技术的性能很走程度上依赖于底层统计特征的提取。广义归一化图像信息度量(GNPIM)和Lorenz信息度量(LIM)在灰度级上描述了图像的分布,在语义层上反映了图像的内容,是区分文本图像和一般连续色调图像的有效统计特征,作为支持向量机(SVM)的输入向量。可区分文本图像与连续色调图像,从而实现网络中文本图像的自动提取。实验结果表明,基于GNPIM、LIM与SVM的文本图像提取技术能够有效提取网络中的文本图像。且正确率高,速度快。
|
关 键 词: | 支持向量机 文本图像提取 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|