共查询到10条相似文献,搜索用时 234 毫秒
1.
社会化标注体现了Web2.0时代的集体智慧,隐含了丰富的语义信息。本文分析了社会化标注的认知过程,探讨了社会化标注的浮出语义,提出了一种社会化标注的语义聚类算法。从语义的角度对社会化标注进行分析,有助于理解和挖掘社会化标注的隐含语义,指导平面化的自由分类法进行本体构建,丰富语义网资源。 相似文献
2.
标注语料库中句子的语义信息应该要有一套完整的规范体系。文章通过利用汉语框架和框架元素体系进行标注,首先介绍基于汉语框架的语义标注方法的概念,接着从句法性能、短语类型和框架元素标注这三个方面对汉语框架语义标注的具体规则进行阐述;最后,通过与其他语义标注方法的比较,分析得出框架语义标注的特点。 相似文献
3.
4.
通过实验采集用户的图像标注结果,对3种图像语义标注模式——基于标签打分的图像标注模式、单标签下基于图像比较的标注模式以及多标签下基于图像比较的标注模式的标注效果进行对比研究。研究发现:1基于标签打分的图像标注模式和单标签下基于图像比较的标注模式能够帮助用户对图像各标签的语义强度进行有效标注;2多标签下基于图像比较的标注模式可以帮助用户对图像各标签语义强度的比例关系进行有效标注;3标注界面中是否同时显示图像的所有标签,可能影响到用户对图像在各标签上语义强度比例关系的判断。 相似文献
5.
高效的Web页面语义标注方法是提高Web信息资源利用效率和知识创新的关键。针对当前Web页面语义标注方法存在的问题和Web页面表现出的结构特征和文本特征及其主题分布规律,设计了基于PLSA主题模型的Web页面语义标注算法。该算法分别对Web页面的结构特征和文本特征构建独立的PLSA主题模型,采用自适应不对称学习算法对这些独立的PLSA主题模型进行集成和优化,最终形成新的综合性的PLSA主题模型进行未知Web页面的自动语义标注。实验结果表明,该算法能够显著提高Web页面语义标注的准确率和效率,可以有效地解决大规模Web页面语义标注问题。 相似文献
6.
提出一种基于协方差特征爬虫的网页语义概念树构建方法,引入语义概念决策树算法进行主特征建模,根据语义三叉特征决策树概率正则训练迁移法则,得到决策树网络节点最近时刻获得的数据集有效特征概率,采用协方差特征网页爬虫进行网页语义概念树构建算法的改进。通过协方差特征爬虫,进行自相关成分的独立快速分离,得到语义自相关检索编码,实现网页语义概念树构建指导信息检索。仿真结果表明,该算法能有效进行数据挖掘和网页语义概念树的构建,为信息定位提供了最优分叉路径,从而实现对主题热点信息的准确检索和定位,算法具有较好的网页召回和定位检索性能,数据召回率提高明显,展示了较好的应用价值。 相似文献
7.
[目的/意义]文章的研究目的是探索科学论文的语义标注模式以满足科研人员快速获取细粒度科学知识的需求。[方法/过程]结合已有的概念模型,提出了一个聚焦于描述科学论文论证过程的语义标注框架,并利用该框架对一篇认知心理学科学论文进行了语义标注实验以验证其有效性。[结果/结论]以上述科学论文为例,利用该框架对其物理结构、论证过程、科学结论和实验过程进行了语义标注,以此构建细粒度的语义出版物,并在此基础上实现了对科学论文的细粒度内容的检索。[局限]如何对科学论文中的图片、表格和数据集进行语义标注,需要进一步研究。 相似文献
8.
9.
传统Web页面语义标注方法需手工处理,或只可将Web页面中有属性的标签赋予数据,针对无属性标签数据不进行标注,不适于大规模Web页面信息标注,且标注结果不可靠。为此,提出一种新的基于集成学习的动态Web页面语义标注方法。给出动态Web页面语义标注流程。将Web页面转换成DOM树,识别待标注文本。选取抽取信息特征与训练Web页面特征,将含有语义信息的内容分配至概念抽象化的本体上,采用多分类器集成学习方法进行分类,区分待标注信息是属性标签还是数据元素,通过不同分类器预测结果的一致性对相应样本被准确标注的置信度进行衡量。通过训练页面中涵盖的属性标注规则集与抽取信息中的属性名称实现语义标注。实验结果表明,所提方法适于大规模动态Web页面语义标注,标注结果可靠。 相似文献