首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于标签的个性化推荐应用越来越普遍,但是标签带有的语义模糊、时序动态性等问题影响着个性化推荐质量,现有研究仅从数量和结构上考虑用户与标签的关系。基于社会化标注系统的个性化推荐首先对融合社会关系的标签进行潜在语义主题挖掘,然后构建多层、多维度用户兴趣模型,提出模型更新策略,最后实现个性化推荐。采集CiteUlike站点数据进行实验分析,结果表明改进算法比传统算法更准确表达用户兴趣偏好,有效提高了个性化推荐准确率。  相似文献   

2.
用户标注是web2.0主要的资源标引和组织方法,由于用户标签组织的平面结构导致标签之间缺乏语义关系,使之很难适应语义信息组织的要求.针对这一问题,探讨在用户标注优化基础上,用户标签的词语网络构建和语义关系处理与控制,简要讨论了用户标注的模型化或本体化.  相似文献   

3.
社会化标注系统中标签的语义模糊性和形式不规范使得资源管理与共享越来越困难,为准确定位标签语义,文章从扩展标签语义与涌现标签语义两个方面,对标签语义检索研究现状进行了综述,分析了社会化标注系统中标签语义检索的研究动态和不足,并总结得出可计算性高、可操作性强、能智能获取标签的语义关系是社会化标注系统标签语义检索的未来研究方向。  相似文献   

4.
本文利用SOM神经网络的自组织特征,对delicious网站的典型标签族进行分类,从而识别社会化标注系统中标签的语义维度,为信息用户对标签的使用提供语义方面的参考。  相似文献   

5.
邱金鹏 《科技通报》2019,35(10):133-136
传统Web页面语义标注方法需手工处理,或只可将Web页面中有属性的标签赋予数据,针对无属性标签数据不进行标注,不适于大规模Web页面信息标注,且标注结果不可靠。为此,提出一种新的基于集成学习的动态Web页面语义标注方法。给出动态Web页面语义标注流程。将Web页面转换成DOM树,识别待标注文本。选取抽取信息特征与训练Web页面特征,将含有语义信息的内容分配至概念抽象化的本体上,采用多分类器集成学习方法进行分类,区分待标注信息是属性标签还是数据元素,通过不同分类器预测结果的一致性对相应样本被准确标注的置信度进行衡量。通过训练页面中涵盖的属性标注规则集与抽取信息中的属性名称实现语义标注。实验结果表明,所提方法适于大规模动态Web页面语义标注,标注结果可靠。  相似文献   

6.
协同标注系统的语义丰富   总被引:1,自引:0,他引:1  
提出利用语义网技术语义丰富协同标注系统的方法,通过对协同标注系统的标签进行标准化处理,利用标签的共现分析出标签的意思组,并将其与相关本体的SWTS(概念、属性、实例)映射,从而丰富标签的语义,以改善协同标注系统的检索结果.  相似文献   

7.
郭雪梅 《情报科学》2020,38(2):68-74
【目的/意义】为了提高信息服务的质量,文章融合“用户-标签-资源项”关系模型以及时间因素对于用户 标注资源的影响,提出了一种个性化推荐方法。【方法/过程】首先建立起“用户-标签-资源项”三者之间的关系模 型,分别计算用户对标签的偏好程度以及资源与标签的相关程度,以此为基础进行用户相似性和资源项相似性的 度量;然后,考虑标签使用的时间因素对用户兴趣偏好的影响结合基于用户标注行为的用户相似性以及资源项相 似性度量方法提出了改进的个性化推荐方法。【结果/结论】提出了一种综合标签和时间因素的推荐算法,该方法利 用标签使用频率描述用户偏好,并结合标签使用的时间因素动态更新用户偏好,提高推荐精度。该方法应用于医 学信息服务应用场景之中,并收集实验数据,最后将提出的方法与其他基于标签信息的协同过滤推荐方法在实验 数据集进行比较,实验结果发现该方法在推荐效果上优于对比方法。  相似文献   

8.
张志武 《情报科学》2015,(4):121-124,131
针对传统的基于关键字Web图像检索中的语义缺失问题,结合Web图像的视觉特征和描述文本,利用本体描述Web图像的语义特征,构建了基于本体的Web图像语义检索模型。该模型以领域本体描述Web图像的语义特征,通过自动图像标注技术构建Web图像本体库,用户可以通过输入关键词或者提交示例图像进行图像检索。实验表明,该模型具有较高的图像检索准确率。  相似文献   

9.
标注语料库中句子的语义信息应该要有一套完整的规范体系。文章通过利用汉语框架和框架元素体系进行标注,首先介绍基于汉语框架的语义标注方法的概念,接着从句法性能、短语类型和框架元素标注这三个方面对汉语框架语义标注的具体规则进行阐述;最后,通过与其他语义标注方法的比较,分析得出框架语义标注的特点。  相似文献   

10.
徐勇  张慧 《现代情报》2016,36(3):144-150
随着Web2.0的逐步发展, 海量用户生成的图像信息充斥于各大网络平台, 图像自动标注技术逐步成为图像检索以及图像理解的关键问题之一。该文主要通过对现有图像自动标注方法的文献进行收集和整理, 在比较、分析各种方法相关理论和实现技术的基础上, 对图像自动标注方法研究进展进行评述;并归纳了各种方法的优势与不足。得出结论:图像自动标注方法和图像处理技术仍然需要从机器学习方面进一步的研究与改进, 且可以从图像信息的标注拓展到视频信息的标注。  相似文献   

11.
社会标注系统中用户生成的标签具有随意性和弱关联性,这将导致标签推荐的精确性降低。本文基于加权元组潜在语义的三维张量结构模型,引入社会网络的结构化分析方法对相关元组进行量化加权,以构建加权的三维张量结构模型,并通过元组的潜在语义分析,得到能体现用户兴趣度的加权元组集。最后,通过典型标注网站Delicious中的用户标注数据集,验证了基于加权元组潜在语义分析的三维张量模型具有较好的标签推荐效果。  相似文献   

12.
文章采用信息可视化工具Citespace对语义标注的研究进展进行分析。先从文献年代、国别和学科分布介绍该研究领域的基本情况。然后对11个文献聚类中的前3个重点聚类进行分析,得到语义相似度、图像自动语义标注、语义标注语料库3个热点研究领域。最后通过文献共被引得到该领域的十篇关键文献,并通过内容分析得到该研究领域的演进历程。  相似文献   

13.
用户标注行为反映了标注对象与标注结果之间的相关关系。本文通过对用户标注行为的分析,详细研究了用户标注行为所反映的网页间相关性、标签间相关性以及网页和标签间相关性的关联程度,并将这种相关性分析用于标签的相关性计算上,改进了SPR算法。结果表明该算法可以有效提高检索结果重排的效果。
Abstract:
User annotation behavior reflects the relationships between annotated objects and tags. Based on the analysis of the user annotation behavior,this paper makes a detailed study of the relativity between Web pages,the relativity between tags and the relationships between them reflected by the user annotation behavior. The paper applies the relativity analysis to the relativity computation of tags to improve SPR. The results show that the algorithm can improve the re-ranking effect of retrieval results effectively.  相似文献   

14.
[目的/意义]文章的研究目的是探索科学论文的语义标注模式以满足科研人员快速获取细粒度科学知识的需求。[方法/过程]结合已有的概念模型,提出了一个聚焦于描述科学论文论证过程的语义标注框架,并利用该框架对一篇认知心理学科学论文进行了语义标注实验以验证其有效性。[结果/结论]以上述科学论文为例,利用该框架对其物理结构、论证过程、科学结论和实验过程进行了语义标注,以此构建细粒度的语义出版物,并在此基础上实现了对科学论文的细粒度内容的检索。[局限]如何对科学论文中的图片、表格和数据集进行语义标注,需要进一步研究。  相似文献   

15.
文章首先梳理了国内外对语义角色标注技术研究的相关文献,并综述了支持语义角色标注的主要语料资源,从句法分析、特征向量选择以及机器学习3个角度介绍了目前语义角色标注的主要方法,指出语义角色标注的未来发展趋势。最后,详细描述了基于语义角色标注的科技创新知识发现过程以及语义角色标注在科技情报分析研究中的应用价值,以期促进大数据时代科技情报语义分析研究。  相似文献   

16.
社会化标注系统的出现为网络信息研究以及自然语言处理领域带来了一个新的研究热点。通过对标签、用户、资源之间的相互关联性进行研究,提供一些对网络信息理解和自然语言处理的新思路、新方法。社会化标注现在已广泛应用于各种网络资源(如网页、视频、音频、图片等)的组织、管理中,为网络信息检索及网络知识个性化服务推送带来了极大方便。  相似文献   

17.
[目的/意义]针对戏曲类视频资源内容的管理难题,旨在构建一个戏曲类视频领域本体,以情节、事件、实体、动作、戏曲音乐等为核心要素,为戏曲类视频语义标注提供参考。[方法/过程]从分析戏曲类视频内容特征出发,确定本体应覆盖的范围;选择复用与参考已有的相关本体,在此基础上进行扩展,确定核心要素及其之间的关系,使用Protégé构建本体。[结果/结论]以豫剧和昆曲的两个经典剧目为例进行语义标注,通过SPARQL检索说明了标注框架的有效性。该本体可对戏曲类视频内容语义有效描述,将多方面的戏曲领域知识与视频内容进行关联,实现视频内容的结构化表达,为向不同类型的用户提供戏曲类视频内容检索提供关键基础。  相似文献   

18.
网页语义标注研究综述   总被引:1,自引:0,他引:1  
郭少友  窦畅  常桢 《情报杂志》2015,(4):169-175
网页语义标注是指利用本体对蕴含在网页中的知识进行描述以便计算机和人均能理解。首先对网页语义标注的涵义、要求和形式进行分析,然后分别讨论静态网页和动态网页的语义标注方法,并对现有的标注工具进行总结,最后提出有待进一步研究的几个问题。  相似文献   

19.
【目的/意义】本文基于颜色、纹理等外部特征与局部视觉特征构成的底层语义特征数据并采用随机森林的 方法对医学图像信息进行语义自动标注,为医务工作者提供临床决策参考,便于普通公众理解医学知识和了解个 人健康情况,也可以在大数据环境下扩展图书情报领域研究人员对信息组织与处理的范围,促进学科交叉与融合, 提升智慧医学的发展,为健康中国战略提供智力与技术支持。【方法/过程】融合图书情报领域知识与医学知识,将 图像语义标注看作为一个多类分类问题,首先,抽取颜色、纹理等外部特征及局部视觉特征等底层语义特征;然后, 运用随机森林的方法,设计了基于随机森林的医学图像自动标注方案。【结果/结论】融合底层语义特征的医学图像 信息自动标注的方案与随机树标注方案相比较,具有较好的效果。【创新/局限】将视觉语义词典作为医学图像的底 层语义特征引入到图像标注中;运用随机森林构建的医学图像标注方案;局限在于仅采用BreaKHis数据集为实验 数据。  相似文献   

20.
[目的/意义]为提高主题建模结果的可读性,解决主题标注过程中主观性强、可解释性弱的问题,引入本体和关联规则构建频繁语义模式。[方法/过程]以肿瘤靶向治疗专利数据为研究对象,首先构建LDA2vec模型挖掘主题;然后考虑主题词的语义与共现,将UMLS本体与FP-growth关联规则相结合,得到频繁语义模式的主题标注;最后将结果与Canopy方法对比评估。[结果/结论]实证结果显示,基于频繁语义模式的标注能够从统计和语义的角度概括主题含义,在主题标注工作中效果更佳。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号