首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
曾金  贺国秀 《情报科学》2019,37(3):136-140
【目的/意义】基于社交媒体用户分享的图像、博文及用户标签数据,为用户推荐潜在的好友,从而更好的为 用户做个性化推荐和精准化服务。【方法/过程】在获取微博用户分享的图像、博文及用户标签的基础上,通过使用 深度学习的方法利用图像、博文及用户标签数据来表达用户兴趣特征,基于这三类特征组合,通过计算用户之间的 余弦相似度来挖掘与目标用户兴趣最相近的若干个候选用户。同时,探讨了多模数据在无监督学习下的用户推荐 问题,并与单模数据进行比较。【结果/结论】实验结果表明,利用图像、博文和用户标签合成的多模数据对用户的兴 趣进行建模并进行好友推荐较单模数据效果好。  相似文献   

2.
唐樾  马静 《情报科学》2022,40(6):108-114
【目的/意义】随着社交网络的复杂化,当前谣言往往是由描述事件的文本、对应的图片或者视频组成,多种 模态的谣言更容易给用户传达一种错误的认知。现有谣言检测的研究往往只使用谣言文本特征,且未能充分挖掘 谣言与事件存在的联系。【方法/过程】因此本文提出一种基于增强对抗网络和多模态融合的谣言检测方法,使用 BERT 和 Text-CNN 提取文本特征,使用 VGG-19网络提取图像特征,再通过注意力机制捕捉多个模态的特征交 互,最后使用增强对抗网络来挖掘谣言和事件之间联系。【结果/结论】在公开的微博多模态数据集上进行对比实 验,实验结果表明该方法检测的准确率达到了 92.5%,相较于传统单模态和现有多模态模型,提升了约 10%~20%。 【创新/局限】本文将对抗网络和多模态特征融入谣言检测中,有效提升了谣言检测的效果,但目前仅尝试了文本和 图像两种模态的结合,如何融合更多模态的特征后续有待研究。  相似文献   

3.
张彬  徐建民  吴树芳 《情报科学》2020,38(4):147-152
【目的/意义】通过对大数据环境下的多源用户兴趣特征有效融合,缓解个性化推荐中用户兴趣偏好数据的稀疏性和准确性问题。【方法/过程】考虑到多域的数据权威度、内容质量及体系结构的差异化较为明显,提出了基于多源用户标签的跨域兴趣融合模型,首先把多个域中的用户兴趣进行标签化处理,然后利用跨域用户识别和标签权重归一方法得到多个域的用户实体-标签矩阵,最后使用域权重影响系数对标签进行融合,构造具有复合权重的用户兴趣标签集。【结果/结论】使用5个来源数据域进行实验与分析,融合模型能够有效提高标签用户覆盖效果,在查全率不断提高的情况,融合域能够保持较高的标签用户查准率,有效提高用户兴趣特征的描绘效果。  相似文献   

4.
张国标  李洁  胡潇戈 《情报科学》2021,39(10):126-132
【目的/意义】社交媒体在改变新闻传播以及人类获取信息方式的同时,也成为了虚假新闻传播的主要渠 道。因此,快速识别社交媒体中的虚假新闻,扼制虚假信息的传播,对净化网络空间、维护公共安全至关重要。【方 法/过程】为了有效识别社交媒体上发布的虚假新闻,本文基于对虚假新闻内容特征的深入剖析,分别设计了文本 词向量、文本情感、图像底层、图像语义特征的表示方法,用以提取社交网络中虚假新闻的图像特征信息和文本特 征信息,构建多模态特征融合的虚假新闻检测模型,并使用MediaEval2015数据集对模型性能进行效果验证。【结果/ 结论】通过对比分析不同特征组合方式和不同分类方法的实验结果,发现融合文本特征和图像特征的多模态模型 可以有效提升虚假新闻检测效果。【创新/局限】研究从多模态的角度设计了虚假新闻检测模型,融合了文本与图像 的多种特征。然而采用向量拼接来实现特征融合,不仅无法实现各种特征的充分互补,而且容易造成维度灾难。  相似文献   

5.
高亚琪  王昊  刘渊晨 《情报科学》2021,39(10):107-117
【目的/意义】针对当前利用计算机管理图像资源存在图像语义特征表达不足等问题,探索和分析了特征及 特征融合对分类结果的影响,提出了一种提高图像语义分类准确率的方法。【方法/过程】本文定义了四种图像风 格,将图像描述特征划分为三个层次,探究特征融合的特点,寻求能有效表达图像语义的特征。分别采用SVM、 CNN、LSTM 及迁移学习方法实现图像风格分类,并将算法组合以提高分类效果。【结果/结论】基于迁移学习的 ResNet18模型提取的深层特征能够较好地表达图像的高级语义,将其与SVM结合能提高分类准确率。特征之间 并不总是互补,在特征选择时应避免特征冗余,造成分类效率下降。【创新/局限】本文定义的风格数目较少,且图像 展示出的风格并不绝对,往往可以被赋予多种标签,今后应进一步丰富图像数据集并尝试进行多标签分类。  相似文献   

6.
曾子明  周知 《情报科学》2018,36(4):150-154
【目的/意义】针对不同主题下资源数量的差异对用户兴趣建模存在影响的问题,提出一种基于主题热度的 兴趣建模策略,提升模型的预测能力与推荐系统的推荐效果。【方法/过程】以主题下不同资源的数量代表该主题的 热度,以此对用户兴趣特征进行调权处理,并在此基础上利用向量空间模型进行兴趣表示。以抓取的“豆瓣电影” 675351 位用户的观影数据进行推荐实验,验证本文策略的效果。【结果/结论】实验结果显示,基于主题热度调权的 兴趣建模方法的推荐准确率明显高于传统基于绝对频次的兴趣建模方法,该策略可以提升用户兴趣建模效果。  相似文献   

7.
陈杰  马静  李晓峰  郭小宇 《情报科学》2022,40(3):117-125
【目的/意义】本文融合文本和图像的多模态信息进行情感识别,引入图片模态信息进行情感语义增强,旨在 解决单一文本模态信息无法准确判定情感极性的问题。【方法/过程】本文以网民在新浪微博发表的微博数据为实 验对象,提出了一种基于DR-Transformer模型的多模态情感识别算法,使用预训练的DenseNet和RoBERTa模型, 分别提取图片模态和文本模态的情感特征;通过引入Modal Embedding机制,达到标识不同模态特征来源的目的; 采用浅层Transformer Encoder对不同模态的情感特征进行融合,利用Self-Attention机制动态调整各模态信息特征 的权重。【结果/结论】在微博数据集上的实验表明:模型情感识别准确率为 79.84%;相较于基于单一文本、图片模 态的情感分类算法,本模型准确率分别提升了 4.74%、19.05%;相较于对不同模态特征向量进行直接拼接的特征融 合方法,本模型准确率提升了 1.12%。充分说明了本模型在情感识别的问题上具有科学性、合理性、有效性。【创 新/局限】利用 Modal Embedding 和 Self-Attention 机制能够有效的融合多模态信息。微博网络舆情数据集还需进 一步扩充。  相似文献   

8.
【目的/意义】在利用用户感兴趣资源进行用户兴趣建模中,传统的资源特征选择方案未能体现用户真实兴 趣,针对这一情况,提出一种基于认知的用户兴趣建模方法,改善个性化推荐效果。【方法/过程】在结合用户群体认 知对资源特征进行识别的基础上,对用户感兴趣资源进行兴趣建模。以电影数据为例,进行个性化推荐实验,验证 模型效果。【结果/结论】实验结果显示,基于认知的用户兴趣建模的推荐准确率明显高于传统基于项目的用户兴趣 建模方法,该策略可以更准确地描述用户兴趣,提升用户兴趣建模效果。  相似文献   

9.
郭雪梅 《情报科学》2020,38(2):68-74
【目的/意义】为了提高信息服务的质量,文章融合“用户-标签-资源项”关系模型以及时间因素对于用户 标注资源的影响,提出了一种个性化推荐方法。【方法/过程】首先建立起“用户-标签-资源项”三者之间的关系模 型,分别计算用户对标签的偏好程度以及资源与标签的相关程度,以此为基础进行用户相似性和资源项相似性的 度量;然后,考虑标签使用的时间因素对用户兴趣偏好的影响结合基于用户标注行为的用户相似性以及资源项相 似性度量方法提出了改进的个性化推荐方法。【结果/结论】提出了一种综合标签和时间因素的推荐算法,该方法利 用标签使用频率描述用户偏好,并结合标签使用的时间因素动态更新用户偏好,提高推荐精度。该方法应用于医 学信息服务应用场景之中,并收集实验数据,最后将提出的方法与其他基于标签信息的协同过滤推荐方法在实验 数据集进行比较,实验结果发现该方法在推荐效果上优于对比方法。  相似文献   

10.
【目的/意义】为提升主流融媒体意识形态建设和舆论引导能力,解决大数据时代背景下主流融媒体多模态 信息资源管理的困境,构建高效的热点发现机制。【方法/过程】笔者着眼于主流融媒体热点发现需求构建需求体 系,然后利用Scrapy-Redis框架、HBase数据库和MapReduce实现了数据的精准采集、有序存储和高效处理,再基于 多模态信息融合的理念,借助 NLP技术对信息资源的特征进行提取,最后利用 LDA2vec模型和 Single-Pass算法实 现了信息归集和热点的发现与更新。【结果/结论】仿真实验结果表明,本研究所使用的方法,能够较好地实现多模 态信息的归集和热点的提取,效果较同类模型有明显提升。【创新/局限】但是在运用NLP技术处理多模态信息时各 处理环节的衔接尚不够流畅,后续仍需进行改进提升。  相似文献   

11.
【目的/意义】本文基于概念格构建了高校图书馆群体用户兴趣画像,揭示不同群体用户的行为需求,挖掘 潜在的行为规律,为高校图书馆不同群体用户的个性化服务提供参考。【方法/过程】以高校图书馆为服务主体,对 服务对象进行细化和分类,利用Con Exp1.3工具构建不同群体用户类别的细分标签,并生成Hasse图,深入挖掘用 户的行为属性和需求特征,通过概念格“Calculate Association Rule”对不同群体的用户行为进行关联规则挖掘,实现 群体兴趣画像的精准刻画。【结果/结论】借鉴概念格的方法,能够更加清晰和全面的展示层级关系,识别群体用户 的需求属性和行为特征,进而探索用户之间的关联,有助于提升高校图书馆的服务质量,提升服务效率。  相似文献   

12.
吴树芳  吴崇崇  朱杰 《情报科学》2021,39(8):103-111
【目的/意义】微博用户画像的精准构建,可有效识别用户的需求,提高个性化推荐的准确率。针对现有微 博用户画像构建方法对用户特征提取不全面、不准确的问题,本文提出了基于兴趣转移的用户画像构建方法。【方 法/过程】首先,依据层次分析法确定不同兴趣行为的权重,并将其用于修订兴趣词权重,获得用户的初始兴趣词 集;然后,依据生命周期理论获得用户兴趣行为周期,构建兴趣转移的时间衰减函数,实现对用户兴趣词集的动态 更新和叠加;最后,将用户的静态属性标签与基于兴趣转移的动态兴趣标签融合构建微博用户画像。【结果/结论】 实验采用从新浪微博爬取的真实数据作为数据集,实验结果显示:与已有微博用户画像构建方法相比,本文提出的 方法在个性化推荐中具有较好的性能。【创新/局限】创新点为:借鉴生命周期理论刻画微博用户兴趣行为周期,构 造兴趣转移的时间衰减函数,实现兴趣标签的动态更新。局限是未对静态属性标签的重要性进行界定,且未对存 在异常波动的兴趣行为曲线进行深入探讨。  相似文献   

13.
【目的/意义】为微博用户生成质量较高的标签,帮助用户对微博特征进行描述。【方法/过程】首先,分析微 博的特征建立候选标签与候选词表。随后,用 LDA对用户的微博进行主题分析,将用户的微博与预选标签相匹配, 生成预选标签。最后,用 LDA对用户关注的人及用户的粉丝的微博进行主题分析,对预选标签进行控制生成最终 标签。【结果/结论】实验结果表明,本文以 LDA为基础提出的标签生成方法具有不错的效果,最终生成的标签能够 较为准确地描述用户的微博特征。  相似文献   

14.
【目的/意义】以基于社会化分享模式的信息共享行为为研究对象,对社会化分享用户及其行为特征进行 识别,研究结果为本领域后续研究提供支撑,为内容服务商、社交媒体等提供优化参考。【方法/过程】以新浪微博为 研究案例,通过爬虫获取 20 574条社会化分享数据并构建包括 12个字段的数据集,采用描述性统计分析、相关分 析、Logistic回归分析等方法进行数据分析。【结果/结论】参与社会化分享的用户具有一定的人口统计学特征和行 为规律,且不同的用户群体对社会化分享内容的选择存在差异,用户的个人特征和社交媒体使用特征均对内容的 扩散产生影响。  相似文献   

15.
吴剑云  胥明珠 《情报科学》2021,39(1):128-134
【目的/意义】用户画像深刻地描述了视频用户的个体和群体行为特征,为视频的个性化推荐服务提供参 考。【方法/过程】通过文本挖掘对爬取的视频、用户及其观影数据分析,构建单个用户画像,并通过K-Means和LDA 模型对用户聚类并提取主题,挖掘群体用户特征。基于用户画像和时间指数衰减的视频兴趣标签,并结合视频喜 爱度和协同过滤,进行视频推荐。【结果/结论】考虑时间指数衰减的个性化推荐,提高了系统对用户兴趣的感知。 结合视频喜爱度和协同过滤,推荐视频评分达0.87,有助于提高用户对网站的忠诚度和活跃度。【创新/局限】基于用 户生成内容的文本挖掘结果,进行单个和群体用户画像,并创新性采用时间指数衰减构建用户视频兴趣标签,以捕 获用户兴趣的变化。由于网络爬虫的限制,实验数据量有一定的局限性,且特征提取兴趣范围有限。  相似文献   

16.
【目的/意义】探究学术社交网络用户使用动机与行为的投射关系,从行为数据中反推使用动机并基于动机 构建群体画像,为平台定位用户群体、挖掘需求偏好提供指导。【方法/过程】首先剖析学术社交网络用户使用动机 的投射过程,明确动机类型及不同动机下行为的投射表达;然后设计用户使用动机画像的总体流程,最后以小木虫 社区为例,采集相应的行为数据进行动机画像的实验分析。【结果/结论】结果表明样本可划分为五类群体,通过类 簇中心与平均用户的对比可从动机视角概括出群体特征标签,解读出用户使用动机及需求偏好。【创新/局限】在变 革用户使用动机的获取方式、发挥动机研究对运营实践指导作用方面进行了创新性尝试,但在细粒度行为数据采 集及不同领域对比分析方面有待进一步研究。  相似文献   

17.
【目的/意义】面对网络时代数据的海量性和无序性,为用户推荐个性化资源有利于增强用户间合作、提高 知识的共享速度,对新知识的发现具有深远意义。【方法/过程】基于具有相同兴趣用户的聚合优于单纯的信息聚 合,构建基于社会化标注系统的个性化推荐模型。通过引入社会网络中用户使用标签的频次来选择与用户关联显 著的标签,并通过加权派系发现和聚合“小众”凝聚组群和相似标签集,进而为用户推荐优质资源,使其真正契合用 户的个性化需求偏好。【结果/结论】结果表明模型能够有效实现信息的个性化推荐,消除单独聚类带来的粗糙数据 集,并通过抓取豆瓣上的数据进行实证分析。  相似文献   

18.
易明  秦涵  蒋武轩 《情报科学》2020,38(2):29-38
【目的/意义】基于标签系统所蕴含的语义信息与隐性社会网络,构建融合标签概念空间及用户网络的语义社 团发现模型,提高社团发现的质量。【方法/过程】通过构建标签的概念空间挖掘标签间的语义关系,并根据标签包 含的隐性社会网络发现用户网络,进而将两者结合融入到社团发现算法中,并以豆瓣网数据对模型进行实证。【结 果/结论】标签概念空间及用户网络能够提升语义社团发现算法效果。  相似文献   

19.
陈晨  侯景瑞  吴任力  王平 《情报科学》2019,37(7):139-145
【目的/意义】社会化问答社区现已成为网络用户共享、传播及获取知识的重要平台,但其开放性和交互性 也给其问题推荐工作带来了巨大的挑战。本文提出的基于多源混合标签的方法能够有效提高社会化问答社区的 问题推荐质量,以促使问题得到及时有效地解决。【方法/过程】利用自动标签标注系统从问答文本中提取关键词, 将语义扩展后的关键词作为基本标签,并建立多源混合标签库;利用标签表示用户的兴趣偏好与权威度,并建立用 户特征模型;最终通过协同过滤的方式进行匹配推荐。【结果/结论】实验结果表明,本文提出的基于多源混合标签 的问题推荐方法在检全率、检准率以及F值等指标方面均不同程度地优于基于文本相似度的基准方法。  相似文献   

20.
王帅 《情报科学》2022,40(6):98-107
【 目的/意义】在突发公共卫生事件情境下面向在线健康社区用户画像与分群,有助于提升社区服务质量,为 拓宽互联网疫情风险感知渠道作出贡献。【方法/过程】以“COVID-19”为例,结合社区数据特点从用户基本特征、 用户兴趣主题、情感倾向、用户问诊需求和用户交互网络角色五个角度出发构建画像标签并利用DBSCAN聚类实 现画像,根据画像结果呈现用户概貌;利用 AP算法在画像基础上实现用户分群,通过社会网络分析找到最具疫情 风险发现价值的用户类群。【结果/结论】实例分析表明,本文所构建的模型能够有效生成在线健康社区用户画像, 画像可以对社区用户进行概括、映射用户原貌;分群结果呈现出5类社区用户群:患者、疑似患者、医师、奉献者和社 区管理员;社会网络分析表明最具疫情风险发现价值的用户群体为疑似患者和奉献者。【创新/局限】实例分析数据 量尚达不到“大数据”标准,画像构建粒度仍有继续提升的空间。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号