首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
周源  刘怀兰  杜朋朋  廖岭 《情报科学》2017,35(5):111-118
【目的/意义】特征提取会很大程度地影响分类效果,而传统TF-IDF特征提取方法缺乏对特征词上下文环 境和对特征词在类之间分布状况的考虑。【方法/过程】本文提出一种改进TF-IDF特征提取的方法:①基于文本网 络和改进PageRank算法计算节点重要程度值,解决传统TF-IDF忽略文本结构信息的问题;②增加特征值IDF值 的方差来衡量特征词w在不同类别文本集中程度的分布情况,解决传统TF-IDF忽略特征词在类之间分布状况的 不足。【结果/结论】基于该改进方法构建了文本分类模型,对3D打印数据进行分类实验。对比算法改进前后的分 类效果,验证了该方法能够有效提高文本特征词提取的准确度。  相似文献   

2.
孟秋晴  熊回香 《情报科学》2021,39(6):152-160
【目的/意义】为了向在线医疗社区中的用户自动推荐符合其自身实际需求的医生,本文基于在线问诊文本 信息,提出了基于相似用户与相似医生的混合医生推荐算法。【方法/过程】首先从用户咨询问题出发,找到具有相 似咨询问题的用户,将其所选择的医生作为基于相似用户的推荐集合;然后从医生回答从发,通过LDA主题模型训 练,从医生回答文本集中挖掘出隐含的疾病主题,按主题查找具有相似疾病诊治经验的医生作为推荐集合;最后通 过混合相似度计算融合基于相似用户和相似医生的推荐结果,得到最终推荐列表。【结果/结论】通过对在线医疗社 区“39健康网”进行实证研究,结果表明,利用本文提出的方法进行推荐,能够有效降低数据维度,挖掘文本间的潜 在语义关联,有效缩小语义鸿沟,提升推荐质量,具有较好的推荐效果。【创新/局限】本文仅选取了针对科室的小样 本数据进行实验,且部分参数使用经验值,未来可深入探讨该方法在大规模医疗数据集上的应用。  相似文献   

3.
【目的/意义】通过网络表示学习方法学习和发现作者间的关联性,提高推荐准确率,更好地进行关联推 荐。【方法/过程】基于2010-2017 年中国管理科学领域的数据构建基于网络表示学习的作者合作推荐模型,通过多 关系映射获取到的多关系序列作为语料库,采用Word2vec 方法进行网络表示学习训练,并利用余弦相似度方法计 算作者间相似度。【结果/结论】本文算法推荐精度达到82.8%,其推荐精度显著提高;融合元路径(元结构)特征的推 荐精度大幅提高,能为作者合作伙伴的选择提供建议和参考,对实践具有一定的指导意义。  相似文献   

4.
周鑫  熊回香  肖兵 《情报科学》2023,(3):145-154
【目的/意义】针对在线医疗信息结构松散,医疗平台医生推荐精度不足的现状,设计了一种基于标签和患者咨询文本的医生推荐算法,提升医生推荐效果。【方法/过程】利用Word2vec模型训练患者咨询文本得到特征向量,改进余弦相似度算法计算医生推荐集A;利用LDA模型训练医生标签得到医生在主题上投影的概率分布,改进KL距离算法计算医生推荐集B;基于社会网络分析理论设计相关算法重构医生网络链接,选择中心性指标得到最终医生推荐集C。【结果/结论】以“丁香医生”数据进行实证,面向UGC数据丰富了算法的可用程度,弥补了单一推荐方法的不足,提高了推荐的精度。本文所提方法有效提升了医生推荐精度。【创新/局限】通过融合标签和患者咨询文本,采用社会网络分析实现了医生混合推荐。虽然通过中心性指标进行重要医生挖掘,但挖掘效果有提升空间。  相似文献   

5.
【目的/意义】通过概念层次关系自动抽取可以快速地在大数据集上进行细粒度的概念语义层次自动划分, 为后续领域本体的精细化构建提供参考。【方法/过程】首先,在由复合术语和关键词组成的术语集上,通过词频、篇 章频率和语义相似度进行筛选,得到学术论文评价领域概念集;其次,考虑概念共现关系和上下文语义信息,前者 用文献-概念矩阵和概念共现矩阵表达,后者用word2vec词向量表示,通过余弦相似度进行集成,得到概念相似度 矩阵;最后,以关联度最大的概念为聚类中心,利用谱聚类对相似度矩阵进行聚类,得到学术论文评价领域概念层 次体系。【结果/结论】经实验验证,本研究提出的模型有较高的准确率,构建的领域概念层次结构合理。【创新/局限】 本文提出了一种基于词共现与词向量的概念层次关系自动抽取模型,可以实现概念层次关系的自动抽取,但类标 签确定的方法比较简单,可以进一步探究。  相似文献   

6.
【目的/意义】学术论文的结构功能是学术论文篇章结构和语义内容的集中体现,目前针对学术论文结构功 能的研究主要集中在对学术论文不同层次的识别以及从学科差异性视角探讨模型算法的适用性两方面,缺少模 型、学科、层次之间内在联系的比较研究。【方法/过程】选择中医学、图书情报、计算机、环境科学、植物学等学科中 文权威刊物发表的学术论文作为实验语料集,在引入CNN、LSTM、BERT等深度学习模型的基础上,分别从句子、 段落、章节内容等层次对学术论文进行结构功能识别。【结果/结论】实验结果表明,BERT模型对于不同学科学术论 文以及学术论文的不同层次的结构功能识别效果最优,各个模型对于不同学科学术论文篇章内容层次的识别效果 均最优,中医学较之其他学科的学术论文结构功能识别效果最优。此外,利用混淆矩阵给出不同学科学术论文结 构功能误识的具体情形并分析了误识原因。【创新/局限】本文研究为学术论文结构功能识别研究提供了第一手的 实证资料。  相似文献   

7.
【 目的/意义】研究从用户群体的角度出发,依据用户特征对社区用户进行群体划分,以了解不同用户群体的 主题差异,从而更加全面清晰的了解社区主题,更好的为社区用户推荐资源。【方法/过程】研究利用社会网络分析 和Topsis算法对用户群体进行划分,再利用LDA模型分别对不同用户进行主题挖掘,最后采用谱聚类实现主题优 化。【结果/结论】科学网情报学社区的核心用户与一般用户群体主题有相同的部分,也存在差异,核心用户群体的 主题专指性较强,一般用户群体的主题较为广泛。基于虚拟学术社区用户群体主题挖掘模型,可以更加全面展示 社区用户关注的主题,更好地为社区用户推荐资源。【创新/局限】研究从用户群体的视角出发,提出了虚拟学术社 区用户群体主题挖掘模型,更好的为社区用户推荐资源,但本研究在数据量、主题模型以及社会网络分析指标的选 取等方面还需要拓展与延伸。  相似文献   

8.
【目的/意义】根据学者当前的科研需求基于学术能力与合作关系网络为其推荐潜在合作学者,有利于增强 学术交流合作,促进科研发展。【方法/过程】从学者的学术能力和合作关系网络两个维度构建推荐模型,通过相关 学者的学术能力挖掘候选推荐学者的知识覆盖度,根据历史合作关系网络挖掘合作质量,综合计算在这两个层面 的推荐值实现合作学者推荐。最终以百度学术学者主页数据进行实证以验证模型的有效性和有用性。【结果/结 论】将学者当前科研任务的合作需求加入到推荐模型中构建多维推荐技术,符合科研用户需求,推动学术的交流合 作,模型具有较好地应用性。  相似文献   

9.
【目的/意义】研究科研社交网站中的学者推荐有利于增强学术合作、提升科研人员学术交流,对科研工作 具有深远意义。【方法/过程】从学者知识结构和学术行为网络两个维度出发,构建基于相似兴趣的学者推荐模型, 挖掘分析学者知识结构特征、学者间合作网络、机构间合作网络关系,计算学者在这三个层面上的相似度并进行整 合实现学者推荐。最后以百度学术学者主页数据为例验证模型的可用性与有效性。【结果/结论】结果表明:模型能 够有效解决科研社交网站信息过载和不对称的问题,满足可操作性和推荐结果有效性。  相似文献   

10.
【目的/意义】利用用户画像以及个性化推荐算法实现智慧图书馆中的图书推荐。【方法/过程】从构建智慧 图书馆用户画像的自然属性、兴趣属性、社交属性三个数据维度出发,借助相似度计算方法分别计算不同维度读者 和图书的相似度,实现基于相似读者和相似图书的虚拟图书推荐,阐述了借助智慧图书馆的先进技术实现基于位 置的实体图书推荐。【结果/结论】实验结果表明将用户画像用于智慧图书馆图书推荐可提升图书馆个性化服务能 力,针对读者实现精准推荐。【创新/局限】基于用户画像的图书推荐从多个维度进行组合推荐,实现了智慧图书馆 虚拟图书和实体图书的个性化推荐,提高了推荐质量,为提升智慧图书馆个性化服务具有一定的借鉴意义。局限 在于选取的读者以及图书数量较少。  相似文献   

11.
[目的/意义] 从关键词语义类型和学术文献老化两个维度出发挖掘学术论文价值,为学者推荐符合其研究需求并在时间维度上具有较大参考意义的学术论文。[方法/过程] 首先,将学术论文关键词按语义类型进行划分|随后,基于共现关系计算同类型关键词间相似度,基于关键词相似度得到论文在语义类型上的相似度|然后,借用文献老化思想,计算不同类型论文的时间价值|最后,结合论文在语义类型上的相似度及时间价值,生成论文推荐列表从而进行推荐工作。[结果/结论] 实证结果表明,使用该方法推荐的论文,一方面与学者研究方向相符|另一方面在时间维度上也具有较大价值,推荐的论文质量较高。  相似文献   

12.
程亚男  王宇 《情报科学》2018,36(8):72-76
【目的/意义】目前问答社区答案数量多且篇幅长,对答案进行重新排序和组织可以方便用户高效获取答案 信息。【方法/过程】针对答案文本的特点,提出基于答案相似度对社区答案进行重新组织、排序的方法。该方法定 义答案文本语义云和情感云,利用标签传播算法计算出词典中不存在的词语语义和情感相似度,即云滴值,然后每 个答案形成多片语义云和一片情感云,通过计算答案云间相似度得到答案文本间的相似度。最后,结合答案“赞” 数对答案进行重新排序。【结果/结论】通过实验的人工评价,发现与基于“赞”数排序相比,基于语义情感相似度的 答案排序方法与人工排序相似度更高,更能满足社区用户需求。  相似文献   

13.
【目的/意义】研究从用户节点和网络全局两个视角出发,基于用户相似度与信任度对虚拟学术社区中学者 进行推荐,提高学者推荐的质量。【方法/过程】首先,利用 LDA 主题模型挖掘学者发表的博文主题,计算博文相似 度;通过学者共同好友比例计算好友相似度;然后将博文相似度和好友相似度融合计算用户相似度;最后,融合用 户相似度和信任度进行学者推荐。【结果/结论】提出虚拟学术社区中基于用户相似度与信任度的学者推荐方法,综 合利用用户节点和网络全局信息,为虚拟学术社区用户进行学者推荐。【创新/局限】从用户节点和网络全局两个角 度进行学者信息融合,有效提高了虚拟学术社区中学者推荐的质量。局限在于本文主要考虑的是学者在网络全局 中的信任度,用户节点间的交互信任关系还有待进一步研究。  相似文献   

14.
陈晨  侯景瑞  吴任力  王平 《情报科学》2019,37(7):139-145
【目的/意义】社会化问答社区现已成为网络用户共享、传播及获取知识的重要平台,但其开放性和交互性 也给其问题推荐工作带来了巨大的挑战。本文提出的基于多源混合标签的方法能够有效提高社会化问答社区的 问题推荐质量,以促使问题得到及时有效地解决。【方法/过程】利用自动标签标注系统从问答文本中提取关键词, 将语义扩展后的关键词作为基本标签,并建立多源混合标签库;利用标签表示用户的兴趣偏好与权威度,并建立用 户特征模型;最终通过协同过滤的方式进行匹配推荐。【结果/结论】实验结果表明,本文提出的基于多源混合标签 的问题推荐方法在检全率、检准率以及F值等指标方面均不同程度地优于基于文本相似度的基准方法。  相似文献   

15.
【目的/意义】当前全球信息化时代下信息过载问题日趋严峻,在深度挖掘信息的基础上,结合用户行为特 征进行智能匹配显得尤为重要。【方法/过程】本文在基于潜在因子模型的个性化推荐算法的基础上,构建了结合时 间序列的语义信息挖掘及匹配模型。通过引入用户历史行为的时间序列语义信息,提高已有模型预测用户偏好的 准确性,结合因子分解机的思想实现对扩展模型的构建,并通过 movielens数据集对该方法的有效性进行验证。【结 果/结论】实验结果表明,新模型能够有效提高已有推荐模型预测用户偏好的准确性,从而实现了良好的数据挖掘 及匹配效果。  相似文献   

16.
【目的/意义】构建基于用户动态画像的学术新媒体信息精准推荐模型是满足学术新媒体用户对学术信息 资源精准化、个性化与专业化的要求,同时也是提高学术信息流转效率以及价值增值的有效途径。【方法/过程】在 探究学术新媒体信息流转模型的基础上,进一步分析学术新媒体用户需求与分层画像,重构学术新媒体用户画像 步骤,构建基于用户动态画像的学术新媒体信息精准推荐模型。【结果/结论】基于用户动态画像的学术新媒体信息 精准推荐模型能够实现学术信息资源与用户的精准对接,提升用户忠诚度,更好地服务科研工作者的学术活动。 【创新/局限】从理论框架角度分析与构建学术新媒体信息推荐模型,后续将重点研究模型的技术实现与实践应用。  相似文献   

17.
【目的/意义】移动互联网时代,微博以其快速、便捷的优点迅速成为信息传播与共享的平台之一。在互联 网信息传播过程中,话题内容焦点会随着时间推动发生动态迁移,及时准确的发现话题内容焦点的迁移有助于了 解网络舆情的演化趋势。【方法/过程】首先,定义基于焦点特征词分布的焦点词提取公式,构造焦点特征词集合;然 后,使用Skip-gram模型在大规模语料上训练得到词向量,再通过BTM对文本建模,直接在BTM主题维上结合焦 点特征词集合构造主题词向量;最后,计算主题特征词间的相似度,将其应用到聚类算法中实现话题焦点识别。 【结果/结论】通过对新浪微博数据集上的实验结果表明,本方法能够充分利用词向量引入的语义信息,提高文本聚 类效果,有效的获取各阶段的话题焦点。  相似文献   

18.
曾金  贺国秀 《情报科学》2019,37(3):136-140
【目的/意义】基于社交媒体用户分享的图像、博文及用户标签数据,为用户推荐潜在的好友,从而更好的为 用户做个性化推荐和精准化服务。【方法/过程】在获取微博用户分享的图像、博文及用户标签的基础上,通过使用 深度学习的方法利用图像、博文及用户标签数据来表达用户兴趣特征,基于这三类特征组合,通过计算用户之间的 余弦相似度来挖掘与目标用户兴趣最相近的若干个候选用户。同时,探讨了多模数据在无监督学习下的用户推荐 问题,并与单模数据进行比较。【结果/结论】实验结果表明,利用图像、博文和用户标签合成的多模数据对用户的兴 趣进行建模并进行好友推荐较单模数据效果好。  相似文献   

19.
针对图书、期刊论文等数字文献文本特征较少而导致特征向量语义表达不够准确、分类效果差的问题,本文提出一种基于特征语义扩展的数字文献分类方法。该方法首先利用TF-IDF方法获取对数字文献文本表示能力较强、具有较高TF-IDF值的核心特征词;其次分别借助知网(Hownet)语义词典以及开放知识库维基百科(Wikipedia)对核心特征词集进行语义概念的扩展,以构建维度较低、语义丰富的概念向量空间;最后采用MaxEnt、SVM等多种算法构造分类器实现对数字文献的自动分类。实验结果表明:相比传统基于特征选择的短文本分类方法,该方法能有效地实现对短文本特征的语义扩展,提高数字文献分类的分类性能。  相似文献   

20.
何喜军  马珊  武玉英 《情报科学》2018,36(11):95-100
【目的/意义】为应对线上技术供需信息超载导致的检索难、信息非结构化导致的供需文本匹配难的问题, 开展技术供需信息语义匹配研究。【方法/过程】构建技术领域本体,利用SAO结构分析提取技术供需信息中多维 语义结构特征,表征供给技术的创新特征及技术需求的问题特征。应用基于本体信息内容与语义距离相似算法, 结合词向量与熵值分析,提出技术供需多维语义结构匹配模型。【结果/结论】对线上新能源领域技术供需数据进行 测试,验证模型有效性,为提高技术供需主体信息检索效率、促进供需对接提供思路,并为考虑供需信息匹配的科 技主体推荐提供决策。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号