首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
王静茹  陈震 《情报科学》2018,36(1):102-107
【目的/意义】目前LDA模型在文本数据挖掘方法中占有重要的地位,已成为数据挖掘领域的研究热点。 为了进一步提高LDA模型在文本挖掘中的应用效果,有必要对LDA模型文本主题提取效果进行对比研究。【方法/ 过程】本文提出了一种基于LDA模型的不同类型文本数据主题提取效果对比评价方法,先通过LDA模型对文本数 据进行主题挖掘;再通过定量的主题提取效果评价方法进行对比研究。【结果/结论】本文以期刊论文、网络舆情事 件话题、微博文本、调查问卷为文本数据源,实验结果表明LDA模型在处理语义信息明确逻辑关系合理的长文本数 据时,主题提取效果较好。这为提高LDA模型的挖掘效率提供了一定的理论依据。  相似文献   

2.
李莉  林雨蓝  姚瑞波 《情报科学》2018,36(10):64-70
【目的/意义】挖掘出客服聊天记录中蕴含的主题,为客服自动问答系统的设计及优化提供指导方案。【方 法/过程】本文针对保险网站客服聊天记录这类交互式短文本,利用会话切分、分词提取以及词汇过滤等方法进行 文本预处理,通过名词短语提取、高频词汇提取以及外部数据集引入等方法进行特征选择,最终应用 LDA建模方法 获取交互式文本主题。【结果/结论】模型结果显示:用户主要关注保险详情、保险金额以及保险险种等主题。不同 主题之间的话题具有一定的独立性,主题和话题之间存在很强的相关性。LDA模型结果成功挖掘出用户关注的主 题,这为电子商务网站运营方进行自动问答系统的设计和优化提供了指导方案。  相似文献   

3.
【目的/意义】本文利用用户在健康信息问答过程中产生的真实数据,从网络结构和信息主题两个维度对网 络健康社区中的健康信息传播网络及主题特征进行研究,进而为社区的建设和维护提供建议。【方法/过程】首先, 利用社会网络分析法对不同时间阶段的健康信息传播网络进行指标测度和可视化呈现,探究其网络结构特征;然 后结合LDA和已有词表,对社区内健康信息进行主题识别和提取,分析健康信息主题的分布及其变化趋势。【结果/ 结论】本研究发现实验选取的网络健康社区内部的健康信息传播网络具有小世界效应,用户流动性大,关键节点变 更快;用户健康信息问答的内容集中在若干主题,且部分主题随时间呈现一定变化趋势。【创新/局限】网络健康信 息的生成和传播源于用户之间的信息交互。本文从网络结构和信息主题两个维度开展研究,更符合其内部机理, 研究更加深入和具象;网络健康社区种类众多,本文只选择其中一个社区进行研究,可能存在一定的局限性。  相似文献   

4.
【目的/意义】大数据时代文本主题挖掘在情报分析领域中的作用日趋重要,通过特征比较共词分析和 LDA模型分析两种主流文本主题挖掘方法,研究两者的具体特点,为相关人员合理地运用文本主题挖掘方法处理 数据提供一定的参考。【方法/过程】本文分两种情况对比研究:第一、两者挖掘不同时段同一种类文本数据的主题 分布信息和主题演化信息的能力;第二、两者挖掘同一时段不同种类文本数据的提取正确主题的能力。【结果/结 论】在不同时段LDA模型分析与共词分析相比挖掘主题分布信息的能力可不断提升,并且其可挖掘出更加细化的 主题演化信息;在同一时段LDA模型分析对语义关系模糊逻辑结构粗糙的文本提取正确主题的效果明显优于共词 分析。  相似文献   

5.
胡吉明  钱玮  李雨薇  文鹏 《情报科学》2021,39(10):11-17
【目的/意义】本文以主题为核心,从外部属性和内容属性两个视角展开政策文本结构化解析,直观反映政 策核心内涵,挖掘政策文本语义,为政策内容解读提供新模式。【方法/过程】利用LDA2Vec主题模型实现基于上下 文的政策文本主题识别,同时借助位置和语法规律提取外部属性,以此构建政策文本结构化解析的描述框架。【结 果/结论】“互联网+”政策文本解读的实证分析发现,本文所提框架有助于直观展现政策要素,有效揭示政策文本主 题分布,以及进行大规模政策领域文本的批量分析和解读。【创新/局限】通过结构化解析框架展现政策文本的形式 化特征和主题性特征,帮助政策相关群体把握政策制定的特点和侧重点,目前深层次内容解读有待进一步研究。  相似文献   

6.
【目的/意义】针对学术APP评论数据特征,挖掘用户评论语义关联关系,为平台运营者和开发者高效获取 用户需求和关注点提供思路和指导方法。【方法/过程】首先,基于LDA主题模型和GloVe 词向量模型构建学术APP 用户在线评论主题语义关联研究框架,然后,采集超星移动图书馆APP在线评论作为样本数据,通过主题识别获取 用户评论主题并基于词向量相似性得到主题语义关联,最后构建出语义关联主题图谱。【结果/结论】实验结果表明 运用文章提出的思路方法能够有效发现用户评论主题和主题间关联关系并得到主题关联图谱,从而为学术APP平 台运营者完善平台功能提供参考和借鉴。  相似文献   

7.
【目的/意义】本文从文献发文量、关键词频次、关键词聚类等方面,研究我国图书馆空间的研究热点、主题 演进情况,为今后该方向的科学研究与实际工作提供借鉴。【方法/过程】以中国知网期刊数据库为数据来源,以图 书馆空间期刊论文为研究对象,利用文献计量学方法与可视化方法对论文进行分析。【结果/结论】我国图书馆空间 的研究热点层次较为分明,宏观主题与微观主题并存,主题演进阶段性特征明显。图书馆空间研究热点主题偏向 于具体空间类型的实践类借鉴与总结,应进一步加强基础性理论的研究和思考。  相似文献   

8.
  航潘逸尘 《情报科学》2018,36(12):83-89
【目的/意义】为了解高校在校生对艺术教育的实际需求,进而对高校艺术教育的开展形式展开针对性的分 析,提出优化策略。【方法/过程】本文利用问卷调查法,选取了长春市的若干所高等院校,对在校生艺术教育的需求 进行了实际分析,并结合实际需求情况,构建了高校图书馆艺术主题服务的模式,研究了主题服务的内容、途径和 开展策略。【结果/结论】通过研究得出,主题服务包括教学支持和活动创新两种内容,拥有多种方法途径和媒介途 径,在高校图书馆实际工作活动中,应当采用加强基础建设、由浅入深、跨校联合等策略,提供艺术教育主题服务。  相似文献   

9.
江秋菊 《情报科学》2019,37(6):96-100
【目的/意义】本文综合考虑文献的主题、被引频次和发文时间,从三维视角出发,提出一种文献影响力指数 (Influence Index of Document,IIOD)计算方法,在主题分类的基础上对文献的影响力进行评价。【方法/过程】以 中国引文数据库中2013-2017年情报学领域9本期刊的10523篇文献为样本,利用LDA模型进行主题提取,并将 LDA与K-means算法结合实现文本分类,进而计算特定主题下文献的影响力指数,根据文献影响力指数对文献进 行排名。【结果/结论】文献影响力指数综合考虑了文献的主题特征、被引频次和时效性,其排名结果更加全面合理, 为评价文献的影响力提供了一种新的视角。  相似文献   

10.
【目的/意义】基于Rao-Stirling 指数和LDA模型进行领域学科交叉主题识别,并以纳米科技为例验证将 Rao-Stirling 指数和LDA模型用于领域学科交叉主题识别的有效性和适用性。【方法/过程】基于Rao-Stirling 指数 测度领域文献学科交叉程度,设定阈值发现高度学科交叉文献。基于LDA模型对筛选出的学科交叉文献进行主题 识别,发现学科交叉点和学科交叉研究主题。【结果/结论】基于Rao-Stirling 指数从引文的角度进行领域文献学科 交叉测度可以有效地发现与某领域相关的学科交叉文献,且有利于大数据集的学科交叉文献发现研究的实现。基 于LDA模型进行学科交叉主题识别可以有效地发现学科交叉主题。两方法的组合应用为发现某领域学科交叉主 题研究提供一种新视角。  相似文献   

11.
【目的/意义】帮助科研工作者了解领域相关科研工作者的研究内容,促进开展进一步的交流合作。【方法/ 过程】根据稀疏分布式表征理论对作者论文的文本内容进行特征表示,计算作者研究内容相似性,根据得分进行排 序推荐。【结果/结论】选取了NIPS会议论文数据集进行了实验,将实验结果与TD-IDF方法和LDA主题模型方法 进行对比,证明了稀疏分布式表征是一种能够从语义层面表征对象特征的数据表示方式,能有效用于合作推荐。  相似文献   

12.
徐红  张斯婷  李凌方 《情报科学》2022,40(10):67-73
【目的/意义】文化振兴是乡村振兴战略的主要任务之一,以农家书屋为代表的农村阅读场所在农村阅读推 广过程中发挥了重要作用。识别农村阅读推广措施的主题与热点,有助于在新形势下更有效地面向农村地区开展 阅读推广。【方法/过程】以学习强国平台收录的关于农村阅读推广的新闻报道文本作为语料,运用LDA主题模型和 共词分析法识别了农村阅读推广举措的主题。【结果/结论】LDA模型识别了农村阅读推广举措7大主题,与共词分 析法识别的农家书屋、党史学习、农民学习、文化普及、图书馆服务等5个主题基本保持一致。研究表明,近年农家 书屋和全民阅读相关主题的热度最高,农村地区数字化阅读趋势日盛,而图书馆在农村阅读推广中的作用有限,应 重视农家书室和图书馆等主体在乡村文化振兴中的作用。【创新/局限】本研究以学习强国平台新闻报道文本作为 分析数据进行了农村阅读推广措施的主题识别与分析,直观地揭示了农村阅读推广的现状与趋势。受平台限制, 所获取数据可能存在遗漏。  相似文献   

13.
张雷  谭慧雯  张璇  韩龙 《情报科学》2022,40(3):144-151
【目的/意义】构建高校师德舆情微博用户评论LDA模型,可以更精准识别舆情演化特征和分析关键主题传 播路径,帮助高校和相关部门更为有效地进行舆情监管和舆情引导。【方法/过程】本文以“天津大学一教授学术造 假”事件为例,基于 LDA模型构建高校师德舆情下微博用户主题生成模型,采用困惑度评价指标确定 LDA模型最 优主题数,采用信息熵确定每一主题在不同日期的主题强度,通过关键词共现知识图谱、词云展现舆情话题的演 变,最后基于主题相似度确定主题传播路径。【结果/结论】LDA模型和信息熵可以解析出网络用户群体关注的重要 主题热点,精准识别舆情演化特征,识别主题最优传播路径进行舆论引导,对爆发的舆情实现预测和管制优化。【创 新/局限】文章创新性地构建高校学术道德舆情的LDA主题模型,有效确定微博用户群体主题、识别舆情演化特征、 分析主题间传播路径,具有普适性;进一步扩大高校师德其他舆情分析及结合网络舆情情感分析为下一步的研究 内容。  相似文献   

14.
田园  宫婷婷 《情报科学》2021,39(9):110-116
【目的/意义】为了进一步提升学生评教信息的使用价值,构建在线教学用户需求指标体系,对在线教学需 求数据进行主题挖掘。【方法/过程】运用数据挖掘理论和LDA主题识别模型,从丰富的在线教学评价内容中挖掘潜 在的在线教学主题,针对教学主题特征向用户需求进行结构映射,最终形成在线教学需求指标体系。【结果/结论】 分析在线教学数据,从教师需求、课程需求、教学成果需求三方面构建在线教学用户需求指标体系,并提出针对性 的教学质量优化策略。【创新/局限】本文通过在线教学需求数据主题挖掘,为高校在线教学评教指标体系的构建与 完善提供了新的途径和方法,但样本数据仅为单一高校数据,未实现全覆盖,对领域研究的整体态势分析还存在一 定的不足。  相似文献   

15.
杨奕  张毅  李梅  邓雯 《情报科学》2019,37(1):86-93
【目的/意义】通过数据挖掘、文本分析法整合公众分散的反馈意见,对比研究出台政策,对政府部门吸纳公 众意见,制定科学合理的公共政策具有重要意义。【方法/过程】基于大数据技术深度挖掘公众对共享单车政策征求 意见稿的反馈内容,采用LDA模型从公众反馈意见中发现并提取低维主题集合,汇总、组织、分析大规模文本信息, 以主题领域和隶属概率值两维度,对比公众意见与政策修订的差异。【结果/结论】从制度体系、政府治理、企业经营、 产品完善、用户规范五个分类主题及其概率值,评估政策制定中的公众参与度以及政府对公众反馈意见的采纳效 果,以期为政府出台政策的科学性提供理论依据和决策建议。  相似文献   

16.
【目的/意义】分析面向智库建设的图书馆数据共享空间的创新服务,提出面向智库的图书馆数据共享空间 的框架体系和服务模式,为我国图书馆以更深层的数据服务支持智库建设与发展提供借鉴。【方法/过程】在梳理和 评述国内外图书馆数据共享空间现状的基础上,剖析美国芝加哥大学数据科学中心的基因组数据共享空间案例, 分析引进国外数据共享空间模式后面向智库建设的图书馆数据服务的新变化,并提出具体建设建议。【结果/结论】 研究认为图书馆数据共享空间模式为智库提供数据服务具有一定的必要性和实践价值,最后提出面向智库建设的 图书馆数据共享空间服务的框架体系及服务模式。  相似文献   

17.
【目的/意义】学科领域的研究前沿是科学研究的重点。鉴于识别研究前沿中缺乏将用户需求信息和发文 趋势结合的现况,本文提出基于引文量与发文量,利用Z分数与Sen’ s斜率的研究前沿识别方法。【方法/过程】利用 LDA模型提取学科领域的研究主题,以Z分数代表研究主题的活跃度,Sen’ s斜率代表研究主题的发文趋势,以图书 馆学领域为例,分析其研究主题在2012-2017年的发文量与引文量,实现对该领域研究前沿的识别。【结果/结论】图 书馆学领域的前沿主题有图书馆网络化与自动化、阅读推广、公共文化事业、信息资源建设与知识管理等。通过与 Citespace突发检测法相比,证明本文提出的方法在识别学科领域研究前沿时更全面。  相似文献   

18.
【目的/意义】探析一个学科领域中学术文献的研究内容与研究方法之间的潜在关系,对科学研究和科研 管理均具有一定的指导意义。为此,本文给出一种“内容-方法”共现分析方法。【方法/过程】选取Web of Science数 据库中国际著名的17 种情报学期刊文献共12082 篇,利用LDA模型提取文献主题;通过人工识别对提取的主题分 别标注为研究内容和研究方法;通过自编程序,建立学术文献研究内容与研究方法的共现关系;最后通过2-模网络 实现共现关系的可视化。【结果/结论】研究结果表明,“内容-方法”共现分析不仅能够从内容和方法两个视角了解 学科领域的研究态势,而且能够发现学科领域研究内容与研究方法之间的潜在关系。  相似文献   

19.
张蕴娣  于宁  赵闯 《情报科学》2022,40(10):187-192
【目的/意义】以主题聚类的方法揭示国内图情领域区块链研究热点,为区块链在图情领域的研究工作提供 参考。【方法/过程】利用中国知网数据库检索区块链在图情领域应用的全部期刊论文、会议论文与学位论文,提取 了470个关键词,并利用杰卡德系数计算文献的相似程度,形成10个主题聚类,之后利用IG(信息增益法)计算所有 关键词在主题聚类中的重要程度,通过前10位核心关键词阐述各主题聚类中研究论文的主要研究内容,并通过主 题聚类下的年度发文趋势分析区块链在图情领域未来的发展趋势。【结果/结论】文章共提取出区块链技术、智慧图 书馆、资源建设、信息服务、阅读推广、隐私保护、借阅服务、科学数据、版权保护、情报分析十大主题聚类,并将其归 纳出包含基础层、技术层、应用层、拓展层的研究框架,分析了未来研究趋势将更加集中于情报分析、智慧图书馆、 阅读推广、科学数据、版权保护、隐私保护六大主题中。【创新/局限】对研究主题的分析还可以采用更多的视角进行 分析,如知识图谱等。  相似文献   

20.
孙振嘉  崔浩男 《情报科学》2019,37(5):103-107
【目的/意义】基于数据可视化分析我国现行电子商务法律法规的特征,有利于进一步完善我国电子商务法 律法规体系。【方法/过程】通过词频统计、定性分析、数据可视化等方法对相关法律法规的名称、施行日期、公布部 门、所属类别等特征进行量化研究和交叉分析。【结果/结论】现行的电子商务法律法规具有实际操作性、环境依存 性、地域差异性、经济共生性的特点,有针对性地从深度驱动、实践驱动、平衡驱动、广度驱动等方面提出了建议。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号