首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
【目的/意义】目前在多文档自动摘要方面,研究者们主要关注于获取多文档集合中的重要主题内容,提出的很多自动摘要方法在提高摘要代表性的同时却忽略了文档中的潜在主题。【方法/过程】针对于多文档自动摘要中存在的冗余度较高且不能全面反映主题内容的问题,本文提出了一种基于句子主题发现的多文档自动摘要方法。该方法将多篇文档转换为句子集合,利用LDA主题模型对句子进行聚类分析与主题发现,并通过word2vec训练词向量计算句子的相似度;最终在主题之下通过TextRank算法来计算句子重要性,并结合句子的统计特征生成多文档集合的摘要。【结果/结论】通过人工测评的结果表明,本文提出的多文档自动摘要方法在主题覆盖性、简洁性、语法性等方面都取得了不错的效果。  相似文献   

2.
为了更好地对微博舆情传播进行实时监管,维护微博舆情的良性运转,打造晴朗的微博舆情网络空间,文章结合微博运行机制,通过爬取微博数据,应用知识图谱的理论与方法,构建微博主题识别知识图谱以及微博主题演变知识图谱,进而发现微博主题演变路径,揭示了微博舆情传播中的主题演变情况以及发生演变的动态变化过程。  相似文献   

3.
当前我国饭店业竞争日趋激烈,行业增长缓慢,利润下滑,主题酒店成为新的发展方向。为使主题酒店不断创新并保持竞争优势,本文从寻找主题、展示主题、传递主题、神话主题及合理配置功能等几个方面对主题酒店的规划设计进行了阐述。  相似文献   

4.
【目的/意义】引用动机不同会导致一篇论文在多次被引用时的引用主题和重点产生差异,识别这些被引主题并分析其变化,有助于引用动机分析,提高文献推荐效果。【方法/过程】本文首先抽取被引文献的上下文语境信息,根据文本长度界定多种引用内容的划分范围;然后结合多种文本聚类方法,识别被引主题并比较其异同;最后通过时序比较,分析被引主题的演化路径和过程。【结果/结论】选取人工智能研究领域中的代表性高被引论文进行分析,发现前后句是对当前引用句的重要补充,引用句及其前后句组合能够更好地揭示被引主题;基于引用内容的被引主题呈现出多样化的特征,揭示了原文内容的扩展和引用动机的差异;被引主题演化分析能够有效地揭示原文内容被应用或改进的方向、主题、方法和技术。【创新/局限】形成基于引用内容聚类的文献被引主题识别及其演化分析框架,证明被引主题的差异化以及对原文的补充作用,同时揭示引用内容的主题时序变化的特征与现实意义,后续有必要扩大研究样本,使得研究结果具有更好的通用性。  相似文献   

5.
主题酒店的规划设计——以京川宾馆为例   总被引:1,自引:0,他引:1  
主题酒店作为当前酒店发展的新形态,虽然在我国出现的时间不长,但作为国际酒店业发展的新趋势,为处于激烈竞争态势下的我国酒店业的发展提供了新的思路.为使主题酒店不断创新并保持竞争优势,本文在对主题酒店本质特性分析的基础上,从主题定位、主题展示、主题传递及合理配置功能四个方面对主题酒店的规划设计进行了阐述.  相似文献   

6.
当前我国饭店业竞争日趋激烈,行业增长缓慢,利润下滑,主题酒店成为新的发展方向。为使主题酒店不断创新并保持竞争优势,本文从寻找主题、展示主题、传递主题、神话主题及合理配置功能等几个方面对主题酒店的规划设计进行了阐述。  相似文献   

7.
教师在教学《散步》时大都将主题定为"尊老爱幼",对文章的分析理解也都围绕着这个主题,如果我们由作者写作意念的产生以及感受、立意进行猜测性还原,就会发现"对生命负责"才是作者真正想表达的主题。  相似文献   

8.
国外主题网关服务的发展及启示   总被引:2,自引:0,他引:2  
王兰敬 《现代情报》2006,26(10):60-64
因特网中蕴藏着大量的学术信息资源.主题网关作为一种新型的网络学术信息资源发现工具,顺应了当今学术信息需求越来越趋向数字化、网络化、集成化和知识化的发展趋势,是网络信息资源组织和开发利用的有效手段.本文论述了主题网关的涵义,深刻分析了国外主题网关的发展状况和我国主题网关的现状,并在此基础上进一步阐述了国外主题网关的建设对我国主题网关服务的启示.  相似文献   

9.
[目的/意义]从研究主题的知识生产与扩散两方面识别学科研究热点,有利于明确学科重点,把握学科发展动向,为预测未来研究趋势提供研究基础。[方法/过程]提出主题动能概念,基于研究主题的生产与扩散指标构建主题动能模型,综合分析某时间段某主题的研究质量(横向热度)与速度(纵向变化),识别学科研究热点;并根据多时间段的动能变化情况划分不同类型的研究热点,描述其动态变化。[结果/结论]选择图书情报领域2017—2021年研究文献与引证文献为例进行实证分析,发现主题动能模型能够有效识别当前阶段的学科研究热点;选择2012—2016年和2017—2021年两个时间段的相关数据分析主题动能变化,能够划分学科“前沿型”“稳定型”“衰退型”三种类型研究热点,实现对学科研究的动态描述。  相似文献   

10.
[目的/意义]通过对中美在疫情期间发布的政策文本进行主题建模与分析,发现中美两国在面对疫情时的应对措施与关注重心,从而为应对其他类似的重大公共卫生安全事件提供参考。[方法/过程]采用结合词嵌入的主题模型,对爬取的中美政策文本进行主题建模和主题发现,并借助词云进行可视化展示。[结果/结论]中美两国在基本的疫情政策目标上保持一致,但在维持稳定的关注主体、封闭隔离程度以及疫苗问题等实现目标的方式上存在差异。  相似文献   

11.
[研究目的]针对主流话题发现模型存在数据稀疏、维度高等问题,提出了一种基于突发词对主题模型(BBTM)改进的微博热点话题发现方法(BiLSTM-HBBTM),以期在微博热点话题挖掘中获得更好的效果。[研究方法]首先,通过引入微博传播值、词项H指数和词对突发概率,从文档层面和词语层面进行特征选择,解决数据稀疏和高维度的问题。其次,通过双向长短期记忆(BiLSTM)训练词语之间的关系,结合词语的逆文档频率作为词对的先验知识,考虑了词之间的关系,解决忽略词之间关系的问题。再次,利用基于密度的方法自适应选择BBTM的最优话题数目,解决了传统的主题模型需要人工指定话题数目的问题。最后,利用真实微博数据集在热点话题发现准确度、话题质量、一致性三个方面进行验证。[研究结论]实验表明,BiLSTM-HBBTM在多种评价指标上都优于对比模型,实验结果验证了所提模型的有效性及可行性。  相似文献   

12.
[目的]从海量微博舆情信息中准确、高效地发现和挖掘当下的热点主题,以期为政府和企业监控和管理舆情动态提供有价值的参考。[方法]研究首先从维度、特征和度量三方面综合考虑构建"帖子-主题"二模网络模型,其次选择词频、主题权重和词频增长率3个特征来抽取模型所需的有效关键词,然后选取社会网络分析法中的社区发现方法进行基于关键词的主题社区发现,最后综合考虑用户影响力和传播影响力两个属性,通过热度分析确立主题热度,识别热点主题。[结果]实验表明,该方法能有效挖掘网络舆情中的热点主题,检测出的主题结果均正确,验证了本文方法的可行性和有效性。在此基础上,研究还选取实例进一步对主题的热度迁移和情感倾向进行了分析,具备一定的预警作用。  相似文献   

13.
Topic models are widely used for thematic structure discovery in text. But traditional topic models often require dedicated inference procedures for specific tasks at hand. Also, they are not designed to generate word-level semantic representations. To address the limitations, we propose a neural topic modeling approach based on the Generative Adversarial Nets (GANs), called Adversarial-neural Topic Model (ATM) in this paper. To our best knowledge, this work is the first attempt to use adversarial training for topic modeling. The proposed ATM models topics with dirichlet prior and employs a generator network to capture the semantic patterns among latent topics. Meanwhile, the generator could also produce word-level semantic representations. Besides, to illustrate the feasibility of porting ATM to tasks other than topic modeling, we apply ATM for open domain event extraction. To validate the effectiveness of the proposed ATM, two topic modeling benchmark corpora and an event dataset are employed in the experiments. Our experimental results on benchmark corpora show that ATM generates more coherence topics (considering five topic coherence measures), outperforming a number of competitive baselines. Moreover, the experiments on event dataset also validate that the proposed approach is able to extract meaningful events from news articles.  相似文献   

14.
严贝妮 《情报科学》2005,23(4):594-596
如SGML/XML描述数据结构一样,主题图(Topic Map)描述了语义链接网络结构。运用SGML/XML置标对原始数据进行加工创建信息,运用主题图对信息集合进行加工创建知识结构。本文对主题图基本内容、主题图模板与主题图的自动生成做了简要的介绍。  相似文献   

15.
[目的/意义]产业变革快速演进,技术创新成为驱动社会经济发展、提高国家和企业科技竞争力的关键所在,如何对前沿技术进行识别和预测,成为国家科技政策研究和企业技术创新活动关注的热点。[方法/过程]以人工智能作为重点研究领域,首先以LDA模型进行技术主题抽取,并结合K-means算法进行专利文本聚类;在此基础上,以Z分数表示技术主题创新度,以Sen's斜率估计技术主题授权趋势,两个指标结合形成技术主题前沿度并将二者映射到二维空间,识别前沿技术主题以及划分技术主题类型;再,计算前沿技术主题的新颖度和关注度,二者融合形成技术主题趋势度指标;最后,采用三次指数平滑法对前沿技术主题的发展趋势进行预测。[结果/结论]人工智能领域的前沿技术主题有“智能家居”“电动汽车”和“自动化控制系统”,其中“智能家居”在未来3年的发展呈下降态势,而“电动汽车”和“自动化控制系统”的发展呈明显上升趋势。  相似文献   

16.
纺曙光 《情报杂志》1991,10(4):41-43
选题是开展情报调研工作的一个重要环节,选题恰当与否,直接影响情报研究的进展和成果的推广应用。本文就选题应遵循的四个原则对情报研究选题的制约关系,进行了分析和探讨。  相似文献   

17.
王晶莹 《科教文汇》2013,(10):105-107
随着我国高等教育进入大众化教育阶段,本科毕业论文质量出现滑坡现象,尤其是论文抄袭、照搬现象严重,普遍缺乏创新性。论文作者以天津市高校近三年的本科毕业论文为样本进行分析研究,研究发现选题是毕业论文撰写的基础和关键环节,其质量直接影响毕业论文质量,但目前本科毕业论文在选题阶段存在较大问题,如选题重复率较大、选题缺乏创新等,为此,本文将对本科毕业论文选题环节进行探讨,以期提高本科毕业论文质量。  相似文献   

18.
【目的/意义】从学者的合作网络中进行社区发现及主题分布研究是具有十分重要的意义点。本文从社区 结构及其主题分布演化的角度分析并归纳情报学领域的研究现状和预测未来发展趋势。【方法/过程】本文通过构 建动态社区-主题模型,拟研究情报学文献中合著社区及其研究主题演变过程。【结果/结论】2000-2017年间,合著 网络社区演化呈现松散到聚合的趋势,在2012-2017年间基本形成三个大型的社区,每个社区的主题演化路径有不 同的模式:分裂融合模式、主干聚集模式和主干分解细化模式。不同社区的主题变化影响着社区演化路径。每个 社区的主题分布具有逐步多样化的特点,并且与数据挖掘、大数据分析、人工智能的研究日益紧密。  相似文献   

19.
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法.该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法.基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量.考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序.实例验证了该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号