典型文献
基于SGC-LDA模型的财经文本主题研究
文献摘要:
传统财经领域研究通常关注结构化数据,较少关注非结构化的财经类文本数据,并且财经文本数据蕴含的信息量巨大.针对上述问题,提出SGC-LDA(sliding-window,genetic factor and common financial topic LDA)财经文本主题研究方法.基于通用财经主题的文本噪声过滤建模,以降低噪声数据的影响;基于滑动窗口技术,同时引入财经遗传因子,保证主题的连续性;完成能够实现财经文本主题模型的SGC-LDA算法.基于真实财经文本的实证研究表明,财经文本主题主要由投资理财、民生时事、商业动态、金融市场、宏观经济、产业经济六个主要部分组成;结合财经主题特征词和财经文本对财经主题的扩充,能够更完整准确地描述其财经主题.同时模型本身表现出一定的去噪能力,且与基准模型的对比分析,也证实了所提出模型在财经主题建模方面优越的分类性能和主题连续性.
文献关键词:
LDA模型;噪声过滤;遗传因子;财经文本;主题建模
中图分类号:
作者姓名:
傅魁;鲁冬;覃桂双
作者机构:
武汉理工大学 经济学院,武汉 430070
文献出处:
引用格式:
[1]傅魁;鲁冬;覃桂双-.基于SGC-LDA模型的财经文本主题研究)[J].计算机工程与应用,2022(15):285-293
A类:
财经文本
B类:
SGC,LDA,文本主题,主题研究,常关,结构化数据,非结构化,财经类,文本数据,信息量,sliding,window,genetic,common,financial,topic,用财,噪声过滤,低噪声,噪声数据,滑动窗口技术,遗传因子,主题模型,投资理财,时事,金融市场,宏观经济,产业经济,主题特征,特征词,去噪,出模,主题建模,分类性能
AB值:
0.307752
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。