CORC  > 兰州理工大学  > 兰州理工大学
题名股市舆情数据的挖掘与分析研究
作者张翰垠
答辩日期2019
导师朱昶胜
关键词股市舆情 数据挖掘 情感倾向分类 交易指标预测
学位名称硕士
英文摘要随着计算机科技的高速发展与网络数据信息的激增,数据挖据技术已经逐步成为信息时代下推动金融股票市场创新发展的核心力量。在股票市场中越来越多的股民投资者热衷于在网络论坛中交流股市投资心得,由此产生的非结构化股评舆情数据成为了影响股票市场健康发展的重要因素。在有关网络舆情数据与股票市场关系的各类研究中,传统的股市交易指标已经无法满足投资者把握股票市场运行规律的需求。本文基于机器学习和深度学习技术对股市舆情数据进行了挖掘与分析,力求解决股市舆情潜藏情感倾向挖掘能力不足以及相关交易指标预测结果不佳的问题,相关研究工作如下:1.使用爬虫抓取器,按照特定规则遍历解析东方财富网股吧网页评论信息及其它特定属性列表信息作为股市舆情数据源。借助多个处理工具对原始数据进行去噪声、去干扰以及分词、停用词过滤等预处理工作,在中文分词和特征矩阵构建的结构化过程中引入TF-IDF加权技术和Word2vec表达技术实现非结构文本的量化表示,以提高后续分类预测模型的输入质量与学习效果。2.以挖掘股市舆情数据的情感倾向作为研究目标,基于朴素贝叶斯和卷积神经网络两种思想构建股评舆情数据情感倾向分类器,根据分类器评测指标对比分析了两种分类器的分类效果,结果表明,基于卷积神经网络的股评舆情数据情感倾向分类准确率高于朴素贝叶斯情感分类器,进一步证明了卷积神经网络在股市领域对股评舆情情感倾向分类的准确性。3.研究了股评舆情数据中潜藏情感信息结构化权值强度对股票交易指标成交量的影响,研究结果表明,通过情感词典匹配计算得到的交易日股评舆情情感值在某种程度上可以对相应股市交易日的成交量指标进行行为预测,并较为真实地反应一定时间内股市成交量的走势情况。4.基于支持向量回归机和BP神经网络两种方法,研究了股市舆情数据对股票收益率的影响,并对两种方法的性能评价指标进行了对比分析,结果表明,两种模型的学习结果均能预测股市收益率及其走势情况,且支持向量回归机模型的预测误差小于BP神经网络,进一步验证了支持向量回归机模型在预测股市收益率时可以产生优于BP神经网络的预测结果。
语种中文
页码72
URL标识查看原文
内容类型学位论文
源URL[http://ir.lut.edu.cn/handle/2XXMBERH/95536]  
专题兰州理工大学
作者单位兰州理工大学
推荐引用方式
GB/T 7714
张翰垠. 股市舆情数据的挖掘与分析研究[D]. 2019.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace