关键词不能为空

当前您在: 股票知识网 > 股票入门知识 >

基于Clementine软件的时间序列分析--以浦发银行股票为例 股市休息时间

作者:股票知识库
来源:https://www.wcgjj.com
日期:2020-03-27 14:58
股市休息时间

基于Clementine软件的时间序列分析 ——以A股浦发银行(600000)股票为例 摘 要 本文的主要内容是借助SPSS Clementine 软件研究A股浦发银行(600000)股票价格随时间的变化规律,并用时间序列分析的有关知识对其进行建模预测。本文首先对Clementine软件作简要介绍,说明其在数据挖掘领域的广泛应用;然后介绍了3种时间序列分析预测的模型,分别为专家模型、Holt指数平滑模型和ARIMA模型;最后借助Clementine 软件对浦发银行股价分别进行专家建模、指数平滑建模和ARIMA建模,并对股价进行短期预测,通过模型参数比较及预测值误差对比,找出最佳模型。在建模的同时,也给出了使用Clementine软件建立数据流的具体过程。 关键词:Clementine软件 时间序列 浦发银行股票

一、 引言 数据挖掘是一个利用各种方法,从海量数据中提取隐含和潜在的对决策有用的信息和模式的过程。通过数据挖掘提取的信息可应用于很多领域,如决策支持、预测、预报和估计等。当今我们正面临这样一个问题,一边是对知识的饥渴,另一边却是大量数据的闲置未被利用,“我们被淹没在信息里,但却感受到知识的饥饿”。因此,我们迫切需要借助数据挖掘技术对这些数据进行及时有效的处理,从这些海量的、有噪音的、随机的数据中提取有效的、潜在有用的而又新颖事先未知的信息 [1]。 数据挖掘的工具有很多,本文选用SPSS Clementine软件。 二、 Clementine软件简介 Clementine是由SPSS公司开发的一款著名且非常实用的数据挖掘软件,也是目前众多软件中最成熟和最受欢迎的一款数据挖掘产品。Clementine拥有丰富的数据挖掘算法,操作简单易用,分析结果直观易懂,图形功能强大,支持与数据库之间的数据和模型交换,可以使用户方便快捷地实现数据挖掘。Clementine形象地将数据分析的各个环节表示成若干个节点,将数据分析过程看作数据在各个节点之间的流动,并通过图形化的数据流方式直观表示整个数据挖掘的各个环节。 Clementine在数据挖掘分析中被应用于分类预测问题方面非常多,但是它的其他功能也十分强大,如可以把Clementine软件运用在探索内部结构、多元统计分析、时间序列预测等领域。由于利用Clementine做分类预测(决策树)问题比较常见,因此本文强调它的另一功能,即利用Clementine做时间序列分析。 三、 数据来源及研究方法 1. 数据来源 本文所用数据为A股浦发银行 (600000) 股票2012年2月13日到2012年11月23日股价数据,来自大智慧软件。数据见附件1(Excel文件)。 2. 研究方法 本文利用时间序列分析知识并结合Clementine软件对A股浦发银行 (600000) 股票每日行情数据进行建模分析,与原始数据比较拟合并根据参数选择最佳模型。本文所用到的模型有:专家建模模型、Holt指数平滑模型和ARIMA(求和自回归移动平均)模型。 (1)专家模型 1

Clementine软件里一种可以自动预测的建模方法,自动进行最优模型的选择、参数估计和预测。 (2) Holt指数平滑模型 Holt指数平滑法是一种线性指数平滑方法,它是一种较高级形式的指数平滑方法。这种方法最突出的优点是对具有趋势变动的时间数列,不用二次指数平滑,而是对趋势数据直接进行平滑并对原时间序列进行预测。这种方法因具有很大的灵活性而被广泛地使用着。 Holt指数平滑适用于对含有线性趋势的序列进行修匀。它的基本思想是假定ˆtxt1r。其平滑公式为: 序列有一个比较固定的线性趋势:x式中,,为两个平滑系数,满足条件0,1。 x,那么使用Holt指数平滑法向前l期的预测值为:假定最后一期的修匀值为~TˆTl~xxTlrT. (3) ARIMA模型 ARIMA模型全称为求和自回归移动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA),是由Box和Jenkins于70年代初提出的一种著名时间序列预测方法。其中在ARIMA(p,d,q)中,AR是自回归,p为自回归项数;MA是移动平均,q为移动平均项数;d为时间序列成为平稳时所做的差分次数。 ARIMA模型是将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。其公式为: 式中,d(1B)d;(B)11BpBp,为平稳可逆ARMA(p,q)模型的自回归系数多项式;(B)11BqBq,为平稳可逆ARMA(p,q)模型的移动平滑系数多项式。 四、 实证分析——以浦发银行股票为例 以浦发银行2012年2月13日至2012年11月23日每日收盘价作为数据源,利用Clementine软件对这些数据进行分析。建立的数据流如图1所示。 图1 浦发银行股票股价数据流 简要步骤如下: 1. 数据过滤:建模过程中考虑到数据源中除了“日期”、“收盘价”字段外,还包含了“开盘价”、“最高”、“最低”、“成交量”、“成交额”等无关字段,所以需要先对字段进行过滤,利用Filter节点可得到我们想要的结果。 2. 在Type节点中,将“日期”的类型改为Typeless,将“收盘价”的方向改为2

Out。 3. 通过Derive节点计算出浦发银行每日收盘价的对数,并连接Time Plot节点,得到收盘价和log(收盘价)的时间序列散点图,如图2所示。 图2 收盘价及log(收盘价)的时序图 在图2所示的时间序列图中,浦发银行每日收盘价是均值非平稳且方差非平稳的,且log(收盘价)有不变方差的向下趋势,故可以选择对数变换。 4. 由于股票市场双休日及节假日不开市的特殊性,收集到的数据在时间段上是分段的,也就是说,在不开市的时间点,数据缺失。为了方便利用模型来分析,我们通过填充的办法使得数据(收盘价)在以天为时间单位上能够连续。具体操作为添加Time Interval节点,连接到数据流合适的位置,在Build选项卡中选择Specify fields and functions,选中“收盘价”并在Padding Function(填充函数)选项卡选择Mean of recent points(最近点的平均值),如图3所示。 图3 Time Interval节点选项的设置 对股票研究的意义在于能够在一定时间段内对股价进行较为准确地预测,而预测时间越长误差越大,尤其是对股票这类数据的预测,无法长时间较准确地预测,故我们只进行短期预测。因此在Forecast选项卡中,选择预测天数为14天。 5. 模型的建立 (1)专家模型 在节点工具箱窗口中选择Modeling选项,找到Time Series节点,添加到数据流合适的位置。Model选项卡中Method(方法)选择Expert Modeler(专家模型),Criteria选项卡中选择All models,确定执行即可得到专家模型,如图4所示。 图4 专家模型参数设置 (2) Holt指数平滑模型 同上添加Time Series节点,Model选项卡中Method(方法)选择Exponential Smoothing(指数平滑模型),Criteria选项卡中选择Holts linear trend,确定执行即可得到Holt指数平滑模型,如图5所示。 图5 Holt指数平滑模型参数设置 (3)ARIMA(p,d,q)模型 同上添加Time Series节点,Model选项卡中Method(方法)选择ARIMA(求和自回归移动平均),Criteria选项卡中对自回归(p),差(d),移动平均(q)进行赋3

值,确定执行即可得到ARIMA模型。 在此,我们通过对模型的观察及其他各方面考虑,对(p,d,q)赋值为(2,1,2),如图6所示。 图6 ARIMA模型参数设置 最终得到的三个模型的数据流如图7(a)、图7(b)、图7(c)所示。 图7(a) 专家模型数据流 图7(b) Holt指数平滑模型数据流 图7(c) ARIMA(2,1,2)模型数据流 6. 模型分析及比较 在数据流上双击模型,打开模型参数界面,可以看到关于模型的一系列参数。现将三个模型的部分参数汇总如表1所示。 表1 浦发银行股票股价收盘价模型比较 Holt指数平滑 专家模型 ARIMA(2, 1, 2) 固定R2 0.584 0.03 0.056 0.986 0.986 0.986 Q Df Sig 0.245 0.269 0.359 RMSE 0.089 0.079 0.078 MAPE 0.677 0.672 0.675 MAE 0.055 0.054 0.055 19.468 16.0 20.096 17.0 15.284 14.0 其中, 固定 用于比较模型的平稳部分及简单均值模型的度量值。当存在趋势或季节模式时,该度量值对普通 R 平方更具优势。 为判定系数,是序列中由模型解释的总变异所占比例的估计值,该值越高表示模型的拟合越好。 Q、Df分别代表模型的检验统计量和自由度。 Sig表示残差自相关检验结果的P值,若P<0.05,则认为残差存在自相关性,模型拟合不足,需改进;若P>0.05,则认为残差为白噪声序列,即表明所建模型已包含了原序列的所有趋势。 RMSE指均方根误差,是一种测量序列实际值与模型预测值之间差异的度量方法,该误差越低越好。 MAPE表示均值绝对百分比误差,用于度量目标序列与其模型预测水平的差异度,用百分比表示。通过审查所有模型中的均值和最大值,可以大概知道预测的不确定性程度。 MAE表示绝对平均误差,用于显示预测误差绝对值的均值。 接下来再考虑残差的自相关性和偏自相关性,可通过残差自相关图(ACF)及4

偏自相关图(PACF)得出结果。残差是指观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差。 三个模型建模所得的残差自相关图(ACF)及偏自相关图(PACF)分别如图8(a)、8(b)、8(c)所示,可以看出三个模型残差的自相关系数和偏自相关系数几乎都在两倍(2)标准差范围内,说明对残差序列的信息提取充分,不存在欠拟合的问题。 图8(a) 专家模型的残差ACF和PACF 图8(b) Holt指数平滑模型的残差ACF和PACF 图8(c) ARIMA模型的残差ACF和PACF 最后考察分别用3个模型做预测所得的结果和真实值的拟合效果图,所得结果如图9(a)、9(b)、9(c)所示。 图9(a) 专家模型拟合预测图 图9(b) Holt指数平滑模型拟合预测图 图9(c) ARIMA模型拟合预测图 其中,蓝线为真实值,红线为预测值。由图9可知,三个模型的拟合效果都是很好的。 将用3个模型建模所得的浦发银行股票收盘价的预测值分别与真实值进行比较,结果如表2所示。 表2 3个模型预测值与真实值的比较 日期 指数平滑 模型 差值 专家 模型 差值 ARIMA 模型 差值 真实值 2012-11-26 2012-11-27 2012-11-28 2012-11-29 2012-11-30 2012-12-3 2012-12-4 2012-12-5 2012-12-6 2012-12-7 7.4744 0.0044 7.4959 0.0259 7.4891 0.0191 7.4680 0.0080 7.4959 0.0359 7.4859 0.0259 7.4616 0.0216 7.4959 0.0559 7.4778 0.0378 7.4553 0.0453 7.4959 0.0859 7.4707 0.0607 7.4489 -0.0111 7.4959 0.0359 7.4665 0.0065 7.4298 0.0798 7.4959 0.1459 7.4518 0.1018 7.4234 -0.0066 7.4959 0.0659 7.4464 0.0164 7.4171 -0.4629 7.4959 -0.3841 7.4416 -0.4384 7.4107 -0.4793 7.4959 -0.3941 7.4367 -0.4533 7.4044 -0.8556 7.4959 -0.7641 7.4315 -0.8285 7.47 7.46 7.44 7.41 7.46 7.35 7.43 7.88 7.89 8.26 五、 结论 通过对以上结果的分析,我们可以得到下述结论: 首先,从对数散点图得知浦发银行股票股价有不变方差变化的趋势,则固定5

更有参考价值。固定 用于比较模型的平稳部分及简单均值模型的度量值,当存在趋势或季节模式时,该度量值比普通 更具优势。其中专家模型拟合程度(固定 值)为0.03,Holt指数平滑模型拟合程度为0.584,ARIMA(2,1,2)模型拟合程度为0.056,所以Holts指数平滑模型拟合程度更好。 其次,对 ,RMSE,MAPE,MAE这几个指标进行对比,三个模型的 都是相等的,均为0.986,其余三个指标相差不大(如表1所示)。 再次,三个模型的Sig值(即P值)均大于0.05,均为显著可行,即三个模型的残差均为白噪声序列,表明所建模型已包含了原序列的所有趋势,也即模型诊断得以通过。 最后,对比A股浦发银行股票股价的真实值与预测值之间的差异发现,专家模型在本例中的预测值没有变化,没能体现出浦发银行股价的趋势。而Holt指数平滑模型比ARIMA(2,1,2)模型的预测精度要高,特别体现在短期预测方面,Holt指数平滑模型的预测值和真实值之差要比其他两个模型小得多。 故综合以上几个方面,我们可以得出结论,对于本例预测A股浦发银行 (600000)股票股价来说,Holt指数平滑模型是三个模型中最可行的。 Clementine软件在数据挖掘方面有很大的使用空间,并在很大程度上简化了时间序列建模的过程。Clementine软件在金融、电信、保险、电商等诸多行业中都有广泛的应用,它可以辅助开展客户分类、风险管理、关联分析等工作,由于篇幅有限,本文仅以A股浦发银行 (600000)股价的预测为例,介绍了Clementine在时间序列分析中的功能。 参考文献 [1]Jiawei Han,Micheline Kambr著.范明,孟小峰等译.数据挖掘概念与技术.北京:机械工业出版社.2003 [2]薛薇,陈欢歌.基于Clementine的数据挖掘.北京:中国人民大学出版社.2012 [3]王燕.应用时间序列分析.北京:中国人民大学出版社.2009 [4]基于时间序列分析及Clementine软件的宝钢股价研究. . 2012年12月5日访问 6

股市休息时间


五粮液股票, 立讯精密股票, 股票怎么玩, 阿里股票, 蓝思科技股票, 东阿阿胶股票, 中国铝业股票, 新五丰股票, 中国神华股票, 中国中冶股票, 东方电子股票, 股票代码查询, 767股票学习网, 佛塑科技股票, 中国银行股票行情, 什么是股票, 长江证券股票, 日照港股票, 国美股票, 沃尔核材股票, 东方国信股票, 振华重工股票, 五粮液股票行情, 金隅股份股票, 万邦达股票, 太极集团股票, 葵花药业股票, 向日葵股票, 贵研铂业股票, 凤凰传媒股票, 上海机电股票, 航天动力股票, 东方电热股票, 茂硕电源股票, 安徽合力股票, 凯恩股份股票, 维尔利股票, 精达股份股票, 交大昂立股票, 东软载波股票, 长春经开股票, 工行股票, 奥普光电股票, 山东黄金股票行情, 光韵达股票, 三爱富股票, 消费类股票有哪些, 万丰奥威股票, 红宝丽股票, 和讯股票, 股票数据, 同达创业股票, 天通股份股票, 广州股票配资, 恒泰艾普股票, 高新发展股票, 中航黑豹股票, 股票短线, 中海地产股票, 招行股票, 如何看股票走势图, 股票池, 修正药业股票, 最新股票行情, 沙河股份股票, 如何选择股票, 房地产股票, 股票牛, 天虹商场股票, 热门股票排行榜, 股票资讯, 鑫科材料股票, 跌停的股票可以买吗, 新疆城建股票, 奥克股份股票, 股票入门视频, xd股票, 同德化工股票, 吉峰农机股票, 股票费用, 申购股票, 广发核心精选股票, 600462股票, 如家股票, 股票消息, 停牌的股票可以卖吗, 天业股份股票, 上证50包括哪些股票, 长江电力股票行情, 股票公式论坛, 股票信息网, 风能股票, 稀土股票有哪些, 学习炒股票, 三维工程股票, 股票交易费用计算, 股票赚钱术, 大橡塑股票, 600497股票, 非公开发行股票是利好还是利空, 尤夫股份股票, 股票作手回忆录txt, 000023股票, jyp股票, a股票, 基金 股票, 银行 股票, 股票怎样, 股票中的, 算股票, 股票 t, 股票的板, 集团股票代码, 股票 复牌, 环保 股票, 股票 公告, 股票的分红, 平安 股票, 股票n, 什么股票好, 股票波动, 股票如何买, 股票的市值, 股票的历史, 股票赚钱吗, 股票 b s, 股票查询代码, 股票l, 股票 个人所得税, 白酒 股票, 股票原理, 股票内盘, 股票与股票基金, 股票用什么软件, 中金股票, 股票能赚钱, 股票退市了, 股票交易是什么, 股票 英语, 新加坡股票, 股票走势分析, 600股票, 为什么股票涨停, 股票配资期货配资, 什么是退市股票, 京东的股票, 技术分析股票, 为什么有股票, 股票怎么中签, 多少股票涨停, 怎么算股票手续费, 太平洋 股票, 太阳能 股票, 茅台股票股, 洛阳股票, 股票权重, 那些股票是, 旅游 股票, 股票背景, 场外股票质押, 什么软件看股票, 股票是怎么买卖, 医药的股票, 股票什么是创业板, 股票 筹码, 小市值股票, 股票的数字, 南航股票, 股票 放量, 经济股票, 说股票的, 中粮股票, 长城 股票, 股票带r, 股票是每天, 会涨股票, 永辉股票, 查询股票行情, 股票登记, 股票稀释, 游戏的股票, 广汽股票, 股票卖出什么时候, 陌陌 股票, 股票是啥意思, 行业龙头股票, 市值与股票, 股票市值与, 股票数据接口, 除息的股票, 美国多少股票, 股票术语., 为什么股票不能买, 股票险, 股票质押登记, 股票退市后怎么办, 股票的账面价值, 股票长江证券, 雪球 股票, 游戏股票有哪些, 布股票, 我的股票, 工程股票, 股票加杆, 培训股票, 俄罗斯股票, 股票收益率怎么算, dr 股票, 股票的本质, 股票号码, 中建股票, 什么股票高送转, gta5怎么买股票, 股票月线, 30的股票, 改革股票, 股票打新股, 潮 股票, 配股股票, 股票质押是什么意思, 手机开户股票, 振幅股票, 同花顺炒股票, 阿里股票价格, 股票002开头, 股票委托是什么, qq群股票, 股票期权什么意思, 50%股票, 上海股票配资, 股票的波动, 发行股票会计分录, 怎么筛选股票, 当天买的股票, 沪市股票代码, 股票api接口, 股票买就跌, 股票的内在价值计算, 股票函数于, 钴股票, 股票怎么拉升, 股票软件快捷键, 股票怎么玩的, 怎么看股票板块, 股票外盘什么意思, 如何计算股票, 绝味股票, 彩票股票, 期货股票开户, 股票怎么撤单, 核股票, 股票如何做t, 股票是钱吗, 股票的多头, 紫光国芯股票, 牛气股票, 股票营销, 股票的波段, 股票业务质押, 股票话术技巧, 股票春节, 硅股票, a股有哪些股票, 股票yy, 成都股票, 股票线颜色, 股票可以做空吗, 黑芝麻股票, 什么是质押股票, 股票金额, 股票年化收益率, 限制性股票 会计处理, 股票c股, 股票涨最高, 中线股票, 开户股票后, 资金对股票, 水电的股票, 股票计算价格, 什么生物股票, 股票合同, 什么买股票最好, 股票的绿线, 股票最近怎么样, 股票 员工持股, 泰什么股票, 股票复盘软件, 股票x, 政策与股票, 股票还是基金, 最近股票行情, 股票怎么涨跌, 股票配资好做, 股票质押 平仓, 沧州股票, 股票跌买入, 股票的换手率高说明什么, 诺华股票, 股票华天科技, 股票申能, 今年股票, 三七互娱 股票, 白酒行业股票, 怎么买阿里的股票, 怎么看股票的市盈率, 前海股票, 未上市的股票, 京能股票, 股票买入法, 深圳股票交易所, 什么是股票回购, 股票准确, 股票不卖, 股票多久卖, ge 股票, 中粮的股票, 股票里的量是什么意思, 白酒股票有哪些, 股票多头策略, 历年股票分红, 股票绿色红色, 大数据与股票, 什么是股票回购注销, 君正 股票, 股票有风险吗, 股票阳阴线, 粤港澳 股票, 股票分红 基金, 拓斯达股票, 什么是雄安股票, 卫信康股票, 股票每日推荐, 股票的红线, 股票中什么是均线, 华龙股票, 达内股票, 股票的时空, 股票投资理念, 拓维股票, 股票交易印花税多少, 鹏鼎股票, 娱乐股票, 鸿海的股票, 股票方证证券, f10股票, 股票的表情, 买股票如何融资, 林业 股票, 股票配资穿仓, 股票权利, 银行买股票吗, 股票资金比,
本文来自网络,不代表本网站立场,转载请注明出处:https://www.wcgjj.com/193112.html

基于Clementine软件的时间序列分析--以浦发银行股票为例 股市休息时间的相关文章