宇宙链 宇宙链
Ctrl+D收藏宇宙链
首页 > TRX > 正文

点宽专栏——教你如何应用朴素贝叶斯分类器进行股价趋势分类预测

作者:

时间:1900/1/1 0:00:00

朴素贝叶斯分类器进行股价趋势分类预测

原理

贝叶斯定理

模型思想

1、在风险识别中,贝叶斯模型本质上也是一种已知结果找原因的思维工具。

2、在风险决策中,利用贝叶斯模型的基本思想是充分利用先验信息,将先验分布和抽样分布整合成后验分布,从而利用后验分布进行决策。如果有新的信息,则更新后验分布,实现递归决策方案。从而得到最优策略,使得决策风险尽可能低。在概率统计的表述是:应用所观察到的现象对有关概率分布的主观判断进行修正的标准方法。

3、在分类预测中,朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。

概率论基础

要理解贝叶斯模型,必须先理解贝叶斯定理。贝叶斯定理实际上就是计算“条件概率”的公式。

美众议院议长:债务上限谈判会达成结果,不会出现违约情况:金色财经报道,当地时间5月24日,美国国会众议院议长凯文·麦卡锡举办新闻发布会,提供有关债务上限谈判的最新消息。麦卡锡表示,目前双方对部分内容仍存分歧,但谈判代表已前往白宫试图完成谈判。

麦卡锡认为,他有能力在美国债务上限问题上取得进展,美债上限谈判会达成结果,不会出现债务违约情况,且美国不会通过增税来解决美债上限问题。此外,麦卡锡还重申了他的立场,即美国政府应在下一财年将支出控制在低于去年的水平。[2023/5/25 10:39:35]

条件概率

条件概率,是指在事件B发生的情况下,事件A发生的概率,用P(A|B)来表示。其公式为:

上式可转化为:

称为乘法公式。

全概率公式

设试验E的样本空间为S,A为E的事件,B1,B2,…,Bn为S的一个划分,则全概率公式为:

AIP-169以超70%赞成率获得通过,ApeCoin DAO与Cartan Group合同延长两个月:金色财经报道,ApeCoin DAO发起将Cartan Group社区管理员功能延长2个月以保持运营连续性和秩序的新提案AIP-196已获得社区通过,其中赞成票的比例达到72.7%。此外,据ApeCoin DAO透露,Cartan Group必须“实施透明的提案请求(“RFP”)流程,以确定在延长期间(2022 年 1 月 1 日至 2 月 28 日)未来的 APE 基金会管理员。如有必要,完全移交给未来的 DAO 管理员,组建由主要 DAO 利益相关者组成的临时工作组,负责开发 DAO 工作组结构和内部能力。据悉,ApeCoin DAO目前已开始寻找下一任社区管理员。[2023/1/6 10:24:29]

模型公式

公式

通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯法则就是这种关系的陈述。

Mobius Capital Partners联合创始人:加密货币是投资者信心的衡量指标:金色财经报道,Mobius Capital Partners联合创始人Mark Mobius周三在接受采访时表示:如果你是股票交易员,现在或许应该把注意力转向加密货币。Mobius认为,加密货币是投资者信心的衡量指标,当比特币下跌,翌日道指便会下跌,由此形成了一个规律,反映比特币是一个领先的指标。

至于如何使用这个“先行指标”,Mobius表示:只有在机构和散户投资者真的“投降认输”,因为亏损而不再向市场投钱的时候,信心才真的达到了最低点,这也是开始买进股票的时候。只要比特币投资者仍然在谈论逢低买进,那就意味着他们还怀着一丝希望,这也意味着,还没有到达熊市底部。[2022/6/23 1:25:45]

设试验E的样本空间为S,A为E的事件,B1,B2,…,Bn为S的一个完备事件组,则:

Avalanche和FLOW将支持ApeCoin从以太坊区块链迁移:金色财经报道,ApeCoin 为元宇宙项目 Otherside 虚拟地块 Otherdeed 五月初启动铸造时引发了以太坊网络大面积阻塞,作为ApeCoin 背后的去中心化自治组织,ApecoinDAO 曾在社交媒体发文暗示可能会离开以太坊区块链,目前 Avalanche 和 FLOW 均透露已与 ApeCoin 就区块链迁移事宜进行了接触。Avalanche 背后公司 Ava Labs 联合创始人 Kevin Sekniqi 表示,该公司已经和 ApeCoin DAO 就 迁移到 Avalanche 区块链的相关事宜进行了讨论,而且已经为迁移做好了准备。FLOW 区块链背后公司Dapper Labs 首席商务官 Mik Naayem 也表示:“我认为 Flow 将成为 ApeCoin 的理想家园,我们已经与 ApeCoin DAO 董事会成员进行了一些对话,但最后仍需要通过社区投票来决定。”[2022/5/24 3:37:24]

其中:P(Bi):Bi的先验概率或边缘概率。之所以称为“先验”是因为它不考虑A任何因素的影响。P(Bi|A):已知A发生后Bi的条件概率,即由于得知A的取值而被称作Bi的后验概率。P(A|Bi):已知Bi发生后A的条件概率,即由于得知Bi的取值而被称作A的后验概率。P(A):A的先验概率或边缘概率,也作标准化常量

比特币自2014年以来首次连续5周下跌:5月7日消息,Bitcoin Archive发推称,比特币自2014年以来首次连续5周下跌。[2022/5/7 2:57:07]

解析

根据贝叶斯公式:

当A为特征向量,Bi(i=1,2,…,n)为分类标签时。贝叶斯模型就可以进行分类预测。例如,在对股价进行分类中,特征向量A可以是各种技术指标或K线量价特征。而Bi(i=1,2,3)对应于给定方向上的实际价格变动的事件,其有三个可能的选项:B1=-1“向下”,B2=0“不确定”,B3=1“向上”。我们就可以根据历史数据来进行分类预测,而预测结果的可能性可以用P(Bi|A)表示,分类级别很简单:P(Bi|A)越大,则属于该类别的可能性也越大。该分类方法也被称为朴素贝叶斯分类器

实践

朴素贝叶斯模型在股票价格趋势分类预测的应用

步骤

朴素贝叶斯分类器的具体步骤如下:

step1:设x={a1,a2,…,an}为一个待分类项,而每个a为x的一个特征属性。

step2:有类别标签集合C={y1,y2,…,ym}。

step3:根据贝叶斯公式,计算P(y1|x),P(y2|x),…,P(ym|x)。

step4:如果,P(yk|x)=max{P(y1|x),P(y2|x),…,P(ym|x。,则x被分到yk类别。

重点

关键就是如何计算第3步中的各个条件概率。

我们可以这么做:

step1:找到一个已知分类的待分类项集合,这个集合叫做训练样本集。

step2:统计得到在各类别下各个特征属性的条件概率估计。即:

step3:如果各个特征属性是条件独立的,则根据贝叶斯定理有如下推导:

因为分母对于所有类别为常数,因为我们只要将分子最大化皆可。又因为各特征属性是条件独立的,所以有:

其中,1/N为常数。

因此,朴素贝叶斯分类器过程是利用样本集统计出各特征属性的条件概率以及分类标签的概率。然后根据以上步骤对待分类项进行分类预测。

心得

可以看到,整个朴素贝叶斯分类分为三个阶段:

第一阶段——准备工作阶段,这个阶段的任务是为朴素贝叶斯分类做必要的准备,主要工作是根据具体情况确定特征属性,并对每个特征属性进行适当划分,然后由人工对一部分待分类项进行分类,形成训练样本集合。这一阶段的输入是所有待分类数据,输出是特征属性和训练样本。这一阶段是整个朴素贝叶斯分类中唯一需要人工完成的阶段,其质量对整个过程将有重要影响,分类器的质量很大程度上由特征属性、特征属性划分及训练样本质量决定。

第二阶段——分类器训练阶段,这个阶段的任务就是生成分类器,主要工作是计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率估计,并将结果记录。其输入是特征属性和训练样本,输出是分类器。这一阶段是机械性阶段,根据前面讨论的公式可以由程序自动计算完成。

第三阶段——应用阶段。这个阶段的任务是使用分类器对待分类项进行分类,其输入是分类器和待分类项,输出是待分类项与类别的映射关系。这一阶段也是机械性阶段,由程序完成。

应用

下面我们利用朴素贝叶斯模型对股票价格趋势进行分类预测:

属性划分

对属性的确定并对属性进行适当划分是非常重要的。这里为了简单起见,我们利用当日的涨跌状态、RSI指标、RSRS指标、CCI指标做为特征属性。而实际价格趋势为分类标签。根据指标的常用方法对特征属性进行划分,其划分如下表:

分类训练

本文利用股市沪深300的所有成分股N天历史数据作为训练样本。以当前天的下一交易日实际价格涨跌状态为分类标签进行分类器训练。训练样本量为:3万。

利用2018年5月1日之前的N天的样本数据为训练样本,训练结果如下表:

分类预测

预测2018年5月2日-5月15日这10个交易日价格涨跌趋势。利用该段时间沪深300成分股的实际价格涨跌检验分类预测价格涨跌趋势的准确率,如下表所示:

总结

简单的利用贝叶斯模型对股价进行分类预测有一定的合理性。如果想要提高贝叶斯模型分类预测的准确性,我们可以从下面两方面出发:

1、从贝叶斯模型的特征属性出发,深入研究和挖掘更多有用的特征属性,并合理地划分每一个特征属性的范围。

2、选择合适的训练样本集进行研究,可以按行业分类选择具有相同趋势的股票进行训练及预测。

拓展

波动率估计

波动率模型,尤其是随机波动率模型在金融领域有着广泛的应用,这就使得模型的参数估计成为一个非常重要的问题。贝叶斯估计在随机波动率模型上是十分普遍并应用广泛的参数估计方法。

有兴趣的同学可以查阅相关资料,利用贝叶斯估计方法对波动率模型进行参数估计。

来源:金色财经

标签:OINAPECOICOINkucoin成都官网TAPESwapcoinzpixiucoin

TRX热门资讯
如何阅读以太坊合约以避免“抽毯子”

许多DeFi的参与者已经成为代币合约漏洞的受害者,这导致他们损失了不计其数的钱或代币。这中情况在Uniswap中最常见,因为只要他们有技术并且可以支付以太坊手续费,任何人都被可以写一份智能合约.

1900/1/1 0:00:00
2021年这些原因会不会影响以太坊飙升?

交易员和分析师拉克认为,以太坊是今年投资的最佳加密货币。受欢迎的才走得更远,打破了他认为将推动加密货币价格上涨的六个关键因素。“到2021年,将进入以太坊年。”他对187,000个订阅者说.

1900/1/1 0:00:00
一家加拿大投资公司提交申请 旨在加速其比特币ETF上市

随着全球金融公司对加密ETF的兴趣重新燃起,加拿大公司AccelerateFinancialTechnologies已经提交了比特币交易所交易基金的申请.

1900/1/1 0:00:00
ZKSwap团队解读零知识证明算法之Zk-stark

谈到ZKP算法,大伙可能听过一些,比如zk-snark、zk-stark、bulletproof、aztec、plonk等等。今天,ZKSwap团队就和大伙聊聊这一对“表面兄弟”,zk-stark和zk-snark算法的异同之处.

1900/1/1 0:00:00
金色说明书|如何在Lendhub借贷挖矿?

LendHub是一个基于火币生态链Heco的去中心化借贷平台,支持多个Heco币种的质押借贷,用户通过在LendHub上进行质押或借贷即可获得激励通证LHB奖励.

1900/1/1 0:00:00
市场再一次选择了多头 BTC 2.4实时分析

?投资犹如下棋,棋艺高者能看出五步,七步甚至十几步,而棋艺低者只能看出两三步,高者顾大局,谋大势,不以一子一地为重,以最终赢棋为目标,低者则寸土必争,只为争一时之需,结果频频受困趋势,一定要有长远眼光,投资,一定要有长远规划.

1900/1/1 0:00:00