宇宙链 宇宙链
Ctrl+D收藏宇宙链

机器学习能预测加密货币价格吗?以片断插值法为例解析

作者:

时间:1900/1/1 0:00:00

本文发布于加密谷Live,作者:MichelKana,翻译:Jeremy。

这份实用指南提供了你预测加密货币价格飞速上涨所需的基础知识。

十五年前,我开始探索数字货币的世界,并为一个只使用短信的点对点移动货币平台做了原型。

最近,我的一位合作者问我,人工智能是否可以预测加密货币的价格。她对区块链的炒作很好奇。

经过研究,我发现预测加密货币价格是一个可以解决的问题,但绝对不是针对所有市场条件。

加密资产的典型预测模型将利用时间序列预测、机器学习或深度学习方法。

在本文中,我研究了在预测给定日期的Litecoin平均价格时,片断插值的表现如何。

马斯克:付费用户验证是解决机器人账户的唯一方法:11月1日消息,美国畅销书作家Stephen King在推特上抨击马斯克主导的Twitter Blue付费用户验证,认为每月19.99美元的价格过于高昂。

对此,马斯克对此回复道,“我们需要以某种方式还账,推特不能仅仅依靠广告收入。后续我将会发长文详细解释,(付费用户验证)是解决账户机器人和网络挑衅者的唯一方法”。[2022/11/1 12:04:13]

数据

我们将关注2013年4月至2021年2月期间Litecoin的历史价格。这些数据取自coinmarketcap,并且是可以免费使用的。我将数据分为80%的训练数据集和20%的测试数据集。后者用于评估我们预测收盘价的准确性。

Reddit用户:黑客利用GitHub信息抓取机器人窃取加密货币:一位Reddit用户表示,自己不小心将钱包的恢复短语保留在GitHub存储库中,不到两分钟的时间里黑客成功从其Metamask钱包窃取价值1200美元的ETH。该Reddit用户表示,黑客们已经建立自动机器人程序来抓取GitHub,搜寻加密货币钱包的私钥、助记短语和其他私人信息,如账户密码。(Cryptoglobe)[2020/5/28]

加密货币Litecoin的价格历史(Source:Kaggle)

短暂的探索性数据分析显示,平均收盘价在年初和年末是最高的。10月份最低。

多项式回归

你可能听说过多项式回归,这可以说是创建一个阶数为d的基础来近似一个非线性函数的最简单例子。

金色相对论 | 肖臻:区块链核心技术还是属于分布式系统、密码学等计算机传统领域,跟机器学习也有很好的结合点:在今日的金色相对论中,针对“区块链、分布式系统以及机器学习领域的研究具体应用有哪些”的问题,北京大学计算机系研究员、博士生导师,肖臻表示,虽然区块链表面上是个新的领域,其实核心技术还是属于分布式系统、密码学等计算机传统领域,跟机器学习也有很好的结合点,目前我们正在致力于利用该技术实现智能合约的高效、细粒度并发执行。已有的区块链技术(比如以太坊中的智能合约)只支持单线程,就是因为在多核环境下并行程序的执行存在不确定性,影响区块链中的节点达成共识。我的课题组开发的确定性重演技术有希望极大地提高智能合约的执行效率,成为区块链3.0中的核心技术。我们的另一项成果是基于多智能体的智能决策系统,通过强化学习技术使得各智能体在去中心化的情况下独立做出判断,实现某个预先设定好的效益函数的最大化。[2019/9/12]

我对Litecoin的历史价格进行了简单的多项式回归,使用5、25和80的阶数。在每种情况下,R2值将提供一些关于模型在测试数据集上的拟合度好坏的信息。

动态 | 推特出现大量机器人账号警告人们不要购买XRP:据AMBCrypto消息,2月13日,推特上出现了大量的机器人账号,这些账号重复发布同一条消息并不断@XRP社区成员以及其它持有者。消息内容是:“我发现你关注了在推特上关注了Ripple,如果你打算购买XRP的话,我送你一个大大的‘NO’,因为XRP已被开发团队抛弃,他们正打算创建另一个项目。”这些账号的关注量与粉丝量都为0,背后的操作者也无从得知。[2019/2/13]

从下面的蓝线与训练数据的拟合度来看,我们可以观察到随着多项式阶数的增加,曲线越来越陡峭。这是由于模型复杂性增加,因为高阶多项式试图追逐训练集中的每一个单一数据点。

第0天代表2013年4月30日,第2800天代表2021年2月28日。

特别是在有离群值的区域,高阶多项式往往会向这些离群值的方向发展。因此,80阶多项式的模型具有最高的方差。

它在训练数据上的偏差也是最低的,这体现在最高的R2值上,相比之下,低阶多项式的R2更低,意味着更高的偏差但更低的方差。低阶多项式对训练数据的敏感性较低。

分片插值

我发现一个更灵活的方法是使用片断多项式来预测加密货币价格。

分片插值用低阶多项式拟合大量的数据点。由于我们只使用低阶多项式,我们消除了过度的振荡和非收敛性。

给定一组数据点,分片插值的工作原理是在每一部分数据中使用不同的多项式。

特别是,我们使用连接的分片多项式,也称为样条。

样条的一个例子是下面的截断线性函数。它在4的左边是平的,称为函数的结。

给定几个结点,我们可以将多个线性基函数组合起来,并将其拟合到非线性数据中。

为了检测加密货币价格中存在的高度曲线关系,我使用了一个截断的三次函数,也叫三次样条。

使用三次样条,我们将数据分割成块,并对每个块拟合一个三次样条。每个样条函数在结点处连接到下一个函数。

三次样条是加密货币价格变化的一个非常好的选择,因为连接是平滑的。三次样条的斜率和它们的第一和第二导数都是匹配的。三次样条是3阶的多项式函数,它仍然足够小,以避免差异性。

三次B-样条是三次样条的一个更容易的变体,用于高效计算,因为最多有5个基函数参与贡献插值。下面我们可以看到三次B-样条在Litecoin价格上的表现,将结点放在四分位数上之后。

通过手动选择结点,即在我们有一堆数据点的情况下,与根据四分位数放置结点时的值相比,我们在测试数据集上实现了更好的R2。

在边界附近的三次样条可能表现得很奇怪,你能够在上面的红色图中注意到。所谓的自然三次样条通过在每个极限处将一个三次多项式改为线性来强制要求函数在极限结点之外是线性的。

自然三次样条需要选择一个自由度。对于Litecoin的价格,我通过交叉验证找到了最佳自由度:挑选了合适的174个结点的量子作为预测器的日期。结果与三次B-样条相比,边缘的差异性更小,但测试数据集的R2略差。

最后,我实现了平滑样条,在惩罚价格变化的同时,使均方误差最小化。

平滑样条似乎是Litecoin价格最合适的分片插值。该模型在测试数据集上实现了迄今为止获得的最佳R2值。

三次样条模型令人兴奋的部分是如何超越用于训练模型的数据范围进行推断。

根据以预测和时间序列工作而闻名的著名统计学家RobJhyndman的说法,三次平滑样条模型在预测方面可以作为与ARIMA模型等效的模型,但其参数空间受到限制。Rob声称,样条模型提供了一个平滑的历史趋势以及线性预测函数。

我邀请你进一步试验这个想法。我的计算机代码可以在网上以JupyterPython/RNotebook形式查看。

本文中使用的GoogleColabNotebook

数字货币和加密货币,如Litecoin,是现代全球经济中最具争议和最复杂的技术创新。本文旨在使用一种不太流行的方法:三次样条来预测Litecoin价格的变化。

标签:ECOCOINCOI加密货币ECOSCLeadcoinrheincoin加密货币与数字人民币的区别

SHIB最新价格热门资讯
DeFi 聚合平台Instadapp宣布进行重大升级,并推出治理代币INST

本文系链捕手原创文章,作者Echo。近日,DeFi聚合平台Instadapp在官方博客公布了其升级计划,将DeFi智能帐户升级到开放的DeFi智能层,允许用户在各个帐户之间执行不同的交互,同时宣布推出其治理代币INST,并在第二季度逐.

1900/1/1 0:00:00
TokenPocket将于新加坡时间4月2日上线聚合闪兑平台

链捕手消息,全球领先的多链去中心化钱包TokenPocket将于新加坡时间4月2日上线聚合闪兑平台.

1900/1/1 0:00:00
Dapper Labs CEO:我超爱泡泡玛特,NFT会将收藏品市场规模提升至万亿美金

本文来自律动BlockBeats。NFT的突然爆发令无数人始料未及,人们没有想到这个在半年前还无人问津的「小圈子」如今会吸引到加密领域以及加密领域之外各行各业的关注.

1900/1/1 0:00:00
上周加密市场共发生29起公开融资事件 | 投融资周报

据链捕手不完全统计,4月5日到4月11日期间,区块链行业共发生29起公开投融资事件,方向主要集中在DeFi、波卡、NFT等板块。其中BlockDreamFund、X21、GBV投资机构出手最频繁.

1900/1/1 0:00:00
TokenPocket与Autofarm达成合作,已为其代币TPT提供机池服务

链捕手消息,BSC链上复投策略机池Autofarm为TPT-BUSDLP开通机池服务,据官方计算,截至4月12日21:00GMT+8,TPT-BUSDLP?机池APY达到685%.

1900/1/1 0:00:00
“戏耍”苹果公司、裁掉联合创始人……揭秘Coinbase的7段往事

本文来自区块印象。 周三,Coinbase在万众瞩目下如约登陆纳斯达克。过去,Coinbase在安全和监管上一直保持谨慎态度,给人留下专业且保守的形象.

1900/1/1 0:00:00