宇宙链 宇宙链
Ctrl+D收藏宇宙链

冗余策略:双副本与纠删码该如何选择?

作者:

时间:1900/1/1 0:00:00

Filecoin主网的上线后,存储的数据呈爆炸式增长,如今全网有效算力已经达到了1.40EiB,海量数据的安全存储给矿工带来了巨大的挑战。

关注Filecoin的小伙伴们近两天可能看到过这两个账户的图片,这两个账户都是之前排名靠前的节点,可是现在账户显示可用余额为负几万FIL-十几万FIL,质押币被罚没,出块奖励被罚没,损失折合人民币数千万元,出现这样的状况非常可惜。

比特币矿企 Cathedra Bitcoin 计划在 360 Mining 的德克萨斯州站点部署比特币矿机:金色财经报道,比特币矿企 Cathedra Bitcoin(CBIT)与离网比特币矿企 360 Mining 建立合作伙伴关系,计划在 360 Mining 拥有的德克萨斯州站点部署移动数据中心与比特币矿机。360 Mining 提供天然气和发电基础设施,为 Cathedra 的比特币矿机提供持续电力。Cathedra 将向 360 Mining 支付每兆瓦时 55 美元的耗电量,外加该站点开采的比特币总量的 10%。双方还保留在经济上有利的情况下放弃比特币挖矿以将天然气出售给市场的选择权。该合作伙伴关系使 Cathedra 拥有 2.0 兆瓦发电能力的权利,并在未来 60 天内完成 0.3 兆瓦的初始部署。[2023/6/2 11:55:14]

扇区生命周期是180-540天,在这期间内我们要不断地进行时空证明,来验证数据存储的安全无误,如果提交的数据有误或者没有在时间内提交就会报错,如果14天内还没有提交上来正确的数据,就会触发非常严重的罚没机制!

以太坊核心开发人员:自2020年以来只有0.04%的以太坊验证者被移除:金色财经报道,以太坊核心开发人员Superphiz表示,自2020年12月1日启动信标链以来,以太坊生态系统只削减了226个验证者,仅占524,060个验证者的0.04%。最大的削减事件之一发生在2021年2月4日,当时质押基础设施提供商Staked的75个验证器因生产竞争区块而被削减。Staked说,违反认证是由于“技术问题”造成的。

削减是一个验证者违反权益证明共识规则的过程,这通常会导致该验证者从网络中移除并削减一部分质押的以太坊。Superphiz表示,这种被大幅削减的可能性很小,这表明人们不应该因为这个特定原因而担心抵押ETH。Superphiz指出许多移除是由于“系统迁移失败”造成的。[2023/2/23 12:24:35]

所以存储方案对于Filecoin挖矿非常重要!

普通的硬盘存储是很危险的。硬盘在存储实际使用过程中年故障率一般在2%上下,这意味着100块硬盘中,平均每年会故障2块,硬盘故障率是非常高的,我们可以看下图的浴缸曲线,硬盘在刚上线时故障风险更大,更远高于平均故障率。

Messari:三季度Filecoin存储数据量为211个PiB,环比增长82%:11月6日消息,加密数据研究机构Messari发文表示,Filecoin的网络使用情况,可以通过存储用户和存储提供商之间的活跃交易中存储的数据量来衡量;截至第三季度末,通过活跃交易,将近211个PiB存储在Filecoin网络上,与上一季度相比增加了82%。[2022/11/6 12:21:42]

这说明我们存储打包的数据是很容易因硬盘损坏而丢失,仅仅靠硬盘存储很难保证可以在扇区生命周期内存储数据的安全。

图:浴缸曲线

所以冗余保护策略就变得非常必要。

多副本和纠删码是目前分布式存储系统中常用的两种数据冗余保护策略,也就是保护我们数据安全的两项技术。

数据:交易所钱包7天流出超过2.4万枚BTC:8月21日消息,据Coinglass数据,交易所钱包近24小时流出1729.41枚BTC,近7天流出24606.78枚BTC,近30天流入5087.13枚BTC。目前全网交易所比特币钱包余额总计为2102318.63枚BTC。[2022/8/21 12:38:06]

注:分布式存储系统中的CAP原则,Consistency、Availability、PartiTIontolerance,对于可用性来说常见的两种技术是多副本和纠删码。

多副本与纠删码分别是什么

多副本就是把数据复制成多份并分别存储到不同地方以实现冗余备份。以双副本为例,双副本顾名思义就是数据存储为两个副本,当某个副本丢失时,可以通过另一个副本复制恢复数据。

纠删码主要是通过纠删码算法将原始的数据进行编码得到冗余,它将数据分割成片段,把冗余数据块扩展、编码,并将其存储在不同的位置,并将数据和冗余一并存储起来,以达到容错的目的。

纠删码最早是在通信行业解决部分数据在传输中损耗的问题,它的基本原理是把传输的信号分段,加入一定的校验再让各段间发生一定的联系,即使在传输过程中丢失掉部分信号,接收端仍然能通过算法把完整的信息计算出来。纠删码技术本身更多是用于传输,而并不是存储。

百度百家号与其平台创作者联合推出艺术IP数字藏品:4月26日消息,据百度百家号官方帐号,百度百家号与其平台创作者联合推出艺术IP数字藏品,将于4月27日和4月28日限量发售。此次发售系列分别为百度创作者@何水晶art的《带你开启异想宇宙》、百度创作者@我是千岁千千岁啊的《可爱熊猫的万千形态》以及百度创作者@朱铁雄的《中国魔法少年的热血英雄梦》。[2022/4/26 5:12:23]

多副本与纠删码技术如何选择

多副本与纠删码技术在不同的应用场景下有各自的优势。

1.存储利用率

多副本是复制多份分别存储到不同地方以实现冗余备份,比如双副本磁盘利用率只有50%,冗余度很高,这带来了巨大的额外存储空间消耗,无形中提高了很大的成本,但它更安全、读写更快。

纠删码技术不需要完整写入真实数据的副本,它主要是通过纠删码算法将原始的数据进行编码得到冗余,并将数据和冗余一并存储起来,以达到容错的目的。其基本思想是将n块原始的数据元素通过一定的计算,得到m块冗余元素。对于这n+m块的元素,当其中任意的少于m块元素出错时,均可以通过对应的重构算法恢复出原来的n块数据。生成校验的过程被称为编码,恢复丢失数据块的过程被称为解码。磁盘利用率为n/(n+m)。与双副本方法相比具有磁盘利用率高等优点。

附:容量空间对比

2.容错性

双副本很好理解就是存一份,备份一份,容错性比较好。双副本在部分数据丢失后可以从另一个副本复制出来损失的数据,恢复正常使用。

纠删码技术本质就是计算,如果出现数据丢失,纠删码技术做的是把丢失的数据计算出来,而计算是需要一些已知的量再进行运算的,当数据丢失多的话,是无法计算的。容错性比起副本有一定差距,

放到实际情况来讲,当纠删码设置4/1情况下,节点或者数据块故障,数据恢复需要读取3个数据块和1个校验,也就是说这5项损坏了任意2项的数据块,数据就无法计算找回,就造成信息丢失、无法找回的严重后果。

3.可靠性对比

双副本有两份数据,可以允许任意一个数据块损坏。

纠删码配置一个数据块配备一个校验位时才能提供和双副本近似的可靠性。

4.数据恢复对性能影响及恢复效率

双副本下,一个节点或者数据块故障,数据恢复直接从另一个副本读取、写入,一次进行恢复副本,影响一个节点的读取性能。恢复效率较高。

纠删码设置4/1情况下,一个节点或者数据块故障,数据恢复需要读取三个数据块和一个校验,通过运算后写入一次进行数据恢复,影响四个节点的读取性能。恢复效率较低。

5.写惩罚

双副本下,某个节点的一次数据写入,实际需要两个节点参与,写惩罚为2。

纠删码设置4/1情况下,一次数据写入,实际需要至少两个节点参与,其中读取两次,写入两次,写惩罚为4。

6.CPU开销

双副本是基于数据完整复制,几乎没有计算的开销,对CPU开销较低。

纠删码由于读写都需要计算校验值,有较高的计算开销,需要额外的CPU资源开销。

7.这两项技术如何选择

副本技术可以更好的保证数据的安全性,提升读写效率。一般适用于关键业务,对性能要求比较高,网络对数据出错容忍度极低的业务,如数据库等。

纠删码则可以提高存储系统利用率,降低成本。一般适用于其他非关键性业务,如视频监控等,部分数据块的损坏不会影响信息的传递。

结语

Filecoin挖矿中最为核心的就是存储,在存储上省钱,如果有一天出了问题,赔了夫人又折兵。在当前副本策略在安全性上无疑是更优的,尽管成本很高,但对我们挖矿中的数据的安全是一个重要保障,备份冗余并不是浪费,而是非常必要的。

当前Filecoin挖矿热度依然很高,市场鱼龙混杂,充斥着各种各样的Filecoin挖矿产品。比如市场上相同价格可能有80%利用率的产品,也有双副本50%利用率的产品,要如何选择呢?投资Filecoin挖矿产品绝对不能只看售卖价格,作为投资人一定要有一个投资标准,很多技术问题可能很难去理解和分析,但我们可以化繁为简比较每万元收益,毕竟拿到手里的收益才是最实在的。

标签:COINOINCOIFILRitocoin币赢coinw资金盘Onegetcoinfil币还有希望吗

莱特币最新价格热门资讯
共建FISCO BCOS生态,巴比特成为首批培训服务合作伙伴

近日,巴比特成为金链盟首批FISCOBCOS培训服务合作伙伴之一,与FISCOBCOS开源社区一同助力区块链人才培育体系建立.

1900/1/1 0:00:00
比特币领导者:在2020年的混沌中,看到了进步的阶梯

2020年是近期最疯狂的一年。整个世界在危机间来回跳动,精神分裂。这是十分糟糕的现象,而且似乎把世界推入了一个混乱的深渊。然而,正如Littlefinger在《权力的游戏》中给我们指出的那样,混沌不是深渊,而是阶梯.

1900/1/1 0:00:00
DappRadar报告:2020年DeFi繁荣推动DApp总交易量增长近12倍

根据DappRadar,2020年迄今为止的DApp总交易量已经高达2700亿美元,其中95%来自以太坊上的DeFi生态系统。与去年210亿美元的总交易量相比,今年的DApp交易量增长惊人,涨幅为1178%.

1900/1/1 0:00:00
留给2021的谜题:谁会是SEC的下一个针对目标?

本文来自?风火轮社区,作者:佩佩大家好,我是佩佩,我们即将和2020saygoodbye,加密市场的市值仍在向上冲锋,不过受瑞波事件影响,包括还在增加的交易所陆续下架的新闻,还是给部分alt市场蒙上了阴影.

1900/1/1 0:00:00
量子问世!比特币凉凉?

关注区块链鉴查院,回复鉴定查询项目 福州大学超高分辨率量子点发光二极管论文在《Nature》发布,将突破元宇宙显示瓶颈:金色财经报道.

1900/1/1 0:00:00
Pantera:比特币的需求是供应的三倍?

作者:PanteraCapital 翻译:李翰博 供求关系 一位TigerCub的朋友/TMT投资者:“我们不投资比特币,因为没有现金流可以折现。”我:“嗯,欧元/美元也没有现金流,但是没有人想过要交易它.

1900/1/1 0:00:00