宇宙链 宇宙链
Ctrl+D收藏宇宙链

一文了解Medalla测试网网络动荡始末

作者:

时间:1900/1/1 0:00:00

“roughtime”事件分析报告

作者:Terence、Raul、Preston状态:等待决议。根本原因已找到,问题已缓解。网络:Medalla总结:Cloudflare的roughtime服务器全都返回错误信息,而Prysm节点并没有采取适当的应急措施。这个bug导致所有Prysm节点出现时钟偏移。在时钟偏移的影响下,验证者为超前的slot提议区块并生成见证消息。影响:由于roughtime响应错误以及出现时钟偏移,验证者计算slot错误,提议的区块和生成的见证消息均无效。这个问题影响到了全局参与度。在北京时间凌晨1:30至2:45之间,所有Prysm节点都受到了影响。根本原因:来自Cloudflare服务器的roughtime响应出错。具体来说,是因为“ticktock”报告了一个24小时之后的时间。这个时间戳,再经过所有6个服务器的数据取平均值,是的所有Prysm节点都产生了+4小时的时间调整。解决方案:在我们评估roughtime响应错误所引发的潜在问题时,先将roughtime时钟同步设为可选项。发现:Terence最先发现了这个问题。他注意到一个本地信标链节点一直在拒绝超前的区块和见证消息。几分钟之后,由于roughtime时钟偏移量较高,产生了报警。同时,#general和#bug-report频道的用户开始报告本地节点拒绝超前区块和见证信息的问题。

Vertex Labs以1200万美元收购NFT系列HAPE PRIME工作室Digimental Studio:5月24日消息,元宇宙、Web3和AI基础设施提供商Vertex Labs以1200万美元完成对NFT系列HAPE PRIME的开发工作室Digimental Studio的收购。通过收购Digimental,Vertex Labs将为其HAPE社区成员引入质押计划。[2023/5/24 15:22:18]

经验教训

哪里出了问题我们误以为,对于roughtime服务器故障的问题,我们有适当的应急方案。网络中的每个Prysm节点同时受到影响,导致验证者参与率大幅降低。PrysmaticLabs团队原以为,NTP服务器本身较为分散,而且每个服务器都开放6个端口,不会出现全局故障的问题。万幸的是一位贡献者已经向我们提交了一个PullRequest,把roughtime时间校准设为可以选择退出的功能。我们已经可以用命令行功能标签立即选择取消roughtime时钟校准,这让修复措施变得简单,而且只需一次PullRequtest就能验证。用户在Discord上积极参与讨论。当节点出现问题时,有大量用户提供了详细报告和重要指标。我们有一个持续不断的重同步机制,当它发现时钟偏移量超过2秒时,它会不断更新节点本地的时间。我们一直在重新校准roughtime时钟,以便更快解决这一问题。这可能让这次事件提前了大约30分钟至1小时结束。roughtime时钟同步问题似乎在大约90分钟后就解决了,而且在我们能够紧急发布新版本前,这个事件就已经结束了。时间线2020/08/151:25AM:Terence发现他的本地节点由于一直拒绝超前区块,收到了大量报警。这些区块的slot都超前了4个多小时。1:28AM:Prometheus监控报警系统收到了roughtime偏移量高的报警。那时,距离网络最后一次敲定区块过去了10epoch。1:35AM:至少有30名用户在Discord频道表示他们开始收到下方报警:WARNroughtime:Roughtimereportsyourclockisoffbymorethan2secondsoffset=4h0m0.028854657s1:43AM:Terence在#war-room频道群发了告警消息,称这是一个PS0级别的事件,需要大家共渡难关。1:45AM:Discord频道的用户提出,重启信标链节点和验证者客户端无法暂时解决这个问题。最可行的方案是将roughtime时钟同步设为可选禁用的功能。1:51AM:问题上升到了多客户端聊天室1:52AM:Ivan完成了https://github.com/prysmaticlabs/prysm/pull/68982:00AM:Terence与512位验证者一起在本地测试了6898号PullRequest。2:20AM:据已捕获的调试日志显示,“ticktock”服务器有段时间一直在报告24小时之后的时间。

Upbit宣布将上线SUI:金色财经报道,据官方公告,Upbit 将在韩元(KRW)、比特币市场新增 SUI,仅支持主网充值。SUI 充提支持时间以及交易开始时间将在核实网络情况后另行通知。[2023/5/3 14:39:58]

2:27AM:Raul联络了Preston。Preston将在1小时内回来构建新版本。同时,我们将发布docker镜像。2:40AM:Preston指出只靠紧急修复还不够,我们需要取消将roughtime时钟同步作为默认项。2:42AM:Raul开始调查Kibana,并使用fluentd中的filter分析来自roughtime的调试日志响应。2:43AM:Terence交叉检查了信标链命名空间中所有pod的kubectl日志。正如预期的那样,pod确实存在roughtime时钟偏移问题。2:46AM:Raul向6898号PR提交了正确的修复程序。3:05AM:Raul确认该修复程序可以让节点在本地工作。如果存在时钟偏移,修复程序会产生告警日志,但是不会试图基于roughtime服务器更新时间。3:08AM:Terence在我们的discord频道向所有人宣布:“Prysm节点出现roughtime响应错误,应急措施没有达到预期效果。我们已经找到了故障所在,很快就会进行紧急修复,并在1小时内上线新版本。在即将发布的新版本中,roughtime时钟同步将不再是默认项。”3:18AM:Buildkite单元测试、规范测试、docker镜像构建成功。e2e测试尚未完成。Preston准备启动上线流程。3:22AM:新版本生成:https://github.com/。Terence确认这个方法可以修复其验证者节点。Preston开始使用新的docker镜像依次重启我们的有状态集合中的pod。集群验证者会基于新的镜像进行更新。3:34AM:Docker镜像被标记成alpha21版本,稳定性好,二进制文件已经构建完成3:34AM:对有状态集合中pod的健康状态进行监控,确保滚动更新成功3:36AM:使用新的docker镜像对我们的验证者pod进行滚动启动。4:29AM:在日志上查看返回的延时值。平均来看,这些值似乎都在0.1秒以下。延迟不是调查的关键指标。准确来说,“中点”才是需要研究的地方。注:下表时间是太平洋标准时间。https://kibana.prylabs.network/

Web3社交层DeSo将推出2.0版本:金色财经报道,Web3社交层和Layer1网络DeSo宣布即将推出2.0版本,目前已公布权益证明系统Revolution。此外,还有Production Fast-Hotstuff、主权质押、Liquid Bonding、Collaborand等更新。[2023/3/24 13:24:01]

-图片来源:/img/20230509045858537472/4.jpg "/>

-图片来源:@prestonvanloon.eth-4:41AM:通过Prometheus报警系统关于平均偏移量的数据,我们可以明显看出在北京时间凌晨1:30至2:45之间确实存在时钟偏移问题,之后偏移量开始下降并恢复正常。4:52AM:即时调查结束。这次时钟偏移故障显然已经结束,而且修复程序已经发布。已经更新的节点将立即恢复,还没有更新的节点需要过段时间恢复。监控系统显示,验证者参与度在逐步回升。6:20AM:用户报告说罚没保护机制已经启动。这是因为之前的时钟偏移导致验证者超前4小时提议区块并生成见证消息。为了避免遭到罚没,Prysm验证者没有继续提议无效区块。8:13AM:再次故障8:13AM:Nishant注意到6898号PR中存在严重缺陷。只有在roughtime功能标记开启的情况下,用户才能设置它的功能。8:16AM:Preston更新了“最新的”二进制文件,使其指向alpha20版本来实现临时回滚,并建议用户回滚至alpha20版本。我们现在正在等待合并7004号PR作为alpha22版本的候选。8:45AM:值班团队正在评估是否扩大热状态缓存的大小,以便alpha22版本能够更快让网络重新开始敲定区块。当前默认的热状态缓存大小为8个epoch,但是Medalla测试网距离上一次敲定区块已经过去了将近100个epoch。9:12AM:值班团队决定将默认缓冲大小更新至64epoch,并使其可以通过功能标记来配置。经过初步测试,这有可能会使内存使用量增加1.5G。等网络重新开始敲定区块后,缓冲大小还可以调整。9:57AM:所有PrysmaticLabs验证者节点都生成了会被罚没的见证消息。紧急修复程序删除了Prylabs验证者节点的本地存储。没有任何外部的罚没保护机制在运行。具体情形尚待确认……在1024名验证者中,至少有800名验证者已经或即将遭到罚没。10:37AM:多名用户报告称无法同步区块链。目前的问题是,网络中有太多节点在同一时间进行同步。Alpha22版本被推迟,需要等待进一步通知。10:46AM:Prylabs团队认为现在最好的办法就是等待。用户应该运行alpha20版本或最新的docker镜像。2020/08/162:12AM:正在对同步难的问题进行调查。11:36AM:Nishant和Victor发布初始同步修复程序。参见PullRequest7012。2020/8/171:51AM:合并拉取7012号PR。一些用户报告说同步成功。PrysmaticLabs开始将7012部署到出块节点上。5:15AM:从commit0be1957c2897909b943b80fdd028f5346ae6cde6开始开发Alpha.22版本5:33AM:Alpha22版本发布。链接:https://github.com/5:40AM:通过Discord频道宣布Alpha22版本上线。Prysmatic的值班团队继续监控同步情况,以便进行优化。与此同时,越来越多用户同步至最新区块。12:53AM:Alpha23版本上线,已在Discord频道宣布该消息。Alpha23版本包含一些同步修复程序,有望解决Medalla测试网的问题。建议用户在运行时开启“--dev”标记,以便获得更好的体验。

欧易OKX推出现货币种盈亏功能:据欧易OKX官方推特显示,欧易已于10月13日推出现货币种盈亏分析&分享功能。用户可通过欧易APP实时查看当前持各币种的现货累计收益额/收益率、最新价/成本价、币种数量/净值等,并可生成收益率图片在社交媒体分享。

据悉,用户可使用该功能查看持仓成本价,辅助实现用户计算长期持仓收益、多次交易及定投平均持仓成本。[2022/10/13 14:26:28]

Solana生态多签管理工具Squads集成Magic Eden:金色财经消息,Solana生态多签管理工具Squads已将Magic Eden原生集成至Squads中,允许团队、DAO以及朋友之间直接从他们的多重签名中共同拥有和购买NFT。[2022/9/2 13:04:39]

标签:IMETIMETIMGHTlime币怎么样AmberTime CoinTIMESERIES价格SAFELIGHT

火币网下载官方app热门资讯
YAM这个红薯都烤焦了,1.8亿美元锁仓还继续挖矿,斯德哥尔摩综合征?

编者按:本文来自小吒闲谈,Odaily星球日报经授权转载。YAM挖矿的36小时。睡一觉醒来,DeFi世界变天了;喝杯下午茶,YAM烤焦了,红薯的焦味飘散整个朋友圈。下面复盘一下参与YAM挖矿的过程.

1900/1/1 0:00:00
专访Celer:layer2的另一种破圈思路

近期由于Defi的爆火,令以太坊的Gas费用飙升达到了历史最高水平,笔者亲手参与后认识到,虽然Defi前景广阔,但目前的Defi更适合:1)追求高赔率小币的投机用户,2)玩Farming和各类XX即挖矿的大资金和科学家的用户.

1900/1/1 0:00:00
去中心化是一场启蒙运动

编者按:本文来自橙皮书,Odaily星球日报经授权转载。有时候,现实比剧本更难琢磨。两年前,和crypto圈的开发者聊天,大家谈Web3、谈去中心化的新互联网、谈DID,所有这些概念看起来都棒极了,但谈着谈着,不免又会陷入另一个老调常.

1900/1/1 0:00:00
CertiK:两千爆涨至四万美元,闪电贷套利事件分析

两千美元转眼爆涨20倍,这是什么致富手法?北京时间8月10日下午1点58分,CertiK安全研究团队发现位于以太坊区块链区块高度10633645处发生交易量巨大的闪电贷行为.

1900/1/1 0:00:00
放量冲高承压回调,市场情绪极度贪婪

2020年第33周区块链二级市场报告2020年8月9日-2020年8月17日本期报告重点内容:本周大盘走势:放量冲高承压回调.

1900/1/1 0:00:00
如何使用BSN官方门户许可链服务?官方演示视频来了

区块链服务网络自2020年正式上线已过去近四个月了,很多开发者已经开始使用BSN发布自己的许可链DApp服务,或参与其他人发布的服务。这一期间,BSN的客服也从各渠道收集了大家在使用时遇到的各种问题.

1900/1/1 0:00:00