宇宙链 宇宙链
Ctrl+D收藏宇宙链
首页 > Filecoin > 正文

Paradigm:如何使用链上数据进行策略研究?

作者:

时间:1900/1/1 0:00:00

I.引言

Crypto政策在制定时很少会用到真实且细化的数据,原因主要有以下三点:

1.新兴技术领域的相关政策大多还停留在理论及定性分析层面,早期阶段很少会使用到数据。

2.尽管链上数据全部开放透明,但要想访问这些数据人们需要在短期内完成大量工作,即便对于Crypto原生从业者来说也是如此。

3.区块链「取证」公司和数据供应商有少量的数据产品,但它们都不具备灵活性/可定制性,也不能满足经济/金融研究人员的需求。

许多现代经济学和金融学研究人员错过了将工具应用于Crypto数据分析的机会。从设计上讲,Crypto可以向任何人提供细化数据,但大部分政策在制定时仍依赖于CoinMarketCap等外部预聚合时间序列数据源,而不是直接从数据源获取数据,这又是什么原因导致的呢?

正如政策制定者可以查询美国每家主要银行的资产负债表,并逐秒观察消费者存款的变化一样,他们也可以毫不费力地查看整个Ethereum生态系统的Stablecoin发行情况,但大多数分析Stablecoin的政策文件却采取了一种探讨假设事件的分析方法。

我将在本篇中具体阐释以下几点内容,希望可以对想要使用链上数据的政策研究人员有所帮助:

OpenSea Pro新增NFT系列价差显示功能:5月13日消息,OpenSea Sea Pro 新增 NFT 系列价差显示功能,用户可以访问任何 NFT 系列的报价列表,了解每个 NFT 系列的最高报价和最低报价。[2023/5/13 15:00:42]

·链上数据的获取方法

·链上数据所采用的结构

·提取和使用链上数据的几个基本工具

在随后的文章中,我将探讨如何使用这里收集的数据来判断Crypto市场的走势。同时,我将在结尾发布可供免费使用的数据和代码。通过阐明如何在区块链中查询数据,我希望向大家展示Crypto的开放性可以为数据决策开辟的新方法。

如果您就职于一家监管机构或研究机构,并在获取Crypto数据时遇到了困难,欢迎与我们取得联系分享你的想法,了解Paradigm可以为您提供哪些帮助。

II.链上数据获取方法

一般来讲,数据收集工作应集中在一个区块链及特定项目的子集上,这些项目主要是以美元计价、法币支持的Stablecoin,具体包括USDC、Tether、BinanceUSD、PaxDollar和GeminiDollar。该方法广泛适用于链上数据,即便你想创建一个不同的数据集。

Shardeum聘请CoinFund前CMO Kelsey McGuire为首席增长官:4月18日消息,由 WazirX 联合创始人兼 CEO Nischal Shetty 创立的 Layer1 区块链 Shardeum 宣布聘请 Kelsey McGuire 为首席增长官。Kelsey McGuire 此前曾在 CoinFund 担任首席营销官(CMO),还在 ConsenSys 担任过营销高管,在加入 Shardeum 之后,Kelsey McGuire 将帮助推动 Shardeum 的发展和扩大 Shardeum 在 Web3 生态系统中的影响力。[2023/4/18 14:10:36]

Etherscan这类区块浏览器非常适用于查看交易快照以及收集特定智能合约的信息,但根据我的经验,它们却不太能用于生成大型数据集。在收集和处理原始数据时,你基本上有两个选择:在本地运行一个完整的节点,或查询已经从链上直接写入原始数据的数据库。第一种方法对于专业技能和计算资源的要求比较高,而第二种方法则只需要基本的SQL和Python技能就可以实现,所以这里我们将采用第二种方法。

Dune和谷歌云平台的BigQuery有最新的链上数据,这些数据都以表格的形式存储在数据库中,研究人员可使用SQL命令对其进行查询。Dune还提供免费的数据库,不过其速度较慢,而且还有些局限性,但它非常适合于A/B测试的数据查询,也有助于你熟悉数据库的运行模式,尤其是对于那些不善于使用SQL查询关联数据库的人。BigQuery虽然更加灵活快捷,但谷歌会对计算资源收费,所以其价格也相对昂贵。我在第一次处理数据时,为了节省费用,我会先在Dune中测试查询语句,然后再将其输入GCP中运行。在大多数情况下,这种方法都能起到很好的效果

Paxos通知部分用户重新进行KYC验证或关闭账户:2月13日消息,据社区用户反应,稳定币发行商Paxos近日向用户发送邮件,通知部分用户重新进行KYC验证,或者通知部分用户关闭账户。

Paxos在邮件中表示:“Paxos是一家受监管的金融机构,法律要求我们对客户有更深入的了解,以便保持准确和最新的记录。”此外,在被要求关闭账户的邮件中,Paxos称:“我们目前无法维护您的帐户,因为您提供的帐户信息或帐户活动超出了我们的风险偏好。”

金色财经此前报道,知情人士表示,美国SEC计划起诉Paxos违反投资者保护法。[2023/2/13 12:03:08]

III.链上数据结构

要回答这个问题,你首先需要搞清楚自己处理数据的目的。对于这个测试案例,我决定为主要的法定支持Stablecoin建立一个大型的时间序列数据集,并观察一些特定的行为:铸币,烧毁(即停止流通Stablecoin)和转移。我之所以选择以这种方式进行研究,是因为政策制定者和学者目前最为关注法定支持的Stablecoin,所以这些数据在短期内可能相当有用。

以美元计价的几大Stablecoin都采用了ERC-20Token标准。顾名思义,ERC-20是一种在Ethereum上使用智能合约创建Token的标准化方式。如果你把区块链理解为一个巨大的去中心化Excel表格,那么智能合约就类似于Excel函数。在函数中输入参数之后,它将使用其内置逻辑产生一个特定的输出结果。

Coinbase股价再创历史新低:金色财经报道,在美联储今年最后一次利率决定之前公布的通胀数据好于预期后,比特币和其他加密货币价格保持上涨。然而,加密股票表现不佳,Coinbase股票创下历史新低。Silvergate下跌近12%。[2022/12/14 21:43:21]

我们可以使用智能合约的Ethereum地址来对它们进行定位,这些地址是区块链数据结构中的唯一标识符:

·?USDC

·?TetherUSD

·?BinanceUSD

·?PaxDollar

·?GeminiDollar

与API类似,智能合约也是可以重复使用的程序。每次智能合约获得互动指令时,都会产生该互动的记录,并由Ethereum协议以日志的形式记录在区块链上,而这些日志则构成了智能合约活动的可靠信息来源。

当智能合同执行一个特定函数时,例如烧毁ERC-20Stablecoin以将其从流通中移除,该函数及其参数将作为交易日志记录在区块链上。

在下面的交易中,USDCStablecoin的发行商Circle烧毁了价值1056.92美元的USDC。

沙特Neom新城科技部门今年已在元宇宙和AI应用投资10亿美元:9月30日消息,由沙特王储小萨勒曼主导的“Neom”新城建设项目科技子公司NEOM Tech&Digital首席执行官Joseph Bradley表示,2022年已在元宇宙和人工智能应用投资10亿美元,其中包括一个元宇宙平台。此外,公司还将更名为Tonomus,因为NEOM致力于将人工智能技术整合到其零碳城市The Line的建设中。该元宇宙平台将帮助来自世界各地的人们在实际投资这座城市之前进行虚拟访问。

此前,沙特王储宣布将斥资5000亿美元用于Neom新城建设,建立一个高度自动化、使用太阳能和风能等清洁能源的城市。[2022/9/30 6:04:55]

如果你切换到「日志」标签,你就可以查看交易事件日志,相应的字段为

·地址:智能合约的合约地址。USDCStablecoin的合约地址是0xa0b86991c6218b36c1d19d4a2e9eb0ce3606eb48。

·名称:智能合约执行的函数,以及该函数中的参数。在这里,智能合约正在调用烧毁函数,该函数接收的参数指定了所烧毁币的发送地点和烧毁币的数量。

Etherscan的输出结果还会显示主题和数据字段,这些字段包含了我们在分析交易时需要解析的大部分相关信息。

·Topic0是函数签名的哈希值。从本质上讲,它会将函数及其参数经由单向算法得到一个唯一的函数哈希值。Ethereum使用的是Keccak-256哈希函数,当你通过Keccak-256算法输入函数签名时,它总是会产生相同的哈希值,所以任何时候该哈希值出现在日志中,你都能确信是调用了同一个函数。

·Topic1是烧毁函数的一个索引参数。在这里,Topic1是烧毁的Token被发往的地址。(注意:如果烧毁函数有更多的参数,这些参数将作为额外的主题出现)

·这里的数据字段表示所烧毁Token的数量。

既然我们已经了解了链上数据的基本结构,就可以开始从Dune和GCP中提取数据了。

IV.提取并处理链上数据的基本工具

如前所述,在这个例子中,我选择从现有数据库中提取链上数据,而不是访问Ethereum网络上的活动节点。为了便于理解,我使用SQL从GCP提取了大量原始数据表格,然后在Python中使用pandas库对其进行清理。

当我们从GCP提取表格时,我们将使用BigQuery,它储存有很多Ethereum的数据表,如下图左边一栏所示。当你点击一个表格时,相应的数据库模式就会出现,就如下图中的ethereum.logs表。与此同时,其中涉及的地址、数据和主题都会记录到日志数据中去。

下图中的查询语句将用于提取日志表中涉及与USDC、TetherUSD、BinanceUSD、PaxDollar或GeminiDollar合约互动的所有记录。除了ethereum.logs中的信息外,一些额外的信息也很有用,所以我还合并了ethereum.block表中的数据,其中涵盖了Gas费等信息。

得到的表格可以直接由Python读取,并借助pandas数据框架细分为以下字段:

·log_index

·transaction_hash

·transaction_index

·address

·data

·topics

·block_timestamp

·block_number

·block_hash

·number

·miner

·size

·gas_limit

·gas_used

·base_fee_per_gas

这些字段中的大多数都可以直接使用,不过第三节中讨论的主题字段需要用Python进行一些额外的清理,以便将其分成多列。

V.结语

这篇文章使用的是Ethereum的日志数据,同样的方法也可以用来访问链上的各种数据。Python和SQL是大多数经济学家和政策制定者所熟悉的工具,它们可以发挥很大作用。与传统金融相比,Crypto更具透明度。这样一来,研究人员就可以利用实时数据来阐明金融体系的运作方式,并及时控制住可能出现的风险。

在下一篇文章中,我将着重分析法币支持Stablecoin的铸造与烧毁,并提前准备好相应的数据集。在第三篇文章中,我将以图表的形式向大家展示精细化链上数据可用来研究的问题。

责任编辑:Kate

标签:THEOINHERCOINEthereumeRushRogan CoinCipher CoreYFIC COIN

Filecoin热门资讯
以太坊合并一月后,各POW公链算力对比

一个月前,以太坊的成功合并开启了它的全新时代,而以太坊矿工也成为一个历史性的名词,伴随着的还有其50亿美元的矿机市场和850TH/S庞大算力的烟消云散.

1900/1/1 0:00:00
Uniswap 在凛冬中完成 1.65 亿美元融资

“当我在2018年构建Uniswap协议时,它只是我的一个实验,想看看我是否可以创建一种完全体现以太坊价值观的东西:透明、安全和可访问。从那时起,它以我从未想象过的方式成长和发展.

1900/1/1 0:00:00
找寻流动性? NFT 借贷面面观

过去的24个月对NFT爱好者来说就如风驰电掣一般,在我们眼前,对数字所有权空前强劲的需求创造出了一种令人兴奋的新资产类别。但到头来,所有新玩具终将失色。一阵疯狂的NFT买卖和交易过后,投资者开始寻求利用资产的新途径.

1900/1/1 0:00:00
代币经济学入门(Tokenomics 106):拆解代币设计

本篇将讲解代币设计所面临的一些问题,与NatElisason的代币经济学系列文章有相似观点,亦有互相补充的内容。作者从代币政策、激励与架构三个方面出发,从数值到概念,为读者拆解代币设计的关键因素.

1900/1/1 0:00:00
Cyber??Connect联创:为什么说Meta无法构建线上社交的未来

正如我们所说,未来用户线上社交方式正在被定义,但与之相较更重要的是,这被Meta和其他大型社交类公司所主导。但仅从表面看,Meta发展史就足以使人们理解该公司正在严重偏离趋势。一些公司喜欢使用Web3准则来纠正Web2的错误.

1900/1/1 0:00:00
快速发散 Azuki 提出的「PBT」可能玩法

18日凌晨,Azuki官方公布了PBT的消息,据其说法,PBT是一种“可以将物理项目与以太坊区块链上的数字令牌联系起来开源协议标准”,第一步将利用“BEAN”芯片跟踪物品所有权、进行去中心化身份验证,达到“扫描即拥有”的效果.

1900/1/1 0:00:00