I.引言
Crypto政策在制定时很少会用到真实且细化的数据,原因主要有以下三点:
1.新兴技术领域的相关政策大多还停留在理论及定性分析层面,早期阶段很少会使用到数据。
2.尽管链上数据全部开放透明,但要想访问这些数据人们需要在短期内完成大量工作,即便对于Crypto原生从业者来说也是如此。
3.区块链「取证」公司和数据供应商有少量的数据产品,但它们都不具备灵活性/可定制性,也不能满足经济/金融研究人员的需求。
许多现代经济学和金融学研究人员错过了将工具应用于Crypto数据分析的机会。从设计上讲,Crypto可以向任何人提供细化数据,但大部分政策在制定时仍依赖于CoinMarketCap等外部预聚合时间序列数据源,而不是直接从数据源获取数据,这又是什么原因导致的呢?
正如政策制定者可以查询美国每家主要银行的资产负债表,并逐秒观察消费者存款的变化一样,他们也可以毫不费力地查看整个Ethereum生态系统的Stablecoin发行情况,但大多数分析Stablecoin的政策文件却采取了一种探讨假设事件的分析方法。
ParaSpace:安全补丁审核与测试已完成,3月25日前将分阶段重启协议:3月20日消息,NFT借贷协议ParaSpace发推称,安全补丁的审核与测试现已完成,以便在主网上重启协议时确保用户资产安全。提现时间锁合约正在完善中,将在未来几天进行审核与测试。ParaSpace团队决定分阶段重新开放协议,将优先考虑还款、供应、清算、贷款、提款与时间锁的增强。团队预计所有平台功能将在3月25日之前上线。平台第一阶段的还款功能已经上线,希望在清算仍暂停的情况下为用户提供机会来偿还债务。
团队将开始为用户手动认领与复利APE池中的APE质押奖励,直到协议上线。仅在APE池中拥有APE的用户在分阶段重新开放期间仍能获得自动复利的收益。[2023/3/20 13:14:48]
我将在本篇中具体阐释以下几点内容,希望可以对想要使用链上数据的政策研究人员有所帮助:
·链上数据的获取方法
·链上数据所采用的结构
·提取和使用链上数据的几个基本工具
在随后的文章中,我将探讨如何使用这里收集的数据来判断Crypto市场的走势。同时,我将在结尾发布可供免费使用的数据和代码。通过阐明如何在区块链中查询数据,我希望向大家展示Crypto的开放性可以为数据决策开辟的新方法。
CleanSpark购买1061台Whatsminer M30S矿机:7月14日消息,比特币矿企CleanSpark宣布已购买1061台Whatsminer M30S矿机,为公司增加了93PH/s的挖矿算力。
此前报道,截至6月30日,CleanSpark共持有561枚比特币,在线矿机数量约2.85万台,算力超2.8EH/s。(globenewswire)[2022/7/14 2:13:52]
如果您就职于一家监管机构或研究机构,并在获取Crypto数据时遇到了困难,欢迎与我们取得联系分享你的想法,了解Paradigm可以为您提供哪些帮助。
II.链上数据获取方法
一般来讲,数据收集工作应集中在一个区块链及特定项目的子集上,这些项目主要是以美元计价、法币支持的Stablecoin,具体包括USDC、Tether、BinanceUSD、PaxDollar和GeminiDollar。该方法广泛适用于链上数据,即便你想创建一个不同的数据集。
Etherscan这类区块浏览器非常适用于查看交易快照以及收集特定智能合约的信息,但根据我的经验,它们却不太能用于生成大型数据集。在收集和处理原始数据时,你基本上有两个选择:在本地运行一个完整的节点,或查询已经从链上直接写入原始数据的数据库。第一种方法对于专业技能和计算资源的要求比较高,而第二种方法则只需要基本的SQL和Python技能就可以实现,所以这里我们将采用第二种方法。
Ribbon Finance将利用Paradigm的流动性网络优化产品流程:4月19日消息,链上结构化产品Ribbon Finance宣布与Paradigm合作,利用Paradigm的流动性网络优化其期权产品流程,并成为Paradigm的第一个DOV(DeFi Options Vaults)集成。Paradigm和Ribbon Finance的共同目标是高效拍卖结算,以更好地满足不断增长的金库的需求。通过改善整体拍卖流程,该项目金库执行获得更具竞争力的定价,最终为用户获得更好的收益。
据悉,Ribbon Finance预计将于5月13日把新的拍卖流程引入T-WBTC-C金库,并分阶段逐步将其推广到其他金库。此前在3月中旬,Ribbon Finance宣布完成875万美元B轮融资,Paradigm领投。(Medium)[2022/4/19 14:34:20]
Dune和谷歌云平台的BigQuery有最新的链上数据,这些数据都以表格的形式存储在数据库中,研究人员可使用SQL命令对其进行查询。Dune还提供免费的数据库,不过其速度较慢,而且还有些局限性,但它非常适合于A/B测试的数据查询,也有助于你熟悉数据库的运行模式,尤其是对于那些不善于使用SQL查询关联数据库的人。BigQuery虽然更加灵活快捷,但谷歌会对计算资源收费,所以其价格也相对昂贵。我在第一次处理数据时,为了节省费用,我会先在Dune中测试查询语句,然后再将其输入GCP中运行。在大多数情况下,这种方法都能起到很好的效果
云银行初创公司Thought Machine完成2亿美元融资,Nyca Partners领投:11月29日消息,云银行初创公司Thought Machine完成2亿美元融资,以帮助银行进入云时代,该轮融资由Nyca Partners领投。Thought Machine计划利用资金在全球扩张,尤其是在亚洲马来西亚和日本。
Thought Machine由前Google员工Paul Taylor于2014年创立,作为银行业的基础设施即服务运营,它旨在帮助传统参与者进入云原生核心银行业务。
包括ING Ventures、JP Morgan Chase和Lloyds Banking Group在内的银行业巨头、机构投资者帮助这家初创公司达到独角兽地位。与此同时,其投资者也恰好是该公司的一些最大客户。
SC Ventures负责人Alex Manson表示:“Thought Machine的部署与我们的数字银行战略息息相关,因为我们已采用Thought Machine作为我们在新加坡和香港的数字银行的核心银行软件。” (The Block)[2021/11/29 12:39:30]
III.链上数据结构
动态 | MVIS与CryptoCompare合作推出机构比特币指数MVIBTC:金色财经报道,VanEck子公司MVIS Index Solutions(MVIS)与数字资产数据提供商CryptoCompare合作推出了MVIS CryptoCompare机构比特币指数(代号:MVIBTC),该指数旨在衡量投资于在特定交易所定价的比特币的数字资产组合的表现。加拿大投资基金管理公司3iQ Corp.将使用该指数来计算比特币基金的资产净值。[2019/11/25]
要回答这个问题,你首先需要搞清楚自己处理数据的目的。对于这个测试案例,我决定为主要的法定支持Stablecoin建立一个大型的时间序列数据集,并观察一些特定的行为:铸币,烧毁(即停止流通Stablecoin)和转移。我之所以选择以这种方式进行研究,是因为政策制定者和学者目前最为关注法定支持的Stablecoin,所以这些数据在短期内可能相当有用。
以美元计价的几大Stablecoin都采用了ERC-20Token标准。顾名思义,ERC-20是一种在Ethereum上使用智能合约创建Token的标准化方式。如果你把区块链理解为一个巨大的去中心化Excel表格,那么智能合约就类似于Excel函数。在函数中输入参数之后,它将使用其内置逻辑产生一个特定的输出结果。
我们可以使用智能合约的Ethereum地址来对它们进行定位,这些地址是区块链数据结构中的唯一标识符:
·USDC
·TetherUSD
·BinanceUSD
·PaxDollar
·GeminiDollar
与API类似,智能合约也是可以重复使用的程序。每次智能合约获得互动指令时,都会产生该互动的记录,并由Ethereum协议以日志的形式记录在区块链上,而这些日志则构成了智能合约活动的可靠信息来源。
当智能合同执行一个特定函数时,例如烧毁ERC-20Stablecoin以将其从流通中移除,该函数及其参数将作为交易日志记录在区块链上。
在下面的交易中,USDCStablecoin的发行商Circle烧毁了价值1056.92美元的USDC。
如果你切换到「日志」标签,你就可以查看交易事件日志,相应的字段为
·地址:智能合约的合约地址。USDCStablecoin的合约地址是0xa0b86991c6218b36c1d19d4a2e9eb0ce3606eb48。
·名称:智能合约执行的函数,以及该函数中的参数。在这里,智能合约正在调用烧毁函数,该函数接收的参数指定了所烧毁币的发送地点和烧毁币的数量。
Etherscan的输出结果还会显示主题和数据字段,这些字段包含了我们在分析交易时需要解析的大部分相关信息。
·Topic0是函数签名的哈希值。从本质上讲,它会将函数及其参数经由单向算法得到一个唯一的函数哈希值。Ethereum使用的是Keccak-256哈希函数,当你通过Keccak-256算法输入函数签名时,它总是会产生相同的哈希值,所以任何时候该哈希值出现在日志中,你都能确信是调用了同一个函数。
·Topic1是烧毁函数的一个索引参数。在这里,Topic1是烧毁的Token被发往的地址。(注意:如果烧毁函数有更多的参数,这些参数将作为额外的主题出现)
·这里的数据字段表示所烧毁Token的数量。
既然我们已经了解了链上数据的基本结构,就可以开始从Dune和GCP中提取数据了。
IV.提取并处理链上数据的基本工具
如前所述,在这个例子中,我选择从现有数据库中提取链上数据,而不是访问Ethereum网络上的活动节点。为了便于理解,我使用SQL从GCP提取了大量原始数据表格,然后在Python中使用pandas库对其进行清理。
当我们从GCP提取表格时,我们将使用BigQuery,它储存有很多Ethereum的数据表,如下图左边一栏所示。当你点击一个表格时,相应的数据库模式就会出现,就如下图中的ethereum.logs表。与此同时,其中涉及的地址、数据和主题都会记录到日志数据中去。
下图中的查询语句将用于提取日志表中涉及与USDC、TetherUSD、BinanceUSD、PaxDollar或GeminiDollar合约互动的所有记录。除了ethereum.logs中的信息外,一些额外的信息也很有用,所以我还合并了ethereum.block表中的数据,其中涵盖了Gas费等信息。
得到的表格可以直接由Python读取,并借助pandas数据框架细分为以下字段:
·log_index
·transaction_hash
·transaction_index
·address
·data
·topics
·block_timestamp
·block_number
·block_hash
·number
·miner
·size
·gas_limit
·gas_used
·base_fee_per_gas
这些字段中的大多数都可以直接使用,不过第三节中讨论的主题字段需要用Python进行一些额外的清理,以便将其分成多列。
V.结语
这篇文章使用的是Ethereum的日志数据,同样的方法也可以用来访问链上的各种数据。Python和SQL是大多数经济学家和政策制定者所熟悉的工具,它们可以发挥很大作用。与传统金融相比,Crypto更具透明度。这样一来,研究人员就可以利用实时数据来阐明金融体系的运作方式,并及时控制住可能出现的风险。
标签:USD区块链USDCUSD币USD价格区块链工程专业学什么区块链存证怎么弄区块链技术发展现状和趋势USDC币USDC价格
继Steem事件之后,今年年初,币圈话题人物孙宇晨再度陷入关于治理攻击的指控。作为一名持有10亿美元以上加密资产的巨鲸、Tron公链的创始人,孙宇晨的链上地址被加密侦探们广泛追踪.
1900/1/1 0:00:00由于预期央行本周将做出利率决定,鲸鱼们似乎正在加紧购买莱特币。从11月初开始,他们已经收购了价值超过2.2亿美元的296万枚莱特币.
1900/1/1 0:00:00随着香港考虑向散户投资者开放加密货币交易,据报道,中国政府正在巧妙地支持这一想法。这是继北京于2021年全面禁止所有与加密货币相关的交易之后的结果.
1900/1/1 0:00:00今年整个数字货币市场引起最多关注的当属YFI,它创造了20年第一个万倍币的神话。它所代表的项目yearn.finance是一个数字资产聚合和管理的平台.
1900/1/1 0:00:00比特币现金价格从135美元兑美元开始新的下跌。价格现在低于130美元区域和55简单移动平均线。在BCH/USD货币对的4小时图上,价格跌破关键看涨趋势线,支撑位在131美元附近.
1900/1/1 0:00:00本期看点: 1.MKR价格回春隐忧仍不少2.6月CPI解读:美联储仍将加息3.币市流动性差,关键看ETF能否通过 01重要新闻 1.CBOE提交5只现货比特币ETF申请修订文件.
1900/1/1 0:00:00