宇宙链 宇宙链
Ctrl+D收藏宇宙链
首页 > BNB > 正文

欧科云链研究院:本福特定律能否考察区块链链上数据

作者:

时间:1900/1/1 0:00:00

美国大选几经反转,终于尘埃落定,拜登目前以290票击败232票的特朗普,将成为下一任美国总统。然而拜登选举欺诈的传闻也甚嚣尘上,最初拜登选票造假的质疑基于本福特定律,后来陆续有重复计票等消息传出。本福特定律是宇宙中许多数据都适用的规律,虽不能作为直接证据,但常被用于探测数据造假。本文介绍了本福特定律,并且应用到区块链行业,找出满足本福特定律的数据指标,并从本福特定律的视角考察链上数据的合理性。

一、本福特定律:广泛存在的数据规律

1.?广泛存在的自然规律

就像牛顿因苹果落地发现了万有引力定律,西蒙·纽康和弗兰克·本福特因翻对数表发现了本福特定律。根据本福特定律,对于许多数据样本,第一位数字是1的概率远远大于其他数字,并且数字越大,出现的概率越小。具体而言,对于最常用的10进制数字,首位数字出现的概率如下:

欧科云链张超:目前已累计解析超1.5亿地址标签,成全球最大链上地址标签库服务商:4月27日消息,欧科云链副总裁、欧科云链控股执行董事张超在出席“甲子引力X数字经济高峰论坛”时表示,截至目前欧科云链已解析链上超1.5亿地址标签(实体标签、行为标签、属性标签)、数十亿交易记录、超1万条结构化指标,成为全球最大的链上地址标签库服务商。

会上张超表示,未来欧科云链将继续探索区块链底层技术,加强对链上数据的分析、治理,为更多上层的区块链应用添砖加瓦,服务于更多实体的应用层。[2022/4/27 2:33:56]

人口、GDP、面积等数据被验证符合本福特定律,甚至斐波那锲数组、放射性元素半衰期等绝对自然的数据也满足本福特定律。但本福特定律是一个经验性的自然规律,没有严格的证明推导。通常来讲,本福特定律的适用条件如下:

港股收盘:欧科云链收涨2.88%,火币科技收跌0.85%:今日港股收盘,恒生指数收盘报26016.17点,收涨1.18%;欧科集团旗下欧科云链(01499.HK)报0.143港元,收涨2.88%;火币科技(01611.HK)报3.510港元,收跌0.85%。[2020/11/9 12:05:37]

样本数量和数量级跨度尽可能大。如跨度小的身高数据不适用,但实践表明,对一些较小样本数据也适用;

数据不能有人为操控的痕迹。人为规定的数字如电话号码、邮编等不满足本福特定律。当数据被人为篡改后,很可能不符合本福特定律,也正因此,本福特定律可以被用来探测数据造假;

对于随着时间呈指数型增长的数据,本福特定律一定契合。这一点是可以从数学上严格证明的,在b进制中数字n出现的概率即。这类数据的特点是早期增长迟缓,后来增长得越来越快;数据本身有自己的分布规律则很可能不符合本福特定律。如收益率不满足本福特定律。

欧科云链研究院:国内矿机芯片厂商的成功 对我国半导体产业发展有重要意义:近日,欧科云链研究院发布的最新研报指出,国内矿机芯片厂商用了不到十年的时间就在全球取得领先地位,是国内工程师人口红利,在动态逻辑、全定制方法学等技术设计上领先的结果。相比国内近三十年来耗费巨资扶持但仍显孱弱的半导体产业,矿机芯片领域的成功更显得难能可贵。该研报同时指出,目前主流市场尚未认识到矿机芯片对我国半导体行业的价值和意义,其主要贡献至少在以下三个方面:对国内半导体产业人才的培育,在AI边缘运算和延续摩尔定律等前沿领域的技术积累,为国内半导体产业链上的诸多厂商提供重要收入来源。[2020/7/3]

人口、GDP、营业收入、播放量、交易量等数据由于规模效应或者网络效应,早期从1到2很艰难,但发展到一定规模后,从8增长到9相对容易,所以在较小数字停留时间长,在较大数字停留时间短,最终数字首位分布呈现出本福特定律。

欧科云链副总裁胡超:“个十百千万”计划打造海南标杆:5月17日,欧科云链集团携手海南省区块链协会发布“个十百千万”计划,宣布未来三年将在海南全力打造“数个”区块链底层技术平台、组织举办“十场”高水平区块链国际论坛、协助引进“百家”区块链企业落地海南、大力推动“千项”区块链创新应用在海南落地、广泛连接“万名”区块链人才参与海南区块链产业发展。

该计划牵头发起方欧科云链集团副总裁、海南省区块链协会常务副会长胡超表示,在海南省具有自贸港政策优势且政府高度重视区块链产业发展的背景下,行业协会与产业界应充分把握机遇,“个十百千万”计划就是根据政府有关政策、立足协会职能而推出的一项系统性工程,旨在积极响应和大力配合海南全省各级政府,在新一轮区块链技术革新和产业落地浪潮中打造“海南标杆”和“海南模式”。[2020/5/18]

2.?用于探测数据造假

港股收盘:欧科云链收涨7.50% 火币科技收涨0.95%:今日港股收盘,恒生指数报21709.13点,收跌2.61%;欧科集团旗下欧科云链(01499.HK)报0.215点,收涨7.50%;火币科技(01611.HK)报3.200点,收涨0.95%。[2020/3/19]

本福特定律常用于探测数据造假,尤其是财务数据中。2003年美国华盛顿州案中,最初是会计师Darrell?Dorrell用本福特定律发现了支票汇款数据的不合理性,通过进一步调查发现了涉案金额高达1亿美元的。无独有偶,安然公司2000-2001年的每股盈利也与本福特定律相去甚远。事实上,自20世界70年代以来,本福特定律被广泛用于挖掘会计欺诈性行为。

除了金融财务领域,本福特定律也被用于其他领域的数据,如2009年的伊朗大选、希腊政府的宏观经济数据、公共计划经济数据,比尔·克林顿的纳税申报数据……

但值得注意的是,本福特定律不能作为呈堂供证,只能作为数据造假的推测,需要后续的取证调查。即使是在华盛顿州案这一成功应用案例中,会计师Darrell用本福特定律的检验只是开始,历经多方努力和3年的搜证才将主犯凯文·劳伦斯送进监狱,判处20年徒刑。加之,本福特定律在某些领域的适用性存在争议,如哈佛大学一份研究表明本福特定律不适用于选票数据。基于以上原因,网友对拜登选票进行本福特定律检验,在适用性和说服力上存在问题,不能作为选票造假的直接有力证据。

二、本福特定律在区块链领域的应用

上文讲述了本福特定律的一般性应用,下文立足于区块链行业,挖掘哪些指标满足本福特定律,并结合区块链技术的特性探讨链上数据的合理性。

1.?区块链行业中适用本福特定律的数据

由前文可知,一些宏观数据如人口、GDP、面积等符合本福特定律。在区块链行业,区块链专利数量、企业数量等宏观数据也满足本福特定律。下图展示了2020年至今各省市的区块链专利数量和Wind全球企业库中的区块链企业数量,其首位分布均较符合本福特定律。

除此之外,区块链行业中的财务数据也是本福特定律的典型适用场景,下文的数据来自区块链指数成分股。

2.?从本福特定律视角看链上数据的合理性

区块链技术本身具有分布式和数据透明的特点,有利于数据的多方监督,数据的不可篡改性也增加了数据造假的成本,欺诈行为会永久留痕,因此区块链技术可以有效抑制数据造假。目前,区块链已在金融、公益等多个领域应用落地,帮助解决数据造假的痛点。

本文先考察了成交额数据的一般特性,再对比了相似体量的基于区块链和不基于区块链的平台数据。首先,在考察了样本量为100多,1000多,2000多的交易平台数据后,发现成交额十分符合本福特定律,并且样本越大数据越接近本福特定律理论值。接下来,从基于区块链的一个交易平台获取成交额数据,整理114个有效样本并比较其首位数字分布和本福特定律理论值,观察发现链上成交额与本福特定律较吻合,除了数字8。为了对比,选取了一个不基于区块链技术的相似体量的交易平台,有效样本数为195,但其成交额在6和7偏高。考虑到链上数据样本量的劣势和整体情况的吻合,仅从本福特定律出发,基于区块链的成交额数据更为合理。

公益项目水滴筹自称是基于大数据和区块链的应用,下文以官网公布的122名失信筹款人黑名单为例,从本福特定律的视角探究区块链技术链上数据的真实性。根据前文讨论,手机号、身份证号等人为规定的数据不符合本福特定律,于是研究对象定为2017年至今每月失信人数量,结果如下。

受制于样本数量,失信人员数量首位分布未完全吻合本福特定律,但大体呈现数字越大出现概率越低的趋势。

三、结语

虽未得到严格证明,但大量实践检验表明本福特定律是广泛存在的有趣数据规律,被用于挖掘数据造假,尤其是财务数据中。此次美国大选中拜登选票不符合本福特定律的问题在数据适用性和说服力上存在问题,因此不能作为推翻选举结果的有力证据。正如本文一再强调的,本福特定律仅仅是发现可疑性的方法,而非充足证据,只是数据打假的起点而非终点。

本福特定律也适用于区块链行业的一些数据,如区块链企业数量、专利数量、公司财务数据等。此外,区块链技术本身数据透明、不可篡改的特点有助于维护数据的真实性。并且对比了一组实际数据发现,从本福特定律的视角,链上数据的首位分布是合理的。

标签:区块链RELGDP611区块链技术通俗讲解简书BARRELgdp币价格611币圈大地震

BNB热门资讯
欧科云连研究院:区块链在债券市场的应用

导言 区块链在证券市场的最大作用在于进一步推进金融资产的数字化。实际上,从上世纪七八十年代的纸上作业危机后,证券市场一直在进行“电子化”和“无纸化”的革命,最显著的例子莫过于曾经的证券都是纸质凭证,而今仅仅为电脑账户上的一个数字.

1900/1/1 0:00:00
比特币挖矿收益大涨,以太坊2.0袭来,矿工该如何选择?

2020年我们经历了疫情,迎来了比特币出块的再次减半,偶遇了DeFi的爆发……作为如此特殊的一年,2020跟我们预想中一样吗,对于区块链的发展,行业的期待,未来的机会又会在哪里?1.比特币减半后难度持续上涨,马上枯水期将至.

1900/1/1 0:00:00
HomiEx(红米交易所)将于 11月17日15:00 上线Value Liquidity(VALUE)

亲爱的用户: 红米交易所将上线VALUE/USDT聚合交易对,具体时间安排如下。开放交易时间:11月17日15:00(UTC8)?由于VALUE为聚合交易币对,所以暂时不开放充币和提币,充币和提币开放时间之后将会以公告另行通知.

1900/1/1 0:00:00
首发 | 用《权力的游戏》讲解比特币的通证特性

今天看到一个微博,是《权力的游戏》中扮演AryaStark的英国女演员MaisieWilliams发出的,原文是:“shouldIgolongonbitcoin?”直译过来就是:我是不是要做多比特币?所以引申为要不要买入并持有比特币.

1900/1/1 0:00:00
AOFEX已完成11月18日转化分发FIL代币的公告

尊敬的用户: AOFEX已根据用户FIL6持仓情况完成11月18日的转化分发FIL代币,用户可在用户中心-账户资产中查看详情.

1900/1/1 0:00:00
三天三次闪电贷攻击 DeFi为何如此脆弱?

之前,起源协议OriginProtocol稳定币OUSD被爆出遭到闪电贷攻击,OriginProtocol共损失225万美元的DAI和100万美元的ETH.

1900/1/1 0:00:00