我们不必知道现象背后的因果,我们只想让数据自己发声。那么,在区块链时代,如何让端对端加密的数据发声?
原创|阿常
在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。
维克托·迈尔-舍恩伯格《大数据时代》移动互联网、大数据技术的发展让我们享受着数据带来的红利,购物、打车、理财等等应用或者服务采集用户的信息,提供精准化、个性化的服务,给人们的生活带来了极大便利。
而这些便利背后,却是数据分析方放弃追求数据“结果”,选择追求一种“联系”,寻找数据之间的关联性,洞察我们的需求进而提供出更具针对性的服务。
彭博社策略师:比特币或在未来两年达到17万美元:金色财经报道,彭博社策略师Mike McGlone在接受采访时表示,短期来看比特币阻力位在2万美元。黄金最近达到了2000美元,此后一直在牛市中巩固,比特币可能会发生同样的状况。McGlone认为比特币可能在未来两年达到17万美元。[2020/11/20 21:25:49]
而在区块链的网络中,数据呈现出端对端加密的特质,远比互联网数据更加严密,寻找这些数据背后的“结果”更是难上加难;但是对于从业者而言,找到这些数据之间的关联,提供“定制化服务”并研判发展趋势同样重要。
市场刚需,加密数据如何利用
大数据分析精髓在于挖掘数据与真实信息的关系。通过海量数据分析甚至某一特殊事件的数据解读,不再热衷于追求数据分析的精确度。单纯令数据发声,提供行动指南。
声音 | Newton Advisor创始人:比特币不会立即回到高位:据CNBC报道,Newton Advisor创始人兼分析师Mark Newton表示,鉴于自5月以来比特币大幅下滑,人们不应该太贪心。看看近期的周期,并不意味着比特币会立即回到高位。Newto表示仍然会“等待和观察”比特币是否可以因过去一个月的表现而恢复。比特币在上周一直难以突破7000美元,并在7月份的大部分时间里以6000美元左右的价格交易。根据CoinDesk的数据,比特币今年已下跌大约有50%,比去年12月的两万美元的高点下降了60%。Newton预计在比特币价格大幅上涨前,会经历5%至10%的下跌。[2018/7/25]
而区块链数据由于其本身的匿名性特征,很多时候并不能轻易找到关联关系,但是通过过去某种现象背后数据的全面分析,就能为之后类似事件提供前瞻性建议或者预警。
声音 | BitMEX首席执行官Arthur Hayes:比特币或将下探5000美元:CNN消息,根据比特币商品交易所联合创始人兼首席执行官Authur Hayes的说法,比特币本周的反弹虽然伴随良好的交易量,使得比特币将来达到更高的价位成为可能。但是,短期而言,其走势可能会再次反转并下探至5,000美元。[2018/7/22]
区块链大数据技术已经广泛应用在交易所、钱包、安全机构的业务场景中,通过对交易信息特征的分析,可以得到交易与潜在风险的关联关系,规避掉黑客盗币、等等违法犯罪行为,并能够帮助用户挽回受损资产。
Chaindigg创始人叶茂举例称,一些黑客在盗取数字货币后,有时会设定远高于市价标准的手续费,令矿工率先确认其交易,以便快速实现资金转移的目的。那么在面对一些不合常理的手续费时,交易所可以对这类地址进行区分处理,降低风险。
前PayPal和Intuit公司CEO:比特币是一个巨大的局:美国金融科技界传奇人物、Personal Capital创始人、前PayPal和Intuit公司CEOBill Harris周二表示,比特币是一个巨大的“拉高出货”局,其规模之大前所未见。他表示,这一局的“输家是那些信息不灵通的买家,大量财富从普通家庭转移到互联网推手手中。”[2018/4/25]
区块链大数据,可以说是目前市场的刚需,可诞生于互联网的大数据技术仍需要做出一些改变,适应区块链数据的特征。
相比较互联网中的数据构成,区块链数据更具备规律性。所有信息都是按照区块组织排列,每个区块中包含着的交易数据都按照该公链所设定的逻辑排列,且大部分区块在时间中存在先后次序,那么在挖掘数据、查找数据的过程中能够精确规定到某一个时间节点;而互联网大数据则往往由于没有一致的标准和时序,产生诸多异构性数据,通过统一加工后方才能够分析。
区块链数据维度比互联网数据相对简单。区块链大数据能够划分的维度相对较少,一般分为交易发起方、交易接收方、交易时间、交易金额、交易频次等维度,简单的特征将有助于更好地对数据进行归类分析。
处理区块链大数据,了解数据特征只是基础,更重要的是需要保证两个关键因素:准确率、召回率。
如何保证数据分析精度?
区块链大数据不光要考虑数据的特征,同时也要考虑数据的准确性,以及在相关维度中信息的关联——其核心难度在于准确性、召回率的提升。
准确性又可以理解为真实性,即数据真伪。以比特币网络为例,在可抓取到的几亿条地址当中,存在一些地址、地址等,那么如果能够在分析数据时发现这些数据,无疑能够提高安全性,降低风险,只有准确率足够高时才能够发挥数据的真正作用。
但仅仅保证高准确性并不足够,召回率同样重要。在巨量的准确数据中仍只有一部分数据能够被分析出来,而某些特征不清晰的数据则无法被解读。以比特币网络为例,某些地址交易记录频繁,有时间、数量、交易费等特征可以分析,这部分数据无疑更方便解读;但同时也有一些地址,可以分析的特征维度较少,甚至只有一笔或者没有交易记录,这部分“难啃的骨头”啃不掉,数据召回率同样无法提高,也就难以利用区块链大数据。
Chaindigg创始人叶茂在接受链得得采访时就指出,准确性、召回率虽然划分维度不同,但是同样重要,只有两者齐备才能够真正进行区块链大数据分析,单一一项很难起到决定作用。
理论上而言,提高了准确性、召回率,就能够提高区块链大数据的使用能力,但是区块链大数据仍面临诸多困难。
相比较互联网数据,同一公链中内容更加规范,但是目前主流数字货币基数较多,存在一些公链产生的数字货币具有较强的特殊性;此外,联盟链中数据则具备更强的商业价值,甚至涉及商业机密,起着指导企业后续规划等作用,这也给数据分析的普适性提出更高要求。
换而言之,想要进行区块链数据分析,就必须研制出能处理这些差异的普适性技术。以比特币与以太坊网络为例,后者较前者增加了智能合约的功能,那么在进行数据采集分析过程中就要考虑到智能合约地址的特征,提高数据分析的准确率和召回率。
互联网语境中大数据分析常用的多项技术和策略,例如机器学习、数据标注、模型分析、交叉验证等等,将其嫁接到区块链语境中同样事半功倍。
区块链大数据,或许可以理解为大数据技术在区块链领域的延伸,尽管区块链数据经过了层层加密,但是仍需要从中寻找到向前发展的指引。
Facebook发布Libra的白皮书后,全世界对加密货币的重视达到了一个新高度。对于正在这个领域创业的我们来说,这是一个令人振奋的节点性事件,它使我们坚信——“货币互联网”的时代正在来临。这一幕正如十年前.
1900/1/1 0:00:00过去一个月,BTC由8000美元涨到14000美元,拉升得太快,一度登上微博热搜。这段时间的上涨,透支了5月中旬到6月初积蓄的能量,回调是必然的事情。目前,连续6天的下跌,让周K收出一根大阴线.
1900/1/1 0:00:00作者 上海高级金融学院实践教授中关村区块链产业联盟理事长元道是中国第一代互联网基础设施专家,见证了互联网给全社会带来的革命性影响.
1900/1/1 0:00:00据Cointelegraph6月29日报道,国际货币基金组织(IMF)6月27日发布的一份报告显示,IMF认为各国央行未来可能会发行数字货币.
1900/1/1 0:00:00看国际政经前景,G20是一个重要窗口;而看加密货币前景,重要窗口是V20。据news.bitcoin6月30日消息,在与G20同期同地举办的V20首脑会议上,加密货币行业代表与监管部门同意,就虚拟货币服务提供商建立一个国际监管机构.
1900/1/1 0:00:00尊敬的BTB.io用户:BTB.io交易所将于新加坡时间2019年7月7日上线SU 上线时间: 开放充值时间:2019年7月7日10:00开放交易时间:2019年7月7日12:00价值约2384万美元的SUI和价值约1382万美元的D.
1900/1/1 0:00:00