宇宙链 宇宙链
Ctrl+D收藏宇宙链

如何利用机器学习识别加密项目风险?

作者:

时间:1900/1/1 0:00:00

作者:PengtaiXu

翻译:Sherrie

加密货币和监管的必要性

加密货币是一种存在于数字世界的交易媒介,依靠加密技术使交易安全。加密货币背后的技术允许用户直接向他人发送货币,而不需要通过第三方,如银行。为了进行这些交易,用户需要设置一个数字钱包,而不需要提供身份证号码或信用评分等个人细节,因此可以让用户伪匿名。

对于普通的加密货币用户来说,这种匿名性可以让他们放心,因为他们的个人信息或交易数据不会被黑客窃取。然而,这种交易匿名性的提高,也容易被犯罪分子滥用,进行、恐怖融资等非法活动。这种非法活动给区块链钱包用户以及加密货币实体都造成了巨大的损失。虽然金融行动特别工作组等监管机构已经在这些实体的监管中引入了标准化的指导方针,但由于每天都有大量的加密货币实体和交易发生,监控加密货币空间是一项具有挑战性的任务。

解决方案

直播|李慧:显卡矿池如何杀出重围:金色财经 · 直播主办的《 币圈 “后浪” 仙女直播周》第8期14:00准时开始,本期“后浪”仙女蜘蛛矿池 市场总监 李慧将在直播间聊聊“显卡矿池如何杀出重围”,感兴趣的朋友扫码移步收听![2020/7/11]

图片来源:?https://dribbble.com/shots/2723032-Needle-in-a-Haystack

因此,人们有兴趣利用开源信息,例如新闻网站或社交媒体平台,来识别可能的安全漏洞或非法活动。在与LynxAnalytics的合作中,我们已经致力于开发一个自动工具,以刮取开源信息,预测每篇新闻文章的风险分数,并标记出风险文章。这个工具将被整合到Cylynx平台中,这是LynxAnalytics开发的一个工具,用于帮助监管机构通过使用各种信息源监控区块链活动。

开源信息的数据获取

我们确定了3类开源数据,这些数据可以提供有价值的信息,帮助检测加密货币领域的可疑活动。这些类别是:

传统的新闻网站,如谷歌新闻,它将报告重大的黑客事件。

动态 | Block.one 总裁发文阐述区块链如何解决银行的 KYC 和 AML 问题:据 IMEOS 报道,Block.one 总裁 Rob Jesudason 十分钟前发文《How Blockchain Offers an Answer to Banks’ KYC and AML Issues 》阐述区块链如何解决银行的 KYC 和 AML 问题。他认为区块链不是官僚或新闻中想象的监管雷区; 相反,它可以成为监管机构的资产。

文中提及在过去十年中,许多世界领先的银行都因反问题而被罚款,罚款总数达260亿美元之多。而在过去12个月中,监管机构如何考虑如何鼓励使用区块链技术方面取得了进展。区块链技术可以减轻数据模糊性并减少欺诈的可能性。如果所有银行都在区块链上,那么KYC和AML数据可以以安全,透明和无缝的方式在金融机构之间共享。[2018/10/16]

加密货币专用新闻网站,如Cryptonews和Cointelegraph,它们更有可能报道小型实体和小型安全事件的新闻。

社交媒体网站,如Twitter和Reddit,在官方发布黑客新闻之前,加密货币所有者可能会在那里发布有关黑客的消息。

动态 | 印度官员赴日本等国学习监管机构如何处理加密货币问题:据bitcoin 9月3日消息,印度证券交易委员会(SEBI)在其2017 – 18年度报告中透露,它已派出一些官员前往日本、英国、瑞士三个国家,研究监管机构如何处理加密货币问题。印度证券监管机构此次行动旨在与国际监管机构合作,深入了解其加密机制和系统,以改善其自身管理流程。[2018/9/3]

检索文章和社交媒体帖子的内容,然后建立情绪分析模型。该模型为文章中提到的实体分配了一个风险活动的概率。

情绪分析模型

我们尝试了四种不同的自然语言处理工具进行情绪分析,即VADER、Word2Vec、fastText和BERT模型。在通过选定的关键指标对这些模型进行评估后,RoBERTa模型表现最佳,被选为最终模型。

声音 | 华盛顿与李大学法学院教授:加密货币用途决定了如何监管:在美国众议院农业委员会昨日举办的加密货币听证会上,华盛顿与李大学法学院教授Josh Fairfield表示,加密货币的用途决定了如何对其进行监管。不同的人因为不同的目的而持有加密货币,有的为了消费,有的为了储存,有的为了投机,有的为了交易,有的随时改变主意,甚至在使用(消费或交易)加密货币之前,不知道其用途。Fairfield表示,一般情况下,加密货币作为个人财产持有和消费是没有问题的,只有交易和投机才会引发监管方面的担忧,尤其是一些从结构流程上看起来像是试图绕过某些监管的交易。[2018/7/20]

图片来源:?https://www.codemotion.com/magazine/dev-hub/machine-learning-dev/bert-how-google-changed-nlp-and-how-to-benefit-from-this/

美国银行分析师解释比特币如何像常规货币:据CCN报道,美国圣路易斯联邦储备银行内容策略师Christine Smith认为,比特币不像人们想象的那样异乎寻常,比特币的两个用例是作为价值和货币存储的,史密斯论证比特币与普通货币没有区别的三大理由:

1.比特币和美元都没有实物资产支持;

2.“稀缺”是美联储货币体系稳定战略的核心,因为“为了保持其价值,货币必须供应有限”,而比特币的数量也是有限的。

3.比特币“纯粹的电子现金对等版本可以让在线支付从一方直接发送到另一方,而无需通过金融机构”,这与现金花费方式有相似性,即“不需要中间人处理交易”。[2018/5/1]

RoBERTa模型对新闻文章或社交媒体帖子的文本进行处理,并为特定文本分配一个风险分数。由于该文本在数据收集过程中已经被标记为实体,我们现在已经有了加密实体的相关风险指标。在后期,我们将多个文本的风险分数结合起来,给出一个实体的整体风险分数。

RoBERTa原本是一个使用神经网络结构建立的情感分析模型,我们将最后一层与我们标注的风险分数进行映射,以适应风险评分的环境。为了提高模型在未来文本数据上的通用性,我们进行了几种文本处理方法,即替换实体、删除url和替换hash。然后我们使用这个表现最好的模型进行风险评分。

风险评分

现在,每篇文章都有一个相关的来源,一个风险概率和一个计数,指的是文章被转发、分享或转发的次数。为了将这些风险概率转换为加密货币实体的单一风险得分,我们首先将文章的概率值缩放到0到100的范围内,并获得每个来源的加权平均值,结合文章的风险得分和计数。加权平均数用于对计数较高的文章给予更大的重视,因为份额数量很可能表明文章的相关性或重要性。

在计算出各来源的风险得分后,我们对各来源的风险得分进行加权求和,得到综合得分,公式如下:

传统的新闻来源被赋予了更高的权重,因为这些来源更有可能报道重大的安全漏洞。

该解决方案的有效性

我们在2020年1月1日至2020年10月30日的174个加密货币实体的名单上测试了我们的解决方案,并将结果与该时间段内的已知黑客案例进行了比较。我们发现,我们的风险评分方法表现相当出色,在37个已知的黑客案例中识别了32个。我们还分析了我们的解决方案对单个实体的有效性。下图显示了Binance从2020年1月1日至2020年10月30日的风险评分。虚线红线代表已知的黑客案例。从图中我们观察到,我们的解决方案报告了5个已知黑客中的4个黑客的风险得分增加。也有几个峰值与已知黑客案例不一致。然而,这并不构成一个主要问题,因为对我们的模型来说,更重要的是识别尽可能多的黑客,减少未识别的黑客数量。

有趣的发现

在风险评分过程中,我们注意到,与规模较小的实体相比,规模较大的实体的风险评分往往有较大比例的假阳性记录。这是因为大型实体被谈论得更多,因此会有更多的负面帖子和虚假谣言,从而导致更高的不准确率。

另一个值得强调的有趣趋势是,围绕着黑客攻击通常有几个明显的高峰。这是由于不同数据源的反应时间不同。社交媒体网站Twitter和Reddit通常是第一个看到高风险事件发生时的高峰,因为用户会发帖提出他们观察到的异常情况,比如一个实体的网站在没有事先通知用户的情况下宕机。官方消息一般是在官方声明之后,稍后才会发布。

局限性

我们发现,我们的解决方案有两个潜在的局限性,首先是需要不断地维护收集器。网站设计可能会随着时间的推移而改变,这些网站的刮擦器需要更新,以确保相关信息仍能被检索到,从而达到风险评分的目的。

第二个限制是,验证一篇文章是否已被正确地标记为加密货币实体是具有挑战性的。例如,一篇报道Bancor可疑活动的文章可能也会因为一个不相关的事件提到Binance。我们的解决方案会错误地将新闻标记为两个实体,并将Binance标记为风险,即使它不是文本中的关键主题。然而,这并不是一个主要的限制,因为我们只使用新闻文章的标题和摘录来进行风险评分,这通常只包含文章的关键信息。

结语

我们的项目让监管机构可以轻松挖掘开源信息,更好地识别加密货币领域发生的风险事件。我们提供了一个分析文章并预测风险分数的语言模型,以及根据实体和来源信息汇总这些分数的方法。这些方法都被编织成一个可以端到端运行的自动化流水线。将该项目整合到Cylynx平台中,将对其现有功能进行补充,并为监管机构识别高风险加密货币实体提供巨大的帮助。

标签:加密货币区块链比特币ERT我国为什么禁止加密货币区块链工程专业学什么女生比特币完整走势图ERT价格

火币APP下载热门资讯
成功投资的核心:不要离开牌桌

真正伟大的投资者,他们往往是活得时间更长。巴菲特是投资界最成功的人,也是活得最长的投资者。StayintheGame是成功投资的核心。如同一群人在打牌,如果你离开牌桌了,未来就算再发出什么好牌,也和你没关系了.

1900/1/1 0:00:00
解析Synthetix最新动态:迁移Layer2、Curve跨资产交换

作为金融乐高积木,DeFi的可组合性带来的空间可观,你无法想象DeFi空间里这一群有意思的人会鼓捣出什么新鲜玩意来。12月15日Coinbase宣布上线SNX后,SNX又经历了一轮飙升.

1900/1/1 0:00:00
CryptoCompare报告:加密ETP规模较上月增长95%,达350亿美元

要点: 最新报告显示,自去年12月以来,所有交易所交易产品的管理资产增长了95%;灰度比特币信托占据了资产管理规模的大部分;报告称,这是因为ETP变得越来越容易获得,且机构投资者也希望参与其中.

1900/1/1 0:00:00
BTC回落期间引争论:新一轮突破将来VS比特币可能腰斩

2021年开年,比特币一度突破4万美元大关后,在最近7天内一度出现回调,截止1月21日18:17,BTC跌破32300美元关口,近7天下跌超15%。面对比特币的连续回落,市场出现持续看涨与即将腰斩两种截然不同的声音.

1900/1/1 0:00:00
教程 | Optimism的Layer 2版Synthetix体验究竟如何?

撰文:Donnager Synthetix可能是第一个正式上线以太坊Layer2网络的主流去中心化金融应用,该网络基于Optimism团队研发的OptimisticRollup扩容技术.

1900/1/1 0:00:00
Tether(泰达),真的受到了监管么?

作者:JPKoning 编译:萌眼财经 原标题:《当泰达说它“受监管”时,它说的究竟是什么?》Tether,真受监管么?加密领域的新人很快就会面对一个普遍的区别,即受监管的稳定币和不受监管的稳定币.

1900/1/1 0:00:00