前言
上一篇我们讲述了人工智能,机器学习与联邦学习的关系。
这篇我们将继续探索联邦学习方法的分类。联邦学习方法被分为横向联邦学习、纵向联邦学习和迁移联邦学习三类,适用于解决不同的实际问题。
横向联邦学习
在两个数据集的用户特征重叠较多而用户重叠较少的情况下,把数据集按照用户维度切分,并取出双方用户特征相同而用户不完全相同的那部分数据进行训练。这种方法叫做横向联邦学习。
▲?应用场景
稳定币crvUSD科普创新清算机制LLAMMA,可在抵押品价格下跌时逐步替换为稳定币:1月17日消息,Curve官方科普其稳定币crvUSD创新的清算机制LLAMMA,解释了LLAMMA通过AMM的特性进行针对债务人更友善的清算方式,让抵押品在价格下跌时逐渐转移成稳定币,让原本要清偿的债务有一定程度的稳定币可以偿还,同时在价格回稳时再逐渐把稳定币换回抵押品,而不是直接的触发清算导致债务人的亏损。
此前报道,2022年11月23日,去中心化交易平台CurveFinance开发者发布Curve即将推出的去中心化Stablecoin“crvUSD”的官方代码和白皮书。[2023/1/17 11:17:13]
横向联邦学习的本质是样本的联合,适用于参与者间业态相同但触达客户不同,即特征重叠多,用户重叠少时的场景,比如不同地区的银行间,他们的业务相似,但用户不同。
动态 | 链客社区联合北京交通广播推出区块链技术科普节目:12月11日15:15—16:00,区块链技术社区——链客区块链技术社区将联合北京交通广播FM103.9从零开始为大众科普解码区块链技术,蜻蜓FM及北京广播网同期进行全球直播。首期做客嘉宾为链客区块链技术社区创始人郄建军和百度区块链产品负责人于雅楠。[2019/12/11]
比如,有两家不同地区银行?—?上海与杭州两地的两家银行,它们的用户群体分别来自上海与杭州的居住人口,用户的交集相对较小。由于银行间的业务相似,记录的用户特征大概率是相同的。因此,横向联邦学习可以被考虑用来构建联合模型。
于2017年,Google提出了一个针对安卓手机模型更新的数据联合建模方案:在单个用户使用安卓手机时,不断在本地更新模型参数并将参数上传到安卓云上,从而使特征维度相同的各数据拥有方建立联合模型的一种联邦学习方案。
声音 | CNBC主持人:加密货币最大的缺点之一就是难以向外行快速科普:CNBC主持人Ran NeuNer近期发推称,加密货币最大的缺点之一就是很难向外行快速解释。当人们要求我向他们解释比特币时,我知道他们至少需要一个小时才能真正理解。[2019/9/10]
▲?学习过程
Step1.参与方各自从协调方上下载最新模型;
Step2.每个参与方利用本地数据训练模型,加密梯度上传给协调方,协调方聚合各用户的梯度以更新模型参数;
声音 | 火星人朋友圈科普RAM:火星人在朋友圈发文称,“什么是RAM?简单来说就是EOS这个国家的土地,所有的经济行为都离不开土地。只要EOS的BP们能投票形成一个稳定的供给预期,并且不改变目前的Bancor算法,那么RAM后续的价格有可能会像北上广深的房价走势。房价下跌不行,房价过快上涨也不行,EOS的生态越来越像某国了,真有意思。”[2018/7/6]
Step3.协调方返回更新后的模型给各参与方;
Step4.各参与方更新各自模型。
纵向联邦学习
在两个数据集的用户重叠较多而用户特征重叠较少的情况下,把数据集按照特征维度切分,并取出双方用户相同而用户特征不完全相同的那部分数据进行训练。这种方法叫做纵向联邦学习。
财政部副部长朱光耀:数字经济还处在发展的过程中,要以科普、推动的态度来推进数字经济发展:今日,在中国发展高层论坛2018年会上,财政部副部长朱光耀表示:“数字经济还处在发展的过程中,要以科普、推动的态度来推进数字经济发展。也要关注数字经济的其他影响,包括税收征管、反监管措施等要跟上。”[2018/3/25]
▲?适用场景
纵向联邦学习的本质是特征的联合,适用于用户重叠多,特征重叠少的场景,比如同一地区的商超和银行,他们触达的用户都为该地区的居民,但业务不同。
比如,有两个不同机构,一家是某地的银行,另一家是同一个地方的电商。它们的用户群体很有可能包含该地的大部分居民,用户的交集可能较大。由于银行记录的都是用户的收支行为与信用评级,而电商则保有用户的浏览与购买历史,因此它们的用户特征交集较小。纵向联邦学习就是将这些不同特征在加密的状态下加以聚合,以增强模型能力的联邦学习。
▲?学习过程
介绍一种简单通用的纵向联邦学习的建模学习过程,加密方式也以半同态加密的PallierEncryption为主。
训练前:
先采用加密文本对齐的技术手段,在系统内筛选出不同企业之间的共同用户。
训练时:
Step1.协调方C向企业A与B发送公钥,用来加密所需传输的数据;
Step2.A和B分别计算和自己相关特征的中间结果,并加密完后进行交互,用来求解各自的梯度结果和损失结果;
Step3.A和B分别计算各自加密后的梯度并添加掩码后发送给C,同时B计算加密后的损失先发送给C;
Step4.C解密梯度和损失后回传给A和B,A、B去除掩码并更新模型。
迁移联邦学习
在两个数据集的用户与用户特征重叠都较少的情况下,不对数据进行切分,而可以利用迁移学习来克服数据或标签不足的情况。这种方法叫做联邦迁移学习。
▲?适用场景
当参与者间特征和样本重叠都很少时可以考虑使用联邦迁移学习,如不同地区的银行和商超间的联合。主要适用于以深度神经网络为基模型的场景。
迁移学习的核心是,找到源领域和目标领域之间的相似性。举一个杨强教授经常举的例子来说明:我们都知道在开车时,驾驶员坐在左边,靠马路右侧行驶。这是基本的规则。然而,如果在英国、香港等地区开车,驾驶员是坐在右边,需要靠马路左侧行驶。那么,如果我们从到了香港,应该如何快速地适应他们的开车方式呢?诀窍就是找到这里的不变量:不论在哪个地区,驾驶员都是紧靠马路中间。这就是我们这个开车问题中的不变量。找到相似性?(不变量),是进行迁移学习的核心。
比如有两个不同机构,一家是位于中国的银行,另一家是位于美国的电商。由于受到地域限制,这两家机构的用户群体交集很小。同时,由于机构类型的不同,二者的数据特征也只有小部分重合。在这种情况下,要想进行有效的联邦学习,就必须引入迁移学习,来解决单边数据规模小和标签样本少的问题,从而提升模型的效果。
▲?学习过程
联邦迁移学习的步骤与纵向联邦学习相似,只是中间传递结果不同。
以上是常见的几种联邦学习类型,联邦学习这件“小事”能用在什么场景中,带来怎样的价值,会在下一篇文章中详细介绍。也欢迎各位与我们一起对以上三种类型的联邦学习进行更深一步的讨论,添加小助手加入技术交流群。
作者简介
严杨
来自数据网格实验室BitXMesh团队?PirvAIの修道者
标签:STEPSTETEP区块链SuperStepPolygon Ecosystem IndexWingStep魔兽币应用区块链吗
据TheBlock6月5日报道,UnchainedCapital是一家专注于比特币的金融服务公司,该公司在一轮由NYDIG及其母公司StoneRidge牵头的融资中筹集了2500万美元.
1900/1/1 0:00:00巴比特讯,6月22日,隐私浏览器Brave发文表示,其独立搜索引擎BraveSearchbeta版本正式上线。通过集成BraveSearch,Brave可提供替代大平台搜索的解决方案.
1900/1/1 0:00:00Forest是ChainSafe对星际文件系统协议的Rust实现。Rust为构建以内存安全和性能为优先的区块链提供了基础。SigmaPrime正对Forest的Rust代码库进行审计,离完全生产化的Forest节点越来越近了.
1900/1/1 0:00:00北京时间6月9日,萨尔瓦多总统布格磊宣布其撰写的《比特币法》已得到萨尔瓦多国会绝大多数议员的认可,这意味着该法案将在90天后生效,比特币将成为该国的法定货币.
1900/1/1 0:00:00据官推消息,对于安全公司CertiK称,PantySwap项目存在高风险,所有者可以利用MasterChef的迁移功能来耗尽所有LP代币,有跑路风险,警告不要参与.
1900/1/1 0:00:00Twitter首席执行官杰克·多尔西(JackDorsey)再次表现出他对比特币的强烈忠诚,甚至他似乎在diss以太坊——尽管他自己的公司显然在市场第二大加密货币中找到了价值.
1900/1/1 0:00:00