OpenAI用GPT-4解读GPT-2，看来能打败魔法的，只有魔法

作者：

时间：1900/1/1 0:00:00

来源丨元宇宙简史

作者丨元宇宙简史编辑Eco

OpenAI最新研究利用GPT-4自动进行大语言模型中神经元行为的解释和评分，并将其应用于另一种语言模型GPT-2，公开了这些GPT-2神经元解释和分数的数据集。这项技术让人们能够利用GPT-4来定义和自动测量AI模型的可解释性，从而更好地理解智能是如何工作的。

大语言模型是基于大量文本数据训练，包含数千亿或更多参数的语言模型。

在大数据时代，这类AI机器学习模型可以在提升产品销售、辅助人类决策过程中起到很大的作用。

但是计算机通常不会解释它们的预测结果，而语言模型想要变得更强大、部署更广泛，就需要研究可解释性，因为人类对模型内部工作原理的理解仍然非常有限，例如可能很难从中检测到有偏见、性内容输出。

Web3浏览器Opera与OpenAI达成合作:金色财经报道，Web3浏览器Opera已宣布与OpenAI达成合作，正式进入人工智能生成内容 (AIGC) 领域，通过访问 OpenAI 的 API，Opera 将获得人工智能模型，以及来自 OpenAI 研究团队的个性化支持，并把人工智能和生成计算技术集成到其产品中，重塑用户体验。（prnewswire）[2023/2/27 12:32:34]

可解释性就是将模型能用通俗易懂的语言进行表达，把模型的预测过程转化成具备逻辑关系的规则的能力，从而通过查看模型内部来发现更多信息。

例如，如果有一个针对“漫威超级英雄”的神经元，当用户向模型提问“哪个超级英雄的能力最强”时，这个神经元就会提高模型在回答中说出漫威英雄的概率。

XEN Crypto创始人在OpenSea Goerli测试网发布XENFT:11月2日消息，XEN Crypto创始人JackLevin在OpenSea Goerli测试网发布XENFT-8pa4UtcksM，目前交易量达92ETH。或受此影响，XEN24小时涨幅达124.5%，现报价0.00002277美元。[2022/11/2 12:09:03]

站在OpenAI的角度看，大模型未来将和人脑一样拥有“神经元”，这些神经元会观察文本中的特定规律，进而影响到模型本身生产的文本。

所以可解释性就是将模型能用通俗易懂的语言进行表达，把模型的预测过程转化成具备逻辑关系的规则的能力，从而通过查看模型内部来发现更多信息。

为了实现这个目标，OpenAI最近发布了一个关于GPT-4语言模型解析神经元的对齐性研究成果，利用自研基于GPT-4技术的开源工具，来尝试计算其他架构、更简单语言模型上神经元的行为并对其进行评分。

涉嫌内幕交易的前OpenSea高管Nate Chastain正开发新NFT平台Oval:4月1日消息，前OpenSea高管Nate Chastain正在开发一个新的NFT平台Oval。截至2月底，Oval正在寻求以3000万美元的投资前估值筹集300万美元的种子轮融资；在更早之前，Oval希望以5000万美元的投资前估值筹集750万美元。

此前2021年9月17日消息，涉嫌“老鼠仓”操作的OpenSea高管Nate Chastain的推特个人简介已变更为“前OpenSea”，这意味着他已从OpenSea离职。Nate Chastain此前为OpenSea产品负责人。近日，此人因疑似利用职务之便进行“老鼠仓”操作而备受争议。（CoinDesk）[2022/4/1 14:30:41]

而且，还可以将其应用于另一种语言模型中的神经元——本次选择4年前发布、包含307200个神经元的大模型GPT-2为实验样本，公开了这些GPT-2神经元解释和分数的数据集。

FTX Europe获得阿拉伯联合酋长国的运营和清算所执照:3月15日，FTX宣布，其大中东地区（MENA）和欧洲子公司FTX Europe已获得阿拉伯联合酋长国（UAE）的虚拟资产（Virtual Assets，VA）交易和清算所许可，并在迪拜设立区域总部。

该执照由迪拜监管机构颁发，获准许可后，FTX Europe成为迪拜首个完全受监管的虚拟资产交易所，在该司法管辖区为机构投资人提供结构较复杂的加密衍生性商品。[2022/3/15 13:57:59]

“我们迈出了使用AI进行自动化对齐研究的重要一步。”OpenAI联合创始人GregBrockman表示。

具体来说，OpenAI开发了一套包含自动化工具和测试方法的评估流程：

首先，研究人员让GPT-2运行文本序列，等待某个特定神经元被频繁“激活”；

OpenSea新迁移合约疑似出现bug，攻击者正窃取大量高价值NFT:2月20日消息，多位用户于推特发布警告称，OpenSea昨日推出的新迁移合约（地址：0xa2c0946aD444DCCf990394C5cBe019a858A945bD）疑似出现bug，攻击者（地址：0x3e0defb880cd8e163bad68abe66437f99a7a8a74）正利用该bug窃取大量NFT并卖出套利，失窃NFT涵盖BAYC、BAKC、MAYC、Azuki、Cool Cats、Doodles、Mfers等多种高价值系列。当前，漏洞原因尚未完全确认，但建议用户通过下方链接撤销对上述合约的授权。

注：昨日，OpenSea执行例行升级，受升级影响，所有于2月18日之前创建的挂单都将于2月25日到期，为了保持用户的原始挂单数据不受影响，OpenSea特地推出了上述挂单迁移合约。[2022/2/20 10:03:31]

然后，让GPT-4针对一段文本生成解释，例如通过GPT-4接收到文本和激活情况判断漫威是否与电影、角色和娱乐有关；

随后用GPT-4模拟GPT-2的神经元接下来会做什么，预测行为；

最后评估打分，对比GPT-4模拟神经元和GPT-2真实神经元的结果的准确度，在下图这个例子中，GPT-4的得分为0.34。

使用上述评分方法，OpenAI开始衡量他们的技术对网络不同部分的效果，并尝试针对目前解释不清楚的部分改进技术。例如，他们发现以下方式有助于提高分数：

-迭代解释。他们可以通过让GPT-4想出可能的反例，在根据其激活情况修改解释来提高分数；

-使用更大的模型来进行解释。随着解释模型能力的提升，平均得分也会上升。然而，即使是GPT-4给出的解释也比人类差，这表明还有改进的余地；

-改变被解释模型的架构。用不同的激活函数训练模型提高了解释分数。

OpenAI表示，他们正在将GPT-4编写的对GPT-2中的所有307,200个神经元的解释的数据集和可视化工具开源，同时还提供了OpenAIAPI公开可用的模型进行解释和评分的代码，从而希望学术界能开发出新的技术来提升GPT模型解释分数。

OpenAI还发现，有超过1000个神经元的解释得分至少为0.8分，这意味着GPT-4模型可以解释大部分人类神经元，同时目前GPT理解的概念似乎和人类不太一样。例如，他们发现了一些有趣但GPT-4并不理解的神经元。

这些神经元似乎对文本中的某些特征或模式有敏感度，但是GPT-4无法用简单的语言描述它们。OpenAI希望随着技术和研究方法的改进，进一步提高AI模型可解释性能力，从而更好地理解这些神经元的行为和意义。

对于本研究局限性，OpenAI表示，目前GPT-4生成的解释还不完美，尤其要解释比GPT-2更大的模型时，表现效果很差。

神经元复杂行为无法用简短的自然语言描述，OpenAI解释了神经元的这种行为，却没有试图解释产生这种行为的机制，而且整个过程算力消耗极大等。

OpenAI希望在未来的工作中可以解决上述这些问题，最终OpenAI希望使用模型来形成、测试和迭代完全一般的假设，从而比肩人类大脑的想法和行为，以及将其大模型解释为一种在部署前后检测对齐和安全问题的方法。

然而在这之前，OpenAI还有很长的路要走。

“我们希望这将开辟一条有前途的途径。”JeffWu表示，这一技术可以让其他人可以在此基础上构建并做出贡献的自动化方案，从而解决AI模型可解释性问题，很好地解释这些模型行为，比如AI如何影响人类大脑中的神经元等。

严正声明：本文为元宇宙简史原创，未经授权禁止转载！内容仅供参考交流，不构成任何投资建议。任何读者若据此进行投资决策，风险自担。

标签：PEN OPEN GPT NAI PENNY OPENX价格 GPT4AI SNAIL币

欧易okex官网热门资讯

为什么目前日本央行没有发行CBDC的计划？

CBDC不仅仅是一种金融手段,也和外交有一定的关系。随着中国深入推动数字人民币,韩国在考虑使用数字韩元。日本也在考虑自己是否要开始准备CBDC.

1900/1/1 0:00:00

Web3.0时代重构竞争法治的开放和统一

黄尹旭：中国人民大学交叉科学研究院讲师、法学博士要目一、问题的提出? 二、Web2.0架构中“围墙花园”式垄断源起：中心化的平台力量三、破除Web2.

1900/1/1 0:00:00

美股指数收益增强策略视角的Crypto资产管理

引言传统金融市场近几年来以ETF为代表的指数型产品发展迅速,呈现出SmartBetaETF-主动管理ETF市场资金流入增速高于普通指数ETF产品的特征.

1900/1/1 0:00:00

人人都可以是导演？视频AIGC工具再进化，100帧成本降至3美分

来源：科创板日报《科创板日报》5月12日讯前脚《复仇者联盟》导演罗素兄弟中的JoeRusso刚刚放话,预计2年后就会出现一部完全由AI制作的电影,后脚StabilityAI就发布了AI生成视频新工具.

1900/1/1 0:00:00

去中心化稳定币协议TiTi Protocol 计划将在未来几周登陆以太坊主网

5?月?9?日,去中心化稳定币协议TiTiProtocol官方宣布,将在未来几周正式上线以太坊主网,并有计划开启IDO和第二轮空投.

1900/1/1 0:00:00

GPT-4竟然有身体，167cm！清华、北师大重磅研究：ChatGPT能像人一样感知行动

来源：新智元 ChatGPT眼里的世界,和人类感知的世界是一样的吗？ChatGPT的语言能力确实很惊艳,但大语言模型在没有人类身体、且缺乏实践经验的情况下,是否能像人类一样感知到真实世界呢？最近.

1900/1/1 0:00:00