宇宙链 宇宙链
Ctrl+D收藏宇宙链
首页 > 聚币 > 正文

OpenAI发布炸裂研究:让AI解释AI黑箱,人类无法理解,语言无法描述

作者:

时间:1900/1/1 0:00:00

来源:FounderPark

就算在新产品满天飞,商业文明正在被AI重建的当下,我们仍然不知道,这些令人惊叹的技术是如何运作的。

AI,语言模型,它是个黑箱,人类无法理解,我们甚至不知道怎样研究才能够理解。

但如果,研究这个黑箱的不是人类,而是AI自己呢?

这是一个令人好奇但又非常危险的想法。因为你甚至不知道,这一研究方法产生的结果,是否会彻底颠覆多年来人类对人脑和AI的理解。

但是有人这样做了。几小时前,OpenAI发布了最新的研究成果,他们用GPT-4解释GPT-2的行为,获得了初步的成果。

毫不夸张地说,人们震惊极了:「求求你们让它离觉醒远点吧!」

「AI理解AI,然后很快,AI训练AI,然后再过几年,AI创造新的AI。」

但客观来说,学术界为之感到兴奋:「疯了,OpenAI刚刚搞定了可解释性问题。」

人与机器之间是GPT-4

OpenAI刚刚在官网发布博客文章《语言模型可以解释语言模型中的神经元》。

简单来说,他们开发了一个工具,调用GPT-4来计算出其他架构更简单的语言模型上神经元的行为,这次针对的是GPT-2,发布于4年前的开源大模型。

Checks NFT系列地板价涨至2.02ETH,24小时成交额OpenSea排名第一:2月6日消息,据NFTGo.io数据信息,Checks-VV Edition NFT系列地板价涨至2.02ETH,24小时涨幅47.89%。此外该系列24小时成交额达1821ETH,24小时增幅达238.96%,OpenSea成交额排名第一。[2023/2/6 11:49:56]

大模型和人脑一样,由「神经元」组成,这些神经元会观察文本中的特定规律,进而影响到模型本身生产的文本。

举例来说,如果有一个针对「漫威超级英雄」的神经元,当用户向模型提问「哪个超级英雄的能力最强」时,这个神经元就会提高模型在回答中说出漫威英雄的概率。

OpenAI开发的工具利用这种规则制定了一套评估流程。

开始之前,先让GPT-2运行文本序列,等待某个特定神经元被频繁「激活」的情况。

然后有三个评估步骤:

第一步,让GPT-4针对这段文本,生成解释。比如在下面的案例中,神经元主要针对漫威内容。GPT-4接收到文本和激活情况后,判断这与电影、角色和娱乐有关。

NFT安全公司Web3 Builders完成700万美元种子轮融资,OpenSea Ventures等参投:10月18日消息,智能合约和 NFT 安全公司 Web3 Builders 宣布完成 700 万美元种子轮融资,Road Capital、OpenSea 的风险投资子公司、Sparkle Ventures、Picus Capital、ACME、TTV、G20、Global Founders Capital、Haven Ventures 和 Greylock 等参投。本轮融资将用于开发产品,增加新的人工智能和机器学习方法,并扩大团队。(coindesk)[2022/10/18 17:31:16]

第二步,用GPT-4模拟这个GPT-2的神经元接下来会做什么。下图就是GPT-4生成的模拟内容。

最后一步,对比评估打分。对比4代模拟神经元和2代真实神经元的结果,看GPT-4猜的有多准。

Coinbase NFT市场已聚合OpenSea和LooksRare上的以太坊NFT:金色财经报道,Coinbase NFT市场已聚合OpenSea和LooksRare,其用户可查看Coinbase NFT、LooksRare和OpenSea上的以太坊NFT,从而以更好的价格进行交易,随后Coinbase也计划扩展到其他市场和区块链。[2022/9/22 7:13:20]

通过这样的方法,OpenAI对每个神经元的行为作出了初步的自然语言解释,并对这种解释和实际行为的匹配程度进行了评分。

最终他们对GPT-2中307200个神经元全部进行了解释,这些解释汇编成数据集,与工具代码一起在GitHub上发布。

超越语言的机器,人类无法理解的机器

据OpenAI在博客文章中表示,目前GPT-4生成的解释还不完美,尤其要解释比GPT-2更大的模型时,表现效果很差,「可能是因为后面的layer更难解释」。

对于GPT-2解释的评分大多也非常低,仅有1000个左右的解释获得了较高的评分。

OpenAI可拓展对齐团队的JeffWu表示,「大多数解释的得分很低,或者无法解释实际神经元那么多的行为。比如,许多神经元以一种难以判断的方式保持活跃,它们在五六件事上保持激活,但却没有可以辨别的模式。有时候存在明显的模式,但GPT-4有无法找到它。」

派盾:OpenSea漏洞事件疑为网络钓鱼,用户授权钓鱼邮件中的迁移导致NFT失窃:2月20日消息,据派盾官方消息,派盾称「OpenSea 漏洞事件」很可能是网络钓鱼,用户按照网络钓鱼邮件中的指示授权「迁移」,而这种授权将允许黑客窃取有价值的 NFT。

以太坊智能合约编程语言 Solidity 的开发者 foobar 表示,黑客使用 30 天前部署的一个助手合约,调用 4 年前部署的一个操作系统合约,使用有效的 atomicMatch() 数据。这可能是几个星期前的典型网络钓鱼攻击。而不是智能合约漏洞,代码是安全的。

此前报道,2 月 19 日,OpenSea 官方在社交媒体上发文表示,其智能合约升级已完成,新的智能合约已经上线,用户迁移智能合约需签署挂单迁移请求,签署此请求不需要 Gas 费,无需重新进行 NFT 审批或初始化钱包,此迁移期将持续 7 天。[2022/2/20 10:03:27]

虽然现阶段成绩不好,但是OpenAI却比较有信心,他们认为可以使用机器学习的方式提高GPT-4产出解释的能力。

比如通过反复产出解释,并根据激活情况修改解释;或者使用更大的模型作出解释;以及调整解释模型的结构等等。

七位前Steem开发人员成立OpenOrchard以构建创新开源技术:金色财经报道,七位前Steem顶级开发人员成立了OpenOrchard,这家公司寻求在Hive之上构建创新的开源技术。OpenOrchard的发展源于OpenSeed,该团队由Steem开发人员Andrew Levine、Benjamin Flanagin和Ron Hamenham组成。据此前消息,Steem社区于北京时间3月20日硬分叉,新链名为Hive。[2020/4/17]

OpenAI还提到,这一方法目前还有很多局限性。

使用简短的自然语言进行解释,也许并不匹配神经元可能非常复杂的行为,不能简洁地进行描述。神经元可能会具备多个不同概念,也可能,会具备一个人类没有语言描述甚至无法理解的概念。

最终OpenAI希望能够自动化找到并解释能够实现复杂行为的整个神经回路,而目前的方法只解释了神经元的行为,并没有涉及下游影响。

解释了神经元的行为,但没有解释产生这种行为的机制。这意味着即使是拿了高分的解释,也只能描述相关性。

整个过程是计算密集型的。

在论文中,OpenAI表示:「语言模型可能代表了人类无法用语言表达的陌生概念。这可能是因为语言模型关心不同的事情,比如统计结构对下一个token预测任务有用,或者因为模型已经发现了人类尚未发现的自然的抽象,例如在不同领域的类似概念家族。」

它把LLM的这种属性,称为AlienFeature,在生物领域翻译为「异类特征」。

FounderPark微信后台回复「解释神经元论文」,获取论文链接和中英对照PDF链接。

把对齐问题也交给AI

「我们正试图开发预测『AI系统会出现什么问题』的方法,」OpenAI可解释性团队负责人WilliamSaunders对媒体说,「我们希望能够真正做到,让这些模型的行为和生产的回答是可以被信任的。」

SamAltman也转发博客文章称:GPT-4对GPT-2做了一些可解释性工作。

可解释性是机器学习的研究子领域,指的是对模型的行为有清晰的理解和对模型结果的理解能力。

简单来说,目的就是解释机器学习模型「如何做到」。

2019年开始,可解释性成为机器学习的重要领域,相关研究有助于开发人员对模型进行优化和调整。针对当下AI模型大规模应用时,亟需解决的可信度、安全性和决策参考等问题。

如果我们不知道AI是如何作出决策的,始终把它当做一个黑箱,那么就算AI在各种场景下表现得再完美,也无法解决部分人类的信任问题。

OpenAI这次使用GPT-4来解决可解释性的问题,就是希望能够使用自动化的方式,让机器完成AI研究。

「这是我们对齐研究的第三支柱的一部分:我们希望自动化对齐研究。令人期待的是,这一方向能让它与AI发展的步伐相匹配。」

在2022年夏天,OpenAI曾发布文章《我们做对齐研究的方法》。

文中提到,宏观来看,OpenAI的对齐研究将由三大支柱支撑:

1、利用人工反馈训练AI

2、训练AI系统协助人类评估

3、训练AI系统进行对齐研究

「语言模型非常适合自动化对齐研究,因为它们通过阅读互联网『预装』了大量有关人类价值观的知识和信息。开箱即用,它们不是独立代理,因此不会在世界上追求自己的目标。」

太快了,连认知都范式革命了

虽然OpenAI本意很好,但是这样的研究成果着实吓坏了网友。

OpenAI的推文下梗图横飞,有不少人在认真地建议OpenAI搞慢点。

「用我们不理解的东西,解释另一个我们不理解的东西,这合理吗?」

「护栏都被你撤了」

「这太迷人了,但也让我感到极度不适。」

「自然创造了人类来理解自然。我们创造了GPT-4来理解自己。」

「我们要怎么判断解释者是好的?这就像...谁监督着监督者?」(whowatchesthewatchers)

还有人看到了更深的一层:

「大模型很快就能比人类更好地解释他们自己的思维过程,我想知道我们未来要创造多少新的词汇,来描述那些AI发现的概念?我们还没有一个合适的词描述它们。或者,我们是否会觉得这些概念有意义?它们又能教会我们如何认识自己呢?」

另一网友回应道:「人类本身对自己行为的解释,大多是谎言、捏造、幻觉、错误的记忆、事后推理,就像AI一样。」

标签:PENOPENGPTNAIBOpenSeaOpenDAOHGPT币NAI价格

聚币热门资讯
GPT-4竟然有身体,167cm!清华、北师大重磅研究:ChatGPT能像人一样感知行动

来源:新智元 ChatGPT眼里的世界,和人类感知的世界是一样的吗?ChatGPT的语言能力确实很惊艳,但大语言模型在没有人类身体、且缺乏实践经验的情况下,是否能像人类一样感知到真实世界呢? 最近.

1900/1/1 0:00:00
NFT深熊之时,“胖企鹅”起死回生

NFT市场正处于最寒冷的时刻。DuneAnalytics数据显示,头部交易平台OpenSea的每日交易量已降至800万美元左右,不足巅峰期数据的2%.

1900/1/1 0:00:00
IDO&IEO:盘点即将上线的8个热门项目(5月第二弹)

本周,Odaily星球日报甄选了近期即将在多个平台首发的8个项目名单,并分别做简要介绍。此外,推荐阅读《?5月第一弹》、《?4月第五弹》《?4月第四弹》、《?4?月第三弹》、《?4月第二弹》、《?4?月第一弹》.

1900/1/1 0:00:00
Layershit的诞生是开发者向贪婪资本的亮剑

2023年5月,Caduceus链上发行了首个MemecoinLayerShit。翻阅其推特,在醒目的介绍中仍能看到其对资本“开战”的痕迹。标签上也赫然写着:“被资本绑架的开发者和项目都是垃圾,以太坊和他的layer2都是”.

1900/1/1 0:00:00
抖音发布关于人工智能生成内容的平台规范暨行业倡议,引发业界关注

来源丨元宇宙简史 编写丨元宇宙简史主理人Fun5月9日,抖音发布了关于人工智能生成内容的平台规范暨行业倡议,以及《抖音关于人工智能生成内容标识的水印与元数据规范》.

1900/1/1 0:00:00
操作指南:24个比特币生态项目和工具全盘点

自Ordinals协议将BTCNFT带火之后,BRC-20又成为了用户、CEX?争抢布局的新赛道。这些新协议的出现让一向「古板」的比特币链又重新焕发生机.

1900/1/1 0:00:00