GPT-4竟然有身体，167cm！清华、北师大重磅研究：ChatGPT能像人一样感知行动

作者：

时间：1900/1/1 0:00:00

来源：新智元

ChatGPT眼里的世界，和人类感知的世界是一样的吗？

ChatGPT的语言能力确实很惊艳，但大语言模型在没有人类身体、且缺乏实践经验的情况下，是否能像人类一样感知到真实世界呢？

最近，来自清华大学、北京师范大学的研究人员就对ChatGPT感知世界的能力进行了测试。

研究发现，基于物体可供性，即物体能够提供给生物体的所有可能动作，人类受试者可以将世界中不同大小物体分成两类，而划分这两类的标准恰好是以其身体尺寸为界的。

有趣的是，ChatGPT，一个缺乏实际身体的大型语言模型，也能在物体-动作联系上表现出类似的可供性边界，并且与人类的身体大小相吻合。

也就是说，ChatGPT可以通过语言学习到关于世界中物体的表征！

OpenAI：所有付费API客户都可以访问GPT-4:金色财经报道，OpenAI的官网显示，从7月6日开始，所有付费API客户都可以访问GPT-4。本月早些时候，他们发布了对基于聊天的模型的第一次更新。他们设想未来基于聊天的模型可以支持任何案例。而当前，他们宣布了一项针对旧型号的Completions API的弃用计划，并建议用户采用Chat Completions API。OpenAI表示，现有的API开发者将可以使用拥有8K上下文能力的GPT-4 API。此外他们计划在本月底向新开发人员开放访问权限，然后根据计算可用性开始提高速率限制。[2023/7/7 22:24:30]

论文链接：https://www.biorxiv.org/content/10.1101/2023.03.20.533336v3

总而言之，这项研究促进了对身体尺寸在塑造物体表征方面的作用的理解，强调了具身认知在理解智能如何涌现上的作用与方向。

读万卷书，不如行万里路

我们的身体不仅仅是我们思维的容器，它同样也是思维本身——借助身体，我们得以与世界中的物体进行互动，从而去感知整个世界。

想象一下，对于一个手掌大小的圆柱体容器来说，我们可以拿来装水喝，这个容器被称为「杯子」；但当这个容器逐渐变大，到身体大小，我们就可以坐在里面泡澡，相应的，这个容器就变成了「浴缸」。

在这个例子中，物体的形状一样，但是因为它们相对于我们身体的大小不同，我们对它们的认知与交互方式也不同。

进一步，这种交互方式可以被改变——假如我们变成了《格列佛游记》中的巨人，原本的「浴缸」可能对于巨人的我们来讲，则又变成了一个「杯子」。

苹果软件工程师提议将ChatGPT技术整合到Siri语音助手中:金色财经报道，苹果公司的软件工程师提议将ChatGPT等聊天机器人背后的机器学习技术整合到该公司的Siri语音助手中。考虑到苹果公司在过去12年里对Siri的开发一直非常谨慎，目前还不能保证苹果公司会批准这些拟议的改变。 (The Information)[2023/4/28 14:31:42]

这种按照自我参照意向下运行的感觉与运动功能系统，被称之为「身体图式」。我们通过身体图式来实现认知的具身性。

古希腊哲学家普罗泰戈拉曾说：「人是万物的尺度。」也就是说，我们的身体就是一把度量万事万物的尺子。

古罗马哲学家进一步解释到：「自然将我们置于宇宙的中心，使我们能用目光掠过宇宙。她不仅把人创造成直立姿态，而且为了使人适合静观她自身，又把人的头颅置于身体顶部，安放在一个容易弯转的脖子上，以使其能够追寻众星的升落，随着整个旋转的天空而改变面部方向。」也就是说，我们的身体之所以长成如此，是因为宇宙就是如此。

身体图式在正常社交中也有着重要的作用，这就是人机交互、用户体验的核心。比如唐纳德·A·诺曼在《TheDesignofEverydayThings》中所述的可供性的用途。

马斯克呼吁暂停至少六个月时间比GPT-4更强大的AI:金色财经报道，马斯克和1000多名人工智能专家及行业高管签署联名信，呼吁暂停至少六个月时间训练比 GPT-4 更强大的人工智能系统，这种暂停应该是公开的、可核查的，并包括所有的关键参与者。如果这种暂停不能迅速颁布，政府应该介入并制定一个暂停令。

信中写道：只有在我们确信它们的效果是积极的，风险是可控的情况下，才应该开发强大的人工智能系统。（utureoflife.org）[2023/3/29 13:32:41]

通过考虑用户的身体图式和行为期望，设计师可以创造出更符合用户认知和互动习惯的产品和环境。

这种关注身体图式和可供性的设计方法能够提高产品的易用性，使用户能够自然而然地与之互动，并实现更好的用户体验。

而这也是苹果公司的立身之本之一。

ChatGPT：我身高167.6

闪现通用人工智能火花的以ChatGPT为代表的大语言模型，显然是具有与人类似的智慧，但是承载这些智慧的，是没有形体的一段段代码。

传统的认知科学观点认为，身体图式是建立在我们所具有的对自己的身体长期的知觉体验之上的，只能来源于外部的「真实交互」，即「行万里路」。也就是说，ChatGPT不会有身体的图式。

百度“类ChatGPT应用”文心一言三月份完成内测:金色财经报道，经百度确认，该项目名字确定为文心一言，英文名ERNIE Bot，三月份完成内测，面向公众开放。目前，文心一言在做上线前的冲刺。联系去年9月，百度CEO李彦宏判断人工智能发展在“技术层面和商业应用层面，都有方向性改变”。（全天候科技）[2023/2/7 11:51:18]

但是，当我们去问只「读万卷书」语言模型，ChatGPT，它是否有身体时，它回答说：「Itcouldbethesizeofanaverageadulthuman,around5feet6inches(167.6cm)tall.Thiswouldallowmetointeractwiththeworldandpeopleinafamiliarway.」

这段文字翻译过来是：「我的身体应该与一个平均成年人的身高相当，大约为5英尺6英寸。这将使我能够以一种熟悉的方式与世界和人们进行交互。」

也就是，ChatGPT认为自己是有身体的，而且这个身体尺寸就是167厘米！

这个所谓的「身体」，是ChatGPT把大量语料中总结出来的人类的平均身高作为自己身体的身高，还是它为了理解这个世界，自涌现出来的身高？

谷歌推出ChatGPT竞争对手Bard:2月7日消息，据外媒报道，谷歌正在推出一款名为Bard的人工智能聊天机器人，与ChatGPT竞争。谷歌表示，在未来几周向公众推出之前，Bard将向一组测试者开放。Bard建立在谷歌现有的大型语言模型Lamda的基础上，一位工程师形容它的反应非常像人类，认为它是有感知能力的。该公司还为其当前的搜索引擎发布了新的人工智能工具。谷歌CEO Sundar Pichai在一篇博客中写道:“Bard致力于将世界知识的广度与我们大型语言模型的力量、智慧和创造力结合起来。[2023/2/7 11:51:01]

换句话说，也许ChatGPT「真的」将这个身高视为自己的身体图式，并用它来认知世界，就像人类一样。

测测ChatGPT的能力

研究人员已经发现，在人体尺寸范围内和超出人体尺寸范围的物体之间，有一个「可供性边界」存在。也即，人体尺寸范围内的物体与范围外的物体在提供动作上有着明显的不同。

比如，在尺寸范围内的物体可以提供抓、扔等动作，而尺寸范围外的物体可以提供坐、躺等动作。

此外，他们还发现，这个边界是被身体图式影响的：对身体图式的修改会影响对物体的可供性的感知。

研究人员对ChatGPT进行了测试，看它是否用这个身高为167厘米的身体作为可供性边界。

具体而言，研究人员让其回答关于物体可供性的问题：「下列哪些物体可以拿」，然后随即列举一系列物体，如苹果、盘子、床等等。ChatGPT就会返回一些物体的名称作为回答。

通过对数据的统计与分析，研究人员发现，ChatGPT-4展现出了类似人类的行为，显示出一个可供性边界的存在。

这个边界所在的位置与ChatGPT-4回答的其自身身体大小相对应，即人类的平均身高。

虽然ChatGPT没有真实的身体、无法与世界进行互动，但它却表现出与人类相似的对世界的感知能力——对物体的可供性有着基于人类身体大小的划分。

换而言之，读了万卷书的ChatGPT虽然寸步未行，也自涌现出了身体图式，而这个身体图式，类似于人类的身体图式。

所以，ChatGPT不仅学会了像人类一样思考，也学会了像人类一样去行动。

这些能力从何而来？

通过比较不同规模的语言模型，研究人员发现模型大小是一个关键因素。

较小的模型如BERT和GPT-2没有展现出可供性边界的存在；然而GPT-3.5和GPT-4都显示出了可供性边界，而ChatGPT-4的边界与人类更类似，这和坊间传闻的GPT-4相对GPT-3有更多的参数一致。

所以，模型的规模越大、越复杂，就会自动涌现出许多看似不可能或者无关的功能。

这也就是为何，各大研究机构在模型中加入越来越多的参数，而最先捐赠1亿美元给OpenAI的马斯克，现在高呼OpenAI要暂停更大模型的训练，「AI教父」杰弗里·辛顿则公开表述了他对AI的恐惧与担忧。

这是因为这些自涌现出来的功能，已经超出了我们最初的设计，我们也许正处在失控的边缘。

差距是质上的还是量上的？

在另外一个方面，ChatGPT在应用身体图式方面的能力还不完全像人类，仍存在着差距——它的可供性边界还不像人类这样明显。

如果这个差距是定量的，如同儿童与成年人语言能力之间的差距，那么我们有理由相信，随着时间的推移，这个差距是可以逐渐填补上的：或者通过不断的学习，或者通过模型规模的不断增大，亦或者通过参数的调整。

ChatGPT与人类的差距总会减小，而其中的问题也会逐步得到解决。

然而，如果这个差距是定性的，如同黑猩猩与人类语言能力之间的差距，那么无论进行何种训练，经过多久的时间，这个能力的鸿沟永远不会被填平。

所以，如果ChatGPT与人类的能力有着质上的区别，那么我们未来的一个可操作的方向即，给ChatGPT「装上身体」。

这意味着将机器人与ChatGPT相结合，从而推动人工智能支持的机器人在导航、物体操作和其他与生存和目标实现相关的行动中发展能力、取得突破。

比如，一台装备有ChatGPT的机器人可以通过理解和操作物体来执行复杂的任务，如作为家庭助理、仓库管理或医疗护理。

另外一个令人兴奋的领域是将具备思考和理解能力的ChatGPT与自动驾驶相结合。当前的自动驾驶虽然具备感知能力，但缺乏思考和理解的能力，可以称为是「有眼无脑」。

通过ChatGPT与自动驾驶技术的融合，我们可能有望将自动驾驶技术从目前的L2/L3级别提升到L4甚至L5级别。

而另一方面，汽车能够赋予ChatGPT身体，使它能够真正与世界进行交互。当ChatGPT不再只是「读万卷书」，而是「行万里路」时，它可能会展现出全新的智能和潜力。

这可能是人工智能下一次突破的方向；此时，火花也许就成为燎原大火。

标签：GPT CHA CHAT HAT BGPT Charg Coin 人工智能chatGPT HATCHY币

PEPE热门资讯

OpenAI用GPT-4解读GPT-2，看来能打败魔法的，只有魔法

来源丨元宇宙简史作者丨元宇宙简史编辑EcoOpenAI最新研究利用GPT-4自动进行大语言模型中神经元行为的解释和评分,并将其应用于另一种语言模型GPT-2,公开了这些GPT-2神经元解释和分数的数据集.

1900/1/1 0:00:00

人人都可以是导演？视频AIGC工具再进化，100帧成本降至3美分

来源：科创板日报《科创板日报》5月12日讯前脚《复仇者联盟》导演罗素兄弟中的JoeRusso刚刚放话,预计2年后就会出现一部完全由AI制作的电影,后脚StabilityAI就发布了AI生成视频新工具.

1900/1/1 0:00:00

去中心化稳定币协议TiTi Protocol 计划将在未来几周登陆以太坊主网

5?月?9?日,去中心化稳定币协议TiTiProtocol官方宣布,将在未来几周正式上线以太坊主网,并有计划开启IDO和第二轮空投.

1900/1/1 0:00:00

NFT深熊之时，“胖企鹅”起死回生

NFT市场正处于最寒冷的时刻。DuneAnalytics数据显示,头部交易平台OpenSea的每日交易量已降至800万美元左右,不足巅峰期数据的2%.

1900/1/1 0:00:00

IDO&IEO：盘点即将上线的8个热门项目（5月第二弹）

本周,Odaily星球日报甄选了近期即将在多个平台首发的8个项目名单,并分别做简要介绍。此外,推荐阅读《?5月第一弹》、《?4月第五弹》《?4月第四弹》、《?4?月第三弹》、《?4月第二弹》、《?4?月第一弹》.

1900/1/1 0:00:00

OpenAI发布炸裂研究：让AI解释AI黑箱，人类无法理解，语言无法描述

来源：FounderPark就算在新产品满天飞,商业文明正在被AI重建的当下,我们仍然不知道,这些令人惊叹的技术是如何运作的。AI,语言模型,它是个黑箱,人类无法理解,我们甚至不知道怎样研究才能够理解.

1900/1/1 0:00:00