ChatGPT为什么这么强

作者：

时间：1900/1/1 0:00:00

1.从周五到周末ChatGPT已经疯传开来，其对话能力让人惊艳。从玩梗、写诗、写剧本，到给程序找bug，帮人设计网页，甚至帮你生成AIGC的提示词，一副无所不能的样子。可以去Twitter上看BenTossell梳理的一些例子，或者自己去试试！一位MBA老师让ChatGPT回答自己的管理学题目，结论是以后不能再布置可以带回家的作业了。很多人用了以后无法自拔，就如这位所见：

Musk问ChatGPT怎么设计Twitter(不得不说还挺有创意）：

2.有人让ChatGPT参加了智商测试，得分83;SAT测试得分1020，对应人类考生52%分位。要知道ChatGPT并没有对数学方面做过优化，已经是相当不错的结果了。

苹果App Store上出现假冒Trezor的恶意应用程序Trezor Wallet Suite:6月20日消息，苹果App Store上出现一款假冒Trezor的恶意应用程序Trezor Wallet Suite，该应用已经上架了几周，可能已经窃取了数千人的资金。该恶意程序最初由The Crypto Lawyers的管理合伙人Rafael Yakobi发现。Trezor的实际iOS应用程序被称为“Trezor Suite Lite”，使用户能够跟踪他们的投资组合并交易资产。如果用户忘记了钱包应用的登录细节，钱包供应商会要求他们离线存储种子短语。种子短语是最后一道防线，用户只能用它从钱包应用程序中收回资金。

Trezor为用户提供了Shamir备份，以帮助他们生成多个种子短语，这些种子短语可以存储在不同的物理位置。下载应用程序后，用户可以选择一定数量的短语来解锁资金。例如，他们可以生成三个种子短语，但只需要两个就可以解锁他们的资金。而使用假冒的Trezor Wallet Suite泄露种子短语的用户可能创建了一个种子短语。生成多个种子短语需要用户创建新的钱包。多个种子短语可以确保即使假冒应用获取了一个短语，它也无法访问用户资金。

截至发稿时，这款假冒应用已成为英国区App Store搜索量第二高的应用。（BeInCrypto）[2023/6/20 21:49:55]

孙宇晨：香港Web3政策展现区块链行业前景，波场TRON将积极参与其中:6月16日消息，波场TRON创始人、火必Huobi全球顾问委员会成员孙宇晨转发全国政协委员、香港立法会议员吴杰庄关于香港Web3政策的推文并表示，他对香港关于Web3和虚拟资产政策的讨论印象深刻。其充满活力的金融生态系统和渐进的监管展现了区块链行业的前景。波场TRON已准备好参与其中，呼应香港致力于接纳行业反馈和促进全球联系的承诺。

在推特中，吴杰庄列举了其在香港Web3和虚拟资产政策研讨和采访中的主要收获，主要包括香港领先的金融环境正在进行演变，以支持虚拟资产行业，新法规邀请全球行业参与者申请许可证；监管水平将适应行业发展，香港对建议持开放态度，并致力于扩大其开放性，接受行业反馈；不要低估香港的市场规模，作为全球金融和新兴科技中心，香港连接世界各地的城市，持续扩大其全球影响力。[2023/6/16 21:42:45]

3.ChatGPT的提升点

相比之前的GPT-3，ChatGPT的提升点在于能记住之前的对话，连续对话的感觉让人舒服。

ChatGPT可以承认错误，如果你认为他的回答不对，你可以让他改正，并给出更好的答案。

ChatGPT可以质疑不正确的前提，GPT-3刚发布后很多人测试的体验并不好，因为AI经常创造虚假的内容，而现在再问“哥伦布2015年来到美国的情景”这样的问题，AI已经知道哥伦布不属于这个时代了。

隐私DID项目zCloak Network与dForce达成合作:金色财经报道，据官方公告，注重隐私的DID和ZKP基础设施zCloak Network将与dForce合作，将隐私保护身份服务与DeFi集成在一起。该合作伙伴关系将专注于在访问DeFi服务时使用真实身份，同时保护用户隐私。

通过与dForce合作，zCloak Network利用零知识证明技术为dForce及其用户提供一套独特的DID协议和基础设施。双方的技术和产品将在合作伙伴关系中实施，主要涉及身份验证，传递可信度和隐私保护。[2023/5/1 14:36:09]

ChatGPT还采用了注重道德水平的训练方式，按照预先设计的道德准则，对不怀好意的提问和请求“说不”；当然，尽管OpenAI非常小心，这种准则还是可能被聪明的提问方式绕开。

4.ChatGPT的训练方法

当下大模型的工作范式是“预训练-微调”。首先在数据量庞大的公开数据集上训练，然后将其迁移到目标场景中，通过目标场景中的小数据集进行微调，使模型达到需要的性能。微调/prompt等工作从本质上对模型改变并不大，但是有可能大幅提升模型的实际表现。人类问问题方式对于GPT-3而言不是最自然的理解方式，要么改造任务，要么微调模型，总之是让模型和任务更加匹配，从而实现更好的效果。

已有超1800个地址向土耳其捐助价值约350万美元的加密货币:2月8日消息，据 Dune Analytics 数据显示，截至目前已有 1,826 个独立地址通过多个网络（BSC、ETH、AVAX），向土耳其捐助价值 3,512,155 美元的加密货币。[2023/2/8 11:55:14]

ChatGPT是22年1月推出的InstructGPT的兄弟模型。InstructGPT增加了人类对模型输出结果的演示，并且对结果进行了排序，在此基础上完成训练，可以比GPT-3更好的完成人类指令。ChatGPT新加入的训练方式被称为“从人类反馈中强化学习”。

ChatGPT是基于GPT-3.5模型，训练集基于文本和代码，在微软AzureAI服务器上完成训练。原先GPT-3的训练集只有文本，所以这次新增了代码理解和生成的能力。

5.为什么ChatGPT的提升这么明显

除了带有记忆能力、上下文连续对话能带给人显著的交互体验提升，ChatGPT的训练方式也值得关注。上述提到的RLHF方法首见于22年3月发表的论文(Traininglanguagemodelstofollowinstructionswithhumanfeedback)，但根据业界的推测，RLHF并未用到InstructGPT的训练中。InstructGPT所用到的text-davinci-002遇到了一些问题，会呈现出模式坍塌(modecollapse)现象，不管问他什么问题，经常收敛到同样的答案，比如正面情绪相关的回答都是跟婚礼派对相关。

数据：CryptoPunks系列NFT 24小时内交易量涨幅超229%:金色财经报道，据NFTGo.io数据显示，CryptoPunks系列NFT总市值达21.1亿美元，在所有NFT项目总市值排名中位列第1；其24小时交易额为402.84万美元，增幅达229.85%。截止发稿时，该系列NFT当前地板价为76.8 ETH。[2022/7/13 2:10:31]

这次RLHF的方法得以在ChatGPT上应用，并取得了很好的效果。但RLHF实际上并不容易训练，强化学习很容易遇到模式坍塌，反馈过于稀疏这类问题，训练起来很困难。这可能也是为什么论文在3月发表，ChatGPT在12月才上线，中间需要大量的时间来调优。

此外，指令调整的贡献也很大。InstructGPT虽然在参数上比GPT-3少了100倍，它的输出效果比GPT-3以及用监督学习进行微调的模型都要好得多。

根据知乎用户“避暑山庄梁朝伟”的观点：“InstructionTuning和Prompt方法的核心一样，就是去发掘语言模型本身具备的知识。而他们的不同点就在于，Prompt是去激发语言模型的补全能力，比如给出上半句生成下半句、或者做完形填空，都还是像在做languagemodel任务，而InstructionTuning则是激发语言模型的理解能力，通过给出更明显的指令，让模型去理解并做出正确的反馈。”

参考下图，以前大模型的提升重心更多放在了大模型本身和PromptEngineering上，而ChatGPT的迭代重点是右侧的闭环。

action-drivenLLM训练流程图

最后，ChatGPT在过于保守不提供有效回答和提供虚假信息之间做出了较好的权衡。之前Meta用于科研的大模型Galactica上线仅3天就被迫下线，因为提供了过多虚假的信息。这跟Meta的宣传策略也有关，其本意是想帮助研究人员整理信息、辅助写作，但Meta将其模型宣传为“可以总结学术论文，解决数学问题，生成维基文章，编写科学代码，为分子和蛋白质做注解等”，过高期望带来了反效果，科研人员本来就是挑剔的。ChatGPT尽管不能完全避免虚假信息的问题，但可以看出在微调/Prompt方面做了足够细致的工作，一些自相矛盾的提问可以被甄别出来，让用户对其回答更有信心。

6.商业策略也是重要一环

这次ChatGPT是免费不限量向公众开放，用户可以尽情在平台上尝试各种奇异疯狂的想法，而此前GPT-3是根据使用量(token)来收费的。在使用过程中，用户可以提供反馈，这些反馈是对OpenAI最有价值的信息。OpenAI并不急于创收也不缺钱，坊间传言最新一轮估值已经达到数百亿美金，还有金主爸爸微软。

对于AI发展来说，工程的重要性实际上大于科学，创建一个迭代反馈的闭环至关重要。OpenAI很注重商业应用，GPT-3已经拥有大量客户。这些客户跟OpenAI的反馈互动也是推动进步的关键一环。相比之下，谷歌的闭门造车就显得不合时宜，或许是缺乏商业化的文化，或许是受限于投入产出比，谷歌对于大模型的应用一直很“克制”，即便起点很高，但如果一直像Waymo做自动驾驶一样小规模迭代，早晚会被更为开放，获得更多数据的企业超越。

7.后续提升点

RLHF是一种较新的方法，随着OpenAI不断摸索，结合ChatGPT搜集到的用户反馈，模型还有进一步提升的空间。尤其是在道德/alignment层面，需要屏蔽掉这几天大家试验出来的绕过系统限制产生负面信息的方法。

当然也别忘了，OpenAI还有WebGPT这样的工具，可以理解为高阶版网页爬虫，从互联网上摘取信息来回答问题，并提供相应出处。比如下面的问题Howdoneuralnetworkswork，WebGPT利用了GPT-3本身具备的语义理解能力和互联网公开信息，自己结合出了一份答案，不失为一种升级的搜索能力。

在MITTechnologyReview对OpenAI科学家的采访中，他们提到了后续有可能将ChatGPT和WebGPT的能力结合起来。有网友挖掘出了ChatGPT内设的提示词，其中包含browsing:disabled，把浏览网页能力关闭了，也就是说后续有可能加入这个能力。可以设想，ChatGPT+WebGPT可以产生更为有意思的结果，信息可以实时更新，对于事实真假的判断将更为准确。

与WebGPT的这种结合，对应到上面?action-drivenLLM训练流程图?的左半部分，即连接外部的信息源和工具库。事实上网页搜索只是一种可能，还结合利用各种工具，实现更丰富的功能。

在产品层面，是不是有更好的界面和实现方式也值得讨论。同屏对话框形式容易让人产生过高的预期，因为要保障对话的流畅性。在这一点上，GithubCopilot产品就做得很好，Copilot主打的是programmingpair，以伙伴的身份提出建议。从用户角度，这个建议好就接受，不好就不接受；即便提出了很多不被接受的建议，但在随机时间间隔产生的有效建议带来的爽感就会让用户上瘾。如果ChatGPT后续成为写作助手、编剧助手、工作助手等等，类似Copilot的产品形态会容易让人接受。

写在最后

很多人惊叹于ChatGPT的能力，但其实真正惊艳的还在后面。OpenAI最厉害的不是他关于大模型的理解，而是其工程化、迭代反馈的能力，以及alignment(AI跟人类目标的统一）方面的工作。很欣赏OpenAICEOSamAltman的一句话：“Trusttheexponential.Flatlookingbackwards,verticallookingforwards.”?我们就处在即将起飞的这个点上。

标签：GPT CHAT ATG HAT bgpt币最新消息 chat币发行价 ATG币 chat币要归零吗