ChatGPT的崛起：发展历程、技术原理以及局限性

作者：

时间：1900/1/1 0:00:00

ChatGPT是个啥？

近期，OpenAI发布了ChatGPT，是一个可以对话的方式进行交互的模型，因为它的智能化，得到了很多用户的欢迎。ChatGPT也是OpenAI之前发布的InstructGPT的亲戚，ChatGPT模型的训练是使用RLHF也许ChatGPT的到来，也是OpenAI的GPT-4正式推出之前的序章。什么是GPT？从GPT-1到GPT-3

GenerativePre-trainedTransformer(GPT)，是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话AI。2018年，GPT-1诞生，这一年也是NLP的预训练模型元年。性能方面，GPT-1有着一定的泛化能力，能够用于和监督任务无关的NLP任务中。其常用任务包括：自然语言推理：判断两个句子的关系问答与常识推理：输入文章及若干答案，输出答案的准确率语义相似度识别：判断两个句子语义是否相关分类：判断输入文本是指定的哪个类别虽然GPT-1在未经调试的任务上有一些效果，但其泛化能力远低于经过微调的有监督任务，因此GPT-1只能算得上一个还算不错的语言理解工具而非对话式AI。GPT-2也于2019年如期而至，不过，GPT-2并没有对原有的网络进行过多的结构创新与设计，只使用了更多的网络参数与更大的数据集：最大模型共计48层，参数量达15亿，学习目标则使用无监督预训练模型做有监督任务。在性能方面，除了理解能力外，GPT-2在生成方面第一次表现出了强大的天赋：阅读摘要、聊天、续写、编故事，甚至生成假新闻、钓鱼邮件或在网上进行角色扮演通通不在话下。在“变得更大”之后，GPT-2的确展现出了普适而强大的能力，并在多个特定的语言建模任务上实现了彼时的最佳性能。之后，GPT-3出现了，作为一个无监督模型，几乎可以完成自然语言处理的绝大部分任务，例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。而且，该模型在诸多任务上表现卓越，例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平，自动产生的文章几乎让人无法辨别出自人还是机器，更令人惊讶的是在两位数的加减运算任务上达到几乎100%的正确率，甚至还可以依据任务描述自动生成代码。一个无监督模型功能多效果好，似乎让人们看到了通用人工智能的希望，可能这就是GPT-3影响如此之大的主要原因GPT-3模型到底是什么？实际上，GPT-3就是一个简单的统计语言模型。从机器学习的角度，语言模型是对词语序列的概率分布的建模，即利用已经说过的片段作为条件预测下一个时刻不同词语出现的概率分布。语言模型一方面可以衡量一个句子符合语言文法的程度，同时也可以用来预测生成新的句子。例如，对于一个片段“中午12点了，我们一起去餐厅”，语言模型可以预测“餐厅”后面可能出现的词语。一般的语言模型会预测下一个词语是“吃饭”，强大的语言模型能够捕捉时间信息并且预测产生符合语境的词语“吃午饭”。通常，一个语言模型是否强大主要取决于两点：首先看该模型是否能够利用所有的历史上下文信息，上述例子中如果无法捕捉“中午12点”这个远距离的语义信息，语言模型几乎无法预测下一个词语“吃午饭”。其次，还要看是否有足够丰富的历史上下文可供模型学习，也就是说训练语料是否足够丰富。由于语言模型属于自监督学习，优化目标是最大化所见文本的语言模型概率，因此任何文本无需标注即可作为训练数据。由于GPT-3更强的性能和明显更多的参数，它包含了更多的主题文本，显然优于前代的GPT-2。作为目前最大的密集型神经网络，GPT-3能够将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本，甚至模仿已故的各位哲学家——预测生命的真谛。且GPT-3不需要微调，在处理语法难题方面，它只需要一些输出类型的样本。可以说GPT-3似乎已经满足了我们对于语言专家的一切想象。注：上文主要参考以下文章：1.GPT4发布在即堪比人脑，多位圈内大佬坐不住了！-徐杰承、云昭-公众号51CTO技术栈-2022-11-2418:082.一文解答你对GPT-3的好奇！GPT-3是什么？为何说它如此优秀？-张家俊中国科学院自动化研究所2020-11-1117:25发表于北京3.TheBatch:329|InstructGPT，一种更友善、更温和的语言模型-公众号DeeplearningAI-2022-02-0712:30GPT-3存在什么问题？

Wework创始人新项目Flowcarbon与电动车充电网络C+Charge达成合作:9月8日消息，Wework创始人区块链项目Flowcarbon宣布与基于实用Token的电动车充电网络C+Charge达成战略合作伙伴关系，通过其GNT实用Token提供链上碳信用，给予电动汽车车主更多激励渠道和方式。[2022/9/8 13:16:01]

但是GTP-3并不完美，当前有人们最担忧人工智能的主要问题之一，就是聊天机器人和文本生成工具等很可能会不分青红皂白和质量好坏，地对网络上的所有文本进行学习，进而生产出错误的、恶意冒犯的、甚至是攻击性的语言输出，这将会充分影响到它们的下一步应用。OpenAI也曾经提出，会在不久的将来发布更为强大的GPT-4：

将GPT-3与GPT-4、人脑进行比较据说，GPT-4会在明年发布，它能够通过图灵测试，并且能够先进到和人类没有区别，除此之外，企业引进GPT-4的成本也将大规模下降。

QuarkChain将发布类似Facebook Diem、支持使用QKC进行支付的应用:QuarkChain官方发推称，将很快发布一款类似Facebook Diem（原名Libra）的支付类应用，该产品将为用户提供透明而且易用的操作体验，并且可以使用其代币QKC进行支付。[2021/5/25 22:42:04]

ChatGP与InstructGPT

ChatGPT与InstructGPT

谈到Chatgpt，就要聊聊它的“前身”InstructGPT。2022年初，OpenAI发布了InstructGPT；在这项研究中，相比GPT-3而言，OpenAI采用对齐研究，训练出更真实、更无害，而且更好地遵循用户意图的语言模型InstructGPT，InstructGPT是一个经过微调的新版本GPT-3，可以将有害的、不真实的和有偏差的输出最小化。InstructGPT的工作原理是什么？

开发人员通过结合监督学习+从人类反馈中获得的强化学习。来提高GPT-3的输出质量。在这种学习中，人类对模型的潜在输出进行排序；强化学习算法则对产生类似于高级输出材料的模型进行奖励。训练数据集以创建提示开始，其中一些提示是基于GPT-3用户的输入，比如“给我讲一个关于青蛙的故事”或“用几句话给一个6岁的孩子解释一下登月”。开发人员将提示分为三个部分，并以不同的方式为每个部分创建响应：人类作家会对第一组提示做出响应。开发人员微调了一个经过训练的GPT-3，将它变成InstructGPT以生成每个提示的现有响应。下一步是训练一个模型，使其对更好的响应做出更高的奖励。对于第二组提示，经过优化的模型会生成多个响应。人工评分者会对每个回复进行排名。在给出一个提示和两个响应后，一个奖励模型(另一个预先训练的GPT-3)学会了为评分高的响应计算更高的奖励，为评分低的回答计算更低的奖励。开发人员使用第三组提示和强化学习方法近端策略优化(ProximalPolicyOptimization,PPO)进一步微调了语言模型。给出提示后，语言模型会生成响应，而奖励模型会给予相应奖励。PPO使用奖励来更新语言模型。本段参考：TheBatch:329|InstructGPT，一种更友善、更温和的语言模型-公众号DeeplearningAI-2022-02-0712:30重要在何处？核心在于——人工智能需要是能够负责任的人工智能OpenAI的语言模型可以助力教育领域、虚拟治疗师、写作辅助工具、角色扮演游戏等，在这些领域，社会偏见、错误信息和害信息存在都是比较麻烦的，能够避免这些缺陷的系统才能更具备有用性。Chatgpt与InstructGPT的训练过程有哪些不同？总体来说，Chatgpt和上文的InstructGPT一样，是使用RLHF训练的。不同之处在于数据是如何设置用于训练的。

Chainlink线上黑客马拉松正式启动:官方消息，2021年春季Chainlink线上黑客松的注册现已开放。为了加速智能合约生态中的持续创新浪潮，春季黑客松将为全球的开发者提供一个与其他社区成员合作的机会，并能通过此机会向该领域中的顶级项目和工程师学习，使用Chainlink预言机网络构建下一代dApps，同时还有机会从超过8万美元的奖池中赢得奖励。

2021年春季黑客松面向这些准备启动新的项目，并使用被业界广泛采用的Chainlink预言机解决方案将其合约连接到现实世界的数据和系统的各类经验水平的智能合约开发者们。

全球线上黑客松将于2021年3月15日至4月11日举行，且免费参加。[2021/3/1 18:03:28]

ChatGPT存在哪些局限性？

如下：a)在训练的强化学习(RL)阶段，没有真相和问题标准答案的具体来源，来答复你的问题。b)训练模型更加谨慎，可能会拒绝回答。c)监督训练可能会误导/偏向模型倾向于知道理想的答案，而不是模型生成一组随机的响应并且只有人类评论者选择好的/排名靠前的响应注意：ChatGPT对措辞敏感。，有时模型最终对一个短语没有反应，但对问题/短语稍作调整，它最终会正确回答。训练者更倾向于喜欢更长的答案，因为这些答案可能看起来更全面，导致倾向于更为冗长的回答，以及模型中会过度使用某些短语，如果初始提示或问题含糊不清，则模型不会适当地要求澄清。ChatGPT’sself-identifiedlimitationsareasfollows.Plausible-soundingbutincorrectanswers:a)ThereisnorealsourceoftruthtofixthisissueduringtheReinforcementLearning(RL)phaseoftraining.b)Trainingmodeltobemorecautiouscanmistakenlydeclinetoanswer(falsepositiveoftroublesomeprompts).c)Supervisedtrainingmaymislead/biasthemodeltendstoknowtheidealanswerratherthanthemodelgeneratingarandomsetofresponsesandonlyhumanreviewersselectingagood/highly-rankedresponseChatGPTissensitivetophrasing.Sometimesthemodelendsupwithnoresponseforaphrase,butwithaslighttweaktothequestion/phrase,itendsupansweringitcorrectly.Trainerspreferlongeranswersthatmightlookmorecomprehensive,leadingtoabiastowardsverboseresponsesandoveruseofcertainphrases.Themodelisnotappropriatelyaskingforclarificationiftheinitialpromptorquestionisambiguous.AsafetylayertorefuseinappropriaterequestsviaModerationAPIhasbeenimplemented.However,wecanstillexpectfalsenegativeandpositiveresponses.参考文献：1.https://medium.com/inkwater-atlas/chatgpt-the-new-frontier-of-artificial-intelligence-9aee812876772.https://pub.towardsai.net/openai-debuts-chatgpt-50dd611278a43.https://openai.com/blog/chatgpt/4.GPT4发布在即堪比人脑，多位圈内大佬坐不住了！-徐杰承、云昭-公众号51CTO技术栈-2022-11-2418:085.一文解答你对GPT-3的好奇！GPT-3是什么？为何说它如此优秀？-张家俊中国科学院自动化研究所2020-11-1117:25发表于北京6.TheBatch:329|InstructGPT，一种更友善、更温和的语言模型-公众号DeeplearningAI-2022-02-0712:30原地址

Cobo Custody与Chainalysis达成战略合作:企业级数字钱包开发及资产托管服务平台Cobo Custody宣布与区块链交易监控服务商Chainalysis达成战略合作，Chainalysis将为Cobo Custody及其合作的200多家客户提供安全合规服务，检测和监控、欺诈等违法行为，降低合规风险。此次合作意味着Cobo Custody成为Chainalysis服务的首批亚洲客户，在安全合规的道路上又迈出了重要的一步。

Chainalysis区块链交易监控工具服务商，为全球40多个国家的政府机构、交易所以及金融机构提供区块链数据分析和交易监控解决方案，同时也帮助客户发现数字货币的可疑活动，以打击相关犯罪活动。

Cobo Custody是面向全球机构客户与合格投资者的钱包开发及数字资产托管服务，以高安全级的HSM加密机、多重签名及冷热分离存储为安全保障基础，已服务于交易所、钱包、资管平台等200多家机构客户。[2020/9/15]

YottaChain创始人王东临：区块链3.0必须满足8个要求:金色财经现场报道，2020 Cointelegraph中文大湾区·国际区块链周8月7日在深圳举行。YottaChain、Ystar创始人王东临在会上表示，区块链3.0是价值互联网的内核，需要丰富的应用场景，满足大规模商业使用，因此区块链3.0需要满足计算、存储、性能、成本、门槛、安全、隐私、交易八方面要求。1、计算方面要具有图灵完备的智能合约；2、存储方面必须具备EB甚至ZB级别的海量数据能力；3、性能要满足大规模应用需求；4、成本费用低廉甚至免费；5、门槛要很低甚至无门槛；6、安全方面需要保护小白用户数据和资产不被盗；7、保证数据和交易隐私；8、交易平台不碰用户资产，足够好用。[2020/8/7]

标签：GPT CHA HAT AIN arbgpt币上架几家交易所 GPSChain chat币发行价 RAINI

USDT热门资讯

全景式解读Web3支付赛道版图与发展趋势

导读支付似乎一直是个浅显易懂却又笼统模糊的词汇,加密支付作为区块链技术原生应用之一包含着更多语义,蕴藏着巨大的机会,是当前网络支付的延伸,本文将从传统移动支付开始讲解支付基础概念,随后阐述Web3加密支付及其与传统支付的异同.

1900/1/1 0:00:00

纳斯达克：复盘2022年元宇宙风投，预测2023年趋势

经济下行,加密熊市,是让所有builder和VC都头疼的阶段,2022年一年里,从年初风投们充满豪气一掷千金,到年底风投们都兴致恹恹都蛰伏静默。今天,我们一起来看一下来自纳斯达克关于元宇宙风投的一份报告.

1900/1/1 0:00:00

TreasureDAO生态在2023年会发生什么？

对于/img/20230508174201706337/1.jpg "/>Treasures市场/img/20230508174201706337/2.

1900/1/1 0:00:00

为什么Web3需要DeFi原生链？

“DeFi原生链”这一名词在Berachain和Sei初露头角时被市场窥见一隅,Sei定义自己为第一条真正意义上的DeFi专用链,Berachain也紧随其后抛出了为解决DeFi流动性而生的创新共识.

1900/1/1 0:00:00

BinaryTalks｜FTX事件给Web3 VC的尽调启示

2021年TigerGlobal曾在贝恩的尽调帮助下对FTX投资3800万美元；淡马锡经过八个月的尽调后向FTX投资了2.75亿美元,在2022年11月11日FTX破产之后他们都将这笔投资减记为0.

1900/1/1 0:00:00

圆桌：Web3.0游戏新纪元 | Web3.0 Cloud Day

12月15日,在Web3.0CloudDaySingapore2022活动上,由ABGA执行主席,BitriseCapitalfounderKevinShao担任主持人.

1900/1/1 0:00:00