宇宙链 宇宙链
Ctrl+D收藏宇宙链
首页 > SAND > 正文

国内“ChatGPT们”的出路在何方?

作者:

时间:1900/1/1 0:00:00

写在前面

2月13日,《2022年北京人工智能产业发展白皮书》正式发布,其中提到全面夯实人工智能产业发展底座,支持头部企业打造对标 ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。

很巧的是,飒姐团队成员在今年10月份的时候测评过:百度文心、源1.0、某道,三款国内现有的大模型,当时对测评结果甚是遗憾。于是又将当时的测试内容让ChatGPT做了一遍,试图摸清国内外大语言模型在问答这一领域的实际差距,旨在希望国内产学研戒骄戒躁,稳扎稳打地发展。

测试方案

本次测试仅仅考虑非连续性的单次问答,且皆为常识性问题,答案唯一,但题目会有一定的挑战性。具体的,涉及到What,When, Where, Who, Which五类问题。

俄罗斯央行行长:加密货币不应该被用作国内结算方式:6月21日消息,据俄罗斯《生意人报》,俄罗斯央行行长纳比乌琳娜最近参加了圣彼得堡经济论坛,她在会上表示,我们的立场是,加密货币不应该被用作国内结算方式。至于在国际结算中使用,如果没有渗透到俄罗斯的金融系统中,是有可能的。其观点与俄罗斯金融管理局此前的立场相左。[2022/6/21 4:41:22]

问题样例如下:

1. “是什么(What)”型问题,如“爸爸的爸爸叫什么?”

2.“什么时候(When)”型问题,如“人们一般什么时候过元旦?”

3.“什么地点(Where)”型问题,如“孙中山安葬在哪里?”

4.“是谁(Who)型问题”,如“中国历史上第一个皇帝是谁?”

5.“哪?个(Which)型问题”,如“哪个洲是倒数第二小的洲?”

问答样例对比

敦煌研究院、卢浮宫等10大国内外博物馆在天猫首发2.5万件数字藏品:5月18日消息,在“5.18国际博物馆日”来临之际,国内外十大博物馆、图书馆旗舰店首次在天猫推出数字藏品。这些文物数字藏品一共20款,总量2.5万件。

据悉,此次共有国家图书馆、敦煌研究院、西安碑林博物馆、麦积山石窟、河南博物院、宫里的世界、国家大剧院、人民文学出版社·人文之宝、卢浮宫博物馆等10家博物馆、图书馆在其天猫旗舰店进行数字藏品的发行,首个中央媒体文创品牌“人民文创”也参与其中。所覆盖的文创数字藏品包括敦煌拾遗、资治通鉴、天龙八部-那伽、卢浮宫胜利女神等世界著名文物的二次文化创作。也有如世界经典名曲《春之圆舞曲》片段音乐数字藏品,记录并保存下这类“瞬间”的艺术。(中国日报网)[2022/5/18 3:24:16]

问题:“孙中山(孙文)安葬在哪里?”

ChatGPT:孙中山的遗体最初安葬在南京中山陵内,后因战乱多次迁移。最终于1929年安葬在南京中山陵北麓的紫金山下,此地现为孙中山陵园。

国内首个“区块链﹢新能源”专利获授权:近日,由国网宁夏电力、国网电商公司共同申请的区块链核心技术发明专利“基于区块链的新能源用电数据处理方法、装置及参与节点”成功获得国家知识产权局授权。为适应高占比大规模新能源出力体系,该专利首次构建了基于区块链技术与新能源出力特性相适应的交易模式,服务于新能源消纳高占比输出。该专利属国内首个“区块链﹢新能源”授权专利,是能源电力行业区块链核心技术自主创新的重要突破。[2020/11/17 21:02:05]

百度文心:孙中山墓地

某道:"孙文(1866年-1925年10月12日),名文,字载之,号仲立,又名帝光,广东省香山县(今中山市)南朗镇翠亨村人,1883年(光绪九年)随父移居澳门。1904年参加孙中山领导的同盟会,任同盟会南方支部书记。曾两次赴日,组织策划惠州起义。后回澳门发展组织,被选为中国同盟会南方总支部庶务部长。1905年春,与陈少白、朱执信等在香港成立兴中会,被举为评议部评议员,旋被派往南洋联络同志,协助筹办革命刊物《中兴日报》。1906年冬,孙中山在日本东京成立中国同盟会中部总会,被委为秘书。1907年奉命回国,在广东发动民军起义。事败后潜赴南洋,继续组织发动华侨、华工和留学生进行革命活动。1911年武昌起义爆发后,被派往广州协助筹划起义,不幸事泄被捕,不久在广州黄花岗就义。

动态 | 顺丰控股:通达国内外的物流网络包括区块链等组成的“信息网”:4月23日晚间,顺丰控股(002352)发布《关于公开发行可转换公司债券填补被摊薄即期回报措施和相关主体承诺的公告》,公告表示,公司已搭建了“天网+地网+信息网”三网合一的服务网络。通达国内外的庞大物流网络,包括以全货机+散航+无人机组成的空运“天网”,以营业服务网点、中转分拨网点、陆路运输网络、客服呼叫网络、最后一公里网络为主组成的“地网”,以及以各种大数据、区块链、机器学习及运筹优化、AI识别、智慧物流地图等组成的“信息网”,共同构筑了顺丰控股独具特点、高度稳定的综合性物流网络体系,为公司业务的不断扩张及货物的高效中转运输提供了强有力的支持。[2019/4/24]

源1.0:孙中山安葬在南京紫金山中山陵

问题:哪个洲是倒数第二小的洲?

ChatGPT:开始回答了错误的答案,与其对话后成功纠正(AMAZING!)

动态 | 国内首单区块链应收款ABN发布:据证券时报消息,银行间市场清算所(上海清算所)官网显示,8月17日,“浙商链融2018年度第一期企业应收账款资产支持票据”(简称“浙商链融”)成功发行,发起机构代理人为浙商银行,发行金额4.57亿元。据了解,这也是我国首单区块链应收款ABN,通过应收款链+证券化,实现引资金活水入实体经济另辟债市通途。[2018/8/20]

百度文心:南极洲

某道:南美洲,南美洲面积最大,但人口最多,人口占全球人口的1/5,因此南美洲是仅次于亚洲的世界第二大洲。南美洲位于东半球的南部,包括巴拿马运河以南的整个南美洲大陆。南美洲大陆东至圣赫勒拿岛(西经34°40'),西至马尔维纳斯群岛(西经61°10'),南至德雷克海峡,北至亚马孙河下游平原,南北相距约5100千米。南美洲大陆最南端是厄瓜多尔首都基多城。南美洲北部以安第斯山脉为界与北美洲相分,东部以乌拉尔山脉和太平洋为界与亚洲相邻,东南部经德雷克海峡与非洲相分,西部则与南极洲隔德雷克海峡相望。(摘自百度百科)“

源1.0:大洋洲

总体分析

四个系统对于基本问题的问答可谓是手到擒来(本次样例问题直接排除了简单的基本问题,挑战难度较高,因此整体错误率较高)。五类问题中,when问题和who问题整体回答的情况最好。三个国产系统中整体文心系统的表现最好。ChatGPT也会犯错,但是往往只要略微引导,便能改正错误。

错误回答分析

错误语句生成:语句本身并不通顺,前后主题不一致或者内容不一致,给人错乱的感觉。

例如问:爸爸的爸爸称谓是什么?

答:  爸爸的父亲,也就是爸爸的爷爷,是妈妈的爸爸。爸爸的爷爷的爸爸叫太爷爷。爸爸的爷爷的爷爷叫太奶爷(奶奶的爸爸)

或问:我们党二大在哪里召开?

答:1921年7月23日至31日,中国第二次全国代表大会在浙江省嘉兴市南湖的一艘游船上召开。出席大会的正式代表共13人,候补代表5人,代表全国121名员。共产国际代表马林、尼科尔斯基和鲍罗廷等参加了会议。

事实性错误:产生了事实性的错误。

例如问: 孙文去世的日子?

答:孙文去世的日子是1918年3月13日

偏见性素材:回答取自的素材较少,体现比较强的笔者的主观性。

例如问:大家什么时候过元旦?

答:谢邀。我是在大学过的,所以元旦是在宿舍过的。我们宿舍六个人,有四个人都回家了,剩下我一个在宿舍,所以元旦那天我过得比较孤独,不过还好啦,因为宿舍就我自己了,所以我可以一个人吃饭,一个人看电影,一个人逛超市,一个人睡觉,一个人......

含有逻辑性的问题无法识别:问题中存在复合问题或者逻辑判断,一般难以处理。

例如问:哪个洲是倒数第二小的洲?

答:" 南美洲,南美洲面积最大,但人口最多,人口占全球人口的1/5,因此南美洲是仅次于亚洲的世界第二大洲。南美洲位于东半球的南部,包括巴拿马运河以南的整个南美洲大陆。南美洲大陆东至圣赫勒拿岛(西经34°40'),西至马尔维纳斯群岛(西经61°10'),南至德雷克海峡,北至亚马孙河下游平原,南北相距约5100千米。南美洲大陆最南端是厄瓜多尔首都基多城。南美洲北部以安第斯山脉为界与北美洲相分,东部以乌拉尔山脉和太平洋为界与亚洲相邻,东南部经德雷克海峡与非洲相分,西部则与南极洲隔德雷克海峡相望。(摘自百度百科)

写在最后

飒姐团队认为,传统的单一问答模型可用性不大,给予用户的体验感也欠佳,国产大语言模型下一个里程碑,前辈ChatGPT已经给出了方向,便是对话问答。在使用ChatGPT的时候,虽然它也经常会给出错误答案,但是其回答的逻辑依旧符合人的习惯,同时经过一定的对话引导,可以自行发现其回答逻辑性的缺失。

作为全新的一种数据合成方式,大语言模型的直接输出可能是我们人类无法把控的,但是只要它能“理解”用户的输入,以此为依调整其输出,最后得到满意的回答,那便是可用的。进一步的,大语言模型未来的趋势很有可能是提前预判用户可能的“纠错”,并提前“自纠错”,并对纠错结果进行评估。

肖飒lawyer

个人专栏

阅读更多

金色早8点

金色财经

Odaily星球日报

欧科云链

澎湃新闻

Arcane Labs

深潮TechFlow

MarsBit

BTCStudy

链得得

标签:区块链HATCHAATG区块链dapp开发框架HATOK币MultichainKaratgold Coin

SAND热门资讯
如果大盘回调 哪些潜力小项目值得关注?

撰写:Minty 别人FOMO,我不追,在低洼地寻找宝藏项目。当 Crypto 中的所有东西都暴涨时,我们很难判断应该关注哪些低市值代币。于是,我列出了一些具有强大价值主张和催化剂的低市值项目,当价格回落时,我们不妨去考虑一下它们.

1900/1/1 0:00:00
比特币「新文化运动」:NFT 正增加网络用例、为矿工创收

图片来源:由 Maze AI 生成过去两周,一个名为 Ordinals 的 NFT 协议在比特币网络备受关注.

1900/1/1 0:00:00
NFT市场下一个风口:动态NFT机制与用例解读

2022 年,NFT 开始变得更加无处不在,成为资本的宠儿、链上世界的新星。Uniswap 一双袜子就卖了 16 万美元,推特创始人五个单词拍出 250 万美元,加密艺术家 Beeple 数字作品 “First 5000 Days”.

1900/1/1 0:00:00
Zhu Su的新加密债权市场OPNX 想来解救我的“被困”加密资产?

本文来自 decrypt,原文作者:André Beganski 2 月 12 日,三箭资本创始人最新推出的加密债权交易市场 Open Exchange(OPNX).

1900/1/1 0:00:00
ChatGPT:是平台的缪斯还是黑客的「MOSS」

图片来源:由 Maze AI 生成ChatGPT 的出现对当今的网络安全形式构成了一定的威胁。为什么这么说?ChatGPT 内置的代码生成器功能可以快速自定义生成符合攻击需求的初阶代码,对于菜鸟黑客来说是雪中送炭,对于老鸟来说也是锦上.

1900/1/1 0:00:00
金色观察 | 深度数据分析a16z加密布局:投资赛道和趋势

文/Crypto Koryo,加密分析师;译/金色财经xiaozou想知道加密领域接下来的机会在哪里吗?我们来关注下smart money(聪明的钱)都是怎么做的。a16z crypto是迄今最大的加密VC.

1900/1/1 0:00:00