宇宙链 宇宙链
Ctrl+D收藏宇宙链
首页 > DOT > 正文

金融圈注意了 BloombergGPT来了

作者:

时间:1900/1/1 0:00:00

ChatGPT引爆的AI热潮也“烧到了”金融圈,彭博社重磅发布为金融界打造的大型语言模型(LLM)——BloombergGPT。

3月30日,根据彭博社最新发布的报告显示,其构建迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型——BloombergGPT。

报告显示,该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务。该模型在金融任务上的表现远超过现有模型,且在通用场景上的表现与现有模型也能一较高下。

一般来说,在NLP领域,参数数量和复杂程度之间具有正相关性,GPT-3.5模型的参数量为2000亿,GPT-3的参数量为1750亿。

巴勒斯坦金融管理局考虑推出数字货币:金色财经报道,巴勒斯坦金融管理局正在研究发行一种数字货币的可能性。据悉,根据1990年代与以色列的协议,巴勒斯坦人同意不立即创建自己的货币,他们的经济主要使用以色列谢克尔、约旦第纳尔和美元。以色列限制了巴勒斯坦银行每月可以汇回以色列的谢克尔数量,因此他们有时不得不借钱来支付给第三方的外汇支付。巴勒斯坦金融管理局行长Feras Milhem表示,目前有两项关于加密货币的研究正在进行中,尚未做出任何决定,但希望最终将数字货币用于“国家的支付系统,并希望与以色列和其他国家一起用于实际支付”。[2021/6/24 0:04:15]

关于BloombergGPT

报告指出,研究人员利用彭博社现有的数据,对资源进行创建、收集和整理,通过构建迄今为止最大的特定领域数据集来完成BloomberGPT,并基于通用和金融业务的场景进行混合模型训练:

央行:在中俄金融合作分委会框架下,双方就数字货币等问题进行了交流:中国央行:6月22日,中国人民银行副行长范一飞在中俄金融合作分委会框架下与俄罗斯财政部部长西卢阿诺夫、俄罗斯央行副行长波特扎金等举行会谈。双方主要就宏观经济金融形势、数字货币和金融市场发展等问题进行了交流。[2021/6/23 0:00:14]

彭博社主要是一家金融数据公司,数据分析师在公司成立的四十年的时间里收集了大量的金融文件,拥有广泛的金融数据档案,涵盖了一系列的主题。

我们将这些数据添加到公共数据集中,以创建一个拥有超过7000亿个标签的大型训练语料库。

使用这个训练语料库的一部分,我们训练了一个具有彭博风格的,达500亿参数的模型,该模型是根据Hoffmann和Le Scao等人的指导方针设计,基于通用和金融业务的场景进行混合模型训练。

谢平:疫情为金融科技发展奠定基础,体现在区块链金融应用项目开始落地:3月30日,由北京立言金融与发展研究院发起的“北京金融科技创新与发展研讨会”在线成功举办,北京金融科技研究院院长谢平认为,疫情没有阻止金融科技的发展,反而促进了个人大数据整合和线上办公的应用,为今后金融科技发展奠定了非常好的基础。具体主要体现在包括:区块链金融应用项目开始落地,中国人民银行贸易金融区块链平台和外管局跨境金融区块链平台运行良好;北京金融科技监管沙箱试点工作顺利进行,其核心是如何与金融监管部门的市场准入政策进行衔接。(新浪财经)[2020/4/1]

结果表明,我们的混合训练方法使我们的模型在金融任务上的表现大大超过了现有的模型,而在通用场景上的表现则与之相当甚至优于现有模型。

动态 | SB101尚未就日本金融厅警告作出任何回应 将导致事态严重化:据Coinpost消息,日本金融厅在15日以“未注册登记进行虚拟货币交换业务”为由对虚拟货币交易所SB101发出警告。截至发文,SB101尚未对该警告作出任何说明,其日本版界面仍可正常访问,Coinpost举例称2018年初币安在收到金融厅警告后迅速发表了官方声明,随后删除了日本版界面并禁止日本地区用户登陆。与币安的回应相比,SB101至今没有任何动作,或将导致事态严重化。[2019/2/19]

1.BloombergGPT优势:特定领域模型仍有其不可替代性且彭博数据来源可靠

在论文中,彭博社指出,现阶段,通用的自然语言处理模型可以涵盖许多领域,但针对特定领域模型仍有其不可替代性,因彭博社的大多数应用均为金融领域,着手构建了一个针对金融领域的模型尤其优势,同时可以在通用LLM基准测试上保持竞争力:

新加坡金融管理局:投资加密货币风险大应谨慎:比特币等加密货币价格近日飙升,以致越来越多人有意投资。新加坡金融管理局提醒公众在投资加密货币时应该非常谨慎考虑,并充分了解相关风险。金管局昨天发文告说,当局认为加密货币飙涨是由投机活动所带动。“价格大幅下滑的风险很高。加密货币投资者应该了解,他们是有可能失去所有本金。”[2017/12/20]

除了构建金融领域的LLM外,本文的经验也为其他研究领域的专用模型提供了参考。我们的方法是在特定领域和一般数据源上训练LLM,以开发在特定领域和通用基准上表现优异的模型。

此外,我们的训练数据不同于传统的网络爬取数据,网络上的数据总有重复和错误,但我们的数据来源可靠。

2.BloombergGPT的训练数据集:

BloombergGPT的训练数据库名为FINPILE,由一系列英文金融信息组成,包括新闻、文件、新闻稿、网络爬取的金融文件以及提取到的社交媒体消息。

为了提高数据质量,FINPILE数据集也使用了公共数据集,例如The Pile、C4和Wikipedia。FINPILE的训练数据集中大约一半是特定领域的文本,一半是通用文本。为了提高数据质量,每个数据集都进行了去重处理。

对金融领域的理解更准

报告指出,在金融领域中的自然语言处理在通用模型中也很常见,但是,针对金融领域,这些任务执行时将面临挑战:

以情感分析为例,一个题为“某公司将裁员1万人”,在一般意义上表达了负面情感,但在金融情感方面,它有时可能被认为是积极的,因为它可能导致公司的股价或投资者信心增加。

报告指出,从测试来看,BloombergGPT在五项任务中的四项(ConvFinQA,FiQA SA,FPB和Headline)表现最佳,在NER(Named Entity Recognition)中排名第二。因此,BloombergGPT有其优势性。

测试一:ConvFinQA数据集是一个针对金融领域的问答数据集,包括从新闻文章中提取出的问题和答案,旨在测试模型对金融领域相关问题的理解和推理能力。

测试二:FiQA SA,第二个情感分析任务,测试英语金融新闻和社交媒体标题中的情感走向。

测试三:标题,数据集包括关于黄金商品领域的英文新闻标题,标注了不同的子集。任务是判断新闻标题是否包含特定信息,例如价格上涨或价格下跌等。

测试四:FPB,金融短语库数据集包括来自金融新闻的句子情绪分类任务。

测试五:NER,命名实体识别任务,针对从提交给SEC的金融协议中收集金融数据,进行信用风险评估。

对于ConvFinQA来说,这个差距尤为显著,因为它需要使用对话式输入来对表格进行推理并生成答案,具有一定挑战性。

ChatGPT为彭博点赞

华尔街见闻就这个问题专门询问了ChatGPT,ChatGPT认为BloombergGPT是一项很有意义的技术进步:

它是专门为金融领域开发的一种语言模型,可以更好地处理金融领域的数据和任务,并且在金融领域的基准测试中表现出色。

这将有助于金融从业者更好地理解和应用自然语言处理技术,促进金融科技的发展。同时,BloombergGPT还可以为其他领域的语言模型的发展提供参考和借鉴。总的来说,BloombergGPT是一个有益的技术创新。

华尔街见闻

媒体专栏

阅读更多

金色财经 善欧巴

金色早8点

白话区块链

欧科云链

Odaily星球日报

Arcane Labs

MarsBit

深潮TechFlow

BTCStudy

链得得

标签:GPTERGLOOMBERTruthGPT (ETH)ICEBERGloom币是什么币Berkshire

DOT热门资讯
美国政府是否主导了加密友好银行倒闭

近期,加密友好银行Silvergate、SVB和Signature相继关闭,让持续低迷的加密行业雪上加霜,多数人认为加密友好银行的倒闭是银行遭到挤兑,但也有人持不同观点,认为是美国政府从中作梗,通过摧毁加密友好银行打击加密行业.

1900/1/1 0:00:00
金色观察 | 23日空投 Arbitrum TVL、协议收入、交易量等最新情况概览

文/TJ Keel,TheTIE EEResearch;译/金色财经xiaozou 1、$ARB Arbitrum将于3月23日向社区分配其ARB代币总供应的12.75%,另外还将向DAO金库分配43%,由代币持有人直接管理.

1900/1/1 0:00:00
暂停巨型人工智能实验 马斯克、ChatGPT之父、图灵奖得主等全球大佬都签了

3月22日,生命未来研究所 (Future of Life) 向全社会发布了一封《暂停大型人工智能研究》的公开信,呼吁所有人工智能实验室立即暂停比GPT-4 更强大的人工智能系统的训练,暂停时间至少为 6个月.

1900/1/1 0:00:00
多生态 LSD 发展报告:赛道很宏伟 项目很早期

作者:waynezhang.ethTwitter:/img/2023525204426/0.jpg" /> 一、BNB Chain BNB ChainBNB 目前的质押状态跟以太坊类似.

1900/1/1 0:00:00
肖飒:AIGC创业 有哪些法律禁忌?

自chatGPT火遍全球之后,各国又掀起了一波AI领域的创业潮。马斯克在采访中也强调人工智能的发展可能会给人类带来空前灾难。结合欧盟人工智能法律提案和我国诸多法规,飒姐团队给诸位创业者一些法律提示。希望大家的创新应用能够开花结果.

1900/1/1 0:00:00
Gearbox V3即将发布 一文速览升级细节

原文:《Gearbox V3 能否重塑杠杆和借贷?》撰文:Karen,Foresight NewsDeFi 可组合型杠杆协议 Gearbox Protocol于本周预告 V3 版本升级细节.

1900/1/1 0:00:00