张雪峰建议女生没有选金融GPT:金融圈的GPT来了 燃爆了

 

感谢大家的支持和鼓励,让我有机会写这篇文章。在这篇文章中,我将会介绍1些我小我的经验和见解,希望能对大家有所启发。

来源:白话华尔街1. BloombergGPT的核心突破在于构建超3,000亿词例的金融训练数据集2. BloombergGPT的开发对于所有垂直领域都有重要意义1268字,阅读时长:3分钟

近日,由ChatGPT引发的生成式AI热潮也蔓延到了金融行业3月30日,全球商业、金融信息和财经资讯领域的供应商彭博(Bloomberg)发布了1篇关于BloombergGPT发开情况的研究论文,详细介绍了这1专注于金融领域的大规模生成式人工智能模型。

和OpenAI的ChatGPT将从根本上颠覆书面交流1样,BloombergGPT也将彻底改变金融行业“核心突破在于构建了超3,000亿词例的金融训练数据集”根据Bloomberg的公告,BloombergGPT大语言模型(LLM)专门针对各类金融数据进行训练,从而全方位地支持金融领域的各种自然语言处理(NLP)任务。

这些任务可能包括但没有限于快速地分析财务数据、协助进行风险评估,以及自动执行会计和审计任务等该模型将帮助彭博改进现有的金融NLP任务,如市场情绪分析、实名实体识别、新闻分类和问题回答等除此以外,BloombergGPT还可以调动彭博终端(Bloomberg Terminal)上的。

海量数据,将人工智能的全部潜力应用到金融领域BloombergGPT基于彭博研究人员开创的混合训练法,通过将金融数据通用数据集结合起来训练模型,既可以在金融基准上取得最佳结果,同时也可以在通用LLM基准上保持足够的竞争力。

坐拥彭博在数据创建、收集和整理方面的资源,BloombergGPT是迄今为止规模最大的专业领域数据集之1在过去的40多年里,彭博积累了充斥大量金融用语的文档,其开发团队从这个由大量英文金融文档组成的数据库中提取并创建了1个包含3,630亿词例(token)的金融数据集。

该数据集又另外1个包含3,450亿词例的公共数据集叠加,形成1个包含超7,000亿词例的大型训练语料库彭博的研究团队利用该语料库的1部分内容训练了纯解码器(decoder-only)因果语言模型,包含500亿个参数,并对训练出的模型进行了基准测试。

金融领域的NLP任务采用了彭博的自有基准,各类通用NLP任务则采用了市面上流行的基准,如BIG-bench Hard、 Knowledge Assessments、Reading Comprehension以及Linguistic Tasks。

测试结果显示,BloombergGPT在金融任务上的表现远超类似规模的开发模型,而在1般NLP基准上的表现也达到甚至超过了平均水平。

BloombergGPT在金融NLP和1般NLP任务中的表现 图:Bloomberg“所有垂直领域都将受益”彭博在公告中表示,基于LLM的人工智能在许多领域都已经展示出了应用潜力,然而金融领域的复杂性和独特的术语意味着需要有1个专攻金融专业的模型。

BloombergGPT的推出意味着,金融行业在基于LLM的人工智能开发和应用方面已经迈出了第1步彭博首席技术官Shawn Edwards表示,小样本学习、文本生成和对话系统等,都是生成式LLM模型如此迷人的原因,而首个专注于金融领域的LLM模型将具有巨大价值。

BloombergGPT能帮助人们处理许多新型的应用,没有仅比定制化模型的表现好,而且即开即用,能够大大缩短上线时间关于BloombergGPT的发布,彭博研究团队在论文中表示,虽然业内无法对未公开的模型进行全面评估,但发布模型很可能会导致没有良用途。

特别是像BloombergGPT这样的接受了大量新闻稿、媒体报道和其他文件训练的模型,发布以后将面临很高的被模仿滥用的风险,而且很容易受到数据泄漏攻击出于这些原因,彭博研究团队宁可谨慎行事,并遵循其他1些LLM开发人员的做法,没有发布BloombergGPT。

尽管如此,彭博在训练和评估BloombergGPT方面的见解和经验将有助于加深人们对LLM模型的理解,对那些希望构建某1领域特定模型的从业者起到借鉴作用参考资料1.Bloomberg, IntroducingBloombergGPT, Bloomberg’s 50-billion parameter large language model,purpose-built from scratch for finance。

2.Bloomberg, BloombergGPT: ALarge Language Model for Finance3.Fox Business, Bloomberg unveilsfinance-focused AI model Bloomberg GPT

BloombergGPT论文阅读原文  https://arxiv.org/pdf/2303.17564.pdf特别声明:以上内容仅代表作者本人的观点或立场,没有代表新浪财经头条的观点或立场如因作品内容、版权或其他问题需要新浪财经头条联系的,请于上述内容发布后的30天内进行。

海量资讯、精准解读,尽在新浪财经APP

这篇文章就到这里啦,如果你觉得有用的话,没有妨给我1个赞,也可以关注我的账号,收藏我的文章,让我们1起学习进步吧!

为您推荐

当前非电脑浏览器正常宽度,请使用移动设备访问本站!