范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

金融圈注意了!彭博研究人员刚推出BloombergGPT

  ChatGPT引爆的AI热潮也"烧到了"金融圈,彭博社重磅发布为金融界打造的大型语言模型(LLM)——BloombergGPT。
  3月30日,根据彭博社发布的研究报告显示,其构建了迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型——BloombergGPT。
  该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务,在执行金融任务上的表现远超过现有模型,在通用场景上的表现与现有模型也能一较高下。
  BloombergGPT到底有多强
  根据彭博发布的报告来看BloombergGPT对金融行业来说无疑是一次颠覆性创新。
  我们先来看一下BloombergGPT使用到的庞大数据集。
  研究人员利用彭博社现有的数据,对资源进行创建、收集和整理,构建了迄今为止最大的特定领域数据集,并创建了一个拥有超过7000亿个标签的大型训练语料库:彭博作为金融数据公司,数据分析师在公司成立的四十年间收集了大量的金融材料,拥有丰富的金融数据档案,涵盖了一系列的主题。
  我们将这些数据添加到公共数据集中,创建了一个拥有超过7000亿个标签的大型训练语料库。
  BloombergGPT的训练数据库名为FINPILE,由一系列英文金融信息组成,包括新闻、文件、新闻稿、网络爬取的金融文件以及提取到的社交媒体消息。
  为了提高数据质量,FINPILE数据集也使用了公共数据集,例如The Pile、C4和Wikipedia。FINPILE的训练数据集中约一半是特定领域的文本,一半是通用文本。为了提高数据质量,每个数据集都进行了去重处理。
  利用庞大的数据集,并基于通用和金融业务的场景进行混合模型训练,BloombergGPT诞生了。
  一般来说,在NLP领域,参数数量和复杂程度之间具有正相关性,GPT-3.5模型的参数量为2000亿,GPT-3的参数量为1750亿。
  根据BloombergGPT的训练结果显示,其在执行金融任务上的表现远超过现有的模型,且在通用场景上的表现与现有模型也能一较高下。
  BloombergGPT优势:不可替代性和准确性
  当下,通用NPL模型也可以处理金融领域的任务,那为金融圈"量身定制"的模型究竟有何意义?
  彭博认为,针对特定领域模型有其不可替代性且彭博的数据来源可靠:因彭博社的大多数应用均为金融领域,着手构建了一个针对金融领域的模型具有优势。
  除了构建金融领域的LLM外,本文的经验也为其他研究专用模型提供了参考。我们的方法是在特定领域和一般数据源上训练LLM,以开发在特定领域和通用领域上均表现优异的模型。
  此外,我们的训练数据不同于传统的网络爬取数据,网络上的数据总有重复和错误,但我们的数据来源可靠。
  而更重要的是,报告指出,通用NLP模型处理金融领域任务时会面临不少挑战,首先就是无法理解财经新闻背后的市场"情绪":
  以情感分析为例,一个题为"某公司将裁员1万人",在一般意义上表达了负面情绪,但从金融市场情绪来看,它有时可能被认为是积极的,因为这一做法可能提振投资者信心,使公司的股价上涨。
  从测试来看,BloombergGPT在五项任务中有四项(ConvFinQA,FiQA SA,FPB和Headline)表现最佳,NER(Named Entity Recognition)排名第二:测试一:ConvFinQA数据集是一个针对金融领域的问答数据集,包括从新闻文章中提取出的问题和答案,旨在测试模型对金融领域相关问题的理解和推理能力。
  测试二:FiQA SA,第二个情感分析任务,测试英语金融新闻和社交媒体标题中的情感走向。
  测试三:FPB,金融短语库数据集包括来自金融新闻的句子情绪分类任务。
  测试四:标题,数据集包括关于黄金商品领域的英文新闻标题,来判断新闻标题是否包含特定信息,例如价格上涨或价格下跌等。
  测试五:NER,命名实体识别任务,针对从提交给SEC的金融协议中收集金融数据,进行信用风险评估。
  对于ConvFinQA来说,这个差距尤为显著,因为它需要使用对话式输入来对表格进行推理并生成答案,具有一定挑战性。
  (注:GPT-NeoX为OpenAI GPT-3的一个开源替代品)
  BloombergGPT将助力新闻领域
  既然BloombergGPT测试中的表现如此优异,那未来可以怎么用?
  除了金融数据查询、回答金融相关问题,BloombergGPT未来可以被新闻领域广泛使用:BloombergGPT训练是以众多新闻为基础的,因此它未来将协助记者日常工作。
  记者需要为每个部分编写简短的标题,专门为此任务设计的模型维护成本太高,但BloombergGPT在这个方面表现优异。
  可以利用BloombergGPT更好的查询金融相关的知识。
  如,BloombergGPT能够很好地辨别公司的CEO。(虽然BloombergGPT正确地识别了CEO,GPT-NeoX出现了错误,FLAN-T5-XXL则完全未能识别)。
  对于这个或将颠覆金融圈的大型语言模型,部分网友并不买账,有人认为彭博此次只发布报告,不发布模型,颇有些"雷声大雨点小"之意。
  也有网友认为,彭博赶在愚人节之前发布,可能在"骗人"。
  ChatGPT为彭博点赞
  部分网友不买账,那ChatGPT怎么看?
  华尔街见闻就这件事专门询问了ChatGPT,ChatGPT认为BloombergGPT是一项很有意义的技术进步:它是专门为金融领域开发的一种语言模型,可以更好地处理金融领域的数据和任务,并且在金融领域的基准测试中表现出色。
  这将有助于金融从业者更好地理解和应用自然语言处理技术,促进金融科技的发展。同时,BloombergGPT还可以为其他领域的语言模型的发展提供参考和借鉴。总的来说,BloombergGPT是一个有益的技术创新。
  本文来自华尔街见闻,欢迎下载APP查看更多

一些网络直播会带坏小孩应禁止孩子是家庭的宝贝,孩子是父母的未来,孩子是国家的未来,孩子是担负国家前途的未来。自从有网络有直播平台,可是,但是,某些网络和直播,某些有姿色和容颜不顾自己丑陋动作,在平台上嗲声嗲气傅抱石的故园情作者周敏生(江西省新余市作协主席,文化学者)中国现代著名画家傅抱石以山水画名世,他祖籍江西新喻县(今新余市),一生曾数度回到故乡。淳朴热情的乡亲以浓浓的乡情,抚慰了游子的乡愁,也滋黄龙县公安局交通管理大队召开创文工作推进会阳光讯(李鹏记者郑玮)9月26日,黄龙县公安局交通管理大队召开创文工作推进会,会议由黄龙县公安局党委委员交警大队大队长胡小龙主持,大队领导班子各科所队负责人参加会议。会议传达了9月国办印发关于深化电子电器行业管理制度改革的意见据中国政府网9月23日消息,国务院办公厅日前印发关于深化电子电器行业管理制度改革的意见。全文如下国务院办公厅关于深化电子电器行业管理制度改革的意见国办发202231号各省自治区直辖婴儿水更营养健康?权威评测来了近几年不少商家开始售卖婴儿水或者将水标注为适合婴幼儿饮用并宣称这类水低钠含多种矿物元素等而在价格上这类水比一般的水普遍要贵婴儿水相比普通的水真的更营养更健康吗?来看看权威测评此前,迦南科技控股股东及非自然人股东拟合计减持不超过4公司股份北京商报讯(记者董亮丁宁)9月20日晚间,迦南科技(300412)发布公告称,公司控股股东迦南科技集团有限公司(以下简称迦南集团)非自然人股东南京比逊投资管理有限公司(以下简称南京守好沃土良田,筑牢粮仓地基9月19日,中共中央宣传部举行中国这十年系列主题新闻发布会。自然资源部介绍耕地保护的举措及成效。耕地是不可再生的稀缺资源,我国人多地少,更要倍加珍惜耕地资源,要像保护文物那样保护耕让科普更接地气日前印发的关于新时代进一步加强科学技术普及工作的意见,就做好新时代科普工作作出部署,对于推动新时代科普创新发展具有重要意义。科普是时代赋予科技创新的历史使命。此时,应多举措提高全民NASA成功撞击小行星防御地球还是昂贵的作秀?文观察者网李泽西探月发射计划连续鸽了多次的美国航天局NASA,终于有些好消息了它实现了人类历史上首次改变小行星轨迹的尝试。北京时间27日早上714,NASA和约翰斯霍普金斯大学应用美国花3亿美元测试航天器撞击小行星,图什么?美国宇航局的DART航天器与小行星Dimorphos碰撞之前示意图9月26日,星期一,美国国家航空航天局(NASA)的一艘航天器以极快的速度撞击了一颗小行星。这是一场史无前例的测试我国西南发现已知最早的长臂猿化石新华社昆明9月27日电(记者岳冉冉)古生物学家在云南元谋盆地发现了距今700万年至800万年的小型猿类化石,命名为元谋小猿,并证明这是已知最早的长臂猿。该成果已于近日发表在国际期刊
晶报社论记住,父母才是孩子真正的起跑线日前通过将于2022年1月1日起施行的中华人民共和国家庭教育促进法,持续引发热议。在这里,家庭教育是指父母或者其他监护人对未成年人实施的道德品质身体素质生活技能文化修养行为习惯等方汤普森换上勇士77号球衣!自称历史第77大巨星库里捂肚子笑嗨了北京时间10月24日,勇士球员德雷蒙德格林连续更新社媒,晒出了汤普森穿上77号球衣的画面。此前,他给汤普森准备了一件77号球衣,并挂在他的更衣柜里,恶搞汤普森无缘官方评选的76大球获清华特等奖学金,但她才不是别人家的孩子那么简单此文为高能E蓓子原创,禁止任何形式的转载,转载请后台联系,但欢迎你们转发到朋友圈。虽然奥运会已经落下帷幕,但是运动员的热度不减,相关话题接二连三冲上热搜,最近,新晋奥运会全运会双料不用看发布会,RedmiNote11新机参数全知道又是爆款的节奏?时间越来越接近10月28日,关于红米下一代爆款新机Note11的消息自然也是越来越多。从根本上来说,其实官方已经把基本的硬件参数全部给大家说完了。所以,如果有购买需求的同学,看完这小米12年内或只发一款!不止骁龙898,或带来最佳挖孔屏方案随着时间进入第四季度,关于各大手机厂商年底旗舰的消息也多了起来,其中小米12系列无疑是很多用户比较关心的。无独有偶,小米12系列近日也有了新的爆料消息。近日,网上曝光了一张疑似小米湖人猛龙交易方案!西亚卡姆布歇交易至湖人威少赴多伦多随着六连败的森林狼大胜湖人后,球迷们对威少正负值31的成绩单非常不满,可以说威少在场就是4打6,没错威少成了卧底。与此同时,湖人与猛龙的交易方案或许是帮助詹姆斯夺第五冠的唯一机会,欠钱也可以不还?2021年,有5类债务被视为无效,望周知现在人们欠钱的现象还是很普遍的,尤其是年轻人群体,2021年10月,中银消费金融联合时代数据发布的当代青年消费报告显示,1。75亿的90后里面,只有13。4的人是没有负债的。人们会不要让自己活得太累人生短暂,不要让自己活得太累。人生短短几十年,若身处此地,且能求超脱,这份沉甸甸的体验也只能自由地在自己的小天地里显出微笑而已。每天活得累了,就抱怨命运的不公?我常常抱怨父母的没有2021年自动集尘机器人对比测试!科沃斯石头追觅由利课代表致没有时间阅读长文的朋友们,我们本期选取了四款自动集尘扫地机器人进行对比评测,最终的各项测试成绩如下图。在清理能力方面,四款产品的表现趋于一致,完全可以满足家庭清洁场景。但是穷人家走出的奥运冠军,全运会乒超联赛表现力压陈梦孙颖莎穷人家的孩子早当家,这话有几分可信度?早当家与否不清楚,但有一点是可以印证的,那就是穷人家的孩子心智会比较早熟,因为从小就目睹了父母的不容易,幼小的心灵不经意便种下一颗种子要乖巧懂新疆男篮该出手了!阿的江已失信任,背锅教练才是最佳人选CBA联赛常规赛已经进行了四轮比赛了。而在四轮比赛过后,新疆男篮仅仅取得了1胜3负的糟糕战绩,排名更是联赛倒数第二。这样的成绩是许多新疆男篮球迷未曾想到的。赛季开始前,虽然大部分新