范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

大模型时代的危与机丨复旦大学计算机学院教授张奇

  张奇,现任复旦大学计算机科学技术学院教授、博士生导师。作为项目负责人承担了国家自然科学基金面上项目、国家自然科学基金重点项目子课题、863高技术发展计划子任务、 国家重点基础研究发展计划(973计划)、上海市教委、上海市科委、校企合作等30余项科研课题。发表论文共70余篇。中国中文信息学会钱伟长中文信息处理科学技术奖--汉王青年创新一等奖等奖项。
  "多模态大模型无所不能,使得人类深受震撼,这种模态融合文本、图像、视频或音频等作为输入或输出,满足了人们的多元化需求,不过很多使用者不知晓大模型的几个误区,模型所能到达的水平,以及小模型和大模型在工作流程和任务范式上的区别,有必要做一个简单清晰的梳理,来优化大模型应用效率。"以上分享来自于复旦大学计算机学院教授张奇以 《大模型时代的危与机》 为主题的演讲。
  在本次直播分享中,张奇教授以GPT核心技术、自然语言处理、算力上的不同,剖析了大模型的几个误区,模型的能力,小模型和大模型各自不同的任务范式和优势,并强调了能广泛使用的大模型可以应用的场景,以及如何操作处理的流程,以银行单位为案例,说明大模型还是在经济学和统计学的范畴,为从业者提供新的研究思路以供借鉴。
  以下是演讲摘要:
  01
  大模型的误区与能力   计算机领域相关从业者在面对一些问题时,样本数据集较为庞大,语言模型训练完成后,数据量只会有增无减。   张奇教授表示,"训练大模型是类似于火箭发射的大规模系统工程,像机器互联、模型参数存储等都有许多困难。团队认识的误区会导致大模型能力不足,成本也会有波动。因此,充分认识大模型建模过程中的几个误区十分有必要。"   1. 大模型的几个误区   大模型的任务能力通常需要较高的成本,并不主要依赖涌现,不同任务也会有知识和语言的区别。而且大模型的量级不一定必须满足千亿,人们可以做选择,有些模型任务范围是记录对世界知识的要求,具体量级需要依据情况而定。   张奇认为,在大模型的训练成本方面,通常训练LLM,一个直观的计算尺度是以达到模型预期效果所需消耗的训练token数量为计算总任务需求,结合GPU上训练过程中的token吞吐能力,计算满足要求训练过程中需要多少块GPU,进而推算成本。 目前任务实现的前提之一是需要高成本,以提升模型训练效率,所以任务能力也不主要依赖涌现。   同时,也不一定必须使用千亿大模型。 人们可以根据任务要求做出选择, 比如有些任务集是需要对世界知识有要求。   2、大模型的能力   大模型发展已经很长一段时间,从Facebook发布的百种语言互译的多语言预训练模型M2M-100开始,机器翻译领域实现新突破,Open AI的多模态模型,参数甚至达120亿,图像生成表现优秀,大模型的文本建模能力和任务泛化能力与日俱增。   大模型真正做的事情本质其实就是"文字接龙", 大模型采用了深度学习和自然语言处理技术,并且使用了大量的语料库进行训练 。   同时,现在的一些出色的大模型极大地改变了自然语言处理(NLP)领域,在模型训练中,数据包含互联网的海量无监督数据,用户反馈的信息,也有人们对大量未标记语料库进行的通用预训练,对少量的任务进行特定的微调,这样模型就可以预测人类问题的答案。   02
  小模型的工作流程和任务范式   小模型时代的工作流程是甲方提出需求给乙方,产品经理根据需求转换为机器学习问题,研发部门的人进行标注数据,然后建立训练模型,通过模型评测,确定最优化的模型进行部署。由于数据的不同,会产生N个小模型,模型较多。   "如果研发人员一直使用小模型,就面临着一些难点。比如任务开发成本高、时间周期长;相同任务的微小需求变化,需要以30%-70%的重新开发成本,导致无法产品化。并且模型开发和维护的成本较高,而人们还需正视高水平算法研究员稀缺的困境。"张奇说道。   小模型未来可能会由大规模语言模型构建,并且通用能力有所增强,比如阅读理解、情感分析、信息抽取、分类能力等,以满足特定任务需要,达成一个相对最优的结果。   张奇强调, 在未来,小模型的任务范式会发生巨大变化。使用自然语言对模型进行训练和使用将较为常见。   03
  大模型的优势更胜一筹   小模型在大模型面前可谓是小巫见大巫了,大模型优势明显。大模型有非常少量的算法研究员, 新任务可以快速训练,并且不需要模型重新部署,低成本产品化将成为一种趋势。   并且在金融方面,大模型的价值可以被进一步挖掘。大模型可以应用于银行,比如信贷辅助决策部门、公司债业务审核业务部门、智能客服业务部门、企业知识库建设业务部门和科技部门。在自然语音处理方面,相关专业人员可以抽取信息,贴标签,文本解析和做出情感分析,提高工作审核及决策效率。   1、大模型时代 挑战与机遇并存   大模型时代是从单个小任务的研究,转向一类问题统一框架研究, 人们面临一些关于"赢者通吃"理念的挑战,不紧跟步伐就会造成代差,并且不容易弥补。   对话交互方式已蔚然成风,先发优势较为明显,用户数据无法获取的情况下,追赶代价更大。不过NLP步入了发展的春天,从手工作坊转向蒸汽机时代,人工智能的Iphone时代就在眼前, 大模型发展越来越侧重于精细化发展, 比如面向B端私有化部署的"小模型"。   2、NLP研究重点出现迁移   大模型时代的NLP研究重点也有所迁移。比如领域大模型,大模型可控文本生成,大模型隐私,大模型鲁棒性评测与提升,超小规模任务模型构建,大模型推理能力构建等等。   不同的业务类型差别很大,例如大模型的长距离建模能力可以解决歧义问题,大模型的统一任务建模能力可以解决模型数量多,管理难的问题,而大模型的领域和任务泛化能力,可以解决领域迁移的问题。 重点是小模型不能解决的问题,大模型可以实现,AIGC即为更加智能化的存在。   3、更优化的大模型处理流程   最后,张奇还提到了,如何进一步实现大模型的自然语言处理问题?这个看似复杂难懂的问题。为更贴合于研发人员的实践需求,张奇教授提出一点意见。 从基础语言模型选择方面的要点到任务数据构造,再到类人类回答的函数的选择和训练,帮助研发者理清了发展思路。   本篇文章由对张奇教授在4月9日"未来科技的实现:AIGC、元宇宙和生物技术"主题直播中的演讲整理而生成。该系列主题活动的主办方为清博智能科技公司。   关注清元宇宙公众号,持续获取后续主题演讲内容~   排版:骆伟玲   图片源于Q仔互联网冲浪所得,若有侵权,后台联系,Q仔滑跪删除~

诗词起名印象加分深情厚意男宝宝名字名字就是一个人的名片,名片设计得出彩漂亮,赏心悦目,就会给人良好的印象,先声夺人。同样的名字起得烂俗,如梓宸,浩轩,泽宇等,这样的名字无法给予对方任何的新鲜感和探索欲,让人丝毫提不中国金茂前11个月销售额1374亿元,近期和两家银行签订合作协议12月7日晚间,中国金茂(00817。HK)披露11月份销售情况。公告显示,11月中国金茂及其附属公司取得签约销售金额约143亿元(其中包含如有长沙梅溪湖国际新城项目南京青龙山国际重庆市璧山区七塘镇将军村荣登全国乡村旅游重点村名单封面新闻记者李茂佳12月7日,文化和旅游部公布第四批全国乡村旅游重点村和第二批全国乡村旅游重点镇(乡)名单,重庆市璧山区七塘镇将军村荣登第四批全国乡村旅游重点村名单。重庆市璧山区七小脚裤下线了!这个秋天流行微喇裤穿搭,复古时髦又有个性这两天我整理了下,前几天发的内容,发现都没有专门写裤子的,今天就想给大家带来一些关于裤装穿搭的内容,在形形色色的裤子中,我发现一款特别时髦有个性的裤子,想要推荐给大家。相较于已经烂深度不躺平,赢一半浙商不怕变,怕的是不变。有变局才有机遇,才有新的发展可能。12月7日,大雪节气。近千位浙商钱塘江畔围炉纵论中国式现代化进程中的浙商新坐标。会上,对浙商有着数十年观察的浙江省第十二届新农民碰瓷碰出新业态村民正在景德镇御窑厂进行青花勾线绘图。资料图这是我第一次来景德镇,很想去一趟三宝国际陶艺村,看看那里的中国新农民是如何揽上瓷器活碰瓷碰出新生活的。11月中旬,在参加2022中国景德江苏徐州第一大制造业民企掌门人27岁任厂长,已年进账171。32亿徐州,江苏省辖地级市,是江苏省面积第二大城市,淮海经济区第一大城市,东陇海线第一大城市,苏北第一大城市,也是中国第二大铁路枢纽,是江苏省的北大门。2021年,徐州全市实现地区生产总坚持特卖的唯品会,正不断丢失活跃用户图片来源图虫在电商江湖,不显眼的唯品会(VIPS。N)却在偷偷赚钱。2022年第三季度,唯品会实现营收216亿元,同比下滑13。3归母净利润17亿元,同比增长168。4。从2012腺样体肥大娃两周半的时候,发现他睡觉打鼾,夜里睡觉经常会惊醒,睡眠很浅,一直不能睡整觉,抖音上很多腺样体肥大的视频,感觉很像腺样体肥大的症状,带娃去当地儿童医院看,网上挂号预约,但还是100当年父母爱情败给了辣妈正传,9年后后者却早已无人问津说起正午阳光,我们自然而然想到的便是琅琊榜伪装者知否等这些脍炙人口的经典剧,而或许大家还忽略了他们9年前的这部父母爱情,作为正午阳光出品的电视剧,尤其是金牌导演孔笙的杰作,这部剧的广东露营亲水地图发布,35处亲水魅力露营地等您来体验近日,广东省水利水电科学研究院(河长制研究院)正式发布首个以露营亲水为主题的全省性便民地图广东露营亲水地图。该地图综合运用创新性的亲水指数评价体系,考虑安全生态便捷人气等因素,遴选
纠正清退超龄农民工,释放政策善意新京报快评2021年5月4日,建筑工人在天津某工程现场施工。图新华社针对当下建筑行业纷纷下达超龄农民工清退令的做法,近期,四川省住建厅省人社厅发出通知,要求各地要尊重超龄农民工就业需求和企业救命!苹果14发货时间居然超6周,溢价严重,为什么我们还在买?近两月,我们频频能看到苹果的身影出现在社会舆论的上端,理由只有一个新产品即将发售。而这个新产品目前以开始预售。和以往的预售不同,这一次的发货时间竟然比双十一更加长,最多的长达67周关于社保缓缴政策,四部门有新通知据国家税务总局9月23日消息,为进一步落实好关于扩大阶段性缓缴社会保险费政策实施范围等问题的通知(人社部发202231号)要求,切实发挥阶段性缓缴社会保险费政策效果,促进保市场主体盘点10月最佳旅行地,在最美的时间,邂逅最美的秋景眨眨眼,黄金十月即将来临。这是一年中最好的出游时节,最适合追着秋风,在大街小巷远山乡野,去寻找最美秋意啦十月,去趟茅兰沟这个养在深闺的森林氧吧,在深秋时节,也换上流光溢彩的秋装,嫣王楚钦已跃居男乒第二,孙颖莎已滑落到第四,这以后还能搭档不?在国乒中有两位球员格外受球迷关注,他俩不仅是男女乒未来的顶梁柱还是最好的黄金搭档,相信说到这不少人猜出了他俩是谁,一个是男乒的未来接班人王楚钦,另一个就是女乒的人气王孙颖莎,但是他单欢欢真不给谢晖面子!坚持不肯向大连服软,已拒绝降薪签新合同单欢欢这段时间成为了大连队焦点球员,让他感到郁闷的是自己成为焦点,并不是场上表现有多出色。单欢欢引起大连队球迷注意,就是他坚持不肯降薪签订新合同。当初,单欢欢来大连队效力时,正好赶谁是NBA新赛季联盟第一人?帕金斯ESPNCBS的看法是一致的NBA新赛季快要开始了,业界人士又开始了一年一度的球星排行评选,在目前出炉的几个榜单中,虽然巨星们的整体排名差异很大,但在联盟第一人的评选中却达成了一致。知名媒体CBS率先推出自己美国成立6G技术联盟,试图打压华为发展,外媒华为没有机会了?本文原创,禁止抄袭,违者必究在华为5G研发成功并且正式商用之前,在通讯领域,美国一直遥遥领先,从2G3G到4G美国一直是通讯领域的领头羊,然而在5G领域却接连受挫,而且好多次爆出美中超资讯!领头羊爆冷输球,山东队重燃夺冠希望,李金羽下课危机北京时间9月24日,中超第17轮的补赛,一共有四场比赛进行,非常精彩,没想到中超也能够踢出如此刺激的较量,让球迷大呼过瘾,让我们看看发生什么。首先说说领头羊武汉三镇和保级球队沧州雄美国故意制造危机,在全球捞取大量利益,却被中国捞到最大好处美国挑起俄乌冲突后,捞到了许多好处,比如能源价格暴涨,美国能源公司赚疯了,仅一艘LNG大船开往欧洲就能赚上亿美元。又比如大量军火畅销西方赚得盆满钵满,最重要的是利用乌克兰持续消耗了本赛季最令人失望的三支中超球队竞技赛场每一年都会有众多得意与失望的球队,在中超赛程即将过半的时候,我们来盘点半程最令人失望的三支队伍。第一,深圳队。深圳队今年赛季开始前出现了一些不小的风波,一度以为参加本赛季的