范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

通用视觉GPT之战打响!智源推出SegGPT,批量抠图神器来了

  智东西
  作者 | ZeR0
  编辑 | 漠影
  智东西4月8日报道,继ChatGPT掀起语言大模型狂潮后,本周,计算机视觉迎来了GPT时刻。先是周四Meta发布"分割一切"模型SAM,紧接着智源研究院视觉团队也推出通用分割模型SegGPT(Segment Everything In Context)。
  SegGPT可用于分割上下文中所有事物,是首个利用视觉提示(prompt)完成任意分割任务的通用视觉模型。SegGPT与SAM的差异在于 :
  (1)SegGPT "一通百通":给出一个或几个示例图像和意图掩码,模型就能明白用户意图,"有样学样"地完成类似分割任务。用户在画面上标注识别一类物体,即可批量化识别分割同类物体,无论是在当前画面还是其他画面或视频环境中。
  (2)SAM"一触即通":通过一个点或边界框,在待预测图片上给出交互提示,识别分割画面上的指定物体。
  无论是"一触即通"还是"一通百通",都意味着视觉模型已经"理解"了图像结构。
  SAM精细标注能力与SegGPT的通用分割标注能力相结合,能把任意图像从像素阵列解析为视觉结构单元,像生物视觉那样理解任意场景。
  论文地址:https://arxiv.org/abs/2304.03284
  代码地址:https://github.com/baaivision/Painter
  Demo:https://huggingface.co/spaces/BAAI/SegGPT
  一、目标是分割一切物体,三大优势加持
  SegGPT是智源通用视觉模型Painter的衍生模型,针对分割一切物体的目标做出优化。
  训练完成后,无需微调,只需提供示例,SegGPT就能自动推理并完成对应分割任务。
  具体来看,SegGPT模型具有以下优势能力:
  1、通用能力:SegGPT具有上下文推理能力,模型能够根据提供的分割示例(prompt),对预测进行自适应的调整,实现对"everything"的分割,包括实例、类别、零部件、轮廓、文本、人脸、医学图像等。
  2、灵活推理能力:支持任意数量的prompt;支持针对特定场景的tuned prompt;可以用不同颜色的mask表示不同目标,实现并行分割推理。
  3、自动视频分割和追踪能力:以第一帧图像和对应的物体掩码作为上下文示例,SegGPT能够自动对后续视频帧进行分割,并且可以用掩码的颜色作为物体的ID,实现自动追踪。
  二、应用示例:批量"抠"出彩虹、行星环带
  1、标注出一个画面中的彩虹,SegGPT就能批量化分割其他画面中的彩虹。
  2、研究人员在广泛的任务上对SegGPT进行了评估,包括少样本语义分割、视频对象分割、语义分割和全景分割。
  下图中具体展示了SegGPT在实例、类别、零部件、轮廓、文本和任意形状物体上的分割结果。
  3、用画笔大致圈出行星环带。
  SegGPT在预测图中准确输出目标图像中的行星环带。
  4、根据用户提供的宇航员头盔掩码这一上下文。
  SegGPT能够在新的图片中预测出对应的宇航员头盔区域。
  三、训练思路:定义为上下文着色问题,多项技术解锁分割能力
  SegGPT将各种分割任务统一到一个通用的上下文学习框架中,通过将各类分割数据转换为相同格式的图像来统一各式各样的数据形式。
  其训练被定义为一个上下文着色问题,每个数据样本都有随机的颜色映射,以根据上下文完成不同的任务,而非依赖于特定的颜色。
  经训练,SegGPT可以通过上下文推理在图像或视频中执行任意分割任务,如物体实例、类别、零部件、轮廓、文本和任意形状物体等。
  如何通过test-time techniques解锁各种能力是通用模型的一大亮点。
  SegGPT论文中提出了多个技术来解锁和增强各类分割能力,比如下图所示的不同的context ensemble方法。论文所提出的Feature Ensemble方法可以支持任意数量的prompt示例。
  此外,SegGPT还支持对特定场景优化专用prompt提示。对于针对性的使用场景,SegGPT可以通过prompt tuning得到对应prompt,无需更新模型参数来适用于特定场景。
  比如,针对某一数据集自动构建一个对应的prompt,或者针对一个房间来构建专用prompt。如下图所示:
  结语:强大零样本场景迁移能力,经典CV数据集上取得最优性能
  模型只需少数prompt示例,在COCO和PASCAL数据集上取得最优性能。
  SegGPT显示出强大的零样本场景迁移能力,比如在少样本语义分割测试集FSS-1000上,在无需训练的情况下取得state-of-the-art性能。
  无需视频训练数据,SegGPT可直接进行视频物体分割,并取得和针对视频物体分割专门优化的模型相当的性能。
  以下是基于tuned prompt在语义分割和实例分割任务上的效果展示:
  SegGPT在广泛的任务中进行了评估,包括少数照片的语义分割、视频物体分割、语义分割、全景分割。结果显示,在对域内和域外目标进行分割时,无论是质量还是数量都有很强的能力。
  随着SAM和SegGPT两款图像分割基础模型的发布,通用视觉GPT曙光乍现。

娱圈揭秘郑少秋的4个女儿同是一个爹差距却很大,网友太残酷在娱乐圈工作的明星夫妇们因为工作非常繁忙,而且经常需要全球各地到处飞,所以因聚少离多而无奈分开的情况实在多见。也有很多明星在结束第一段婚姻之后,很快会遇到自己的第二段感情,但这对孩乾隆去世后,嘉庆将和珅赐死了,那么纪晓岚结局怎么样?导语古代皇帝需要什么?当然是衷心了,更何况古代皇室对帝位的追求可谓是十分血腥的,各位皇子为了争夺皇位,必定会拉拢一些人。当一位新的皇帝登基时,朝堂之上的大臣,会逐渐地被替换掉,甚至后天霜降秋天最后1个节气来了,这7件伤肾的事,记得别再做了不知道大家有没有觉得,秋分过后,天气明显开始变冷,动不动就口鼻发干咽痛咽痒膝盖发凉心烦气躁腰腿酸软小便明显多了这些表现都是在提醒你,肾的能量不足了。为什么呢?主要是今年的天地能量对33分24篮板,离开詹姆斯全面爆发,湖人亏到家,威少要背锅常规赛第二个比赛日有22支球队进行比赛,其中失去威少的奇才队客场挑战猛龙,这是一场很受关注的比赛,毕竟奇才有很多新援加入,其中就有被湖人抛弃的库兹玛,更有被篮网抛弃的丁威迪。比尔是与光阴把酒,与往事倾杯,与岁月言欢一直觉得,光阴是一把慢刀,总是一层一层地割伤多情的男女。也一直相信,文字是一剂良药,又总是一寸一寸地治愈心的期许。我想象,那个秋霜泛白的时候,你便是那长风古道边静静写诗的女子,素心静中无妄念,忙里有欢喜,度四季渡自己你每日辛劳人群拥堵,我日日绘画一样碌碌你说人生无趣处处算计,我想处处计算皆为人生光阴里的凉薄和温存,都需要自己忘记和感恩,有残缺方才真切,有软弱方见率真。01hr总该有那么一两个早毛周邓三位伟人最为霸气的话,比比谁的更霸气?毛泽东1。妨碍渡江,均可轰击。背景1949年回复粟裕英国军舰紫石英号妨碍我军渡江作战时的电报结果人民解放军炮击英国紫石英号,紫石英号搁浅投降渡江部队炮击紫石英号,紫石英号官兵排队投莫兰特狂砍3766!灰熊开门红,神塔11投全中,探花首秀1796北京时间10月21日,灰熊队在主场以132121击败骑士队,取得新赛季开门红。这场比赛两队的投篮命中率都很高,在首节比赛,两队均拿到32分,平分秋色。而进入次节,灰熊队开始发力,他官宣禁赛!干起来了!西蒙斯被里弗斯赶出球场最近很多球员与球队产生矛盾,用一句话形容他们天下硬气共一石,周琦独占八斗,欧文占两斗,至于西蒙斯,天下欠他一斗。为什么这么说呢?一方面是因为西蒙斯总觉着全天下都欠他的,另一方面是因李云迪被行拘彻底翻车!回看哥哥反差太大,应采儿也在线吃瓜饿了吗?戳右边关注我们,每天给您送上最新出炉的娱乐硬核大餐!10月21号晚,北京警方发布通报,39岁李云迪嫖娼被查获,对违法事实供认不讳,已被依法行政拘留。消息一出,网友们简直惊呆林依晨产下一女!女星为了怀孕有多拼?打上千针吞蛤蟆喝鸽血林依晨生产了!10月20日,台媒曝光林依晨已于前一日顺利产下天秤座宝宝。经纪人随后也证实她生了个女儿,母女平安。自从9月底林依晨在个人社交媒体发文宣布自己怀孕的好消息后,大家就翘首
2022年最后一天小米再出招,仅699元的国民入门手机发布!今天一过,我们就要正式和2022年说再见了。而令人没想到的是,就在2022年的最后一天,小米竟然又发布了一款新机红米12C,熟悉红米机型型号的朋友不难看出,这款红米12C的定位是低龙虎榜华泰证券放量大跌6。67三机构合计卖出1。42亿元1月3日,华泰证券低开低走,截至收盘报11。89元,收跌6。67,全天成交金额超20亿元。盘后龙虎榜数据显示,沪股通卖出2。3亿元并买入5765万元,三机构合计卖出1。42亿元,中计算机行业年度策略新周期,新起点(报告出品方华泰证券)计算机周期上行的起点我们认为,目前计算机行业处于多个变量周期上行的起点,展望2023年计算机行业整体有望迎来上行周期。上行周期的变量包括1)下游需求,2)业绩李子柒回归,掌握IP有多重要?张思滢(重庆大学)消失接近600天后,头部网红李子柒复出。杭州微念品牌管理有限公司与李子柒达成和解。以打造李子柒IP为主的四川子柒文化传播有限公司发生股权变更。微念持股比例减至1,Fintech周报蚂蚁消金获批增资至185亿元富途老虎境内证券业务被认定非法Fintech周报是由钛媒体TMTpost发布的特色产品,将整合本周最重要的金融科技行业的监管政策行业动态。监管动态金融稳定法草案首次提请全国人大审议据新华社消息,12月27日,金重磅!天津民营企业百强年度榜单发布,静海区多家企业上榜!2022年12月30日,由天津市工商联天津市发展改革委天津海河传媒中心共同主办的第十一届天津市民营企业健康成长工程发布会隆重举行。会上发布了本届健康成长工程榜单及研究报告。其中,静电子产品对人体的辐射SAR测试的秘密在科技产品日益发展的今天,无数的通讯产品围绕我们的生活,随着越来越多的电子产品的涌入,辐射成为人们倍感关注的问题,尤其是我们日常使用的手机电脑平板等电子产品,它们日夜陪伴在我们的身苹果将iPadmini3标记为过时产品,iPad9为新机让路跌至白菜价2023年1月4日,近日,苹果正式将iPadmini3标记为过时产品,标志着苹果最受欢迎的iPad之一的正式终结。苹果不再提供硬件服务。值得一提的是,由于iPad10新机的上市,导海乐集丨产品效果到底怎么样?HIGHLOGEE海乐集的抗皱奢宠铂金到底有没有效果作为一个源自美国的私人高端定制护肤品牌,专研的全球首个适合亚洲30岁女性肌肤的海乐集奢宠铂金系列,在抚平面部岁月痕迹方面,有着性广州车展一场自动驾驶的狂欢?有车连方向盘都不要了!以新科技新生活为主题的第20届广州车展,正式拉开帷幕。展馆更加紧凑,亮点也更显集中。相比起近年车展上铺天盖地的电气化新品,本次车展各家企业的自动驾驶成果显然更加抢占眼球。智能化已成全球企业研发哪家强?华为排第4,千亿投入超过苹果三星大众研发投入是科技企业提升竞争力的关键,虽说不一定每年都能够取得巨大的进步,但科技研发的成果必须经过时间以及投入的积累。因为只有这样,才能完成从量变到质变的转换过程。根据欧盟工业研发投