童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

基于显著性的图像分割

8月12日 眉梢欢投稿
  本篇文章介绍了显著性图像的分割,这个方法最初来源于对于发掘一个自动生成图像三分图方法的兴趣,这个抠图算法用于关注前景和背景细节的图像分割。
  通常我们看到一幅图像的时候,我们都会关注于图像中的某一点上,这有可能是一个人,一个建筑物或者甚至是一个水桶。图像的清晰部分几乎没有什么意义,这些部分在图像中通常的特点是缺少关注点、颜色单调和纹理平滑。当这样一类图像出现的时候,它们是从图像剩余部分分割出感兴趣目标的理想图像。这篇文章就探索了这类显著性图像的分割。
  显著性图像的例子。左边的水桶和右边的人就是感兴趣的目标。
  这个项目最初来源于对于发掘一个自动生成图像三分图方法的兴趣。当和抠图算法相结合的时候三分图就是图像的掩膜。这个抠图算法用于关注前景和背景细节的图像分割。正常情况下一个三分图包含了前景的白色部分、背景的黑色部分和不确定的灰色区域。
  三分图的例子(来源于参考文献〔2〕)
  大多数抠图算法的问题就是它们希望由用户提供三分图,这是一个耗时的工作。这里有两篇我参考的主要的论文,他们尝试去自动生成三分图〔1〕〔2〕。在第一篇论文里,Hsieh等人使用了一个相当直接和易完成的方法。但不幸的是他们的方法并不是完全自动的,因为它需要用户给Grabcut算法提供一个矩形区域。Gupta等人而是使用显著性方法去预测感兴趣的区域。然而他们的显著性方法非常复杂,结合了三种显著性算法的结果。其中一种算法使用了卷积神经网络,这是一种我希望为了简单实现而避免使用的技术。
  除了需要用户提供信息之外,Hsieh’s等人的算法产生的结果是非常合理的。我想如果我能够使Grabcut部分自动化,那么他们算法的其余部分就会解决最初始的那个问题。我是从Gupta等人提供的方法那里得到的去创造这样一个自动方法的灵感。
  方法
  很多的图像分割方法的目标就是将图像二值化为感兴趣的区域。这个项目的目标是不一样的。
  首先,我想大致的找出感兴趣区域。将高斯模糊滤波器应用于图像。从模糊图像中生成平均15个像素大小的超像素。超像素算法旨在基于像素区域中的值的颜色和距离来打破图像。具体来说,用了简单线性迭代聚类算法(SLIC)。
  水桶和人的超像素图
  超像素将图像分为几乎一样大小的区域。这样做的好处之一就是超像素允许区域的泛化。我们可以假设超像素里的大部分像素有着相似的属性。
  与确定图像中的超像素并行地,计算图像的显著图使用了两种不同的显著性方法。第一种方法使用了内置的OpenCV方法,叫细粒度显著性。第二种方法涉及获取细粒度显著图像的平均值并从图像的高斯模糊图中减去它,就得到了新图像的绝对值。
  这两种方法的不同之处在于结果的侵略性。下面的两张图象高亮了感兴趣区域。细粒度显著性方法产生的图像相对柔和一些。另外,细粒度显著性图像主要勾勒出显著图像的边界,尽管另一种方法也捕获了显著图的内部。与细粒度方法相比积极的方法确实产生了更多的噪声。消除噪声是这个过程的下一步。
  使用细粒度方法产生的水桶和人的显著性图
  使用积极显著性产生的水桶和人的显著性图
  以下的技术是从Gupta等人的论文中挖掘出来的。为了对图像进行二值化,通过迭代从彩色图像生成每个超像素。如果显著性图像超像素区域的中间像素值大于阈值T1,那么这整个超像素就二值化为白色。否则整个超像素就是黑色。T1由用户选择。在参考文献〔2〕中,T1被设置为显著性图像中最大像素值的30,但是在该项目中使用的是25。
  在二值化图像之后,扩张图像基于使用哪种显著性技术。在细粒度显著方法中,图像被扩大为超像素平均值的两倍大小。Aggressive显著性方法没有扩张图像。图像中出现的噪声越大,任何扩张都有风险。
  细粒度显著性方法(左)和二值化Aggressive显著性方法扩张后的水桶图像
  最后一步又取决于使用哪种显著性方法。在这两种方法中,都提取了白色像素最大的区域。在OpenCV中,这个操作可以通过寻找图像中的轮廓并选择具有最大面积的轮廓来实现。对选择出来的区域会匹配一个包围框。
  据观察,细粒度显著性方法常常会生成碎片区域。在包围框生成后,其他任何落在包围框里的不属于最大区域的白色部分都会被添加到包围框里。包围框的边界会增大来包围这些区域。Aggressive显著性方法并不需要这样做。通常最大区域的包含量超过了预期。
  最后一步是将最终找到的包围框输入到Grabcut算法中。Grubcut是分割图像的常用方法。包围框给了Grabcut函数什么会被算法最终分割为背景和前景。在包含Grubcut应用程序的大多数软件包中,用户编辑矩形区域可以为算法产生更好的结果提供更多的信息。在这个项目中,使用了OpenCV内置的Grubcut功能。
  在桶的实验中,两种方法都产生了相同的结果。
  此过程在〔1〕开始的地方结束。在将来我计划继续开发这种自动tripmap生成器。
  结果
  在这两种方法中,Aggressive显著性图似乎为大多数图像产生了精确的掩模。细粒度显著性方法产生的图像中的显著性目标更为“笨重”。如果图像很长或有卷须,则这些部分通常会与图像的其余部分断开连接。然而,由于其保守的性质,当图像特别嘈杂时,细粒度方法更好。掩模不一定能够捕获整个图像,但它并没有像Aggressive方法那样频繁地溢出。
  两种方法的样本结果
  还要必要指出,对于〔1〕中开发的算法,欠发达的掩模并不坏。由于最终目标是开发tripmap图像,因此掩模将由灰色区域填充。该灰色区域将有助于区分前景和背景。
  对于任何的每周的读者来说,使用C学习OpenCV并实现这个算法是非常耗时的。对于时延感到很抱歉,但希望将来这个项目会继续并有更多的内容!
  Github代码地址:https:github。comTimChinenovGraspPicture
  参考文献
  〔1〕C。HsiehandM。Lee,“Automatictrimapgenerationfordigitalimagematting,”2013AsiaPacificSignalandInformationProcessingAssociationAnnualSummitandConference,Kaohsiung,2013,pp。15。
  〔2〕Gupta,VRaman,Shanmuganathan。(2017)。AutomaticTrimapGenerationforImageMatting。
  
  本文为AI研习社编译的技术博客,原标题:SaliencyBasedImageSegmentation
投诉 评论

没有压力的“压力测试”:来看看LSTM神经网络是如何预测焦虑随着社会的快速进步和发展,人们身上的负担越来越重,各种负担化身成焦虑,让人压力山大。而通过本文提到的LSTM神经网络,就能预测焦虑,并通过AI解决一部分焦虑情绪。身为现代……AI能预测经济了吗?科学家门从经济学角度出发,详细探讨了AI预测功能在实际生活中的运用,AI真的可以预测经济了吗?至少目前看来,答案仍是不确定的。众所周知,人们难以预测的东西有二,一是死亡,……触屏之战,巨头智能音箱的中场战事智能音箱在中国的发展一直存疑,而加上一块屏幕和价格补贴似乎给了中国消费者购买尝试的动力。带屏幕的音箱和陪伴机器人们模糊了智能家居、平板电脑等设备的界限,屏幕不会是AI落地的终点……基于显著性的图像分割本篇文章介绍了显著性图像的分割,这个方法最初来源于对于发掘一个自动生成图像三分图方法的兴趣,这个抠图算法用于关注前景和背景细节的图像分割。通常我们看到一幅图像的时候,我们……AI芯片简识本篇重点讲述何为AI芯片,AI芯片的分类,不同AI芯片的对比,AI芯片的主流技术路线,AI芯片产业概况,国外国内AI芯片和企业发展情况,最后小结AI芯片发展的预期。世间事……从老虎机讲起,从头开始深度强化学习本文笔者将对深度RL领域的各个核心部分做出一个任何人都可以读懂的概述,对深度RL主要使用的许多算法的一个全面总结。最近,我在北京的O’ReillyAI大会上做了一个演讲,……企业SaaS中的AI:真智能还是伪智能?人工智能技术在企业SaaS中的应用体现在哪些地方?人工智能与传统软件的结合,是否真的能将操作用户的工作效率提高?自从AlphaGo一鸣惊人之后,满大街的公司都在自己的公司……知识图谱与自然语言处理的故事你指尖跃动的代码,是我此生不变的信仰,唯我NLP永世长存。从NLP和知识图谱说起本人的主要领域是知识图谱的方向,但是自然语言处理是知识图谱是绕不开的话题,一种普遍看……用图像控制猴子大脑,哈佛大学是如何用算法“造梦”的?我们看见某些图像之所以感到快感,因为我们一边在看,一边在求知。善于摹仿,是人类的“本能”,也是AI的宿命。还记得电影《盗梦空间》中的“造梦师”吗?他们可以制造出多层……起底AI电话历史,AI电话推销背后的来龙去脉通信业和自动化技术发展后电话通讯和场地设备成本降低,而最近AI技术的爆发使得人力和时间成本极大降低,于是销售电话狂轰滥炸的时代到来了。五一劳动节前后,三家运营商集中向用户……“闲聊”的当前现状及未来展望“闲聊”短时间内还是需要产品驱动,而长时间则可能是依赖技术驱动。现状梳理人机对话的发展还处在起步阶段,音箱之间的大战就是一个很好的开始,未来会有更多……人类也许高估了20年后发生的事到底什么是人工智能?人工智能不能做什么?为什么接下来20年人工智能不会有一个巨大的加速发展?三年前,开启了人工智能时代,“它能做的事越来越多,几乎所有的事都可以做”,这是……
HTC新5G手机正式开售2700元沉寂多年的HTC终于发布了全新的5G手机Desire22Pro,新机已经正式开售,价格约为2700元起,而目前来看这款手机专为元宇宙设计,并且还植入元宇宙入口的ViverseA……多项权威奖项加持三星GalaxyZFlip35G获青睐赢市场折叠屏手机是近几年智能手机市场衍生出的一条重要分支,进入2022年来,折叠屏的发展尤为迅猛。据行业数据机构DSCC给出的一季度数据,全球折叠屏手机出货量同比增长571,在今年智……等等党永不吃亏!新天玑8系5G处理器年底就上:神U预定在当前的5G处理器中,联发科今年凭借天玑9000及天玑8000系列一战成名,特别是天玑8100及天玑8000两款处理器,在中高端手机中极受认可,不过没上车的等等党也不会吃亏,因……华为nova10将支持5G7月4日发布5G套装华为nova10系列将会在后天上市两款手机,分别为华为nova10和华为nova10Pro,而目前有消息称在7月4日的发布会中还将发布华为nova10的5G套装,由于手机的厚度……中兴通讯:已凭借5G等专利储备获得可持续的许可收益7月2日消息,在深交所互动易平台上,有投资者建议中兴通讯对禁止公司参与5G建设的国家提高专利使用费用。对此,中兴通讯回复称,中兴通讯作为5G标准技术贡献者和标准必要专利权……日本开发出支持5G玻璃天线或可用于汽车、大楼等凤凰网科技讯7月2日消息,日本电气硝子宣布开发出了支持高速通信标准“5G”的玻璃材料天线,特点是可以高效收发容易衰减的高频段电波,设想将设置于大楼的窗户和汽车前窗玻璃等处。……日本开发支持5G玻璃天线或可用于汽车凤凰网科技讯7月2日消息,日本电气硝子宣布开发出了支持高速通信标准“5G”的玻璃材料天线,特点是可以高效收发容易衰减的高频段电波,设想将设置于大楼的窗户和汽车前窗玻璃等处。……解密苹果5G芯片开发“失败”原因两年后或有大突破凤凰网科技讯北京时间7月3日消息,知名苹果分析师郭明錤本周爆料称,苹果公司的自研基带芯片可能已经研发失败,还得继续依赖高通供货。知名记者马克古尔曼(MarkGurman)周日在……华为nova10今天发布:3699起支持5G首先是外观,华为nova10基本已经完成量产,而且真机外观已经公布,背部的摄像头模组呈椭圆形,而且还有金色的边框点缀,华为也是首次使用这样大胆的设计。而华为nova10的……华为nova10手机价格公布:2699元起有5G套装华为nova10发布,价格在会中正式公布,如下:128G版本2699元,而256G位2999元,新机将在今晚开始预约,本月正式首销。华为nova10手机拥有4款首发颜色,……史上最贵iPhone手机要来了!苹果最重要自研5G芯片陷“难自2019年7月苹果收购英特尔基带芯片业务、正式进军5G芯片研发已有三年时间,但5G基带芯片的研发难度可能超过了苹果公司的预期。近日,天风国际分析师郭明錤在推特爆料,称最新调查……爱立信:2022年底全球5G用户数将突破10亿户大关站长之家(ChinaZ。com)7月5日消息:据电信设备商爱立信公布最新移动趋势报告,预估2022年底时,全球5G用户数将会突破10亿户大关,2027年时,全球移动用户数预计将……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界