华为3D实景地图,30分钟构建超精细数字世界,达到厘米级
机器之心专栏
作者:黄经纬
华为 HDC2022 发布了 3D 实景地图,可以实现任意视角下 3D 物理环境的实景渲染。
千百年来,人类都致力于记录和解释身处的物理世界。随着计算机科学的发展,将物理世界数字化重建,不仅是长远的理想,更是千行百业努力的当下工作。真实的数字化重建三维物理环境,进而从任意视角观察重建的环境,是图形学、计算机视觉领域每个人的终极梦想,也是虚拟增强现实、元宇宙等众多未来应用的基石。
华为 HDC2022 发布了令人震撼的 3D 实景地图,可以实现任意视角下 3D 物理环境的实景渲染。通过 2500 张照片,仅需 30 分钟就可以构建出 5 平方公里的超精细数字世界,拥有厘米级精细化建筑和真实光照还原能力。
华为 3D 实景地图技术由毕业于斯坦福大学、现华为 2012 实验室技术专家黄经纬博士及其团队研发完成。先来看看使用实景渲染技术的室内外效果。
1 问题背景
从任意视角观察一个三维场景被广泛应用于游戏领域。通过美术师绘制的三维场景加以标准的 CG 渲染管线,用户可以自由的探索场景的每个角落。为了用自动化的手段得到更加真实的场景,计算机视觉从业人员致力于采集真实的物理世界的数据,用以重建一个孪生的三维场景供人预览。然而经过数十年的发展,重建模型的渲染效果仍不足以替代人工生产的场景。为了进一步改善复杂光照场景下的渲染效果,光场重建和渲染技术被提出,并在小场景下得到了惊艳的效果。近些年,神经辐射场(NeRF)的概念,可用于同时重建复杂的几何和光照。然而对于复杂的大场景,这些方案都存在一定的局限性。华为 3D 实景地图整合了各方案的优势,从而可以在复杂大场景下进行高质量的真实重建和快速渲染。
2 相关工作的局限与机遇
除去很多昂贵的三维重建解决方案,最接近商用的解决方案仍然是基于多视角图片的三维重建。然而,重建技术往往假设表面在各视角下拥有一致的光照,因此无法处理高光、半透明物体的重建。光场重建模型可以根据不同视角采集的光线加权来处理复杂光照,但在表面重建错误的情况下,新视角下的渲染往往存在残影。虽然神经辐射场(NeRF)技术使用复杂的模型能正确的概括真实场景,但恢复模型参数往往需要稠密采集的图片,否则就成为一个欠约束问题,在稀疏采集的大场景下新视角的泛化性尤为欠缺。
然而,各个方案亦有他们的优势。基于多视角图片的各向同性光照假设,在大部分情况下都是实用的,基于搜索深度信息的本质使其拥有稀疏视角的高效重建并拥有很好的泛化性,能够很好的弥补光场渲染和神经辐射场渲染的不足。光场渲染可以直接从采集的光线中获取颜色,既保证真实,又无需像神经辐射场那样优化复杂的 MLP 或者球谐函数。神经辐射场作为一个全局模型,改善了传统重建融合局部重建结果无法全局优化的情况,同时引入不透明度下的体渲染增强了模型描述环境的能力。
3 解决方案
华为 3D 实景地图结合了各家所长,提出了显式辐射场模型,系统模块如下:
第一阶段,系统使用传统三维重建方法对环境进行粗略构建,形成三角形网格。针对 3D 数字溪村场景,初始的几何构建能力使系统能使用 500 米高空航拍的 2500 张图片快速构建,并拥有新视角下渲染的泛化性。这个模型是粗模,虽然可以被直接用于渲染,但几何和环境光照的恢复不够真实。
在第二阶段,粗模作为环境轮廓,被初始化为显示辐射场。其具体的表达形式是纯几何的,即在粗模表面附近显式的记录不透明度为 1,其他地方不透明度为 0。接下来,系统使用采集的图片和三维重建中获取的图片位姿进一步优化辐射场模型。具体而言,可以对于每个局部区域进行区域增长式优化不透明度,从而过滤重建粗模中的噪音,并补全模型的缺失几何。在此过程中,不同于神经辐射场对光照模型用 MLP 或球谐函数来表达,而是直接使用类似于光场渲染的采样技术,快速获得特定位置和方向上的最佳模型光照。采样中由于使用加权平均的限制,空间中没有表面的点与对应采集图片相应像素比,仍会引起较大的颜色误差。因此,可以使用 L2 损失函数调整不透明度,从而优化几何体。
在最终阶段,辐射场模型转化为可用于渲染管线支持的网格模型。使用纹理模型进行光栅化渲染对性能尤为关键。系统将显式的辐射场模型重构回网格,并根据光场渲染压缩技术将表面光照压缩成多个纹理,用于使用着色器进行快速渲染。对于大规模场景,系统对几何进行 LOD 层次化,使模型渲染可以由粗至细加载进行。
借此,显式辐射场技术综合百家所长,能够实现良好的视角泛化性、精细的几何和真实光照效果,并以高效的渲染效率处理大规模场景。
4 效果展示
显式辐射场技术,可以帮助重建的环境获取真实的渲染光照效果。
对比传统几何重建(左),辐射场能够更好的恢复精细的桥梁结构(右)。
同时,本技术可以恢复复杂的材质(如透明玻璃、高光桌面)效果和复杂的几何体(植物、吊灯)。
5 挑战与未来
虽然在技术上实现了显著突破,但其商业价值仍需时间去发掘和思考,其主要问题在于环境采集的方式。为了得到优质的环境重建,图像的采集往往需要专业人士或者专业设备来实现。例如,大规模的室外环境可以通过专业的大飞机倾斜摄影完成。航飞场景往往容易遮挡地面,对于地面应用,如高自由度的街景,仍需要地面采集的数据以避免航飞带来的遮挡问题。另外为了保证环境的高覆盖采集,地面的采集往往需要使用全景设备,也为采集带来了额外的成本而不适用于众包生产。
从应用来看,未来最广阔的市场仍属于是广大消费者,因此,对于大规模实景地图的云渲染技术至关重要。另外,如何让实景渲染的真实场景与有价值的应用结合带来全新的用户体验,仍然是元宇宙行业需要思考的首要命题。对于 2B 场景,确实有大量的客户需要实景渲染能力,然而其所带来的价值以及生产成本的平衡,需要进一步探索,从而找到技术的真正落地点。
6 致谢
本技术由华为 2012 实验室技术专家黄经纬,预研算法工程师郭晓阳、时北极,三维重建工程师张彦峰,空三与采集负责人张行航等成员共同完成。更多有关 3D 数字溪村的体验可在 Petal Map 地图应用中搜索松山湖溪村进行体验。 欢迎访问技术负责人主页:https://cs.stanford.edu/~jingweih 或者通过邮件方式联系作者:jingweih@cs.stanford.edu
一张床垫卖到400万天价,它到底凭什么?向老消费学习这是新消费智库第1868期文章新消费导读一张床垫究竟能有多贵?作者Iyy编辑竺天审核SingleZZ来源新消费智库一张床垫究竟能有多贵?几千元万元十几万元?还是几十万元?前段时间,
美迪装饰发挥百强优势,打造高品质家装满足人民美好生活愿望,为千家万户建设美好家居生活空间,是家装行业的责任和使命,在三年疫情迎来关键转折的新时期,在压力转化为动力,徘徊转化为奋进,观望转变为希望的关口,全国工商联家具
闪崩!瞬间大跳水,一度暴跌超55中国基金报记者伊万12月12日周一,港股低开低走,全天维持弱势。截至收盘,恒生指数收跌2。2,跌437。24点,报19463。63点恒生科技指数跌4。05,报4192。67点恒生国
花房集团成功上市直播社交引领Z世代走向元宇宙12月12日,花房集团(03611。HK)正式登陆港交所。当日,花房集团的股票开盘价为3。29港元股,盘中涨幅一度超过25,截至记者定稿,公司总市值已经超35亿港元。花房集团的正式
日本首富柳井正做不到这些,你就不可能成为成功的经营者近年来ZaraHM等快时尚品牌颓势渐显,优衣库却逆势而上,连续几年净利润增速达到两位数。做到这一点,优衣库创始人柳井正功不可没,外界评价他,全世界卖衣服的人很多,但只有他卖成了日本
亏损创新高,理想汽车爆款落幕!近日,理想汽车发布三季报显示三季度实现营收93。4亿元,同比增加20。2净亏损16。5亿元,去年同期仅亏损0。215亿元,可以说亏损大超预期。前三季度,理想汽车累计22。69亿元,
25年坚持高质量发展,绿源递出一张新名片1997年,绿源在浙江金华诞生。彼时的绿源和大多数创业企业一样,只是一家再普通不过的小工厂,只有一条简陋的生产厂房。而这之后的25年里,绿源在浙江这片热土上茁壮成长。在澎湃的创新动
小熊电器困于高不成与低不就打开小红书,搜索空气炸锅,相关的笔记高达150万条搜索破壁机相关笔记超过42万条百万网友分享下厨经验的同时,也让小熊电器(SZ002959)为代表的创意小家电企业被消费者熟知。不过
长城金麒麟万能账户多子女账户双投保人双被保人独立投保功能比收益更重要。对保险这个金融工具的理解,我一直都认为功能比收益更重要。收益只要能达到中上水平不差,加上好的功能和灵活性,就会是我比较认可和喜欢的产品。最近正好帮一个9月份投保的
各地加大助企纾困力度全力提振经济央视网消息(新闻联播)各地在调整优化防控疫情措施的同时,加大助企纾困力度,激发市场主体活力。在北京,助企纾困新12条明确进一步降低企业经营成本加大金融支持力度稳定产业链供应链加力稳
云瀑万顷!航拍江西庐山壮阔瀑布云美景视频加载中央广网庐山12月13日消息(记者邓玉玲)大雪节气过后,庐山雪霁初晴,牯岭山城时而云海奔涌,时而薄雾氤氲,天蓝山青瓦红绿,雾凇点点白,亦动亦静,山川辽阔,云瀑泻流,景象壮美