用一张单色图像生成高质量3D几何结构 (怎么用单色)

文章编号：43891 资讯动态 2024-12-09 体素 3D几何结构层进表面预测

雷锋网AI科技评论按：用图像来重建3D数字几何结构是计算机视觉领域一个非常核心的问题。这种技术在许多领域都有广泛的应用，例如电影制作、视频游戏的内容生成、虚拟现实和增强现实、3D打印等等。伯克利人工智能研究中心的Christian Häne等人近日发表一篇论文《 HierARChical Surface Prediction for 3D Object Reconstruction 》，论文中他们讨论如何从单张色彩图像重建出高质量的3D几何结构，就像下面这幅图所显示的。雷锋网编译如下。

用一张单色图像生成高质量3D几何结构

对于我们人类来说，即使只看到一张图像，我们也能毫不费力地对物体和场景的形状进行理解。请注意，我们眼睛的双目效果允许我们感知深度，我们不需要了解物体3D几何结构。所以即使我们只是看到一个实体的照片，我们也能对它的形状有很好的感知。不仅如此，我们还能理解物体看不见的部分（例如背面），这对抓取物体这样的动作来说是非常重要的。于是问题就来了，我们人类是如何从单张图像推出物体的几何结构的呢？在人工智能这个方面，我们怎么才能教会机器掌握这个能力呢？

一、形状空间

由任意的输入图像来重建其3D几何结构，基本的原理就是： 物体形状不是任意的，因此有些形状是可能的，而有些是不可能的。 一般来说，物体的表面往往是光滑的，尤其是人造物体，常常就是由几个分段的平面构成。对于预测物体，我们可以使用同样的规则。例如，飞机通常具有机身，两侧附接两个主翼，后侧会安装有垂直稳定翼。人类能通过眼睛观察世界，并用手来与世界进行互动，然后获得这样的知识。在计算机视觉中，“形状不是任意的”这个事实允许我们通过收集大量的示例形状，来将一个对象类或者多个对象类的所有可能形状描述成低维形状空间。 使用CNN来预测体素（Voxel Prediction）

最近，等人发表了他们关于3D重建的论文，在他们的工作中他们的“输出”是一个3D体积空间，这个3D体积被细分成体积元素（称为体素，voxel），每个体素会有一个分配（被占据或自由空间），而物体形状的预测则表示为由体素组成的3D占据体积。在他们的模型中“输入”通常为一个描述物体的单色图像，然后他们用卷积网络神经（CNN）的上卷积解码器架构来预测这个占据体积。该网络由端对端进行训练，并且由已知的ground truth占据体积（通过合成CAD模型数据集获得）来进行监督学习。通过这种3D表示（体素）以及CNN，这种模型就可以学习，且能够适应各种对象类。

用一张单色图像生成高质量3D几何结构

二、层进表面预测

上述方法（使用CNN预测占据体积）有一个很大的缺点，由于其输出空间是三维的，于是相对增加的分辨率就会以立方的形式增长。这个问题使得这种方法难以预测高质量的几何形状，且限于比较粗糙的分辨率体素网格，例如上面32^3的结果。在Christian Häne等人的工作中，他们认为这是一个不必要的限制，因为表面实际上只是二维的。于是他们通过层进的方式利用表面的二维性质来预测精细分辨率体素，此时只需要对表面进行高分辨率的预测即可。其基本思想和八叉树表示的思想关系很近，八叉树表示通常是用于多视图立体声和深度图融合等领域来表示高分辨率的几何结构。

方法

在这个3D预测模型（称为层进表面预测（Hierarchical Surface Prediction, HSP））中，首先我们输入一张单色图像，用卷积编码器将其编码为低维表示。然后，将该低维表示解码成3D占用体积。其主要思想是通过预测低分辨率体素开始解码。关键之处在于，不同于标准的方法将体素分为占据／自由空间，HSP会将体素分为三类： 自由空间 、 占据空间 和边界。使用这种方法，“输出”的分辨率可以很低，只要保证在那些有迹象表明它包含“边界”的部分有较高的分辨率即可。通过迭代，我们可以层进地预测出高分辨率的体素网格。模型更多的细节可以参看论文，这里就不再详解。

用一张单色图像生成高质量3D几何结构

实验

模型的实验主要利用了合成的ShapeNet数据集进行训练。作者将结果与两个基线模型——硬低分辨率模型（low resolution hard，LR hard）和软低分辨率模型（low resolution soft，LR soft））——进行了对比。这两个基线模型都是以32^3粗分辨率进行预测，只是训练数据的生成方式不同。LR hard对体素使用双分法进行分配，即如果在相应的高分辨率体素中至少一个被占用，则所有体素将被标记为被占用。LR soft则使用分数法进行分配，每一个体素将反映出在相关的高分辨率体素中占有的百分比。HSP方法则以256^3的分辨率进行预测。下面的结果显示，HSP方法与基线方法相比，在表面质量和高分辨率预测的完整性方面表现更好。

用一张单色图像生成高质量3D几何结构

雷锋网注——

本文参考了： High Quality 3D Object Reconstruction fROM a Single Color Image

相关论文连接：

1、 Hierarchical Surface Prediction for 3D Object Reconstruction （Christian Häne等）

2、 3D-R2N2: A Unified Approach for Single and Multi-view 3D Object Reconstruction （Choy等）

3、 Learning a Predictable and Generative VeCTOr Representation for Objects （Girdhar等）

4、 ShapeNet: An Information-Rich 3D Model Repository （关于ShapeNet数据集的论文）

原创文章，未经授权禁止转载。详情见转载须知。

用一张单色图像生成高质量3D几何结构

谷普下载提醒您

本文链接：http://www.gpxz.com/article/d46b93c853a74778602f.html

上一篇：用层进表面预测来重建三维物体如何选择表面

下一篇：视频上传速度提升超60%腾讯云音视频助力印

免费的MG动画制作软件,动画视频制作软件,微课制作软件

万彩动画大师是免费易上手的动画制作软件,MG动画制作软件,动画视频制作软件,微课制作软件,可用来制作企业宣传片,产品介绍短片,趣味课件视频,微课视频,演示演讲动画视频等.

电影视频 2024-11-13 11:08:25

健脾养胃吃什么

豆果美食是最优质的美食菜谱社区,提供各种菜谱大全,食谱大全,家常菜做法大全,丰富的菜谱大全可以让您轻松地学会怎么做美食,展现自己的高超厨艺,开启美好生活！

生活常识 2024-08-17 00:25:44

广州星颖纺织品有限公司

电影视频 2024-08-17 00:32:34

河北黑一橡胶有限公司

河北黑一橡胶有限公司|黑一橡胶|黑一传动带公司拥有12条传动带生产线，生产范围从550mm-12000mm,产品应用涵盖农机、汽车、工业设备等多领域。

网络应用 2024-08-17 22:29:29

思亿欧外贸快车官方网站

思亿欧外贸快车是专业的外贸独立站SaaS平台，通过一站式外贸独立站智能建站、智能管理、智能运营、智能洽谈，帮助中国外贸企业品牌出海，询盘精准质量高！

网站模板 2024-07-13 19:52:20

乔丰牌塑料卡板,乔丰牌塑料周转箱,惠州塑料托盘,惠州地台板,惠州栈板,惠州胶箱,惠州胶框,河源周转箱,惠州垃圾桶,惠州胶卡板,惠州物流箱EU箱

惠州炜鸿塑胶制品有限公司产品供应有:塑胶卡板,地台板,栈板,托盘,周转箱,周转箩,胶框,物流箱EU箱,电话:18026683545化工桶,垃圾桶,中空板,防静电产品等工业塑料产品的企业.

企业品牌 2024-08-10 23:30:35

好玩的网页游戏

我们好玩的网页游戏_1ddnc手游网_有趣的手机游戏_游戏攻略技巧，致力于为玩家提供全面、实用、好玩的游戏攻略和技巧，帮助玩家解决游戏中的难题，提升游戏技能。

游戏网游 2024-11-27 16:51:10

不锈钢板,不锈钢管,不锈钢棒,不锈钢带

游戏策略实验室，为玩家提供独特的游戏攻略和创新战术。

游戏网游 2024-12-04 13:29:18

青岛济南甲醛检测公司

青岛甲醛检测公司-绿猫环保是一家致力于室内装修环境污染检测,提供济南甲醛检测、潍坊CMA甲醛检测,烟台室内空气检测,临沂甲醛检测,可出具具有法律效力的CMA检测报告。

房产装修 2024-12-21 15:39:46

域名联盟

域名联盟为易名科技旗下网站，致力于域名推广和域名展示页等服务，联盟的宗旨是打造域名界的生态闭环，流量变现，凸显域名的价值。

网站模板 2025-01-30 23:46:22

成都失眠医院

成都哪家医院治疗失眠较好,成都治疗失眠医院:成都棕南医院精神科，环境优美，交通方便，主任医师带队，一堆一面诊，收费透明，平价医院，一直以来，深受广大患者的好评！地址：成都市二环路南二段19号。

电影视频 2025-02-09 23:09:45

金夫人连锁加盟官网

金夫人成立于1989年，至今已有34年的历史，遍布全国28个省、市，400+家门店，至今已为百万对新人记录人生中最幸福影像。金夫人，成就加盟商拥有更多的店。婚纱摄影|样片赏析专区提供欧式婚纱摄影，韩式婚纱摄影，时尚婚纱摄影，复古婚纱摄影，清新婚纱摄影，唯美婚纱摄影，画意婚纱摄影，经典婚纱摄影等特色风格样片欣赏~

图片摄影 2025-02-15 21:26:09

为什么特朗普能让硅谷如此悲伤和愤怒 (为什么特朗普上任黄金会跌)

硅谷对特朗普获选美国总统什么反应?创办了YCominator并被称为硅谷教父的PaulGraham在Twitter上说，我知道政治家通常无法实现他们竞选时的诺言，但这是第一次我‘希望，这会发生，YCombinator现任CEOSamAltman说，今天我们哭泣、绝望和害怕，明天我们回来接着工作建立我们想要的世界，而孵化器500...。

2025-01-30 21:36:56

能行吗 Redmi 做游戏手机 (上环前一天同过房能行吗)

在4月27日的发布会上，卢伟冰宣布了这一消息，卢伟冰表示，在充分研究了游戏手机市场之后认为，要解决游戏手机存在的痛点和困境，只有一个解决方案，就是大厂要入场，基于此，在本场发布会上，Redmi带来了首款游戏手机RedmiK40游戏增强版，用卢伟冰的话形容，这是一款，日常使用的主力旗舰机与游戏手机的结合体，游戏手机存在三大痛点4月27...。

2024-12-09 16:42:11

信服云李新混合云助力报业用户数字化服务化转型 (信服云公司)

12月23日，由中国报业协会主办、深信服科技股份有限公司承办的2021年中国报业技术视频研讨会成功举办，信服云副总经理李新在会上发表了，混合云助力报业用户数字化、服务化转型，的主题演讲，李新表示，在，十四五，这关键五年，混合云为报业媒体提供兼具私有云与公有云优势的第三种选择，让报业媒体能够获得，数字化平权，，享受数字化带来的红利，李新...。

2024-12-09 15:09:54

Inphi 亿美元收购 100 半导体行业重大交易继续官宣以 Marvell

又一半导体行业的重大收购完成，当地时间2020年10月29日，全球领先半导体厂商Marvell官宣，Marvell与美国模拟芯片制造商Inphi两家公司董事会一致决定，Marvell将通过，股票，现金，的方式以总价约100亿美元收购Inphi，此交易之后，Marvell将重组为一家企业价值约400亿美元的半导体公司，加码云数据中心和5...。

2024-12-04 01:20:36

我是一个医生我的名字叫沃克也是一名德国人 (我是一个医生英语翻译)

…我是一名德国人，也是一名医生，我的名字叫沃克，我在重庆临江门外开了一个诊所，今天来了一个病人，我没有抬头，是冷冷的问，你叫什么名字，年龄多少，什么病，病人答道，我叫刘大川，今年24岁，被土匪打伤了眼睛，我熟练地解开了病人的绷带，伤势很严重，我愣住了，我重新审问了一遍这个病人，我问他是干什么的，他说他是邮局职员，我一针见血的说...。

2024-11-29 17:58:55

电脑输入法怎样设置搜狗输入法 (电脑输入法怎么删除)

电脑输入法设置网络输入法的方法，工具原料系统，win10电脑，联想挽救者y70001、首先关上电脑而后点击，win图标，如下图所示，2、而后再点击，齿轮图标，如下图所示，3、再点击，设施，如下图所示，4、再点击，输入，如下图所示，5、再点击，初级键盘设置，如下图所示，6、再点击，倒三角形，如下图所示，7、最后再点击选用，网络拼音输入法...。

2024-07-16 03:55:11

单机斗地主下载 (单机斗地主下载免费版无需联网)

成都斗地主下载地址，斗地主下载地址，开心斗地主下载地址，有太多麻帐了.给你自己.自己去看吧，不用下载的斗地主间接玩游戏下载斗地主，可以经常使用单机形式，我想玩单机的斗地主，不用花钱的那种，在哪里有，你好，这个游戏是比拟经常出现的，我妈妈也青睐玩这个，不须要充钱，所有都是按积分算的，我记得她用的运行宝，还是我教她的，你也下一个PC版的运...。

2024-07-08 20:28:16

马自达双门跑车 (马自达双门跑车mx5)

1、马自达rx7是双门的，其是马自达旗下的一款跑车，有四座版和双座版马自达rx7驳回传统跑车规范的FR驱动性能，搭载五速手动挡变速箱，车尾外型是一体化尾灯组，其仰仗性能杰出的转子发起机和诱人的外观设计赢得了不少车迷的喜，2、太平洋汽车网马自达跳灯mx5国际能上路，这款车被引入国际了，马自达mx5是马自达旗下的一款双门双座敞篷跑车，马自...。

2024-07-07 15:55:29

绅宝cc用的是什么发起机 (绅宝cc怎么样)

是国产发起机；宿愿能帮到您这，望采用，祝您用车欢快，谢谢好友，绅宝CC什么时刻上市截止到目前的信息是绅宝cc在2015年内上市，绅宝CC是不是停产了，还值得买吗，是...。

2024-07-05 22:44:10

菲亚特suv多少钱是多少 (菲亚特suv车型七座)

你好，广汽菲亚特目前的售价在24.98万起，基本是全出口的汽车，这个多少钱性价比很高的，详细多少钱重要是看汽车的性能，性能越高，多少钱也会越高的，菲亚特菲翔参数性能1、菲翔搭载了14T涡轮增压发起机和7挡双离合变速箱，最大功率是110千瓦，最大扭矩是230牛米，驱动模式是前置前驱悬架方面，其前悬架经常使用了麦弗逊式独立悬架，后悬架经常...。

2024-07-02 12:22:30

信息，信息如何，什么信息，哪些信息，怎么信息

2023-11-05 02:28:32

精心打扮却大妈味十足？你可能是踩了这3个穿衣误区，看看是你吗|卫衣|穿搭|版型|针织衫|时尚单品

精心打扮却大妈味十足？你可能是踩了这3个穿衣误区，看看是你吗,卫衣,穿搭,版型,针织衫,大妈味,精心打扮,穿衣误区,时尚单品

2023-09-19 01:00:14

文章推荐

火环官网预约下载地址分享火环官网下载预约在哪里 (火环prometheus预约)

很多玩家不知道火环官网下载地址在哪里，该游戏是一款地牢动作游戏，有着可爱的画风迷人的的景色以及众多的可爱角色，在这个迷你的世界当中充满着让人激动的大冒险，如此有趣精良的手游一定是让很多玩家好奇期待的吧，接下来就为大家分享一下下载的方法，一起来了解一下吧，火环，最新版预约，下载地址普通下载安全下载游戏尚未上线，但是游戏的热度不小，并且...。

2025-02-12 01:05:25

资讯动态

香辣虾加盟哪个好 (香辣虾加盟哪家好)

大家都知道虾蛋白质高，富含人体必须的微量元素，脂肪含量低，是营养佳品，所以现在也演变出了很多虾的不同做法，其中香辣虾广受人们的欢迎，因为香辣虾既美味、肉质鲜嫩，爽滑细腻，又不失虾原本所富含的各种营养，不少创业者都加盟了香辣虾这个项目，那么香辣虾加盟哪个好小编觉得爆爆椒香辣虾就很不错，爆爆椒香辣虾成立于1986年，拥有上乘的口感和热情周...。

2024-12-21 15:20:46

创业加盟

华为比苹果成本高却更便宜；比尔盖茨回应阴谋论挺讽刺；B站获索尼4亿美元投资余承东 (华为比苹果成本低)

比尔盖茨为完成，人类清除计划，制造肺炎疫情，本人回应，挺讽刺的疫情本身是比尔盖茨基金会制作出来的，4月9日晚间的央视，新闻1，1，节目中，美国盖茨基金会联席主席比尔盖茨面对这个阴谋论，给出了自己的回应，盖茨表示，，我觉得这挺有讽刺意味的，尤其是对于那些尽全力帮助世界，做好应对疫情准备的人来说，我目前已经捐出几十亿美元，用于资助研发应对...。

2024-12-03 20:59:16

资讯动态

明基LX720是激光商务初始系列三支新品中规格最强的产品 (明基LX833STD参数)

发表在行业动态2018，12，1912，35还记得一个多月前北京召开的那场发布会吗，有三支叫蓝朋友的明基BenQ激光商务投影机，决定一齐手拉手迈向商务市场，为了这段前所未有的新征程，它们准备得不多，除了帅气外形、特色焦段、蓝核光芒，也就无需更换灯泡、使用寿命超长、相对抗尘、减少维护、长期成本较低、低耗能、全天候运作、开机即用这8个优势...。

2024-11-29 01:41:27

网络百科

第1哇鸡排怎么加盟 (第一佳鸡排做法)

鸡排项目是餐饮创业十分流行的领域，为什么，自然因为其经营特性，鸡排项目做起来，需要的资金好技术是比较有限的，因此很适合广大创投者选择，不过自己经营终归困难重重，不如与品牌商合作，借助品牌效应打造自己的事业，哇鸡排就是很流行的鸡排品牌之一，下面我们分析看看哇鸡排怎么加盟的吧，关于哇鸡排的品牌简介哇鸡排是从台湾沿袭而来的炸鸡美食店，光从我...。

2024-11-22 21:00:12

创业加盟

用一张单色图像生成高质量3D几何结构 (怎么用单色)

一、形状空间

二、层进表面预测

相关文章

文章推荐