部件分割和语义分割等应用提供了一个统一的体系结构。虽然简单,但PointNet是高效的。从实验上看,它的表现相当出色,甚至达到当时的SOTA。该论文还提供理论分析,证明PointNet具有对任意连续集函数的逼近能力,以及网络对于输入含噪和缺失是鲁棒的。问题阐述点云用3D点集合表示,其中每一个点为坐标向量,还可以有附加的通道,如颜色、法线等。分类:对于分类任务,输入的点云可以直接从形状中采样,也可以从场景中预分割。模型输出的是所有个候选类的个分数。分割:对于语义分割,输入可以是用于零件区域分割的单个对象,也可以是用于对象区域分割的三维场景的子体积。模型将为点和种语义子类别输出个分数。深度学习于点集相关工作Volumetric CNNs:是将3D卷积神经网络应用于体素化形状的先驱。然而,体素表示受到其分辨率的限制,因为体素数据具有稀疏性且三维卷积的计算成本很高。FPNN、Vote3D:提出了处理稀疏问题的特殊方法;他们的操作仍在稀疏体素上,这对于于处理非常大的点云很有挑战性。Multiview CNNs:尝试将三维点云渲染为二维图像,然后应用二维卷积网络对其进行分类。通过精心设计的图像CNN,这一系列方法在形状分类和检索任务上取得了卓越的性能。然而,这很难扩展到场景理解或其他3D任务(如点云分割和形状补全)。