LaneCPP:使用物理优先级的连续 3D 车道检测
单目 3D 车道检测已成为自动驾驶领域的一个基本问题,自动驾驶包括寻找路面和定位车道标线的任务。
测试时间线性分布外检测
分布外(OOD)检测旨在通过在输入样本显著偏离训练分布(分布中)时触发警报来解决神经网络的过度置信度预测,这表明输出可能不可靠。
CAT:利用类间动力学进行域自适应目标检测
域自适应对象检测旨在使检测模型适应注释数据不可用的域。
MatchU:从 RGB-D 图像中匹配用于 6D 姿态估计的未检测对象
最近用于物体姿态估计的学习方法需要对每个单独的物体实例或类别进行资源密集型训练,这阻碍了它们在实际应用中面对以前未见过的物体时的可扩展性。
CrossKD:用于目标检测的十字头知识提取
知识提取(KD)已被证明是一种有效的学习紧凑目标检测器的模型压缩技术。现有的最先进的目标检测 KD 方法大多基于特征模仿。在本文中,我们提出了一种通用而有效的预测模拟蒸馏方案,称为 CrossKD。
SDDGR:用于类增量对象检测的基于稳定扩散的深度生成重放
在类增量学习(CIL)领域,随着生成模型的不断改进,生成重放作为一种减轻灾难性遗忘的方法变得越来越突出。
面向可扩展的三维异常检测和定位:基于三维异常合成的基准和自监督学习网络
近年来,三维异常检测这一涉及细粒度几何判别的关键问题越来越受到关注。然而,缺乏丰富的真实三维异常数据限制了当前模型的可扩展性。
CORES:基于卷积响应的分布外检测分数
深度神经网络(DNN)在遇到分布外(OOD)样本时往往表现出过度自信,这在现实世界的应用中带来了重大挑战。
基于基础模型的小样本目标检测.
小样本目标检测(FSOD)旨在检测只有几个训练例子的目标。视觉特征提取和查询支持相似性学习是两个关键组成部分。现有的工作通常是基于 ImageNet 预训练的视觉骨干进行开发的,并为少量镜头学习设计复杂的度量学习网络,但精度仍然较差。在这项工作中,我们研究了使用现代基础模型的少镜头物体检测。
VSRD:用于弱监督3D目标检测的实例感知体积轮廓绘制
单目 3D 对象检测由于其在单目深度估计中固有的不适定性,在 3D 场景理解中构成了重大挑战。现有的方法在很大程度上依赖于使用丰富的 3D 标签的监督学习,这些标签通常是通过在激光雷达点云上进行昂贵且劳动密集的注释来获得的。为了解决这个问题,我们提出了一种新的弱监督 3D 对象检测框架,称为 VSRD(检测的体积轮廓绘制),用于训练没有任何 3D 监督但只有弱 2D 监督的 3D 对象检测器。
Endow SAM with Keen Eyes:用于视频伪装目标检测的时空提示学习
分割一切模型(SAM)是一种即时驱动的基础模型,在自然图像分割中表现出了显著的性能。然而,它在视频伪装对象检测(VCOD)中的应用遇到了挑战,主要源于被忽视的时间-空间关联以及用户提供的难以用肉眼辨别的伪装对象提示
的不可靠性。为了解决上述问题,我们赋予 SAM 敏锐的洞察力,并提出了时空提示 SAM(TSP-SAM),这是一种通过巧妙的提示学习方案为 VCOD 量身定制的新方法。
HUNTER:通过将知识从合成实例转移到真实场景,实现无人监督的以人为中心的 3D 检测
以人为中心的 3D 场景理解最近因其对机器人的关键影响而引起越来越多的关注。然而,以人为中心的现实生活场景极其多样和复杂,人类有着复杂的动作和互动。由于标记数据有限,监督方法很难推广到阻碍实际应用的一般场景。模仿人类智能,我们提出了一种无监督的 3D 检测方法,用于以人为中心的场景,通过将知识从合成的人类实例转移到真实场景。
海鸟:具有骰子丢失的鸟瞰图分割改进了大型物体的单目 3D 检测
单目 3D 探测器在汽车和较小物体上实现了卓越的性能。然而,它们在较大物体上的性能下降会导致致命事故。一些人将失败归因于训练数据稀缺或大型物体的感受野要求。在这篇文章中,我们强调了这个研究不足的大目标的泛化问题。我们发现,即使在几乎平衡的数据集上,现代正面探测器也很难推广到大型物体。我们认为,失败的原因是深度回归损失对较大物体噪声的敏感性。
注意
CVPR 2024 收录所有论文题目的合集:https://mbd.pub/o/bread/ZpeYmphy
CVPR 2024 收录所有论文题目和题目的合集:https://mbd.pub/o/bread/ZpeYmplt