CVPR 2026|AnyVisLoc:为真实低空无人机视觉定位建立统一基准

📅 2026/7/2 2:13:12
CVPR 2026|AnyVisLoc:为真实低空无人机视觉定位建立统一基准
CVPR 2026AnyVisLoc为真实低空无人机视觉定位建立统一基准AnyVisLoc 是第一个面向真实低空多视角无人机视觉定位的大规模数据集与评测基准。它不再局限于传统的高空俯视图像而是系统覆盖低空飞行、倾斜视角、多高度、多航向、多场景以及航空图与卫星图双参考源。对于无人机视觉定位、跨视角图像检索、图像匹配、视觉地理定位和三维位姿估计等方向而言AnyVisLoc 提供了一套规模大、场景复杂、任务完整、挑战性强的研究平台。相关论文Exploring the Best Way for UAV Visual Localization under Low-altitude Multi-view Observation Condition: A Benchmark已被CVPR 2026 Findings接收完整数据集和测试代码现已公开。GitHub 项目主页百度网盘下载提取码fcw8论文原文CVPR 2026 Findings图 1 AnyVisLoc工作流AnyVisLoc 解决了什么问题现有无人机定位数据集往往更关注高空、近似垂直俯视的理想情况但真实无人机在低空执行巡检、导航、测绘或自主飞行任务时拍摄视角通常更加复杂。无人机可能以不同高度、不同俯仰角和不同航向观察同一片区域。低空图像中还会出现明显的建筑立面、透视变化、遮挡、尺度变化、光照差异、季节变化以及跨时间地物变化。这意味着低空无人机定位远不只是“在地图中找一张相似图片”。它同时涉及大范围地图检索、跨视角匹配、像素级对应、三维几何恢复以及高精度位姿估计。AnyVisLoc 正是针对这些真实问题构建的。它将无人机图像检索、图像匹配和 PnP 定位统一到同一个评测框架中使研究者能够真正检验算法在复杂低空环境中的定位能力。数据规模与场景覆盖AnyVisLoc 当前公开版本包含24 个场景和 20,077 张全分辨率 DJI 无人机图像。无人机飞行高度约覆盖6 米至 500 米相机俯仰角约覆盖5° 至 90°既包含垂直俯视图像也包含大量具有明显透视变化的倾斜视角图像。数据由多种 DJI 无人机采集包括 Mavic 2、Mavic 3、Mavic 3 Pro、Phantom 3、Phantom 4、Phantom 4 RTK 和 Mini 4 Pro。场景覆盖城市建筑群、城镇、乡村、校园、公园、地标建筑、农田、草地、山地以及多种混合环境同时包含不同季节、天气和光照条件。相比只在单一城市、固定高度或固定视角下采集的数据集AnyVisLoc 更接近真实无人机系统在复杂环境中遇到的视觉变化也更适合研究模型的跨场景泛化能力。图 3AnyVisLoc数据集中的无人机图像示例航空图与卫星图双参考定位AnyVisLoc 的另一个重要特点是同时提供高分辨率航空参考图和卫星参考图并配套相应的 DSM 高程数据。航空影像具有更高的空间分辨率可以支持更精细的图像匹配和更高精度的位姿估计但通常需要提前进行航空摄影测量和地图重建。卫星影像的获取范围更广也更适合大规模部署但卫星图与低空无人机图像之间往往存在巨大的视角差异、分辨率差异、时间差异和外观变化。卫星影像还可能存在建筑倾斜、局部配准误差、拼接伪影、模糊和地物变化。因此卫星参考定位并不是航空参考定位的简单替代而是一个难度更高、也更有实际价值的研究方向。AnyVisLoc 将这两种参考条件放在同一套数据和评测体系中为研究高精度航空定位与大范围卫星定位提供了统一平台。图 2AnyVisLoc数据集中的基准图示例一套完整的无人机视觉定位 BenchmarkAnyVisLoc 不只是发布了一批无人机图像还提供了完整的视觉定位评测流程图像检索 → 像素匹配 → PnP 位姿估计图像检索负责从大范围航空图或卫星图中寻找候选区域像素匹配负责建立无人机图像与参考图之间的精细对应关系最后结合 DSM 中的三维信息通过 PnP 估计无人机位置与姿态。公开基线涵盖 CAMP、RoMa、SuperPoint、LightGlue、GIM、MINIMA、ALIKED、DISK 等多种检索与匹配方法并支持不同 PnP 求解方式。这使得 AnyVisLoc 不仅可以用于比较完整定位系统也可以单独研究图像检索、局部特征匹配、跨视角匹配和三维定位中的具体问题。总结AnyVisLoc 的价值不只是“数据量大”更重要的是它将真实低空无人机视觉定位中的关键难点集中到了一套统一基准中低空、多视角、多高度、多航向、多场景、跨时间变化、航空与卫星双参考以及从粗定位到精确位姿估计的完整流程。对于无人机自主导航、视觉地理定位、跨视角检索、图像匹配、卫星图定位和三维视觉定位等研究方向AnyVisLoc 都是一套非常值得关注的数据集与 benchmark。