建材 |政策 |市场 |建筑 |家装 |维修 |车展 |报价 |行情 |时评 |新车 |访谈 |股票 |创投人物 |产业 |金融

当前位置：首页> 房产> 家装 > 温州网站推广好不好_南宁疫情最新消息今天封城了_百度云搜索引擎入口盘搜搜_网络营销步骤

温州网站推广好不好_南宁疫情最新消息今天封城了_百度云搜索引擎入口盘搜搜_网络营销步骤

时间:2025/8/23 9:21:46来源：https://blog.csdn.net/weixin_37990186/article/details/144482252 浏览次数:0次

温州网站推广好不好_南宁疫情最新消息今天封城了_百度云搜索引擎入口盘搜搜_网络营销步骤

作者：Shubo Liu, Hongsheng Zhang, Yuankai Qi, Peng Wang, Yanning Zhang, Qi Wu
单位：西北工业大学，阿德莱德大学
原文链接：AerialVLN: Vision-and-Language Navigation for UAVs (https://openaccess.thecvf.com/content/ICCV2023/papers/Liu_AerialVLN_Vision-and-Language_Navigation_for_UAVs_ICCV_2023_paper.pdf)
代码链接：https://github.com/AirVLN/AirVLN

主要贡献

论文提出了AerialVLN任务，允许智能体在四自由度（前向、左转/右转、上升/下降、左移/右移）中移动，更接近真实的无人机飞行行为。
开发了包含25个城市级场景的模拟器，支持连续导航和环境扩展配置，能够模拟动态的户外环境，如风吹树叶、车辆运行、光照变化等。
收集了8,446条飞行路径和相应的自然语言指令，数据集规模大且多样性强。平均路径长度为661.8米，远长于地面VLN任务的路径长度。
提出了前瞻指导（Look-ahead Guidance，LAG）策略，通过生成“前瞻”路径来改进模型的性能。每个子路径与其子指令对齐，实现了细粒度的跨模态匹配学习。

研究背景

研究问题

论文主要解决的问题是如何在无人机（UAV）上进行视觉语言导航。现有的视觉语言导航（VLN）任务主要针对地面上的智能体，而忽略了无人机在空中导航的应用场景。

研究难点

该问题的研究难点包括：

无人机导航需要考虑飞行高度和更复杂的空间关系推理。
无人机导航的环境更大且更复杂，涵盖多种城市级场景。
无人机导航的路径比地面VLN更长，平均路径长度为661.8米。
智能体需要学习在三维空间中躲避障碍物。

相关工作

该问题的研究相关工作有：

UAV导航：早期的UAV自主导航需要解决感知、映射、定位、决策、动作分解和控制等挑战。
地面VLN任务：如R2R、RxR、REVERIE、TouchDown等，这些任务主要针对地面上的智能体，无法反映无人机在空中导航的挑战。

研究方法

论文提出了AerialVLN任务，用于解决无人机在空中进行视觉语言导航的问题。

任务定义

AerialVLN任务要求智能体（多旋翼无人机）通过自然语言指令和其第一人称视角的视觉感知，从起点飞到终点。

任务不提供预建的导航图，任何未被物体占据的点都是可导航的。

模拟器

使用Unreal Engine 4和Microsoft AirSim插件开发了一个3D模拟器，渲染了25个城市级场景的接近真实图片。模拟器支持连续导航、环境扩展和配置。

模拟器输出前视图的RGB图像和深度图像，并支持动态环境（如风吹树叶、车辆行驶、不同光照和气候模式）。

数据集收集

收集了25个不同城市级环境的数据，涵盖市中心、工厂、公园和村庄等多种场景，包含超过870种不同的对象。

数据集由经验丰富的无人机飞行员生成飞行路径，最终包含8446条飞行路径，每条路径配有3条自然语言指令。

并由AMT工人标注语言指令，共收集了25,338条指令，词汇总量为4,470个词，平均每条指令包含83个词。

实验设计

数据集划分

将数据集划分为训练集、验证集（可见和不可见）和测试集。训练集包含16,380条指令，验证集包含1,818条指令，测试集包含4,830条指令。

基线模型

评估五种基线模型在AerialVLN任务上的性能，并使用前瞻指导策略改进最佳基线模型的性能。包括：

随机模型：在每个位置随机选择动作，直到选择“停止”动作或达到最大步数。
动作采样模型：根据训练集的动态度分布采样动作。
LingUNet模型：将LingUNet模型适应为步进范式。
Seq2Seq模型：使用循环策略的序列到序列模型。
CMA模型：基于双向LSTM的跨模态注意力模型。

提出了前瞻指导策略（Look-ahead Guidance，LAG），通过生成“前瞻”路径来改进模型性能。具体步骤包括：

找到返回真实路径的最短路径，
沿真实路径前进10步，生成前瞻路径，
根据前瞻路径确定下一步的真实动作。

结果与分析

基线模型性能

随机模型的成功率为0%，动作采样模型的成功率低于1%。
LingUNet模型在不可见情况下的成功率略高于动作采样模型。
Seq2Seq和CMA模型在完整数据集的不可见分割上的成功率分别为1.0%~1.6%和2.2%~3.9%。
数据集聚合技术（DA）提高了模型性能，但仍未达到人类表现。

前瞻指导策略效果

前瞻指导策略显著提高了模型在不可见分割上的成功率和SDTW指标。

模态消融研究

视觉和语言输入对任务至关重要，去除任一输入都会导致任务变得无意义。RGB信息对最终成功贡献更大。

总结

论文介绍了一个新的任务AerialVLN和一个大规模数据集，用于探索空中的视觉语言导航。

结果表明，现有的基线模型在AerialVLN任务上表现不佳，远低于人类表现。前瞻指导策略显著提高了模型性能，但仍需进一步研究以应对这一具有挑战性的任务。

关键字：温州网站推广好不好_南宁疫情最新消息今天封城了_百度云搜索引擎入口盘搜搜_网络营销步骤

版权声明:

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

责任编辑：

>> 相关文章

>> 热门图片

网店装修素材_如何建立官方网站_数据分析培训课程_电子商务

网店装修素材_如何建立官方网站_数据分析培训课程_电子商务

葆婴保健品_公司简介模板文字版_西安seo建站_网页制作接单平台

葆婴保健品_公司简介模板文字版_西安seo建站_网页制作接单平台

文化墙_网页制作软件app免费_我们公司想做网络推广_网络营销自学网站

文化墙_网页制作软件app免费_我们公司想做网络推广_网络营销自学网站

西安最新疫情最新消息_核酸检测收费_免费引流推广工具_教育培训机构报名

西安最新疫情最新消息_核酸检测收费_免费引流推广工具_教育培训机构报名

广州讯博网络科技有限公司_郑州app开发流程_适合小学生的新闻事件_网络营销软文案例

广州讯博网络科技有限公司_郑州app开发流程_适合小学生的新闻事件_网络营销软文案例

日本最新新闻事件_泰安星际网络公司_alexa排名查询统计_九易建网站的建站模板

日本最新新闻事件_泰安星际网络公司_alexa排名查询统计_九易建网站的建站模板

苏州展厅设计公司排名_如何制作效果图_百度关键词工具_长沙网络科技有限公司

苏州展厅设计公司排名_如何制作效果图_百度关键词工具_长沙网络科技有限公司

网页设计入门基础_品牌营销名词解释_西地那非片多少钱一盒_seo社区

网页设计入门基础_品牌营销名词解释_西地那非片多少钱一盒_seo社区

>> 热门搜索

评论排行

图片新闻

温州网站推广好不好_南宁疫情最新消息今天封城了_百度云搜索引擎入口盘搜搜_网络营销步骤

企业信息管理系统情况的证明材料_天津滨海新区落户政策_网络舆情处置的五个步骤_seo人员的职责

成都网络公司有哪些_庆阳环县疫情最新消息_广州中小企业seo推广运营_网店推广策划方案

伊春网络推广_虚拟主机和云服务器的区别_可口可乐营销策划方案_公众号软文是什么意思

点击排行