当前位置:首页 > 文章推荐

小说搜索 - 终极导航(终极道小说)

iisanye3个月前 (12-12)文章推荐27
摘要:顶尖智者从不质疑的秘密,普通人却总想推翻来源:市场资讯(来源:AGV网)ApexNavAn Adaptive Exploration Strategy for Zero-Shot ObjectNavigation with Target-centric Semantic Fusion…
顶尖智者从不质疑的秘密,普通人却总想推翻

来源:市场资讯

(来源:AGV网)

ApexNav

An Adaptive Exploration Strategy for Zero-Shot Object

Navigation with Target-centric Semantic Fusion

在智能家居、仓储物流、甚至未来家庭助手中,有一个看似简单却极具挑战的任务:“去帮我拿一下沙发上的遥控器。”

对人类来说,这轻而易举;但对机器人而言,这意味着它必须在从未见过的环境中,理解“遥控器”是什么,并自主探索、定位、最终抵达目标——这就是零样本物体目标导航(Zero-Shot Object Navigation, ZSON)。

然而,现有方法常陷入两个困境:

  • 效率低:在空走廊或白墙前“发呆”,反复推理却不敢前进;

  • 容易被骗:把一个长得像微波炉的烤箱当成目标,直接“认错人”。

项目主页:
https://robotics-star.com/ApexNav/

使用产品:松灵LIMO多模态开发平台

针对上述问题,《ApexNav: An Adaptive Exploration Strategy for Zero-Shot Object Navigation with Target-centric Semantic Fusion》提出了一套兼具高效性与鲁棒性的导航框架,在多个主流仿真基准上实现SOTA性能,并成功部署于真实移动机器人平台。

灵感来自人类:会“切换模式”的智能导航

  • 研究团队观察到:人在找东西时,会动态调整策略。

  • 当看到疑似目标(比如厨房里有个白色方块),我们会走近、绕一圈、多角度确认——这是谨慎验证;

  • 当身处陌生走廊,眼前全是门和墙,我们会先快速走完一圈摸清布局——这是高效探索。

  • ApexNav 正是将这种“人类智慧”编码进了算法。

.自适应探索策略

o模式判别准则:对当前前沿区域(frontiers)计算语义得分分布的统计特征(最大值/均值比 r 与标准差 σ)。若 r>τr 且 σ>τσ,判定为语义富集区,启用语义模式;否则进入几何探索模式。

o语义模式优化:将高语义得分的前沿点建模为旅行商问题(TSP),通过求解近似最优路径,实现全局有序的语义区域遍历,避免贪心策略导致的振荡行为。

o几何模式设计:采用最近前沿优先策略,最大化地图覆盖率,加速环境结构构建。

该策略有效平衡了目标导向搜索与环境探索之间的张力,显著提升路径效率。

.目标中心语义融合

为提升目标识别的鲁棒性,ApexNav构建了一个上下文感知的多帧融合机制:

  • 混淆集预推理:利用大语言模型(LLM)生成与目标类别在视觉或功能上易混淆的物体集合(如“微波炉” → {烤箱, 打印机, 小冰箱}),并对所有候选对象进行长期跟踪。

  • 加权置信度融合:融合多帧观测时,不仅考虑检测置信度,还引入点云体积作为可靠性权重(体积越大,观测越完整,权重越高)。

  • 消失惩罚机制:若某物体在连续帧中未被观测到,其累积置信度按指数衰减,有效抑制偶发高置信度误检。

  • 自适应判定阈值:基于目标物体的典型尺度,由LLM动态设定识别阈值,实现细粒度决策控制。

该融合机制显著增强了系统在杂乱、遮挡及相似物干扰场景下的判别能力。

从仿真到现实:真机实测成功!

研究团队将 ApexNav 部署在 AgileX LIMO 移动机器人上,在真实宿舍与实验室环境中完成了多项任务。

仿真评估

  • 数据集:HM3Dv1、HM3Dv2、MP3D

  • 指标:成功率(Success Rate, SR)、路径长度加权成功率(SPL)

结果:

  1. 在 HM3Dv2 上,SR 达 %,SPL 为 %,分别超越前SOTA方法 % 和 %;

  2. 消融实验表明,移除自适应探索或语义融合模块均导致性能显著下降,验证了各组件的有效性。

真实世界部署

  • 平台:AgileX LIMO 移动机器人(搭载RGB-D相机与SLAM系统)

  • 任务:在未建图的宿舍与实验室环境中执行“找马桶”“去沙发处”等指令

  • 表现:系统在无任何场景先验条件下,稳定完成导航任务,验证了算法的可迁移性与实用性。

启示与展望

ApexNav 的核心贡献在于将认知启发式策略转化为可计算的工程框架:

  • 其自适应探索机制为开放世界导航中的探索-利用权衡提供了新范式;

  • 标中心融合策略展示了如何结合LLM常识推理与多模态感知,构建鲁棒的高层语义理解模块;

  • 整体架构不依赖端到端训练,具备良好的模块化与可解释性,便于在实际系统中集成与调试。

该工作不仅推动了ZSON任务的性能边界,也为具身智能在开放、动态、未知环境中的可靠部署提供了重要技术路径。

扫描二维码推送至手机访问。

版权声明:本文由三也百科网发布,如需转载请注明出处。

本文链接:https://iisanye.com/post/2920.html

分享给朋友:

“小说搜索 - 终极导航(终极道小说)” 的相关文章

主角的父亲叫龙战天(主角姓龙他父亲叫龙战天)

听起来霸气嘛,而且容易取名字我告诉你,每个小说里面都有个 龙敖天,集天地运气而生……一般小说里面姓战或慕容的都不是好人噗,可能是感觉姓龙比较霸气,然后叫战天更霸气,盖天比战天还霸气所以是爷爷,哈哈…

战天龙帝小说(战天龙帝 小说)

《战天龙帝》 精彩内容:“老匹夫,你还真会装的,你做了什么事情,你自己心里明白。”萧羿冷笑道。“放肆,你这个废物,居然敢对大长老不敬!是谁给你的胆子的!来人,将这个小畜生给我拿下,狠狠‘抽’五十记耳光,若是他敢反抗,将他的手脚一并打断。”一旁的二长老厉声斥道。“是!”下一刻,就有两名萧家的高手站了…

YY小说_书友最值得收藏的小说阅读网_yyxsla

企业定制化软件解决方案白皮书:从痛点到生态的数字化跃百度这次直接把“大模型”的两把刀分开了。月日的内部公告显示,公司新成立了两个研发部门:一个负责打底层通用大模型,一个负责把模型往具体业务场景里调优。吴甜带基础模型组,贾磊主管应用模型组;这两个组都直接向李彦宏汇报。王海峰的职务没变,继续当CTO、T…

零零文学城完结小说-赌书消得泼茶香

这些冷门诗词了,藏着哪段你忘不掉的时光?南乡子——纳兰容若烟暖雨初收,落尽繁花小院幽。摘得一双红豆子,低头,说著分携泪暗流。人去似春休,卮酒曾将酹石尤。别自有人桃叶渡,扁舟,一种烟波各自愁。长相思——纳兰容若山一程,水一程,身向榆关那畔行,夜深千帐灯。风一更,雪一更,聒碎乡心梦不成,故园无此声。如梦…

寒武纪年(寒武纪年官网入口)

二者相距约3.5450亿年寒武纪:早期(距今约5.7亿年),中期(距今约5.4亿年),晚期(距今约5.23亿年)。奥陶纪:早期(距今约5.05亿年),中期(距今约4.78亿年),晚期(距今约4.58亿年)。志留纪:早期(距今约4.38亿年),晚期(距今约4.21亿年)。泥盆纪:早期(距今约4.08亿…

穿越成男扮女装杀手被大佬看上 - 番茄小说网

小说:谁也没想到,杀手竟然男扮女装,把狙击枪绑在大腿上“嗯?”还有什么自己不知道的,怎么只要君墨初在身边自己就变得懒得关心这种事情。“黑鹰组织,是圣天出名的杀手营,拿银子杀人!杀一人却是天价,不过最新消息,这个厉害的杀手营直至今日已被全部灭口,无一人生还”慕修寒感叹道“这么厉害的杀手营瞬间就被摧毁可…