今日版 / 2026年6月25日星期四

limbo logolimbo

数据更新时间

6月23日 17:59

启用来源

10

抓取状态

真实抓取

研究进展arXiv AI / CL

InSight:通过可操控VLA实现自主技能获取

摘要

InSight框架使视觉-语言-动作模型在基本动作层面可操控,通过自动分割演示数据为带标签的基本动作,并利用VLM引导的数据飞轮自主尝试缺失技能,实现无需人工演示的自主技能获取。在模拟和真实任务中验证了其有效性。

背景解释

传统VLA模型能力受限于训练数据中的技能,而InSight通过让模型在基本动作层面可操控,并自主探索缺失技能,实现了持续技能学习。这为机器人自主适应新任务提供了新思路,无需大量人工演示即可扩展技能库。

来源地区

Global

热度分

68

分类

研究进展

语言

en