研究进展arXiv AI / CL6月23日 17:59

InSight：通过可操控VLA实现自主技能获取

摘要

InSight框架使视觉-语言-动作模型在基本动作层面可操控，通过自动分割演示数据为带标签的基本动作，并利用VLM引导的数据飞轮自主尝试缺失技能，实现无需人工演示的自主技能获取。在模拟和真实任务中验证了其有效性。

背景解释

传统VLA模型能力受限于训练数据中的技能，而InSight通过让模型在基本动作层面可操控，并自主探索缺失技能，实现了持续技能学习。这为机器人自主适应新任务提供了新思路，无需大量人工演示即可扩展技能库。

来源地区

Global

热度分

分类

研究进展

语言