研究进展arXiv AI / CL
InSight:通过可操控VLA实现自主技能获取

摘要
InSight框架使视觉-语言-动作模型在基本动作层面可操控,通过自动分割演示数据为带标签的基本动作,并利用VLM引导的数据飞轮自主尝试缺失技能,实现无需人工演示的自主技能获取。在模拟和真实任务中验证了其有效性。
背景解释
传统VLA模型能力受限于训练数据中的技能,而InSight通过让模型在基本动作层面可操控,并自主探索缺失技能,实现了持续技能学习。这为机器人自主适应新任务提供了新思路,无需大量人工演示即可扩展技能库。
来源地区
Global
热度分
68
分类
研究进展
语言
en
