VLM 閉環符號規劃器:控制理論視角的機器人應用優化,熱啟動提升28.2%,閉環目標達成率超開環21.7%
摘要:南加州大學&斯坦福大學聯合研究的VLM 閉環符號規劃器《Using Vision Language Models as Closed-Loop Symbolic Planners for Robotic Applications: A Control-Theoretic Perspective》:從控制理論角度,系統研究視覺語言模型(VLM)作為機器人閉環符號規劃器的核心影響因素,通過 4 類任務環境(CUBE-EASY 至 YCB-HARD)和 3 款主流 VLM(GPT-4.1-mini、Gemini-2.5-flash、Llama-4-Maverick-17B)的受控實驗,證實閉環規劃優于開環、熱啟動顯著提升性能、控制時域并非越短越好三大核心結論。該優化方案使 VLM 規劃器的任務完成率平均提升 28.2%,目標達成率比開環提升 21.7%,為長程機器人操縱提供更穩健、可解釋的符號規劃解決方案。
