超越VLA!英偉達DreamZero問世,機器人迎來“GPT-2時刻”
摘要:過去一年,機器人行業圍繞一個核心議題爭論不休:大型語言模型(LLMs)究竟能否真正掌控物理世界?今日,英偉達(NVIDIA)GEAR實驗室正式給出了明確答案——重磅發布擁有140億參數的“世界動作模型”(World Action Model, WAM)DreamZero,將機器人智能的核心根基,從基于文本的推理,徹底轉向基于視覺的想象。英偉達高級研究經理Jim Fan將這一突破定義為機器人領域的“GPT-2時刻”:通過訓練模型同時“構想”未來像素與機器人動作,英偉達成功打造出一套能夠完成從未經過明確訓練任務的系統——從解開鞋帶,到與人握手,均能流暢實現。作為物理AI領域的里程碑式成果,DreamZero不僅顛覆了傳統機器人的訓練與控制邏輯,更直接回應了圖靈獎得主Yann LeCun對行業“過度依賴LLM”的批判,為機器人世界模型的發展開辟了全新路徑。本文將深度解析DreamZero的技術突破、二次預訓練范式的核心內涵,拆解其在數據利用、跨具身遷移上的獨特優勢,詳解英偉達如何通過GB200架構破解實時性難題,剖析其對機器人行業的顛覆性影響,為技術從業者、行業觀察者、投資者呈現最專業、最全面的深度解讀。
