摘要:近日,靈初智能發布的的分層端到端VLA+強化學習算法模型Psi-R1,已實現機器人在開放環境中的長程靈巧操作能力
近日,靈初智能發布的的分層端到端VLA+強化學習算法模型Psi-R1,已實現機器人在開放環境中的長程靈巧操作能力,達成了30分鐘+持續CoAT超長任務時長,同時驗證了三重復合交互能力(人-機交互、機-機交互、機-環境交互),體現出VLA的超強推理能力和RL超越人類上限的思考、操作能力。
理論上,只有具備L3(即基于Chain of Action Thought(CoAT)框架的自主推理系統)的長程CoAT靈巧操作能力,才能理解世界,并將學到的知識遷移到新的環境中落地。靈初智能憑借其分層端到端VLA+強化學習算法模型Psi-R1,以麻將為場景,展現了機器人在開放環境中的長程靈巧操作能力,達成了30分鐘+持續CoAT超長任務時長,同時驗證了三重復合交互能力(人-機交互、機-機交互、機-環境交互),體現出VLA的超強推理能力和RL超越人類上限的思考、操作能力。
這項突破性成果標志著具身智能從單一動作執行向完成復雜物理世界感知、推理和執行閉環的關鍵躍遷,為具身智能真正進入商業場景提供了可落地的技術范式。
在24年成立之初,靈初智能率先提出分層端到端快慢腦架構技術路線,如今已成為行業共識;而此次發布的Psi-R1快慢腦架構,不僅可實現模態對齊,結合強化學習達到具身Aha Moment,更是回應了并一定程度解決了Nvidia機器人高級總監及華盛頓大學教授 Deiter Fox對快慢腦架構存在兩個核心問題(即,如何連接快慢腦、實現慢腦規劃和快腦操作的模態對齊;如何突破模仿學習的瓶、訓練豐富技能)。
靈初R1模型已首度成功驗證VLA Test-Time Scaling
靈初智能R1快慢腦系統具備L3能力,可在開放環境下自主推理決策,完成長程復雜操作,其技術得以廣泛應用并已與制造業、商超零售、跨境物流等行業龍頭企業展開合作,梯次布局高價值商業化場景,從泛工業向泛零售物流,再最終邁向家庭應用,并進一步探索具身智能的未知領域。
近日,由全球化媒體智庫霞光社&霞光智庫聯合舉辦的「品牌引力·重構增長 - WAVE2025品牌全球化...
希臘政府近日宣布一項重磅政策:自2026年起,全國房租支付將全面禁止現金交易,所有租金必須通過銀行系...
?在當今數字化營銷的浪潮中,總裁直播已成為品牌營銷的常態手段,品牌總裁紛紛走進直播間與消費者直接對話...
投資家網(m.51baobao.cn)是國內領先的資本與產業創新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創業企業、地方政府等提供專業的第三方信息服務,包括行業媒體、智庫服務、會議服務及生態服務。長按右側二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。