国产无遮挡色视频免费视频-国产五月色婷婷综合-国产五月婷婷-国产午夜不卡-曰批免费视频播放在线看片二-曰韩一级毛片

更多精彩 >

首個端到端強化學習具身模型PsiR0,橫空出世!

2024-12-30 13:23:28   來源:搜狐網  作者: 

摘要:近日,靈初智能發布首個基于強化學習(RL)的端到端具身模型PsiR0。

近日,靈初智能發布首個基于強化學習(RL)的端到端具身模型Psi R0。該模型支持雙靈巧手協同進行復雜操作,將多個技能串聯混訓,生成具有推理能力的智能體,從而完成并閉環長程靈巧操作任務。并且,Psi R0還可以實現跨物品、跨場景級別的泛化。

21.png

真實世界中,人類生活近乎100%的場景涉及抓握、轉動、捏取、觸摸等操作,而其中超過 90% 的操作屬于多技能融合的長程任務。然而在當下具身業界,多局限于Pick and Place操作的泛化,一旦任務復雜化、長程化,泛化性和成功率則大大降低,無法兼顧——這也是具身智能只能存在于demo,遲遲無法在真實場景中落地的核心原因!機器人如何突破Pick and Place、脫離遙操作,擁有自主完成長程靈巧操作的能力,實現真正類人的場景級任務閉環,仍是具身智能亟待攻克的難題。

RL是長程靈巧操作實現任務閉環的唯一解

在真實世界中,機器人解決長程任務必須通過Learning-based模式,目前主流技術路徑有兩種:模仿學習(IL)和強化學習(RL)。

純模仿學習的泛化能力受限于示范行為的多樣性和質量。加之長程任務步驟較多,更容易出現分布漂移問題,使得 IL實現長程任務的泛化性能較差,魯棒性也較弱。

基于RL的Psi R0 模型,使用海量仿真數據高效訓練出雙手操作的智能體,并通過雙向訓練框架串聯多技能,在業界率先完成開放環境中的長程任務,具備較強的泛化能力與較高的魯棒性。這一技能訓練框架從物體時空軌跡抽象出關鍵信息以構建通用目標函數,從而解決獎勵函數難設計的問題。在后訓練階段,通過少量高質量真機數據對齊,進一步提升長程任務的成功率。除此之外,雙向訓練框架中的轉移可行性函數發揮著重要作用,它能夠微調技能以提高串聯的成功率與泛化性,同時賦予模型自主切換技能的能力,使其在遭遇操作失敗時能夠迅速調整策略,確保高成功率。

22.png

Sequential Dexterity: Chaining Dexterous Policies for Long-Horizon Manipulation  

Yuanpei Chen, Chen Wang*, Li Fei-Fei, C. Karen Liu

Psi R0 模型表現出的靈巧性、高成功率以及泛化性,充分展示了其大腦的任務拆解與規劃能力,以及小腦的靈巧操作、泛化和魯棒能力。這一模型的誕生,突破了當前具身機器人在商業化應用進程中所面臨的核心技術瓶頸,為整個行業的未來發展開拓出一片全新且廣闊的天地,有望引領具身機器人邁向全新的發展階段。

從理論概念到有效落地,Psi R0解答了具身智能商業化的終極命題

長程任務靈巧操作場景無處不在,從工廠產線組裝,到服務業的揀貨打包,到家居環境的清潔整理。

Psi R0模型的智能體展示了其強大的場景落地能力。以電商場景為例,商品打包是典型的長程任務作業,需對上萬件商品進行抓取,掃碼,放置,塑料袋打結等多個操作。Psi R0能夠使用雙靈巧手流暢地完成這一系列動作(此系列動作在客戶現場可以取代一個完整工位),成為首個基于強化學習訓練完成長程靈巧操作任務的具身機器人。

視頻中,機器人系統接收到的指令僅僅是“將桌面的物體打包”,而這一看似簡單的任務背后,是靈初智能極具創新性的端到端技術架構在發揮作用。當指令下達后,上層視覺語言模型(VLM)對桌上混亂擺放的商品進行分析,編排出商品的操作順序,下層操作模型拆解出單個商品的子任務,如抓取、放置、掃碼、打包等,智能體依次執行。

抓取環節,面對隨意擺放、形狀各異的商品,模型必須具備高度的泛化能力,才能成功完成商品的逐個抓取。視頻中展示的品客薯片,Psi R0 僅僅依靠 20 條真機數據,模型就成功實現了99%+的成功抓取率。

23.png

掃碼環節更是考驗機器人的靈巧操作水平,需要雙手高度精細地協調彼此相對位置,以確保掃碼槍與商品條碼能夠精準對齊,任何細微偏差都可能導致掃碼失敗。此時,RL訓練策略為雙手雙臂構成的高自由度復雜系統提供了可靠的實時閉環控制,保障掃碼動作精準流暢地完成。

打包環節,需要雙手協調完成對塑料袋的靈巧操作。在動態打包的過程中,塑料袋的形狀會隨動作變化,需要實時調整操作。為了提升機器人對柔性物體的操作適應能力,Psi R0在仿真環境中模擬多種柔性物體的操作場景,同時結合真機數據進行微調優化。甚至在被打斷、干擾的情況下,也能自適應調整策略,重新進行打包動作。

24.png

靈初智能Psi R0模型是具身智能遞歸性成長的第一步。具身智能將遵從從簡單到復雜、從保護到協同的漸進式演進。在早期,小腦是與真實世界交互的物理基礎,其設計需結合領域知識,滿足環境中的約束條件,同時具備容錯性,支持大腦學習與優化。Psi R0模型發揮RL算法探索的優勢,支持小腦的快速迭代,生成支持長程靈巧操作的智能體。通過靈巧操作轉動數據飛輪,實現從小腦Action到大腦Cognition的閉環回饋,驅動大腦認知能力優化,模型持續迭代,形成小腦協同+大腦優化的具身智能“神經回路”,使端到端模型完成從簡單到復雜、從保護到協同的漸進式演進。


猜你喜歡

泓德基金:上周國內權益市場延續小幅反彈走勢

金融科技泓德基金

上周國內權益市場延續小幅反彈走勢,日均成交量相較上上周變化不大,維持在1.1萬億元附近,萬得全A周漲...

1小時前

鈞達新能源招股 百惠擔任聯席全球協調人、聯席賬簿管理人及聯席牽頭經辦人

金融科技百惠金控

于2025年4月28日至5月2日期間招股,百惠金控團隊擔任聯席全球協調人、聯席賬簿管理人及聯席牽頭經...

5小時前

靈初智能發布分層端到端VLA+強化學習算法模型Psi-R1

金融科技靈初智能

近日,靈初智能發布的的分層端到端VLA+強化學習算法模型Psi-R1,已實現機器人在開放環境中的長程...

9小時前

鎖定中期確定性,鑫利年年助您掌控人生主動權

金融科技泰康人壽

在低利率時代背景下,在快節奏的現代生活中,如何為家庭財富筑起一道兼具安全性、收益性和靈活性的防線?

11小時前

金價巨震現金條搶購潮 我國黃金相關企業超14.5萬家

金融科技天眼查

4月23日,經歷持續大漲的貴金屬市場突現劇烈震蕩。

1天前

叮當健康加密北上廣深門店布局 持續深耕高潛力城市

上市公司叮當健康

叮當健康旗下核心業務叮當快藥發布最新業務進展,宣布在北京、上海、廣州、深圳等核心城市加速新開門店,今...

2025-03-10

從政府工作報告看北斗應用發展方向

創新創業北斗應用

3月5日政府工作報告中介紹了我國一年來大力推動創新驅動發展,促進產業結構優化升級的成績,并作出了“北...

2025-03-10

解密益生菌如何“升級”衛生巾 人民日報健康客戶端探訪自由點工廠

大消費百亞股份

3月8日國際勞動婦女節,人民日報健康客戶端走進百亞股份自由點衛生巾智能工廠,探尋衛生巾與益生菌創新結...

2025-03-10

WeLab Bank匯立銀行成為亞洲首批本地化部署DeepSeek開源大模型的數字銀行

金融科技WeLab Bank匯立銀行

近日,亞洲領先的數字銀行WeLab Bank匯立銀行宣布,于中國香港及內地市場本地化部署開源人工智能...

2025-03-10

【為民辦實事,服務暖人心】中銀三星人壽用心用情傳遞金融溫度

金融科技中銀三星人壽

【為民辦實事,服務暖人心】中銀三星人壽用心用情傳遞金融溫度

2025-03-10

六年磨一劍,百星耀香江

上市公司洲際航天科技

自2019年9月成立以來,洲際航天科技集團歷經六載,從無到有,從設想到落地,終于在2025年3月成功...

2025-03-10

“專業服務”成即時零售增長飛輪,叮當健康24小時即時到家迎機遇

醫療健康叮當健康

隨著人們生活節奏的加快,對于便利、高效、高確性需求不斷提高,即時零售行業在我國呈現出爆發式增長。

2025-03-10

原創

繪就金融溫暖底色 廈門國際銀行以適老服務“小切口”做好養老金融“大文章”

金融科技廈門國際銀行

在金融科技高速發展的當下,如何讓老年群體共享數字化便利,成為銀行業服務升級的重要課題。

2025-03-10

投資家網(m.51baobao.cn)是國內領先的資本與產業創新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創業企業、地方政府等提供專業的第三方信息服務,包括行業媒體、智庫服務、會議服務及生態服務。長按右側二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。

分化浪潮中的堅守與突破 | 第19屆中國投資年會,即將啟幕

分化浪潮中的堅守與突破 | 第19屆中國投資年會,即將啟幕

在時代的浩渺長河中,“分化”宛如一條隱匿的脈絡,貫穿于萬物的生長、發展與變遷。從生命的進化到文明的演...

第二屆中匈可再生能源、新材料商業投資峰會將盛大啟幕

第二屆中匈可再生能源、新材料商業投資峰會將盛大啟幕

第二屆中匈可再生能源、新材料商業投資峰會于2025年4月9日在匈牙利布達佩斯盛大啟幕。

雕刻耐心|第18屆中國投資年會·有限合伙人峰會在滬召開

雕刻耐心|第18屆中國投資年會·有限合伙人峰會在滬召開

“中國投資年會”作為私募股權行業的年度盛會,已成功舉辦了18屆,吸引了全國VC/PE領域從業者的廣泛...

主站蜘蛛池模板: 精品久久久久久久久久久久久久久 | 手机在线看片国产日韩生活片 | 中国高清色视频www 中国黄色网址大全 | 亚洲国产精品综合久久20 | a毛片免费全部播放毛 | 100000免费啪啪18免进 | 91精品欧美一区二区综合在线 | 国产三级精品三级国产 | 亚洲日本在线观看视频 | 欧美亚洲国产精品 | 国产精品亚洲视频 | 午夜私人影院免费体验区 | 亚洲日韩中文字幕 | 成人性生免费视频 | 亚洲国产精选 | 国产精品一区二区三区四区五区 | 国产高清一区 | 久久久久久在线 | 亚洲bt欧美bt国产bt | 男操女视频 | 全免费a级毛片免费看 | 欧美三级美国一级 | a级毛片免费观看视频 | 亚洲久久在线观看 | 免费一级网站 | 欧美日韩久久 | 在线观看国产一级强片 | 亚洲日本va午夜中文字幕一区 | 男女男免费视频网站国产 | 久草最新网址 | 97久久国语露脸精品对白 | 99精彩免费观看 | 国产九区 | 国产成人精品午夜免费 | 极品美女写真菠萝蜜视频 | 免费特黄级夫费生活片 | 日韩在线视频观看 | 日本成人在线看 | 北条麻妃在线一区二区 | 蜜臀91精品国产高清在线观看 | 免费国产成人高清在线观看视频 |