摘要:在繁華都市的交通脈絡中,自動駕駛技術正不斷面臨著復雜路況的考驗。
在繁華都市的交通脈絡中,自動駕駛技術正不斷面臨著復雜路況的考驗。就拿北上廣城市快速路的限時段公交車道來說,這一特殊場景猶如一道難題橫亙在智能駕駛系統面前。
以往,AI系統依賴人類預設規則,在面對限時規則切換時顯得僵化。而如今的端到端自動駕駛模型雖旨在自主學習適應,但對于“限時公交車道”這類特殊路況與場景的學習,仍需耗費大量時間,難以迅速達到理想的應對效果。
世界模型與視頻生成:自動駕駛的關鍵拼圖
在全球智能駕駛研發的前沿陣地上,基于Artificial General Intelligence(AGI通用人工智能)與世界模型(World Model)的仿真平臺相較于傳統的單一道路測試,具有顯著優勢。它能夠更加精準地滿足日益增長的模擬需求,大幅削減重復采集和分析工作,按照需求生成特定場景,有力提高算法精準度和迭代效率,是實現“端到端”智能駕駛方案的關鍵基石。
在自動駕駛領域,世界模型和視頻生成技術無疑是兩塊關鍵拼圖。世界模型旨在模擬真實世界環境動態,而視頻生成模型則負責產出逼真視頻序列,二者的整合對于提升自動駕駛汽車的態勢感知和決策能力意義非凡。
早期的視頻生成技術尚顯稚嫩,難以制作出自然流暢且冗長的視頻。那時的模型多在像素級別依據訓練數據中的模式預測下一幀,或借助概率模型來優化數據分布近似值,缺乏標準化結構,如長短期記憶(LSTM)、Transformer和生成對抗網絡(GAN)等架構都曾被嘗試,通過對抗訓練艱難提升生成質量。
反觀世界模型,其在自動駕駛領域蘊含著巨大潛力。它能夠構建完整的場景認知,精準理解各元素間的關聯,提前預判整個場景的演變,深入理解意圖和因果關系,進而基于整體認知做出決策,甚至預見潛在風險。當世界模型與視頻生成模型無縫集成,便如同為自動駕駛汽車的“大腦”裝上了更為敏銳的“感官”與更智慧的“思維”,大幅增強其態勢感知與決策的準確性。
DriveDreamer4D:開啟 4D 駕駛場景重建新紀元
隨著大模型技術的蓬勃發展,世界模型技術成為行業矚目的焦點,引發了自動駕駛領域的創新熱潮。極佳科技去年率先提出DriveDreamer,這款全球首個真實世界驅動的自動駕駛世界模型,在工業界和學術界掀起了廣泛而熱烈的討論,并成功被國際頂級計算機視覺會議ECCV 2024收錄。
今年10月,極佳科技聯合中國科學院自動化研究所、理想汽車、北京大學、慕尼黑工業大學等一眾實力單位,重磅推出DriveDreamer4D。這一創新成果首次利用世界模型增強4D駕駛場景重建效果,為行業發展開辟了新的路徑。
DriveDreamer的功能豐富多樣,令人矚目。它能夠生成符合交通結構化信息的視頻,仿佛擁有交通規則的“內化知識”;還能依據文本描述輕松改變生成視頻的天氣、時間等要素,如同掌控著一個虛擬的“氣候與時間魔法盒”;更可以根據輸入的駕駛動作生成不同的未來駕駛場景視頻,或者依據歷史的駕駛動作和圖像輸入預測未來的駕駛動作,就像是一位經驗豐富的“駕駛預言家”。
當下的傳感器仿真方法,如NeRF與3DGS,存在著對訓練數據分布過度依賴的短板。一旦訓練數據不足,在面對復雜駕駛操作,如變道、加速或減速時,重建效果便大打折扣。而DriveDreamer4D的出現恰如其分地彌補了這一缺陷,它以世界模型作為強大的數據引擎,基于真實世界的駕駛數據合成新軌跡視頻,例如在變道場景中表現卓越。
DriveDreamer4D在提升圖像渲染質量方面成績斐然,它能夠顯著提升多種重建算法(PVG、S3Gaussian、Deformable - GS)的效果,讓駕駛前景(車輛)和背景(車道線)的時空一致性達到新的高度。其總體結構設計精妙,軌跡生成模塊(NTGM)猶如一位智能“調度員”,靈活調整原始軌跡動作,如轉向角度和速度,從而生成全新的軌跡。這些新軌跡就像是打開新世界的鑰匙,為提取結構化信息(車輛3D框和背景車道線細節)提供了前所未有的視角。緊接著,憑借世界模型的視頻生成能力,以更新軌跡后得到的結構化信息作為控制條件,順利合成新軌跡的視頻。最后,將原始軌跡視頻與新軌跡視頻巧妙融合,對4DGS模型進行優化,如同為模型注入了源源不斷的活力,使其在user study實驗中斬獲超過80%的偏好投票,向著空間智能和4D世界模型昂首邁進堅實的一步。
回顧DriveDreamer系列,其發展歷程亦是熠熠生輝。DriveDreamer作為首個面向真實駕駛場景的世界模型,具備根據不同控制條件生成自動駕駛周視視頻的能力,如同給自動駕駛汽車裝上了“千里眼”,有效提升了BEV感知的性能。DriveDreamer - 2則更進一步,創新性地引入大語言模型,搖身一變成為“駕駛場景定制大師”,能夠生成用戶自定義的駕駛數據,為長尾和corner case場景下的數據生成難題提供了巧妙的解決方案,進一步提升了數據生成能力。DriveDreamer4D充分利用DriveDreamer系列的技術積累,針對端到端自動駕駛和閉環仿真對場景重建的急切需求,生成新軌跡視頻(如變道、加減速),成功大幅提升了多種4DGS算法的重建效果,讓自動駕駛場景重建技術實現了質的飛躍。
極佳科技:自動駕駛創新浪潮中的領航者
作為DriveDreamer4D論文的牽頭完成單位,極佳科技無疑是自動駕駛領域的一股強勁力量。這是一家專注于空間智能的先鋒企業,以將視頻生成提升到4D世界模型為使命,全力賦予AI大模型對4D空間的理解、生成、常識和推理能力,力求實現4D空間中的交互與行動,向著通用空間智能奮勇前行。
極佳科技在影視游戲、元宇宙等虛擬空間的內容創作領域,以及自動駕駛、具身智能等物理空間的數據生成與認知推理方面,都擁有不可估量的價值。它在國內率先踏上探索和布局世界模型和空間智能方向的征程,并在技術研發與商業拓展兩方面都收獲了累累碩果,贏得了行業的廣泛贊譽與認可。
在近期舉辦的現代汽車集團創新計劃頒獎典禮上,極佳視界憑借其在4D世界模型和視頻生成領域的卓越創新表現,榮耀斬獲現代集團“燈塔”創新開放計劃“創新企業獎”?,F代汽車作為全球汽車制造業的巨頭,剛剛跨越全球產量1億臺的偉大里程碑(2024.09),極佳科技此次獲獎,無疑為其進軍海外市場,服務類似現代汽車的國際客戶打造了一個極具說服力的成功案例,也標志著其在全球自動駕駛舞臺上嶄露頭角。
如今,極佳科技的相關技術已經在智駕行業的頭部客戶中落地生根,已與近20家汽車廠家和智駕方案商建立了緊密的合作關系,充分展現出其廣闊的應用前景。
以公司與全球出行科技企業億咖通科技強強聯手為例,雙方致力于建設基于先進的生成式AI和視覺大模型的仿真模擬平臺,旨在高效推動智能駕駛技術的發展驗證及功能迭代。
通過此次合作,雙方將精心打造融入真實道路環境和傳感器特性的場景庫,借助對AGI能力的持續建設與迭代升級,生成高度真實、豐富多樣的虛擬駕駛場景與交通流。這些形成的空間場景具備多視角及多車型的泛化能力,并且能夠針對特殊場景(corner case)進行量化生成,與測試車實測完美結合,共同構建起高效的模擬平臺。這一平臺將加速智能駕駛的場景仿真、預判和功能開發效率,顯著提升有效道路驗證公里數。
該仿真平臺將率先聚焦ACC、AEB、NOA等相關功能,深入開展算法仿真和回灌工作,不斷提升模擬精度,大幅提高道路和泊車場景驗證效率,有效推動相關算法模型的迭代更新,助力核心技術的快速研發和能力提升,全方位滿足未來行泊一體智駕能力的研發需求,最終打造出更安全、更自然、能夠適配更多場景和車型的智能駕駛解決方案。
更為重要的是,除了將生成式AI大模型應用于感知能力的提升以及現有駕駛功能的測試和迭代之外,雙方還將攜手探索世界模型在下一代智能駕駛解決方案中的前瞻研發與落地應用。
在自動駕駛的漫漫征途中,極佳科技以DriveDreamer4D為利刃,以世界模型為核心驅動力,正與合作伙伴們并肩作戰,劃破技術的重重迷霧,駛向智能駕駛的未來新藍海。有理由相信,在這樣的創新力量推動下,自動駕駛的明天將更加安全、高效、智能,讓我們拭目以待這一偉大變革的全面到來。
未來,中免集團將持續秉承“誠信經營 優質服務”理念,深耕海南市場,創新營銷、優化環境、提升服務,助力...
這一舉措不僅加速了斯帝爾在智能打磨技術領域的深耕,也標志著柔性力控機器人在工業形態與人形形態的雙向融...
2月10日,安徽安科生物工程(集團)股份有限公司(以下簡稱“安科生物”)股票代碼300009,召開第...
新場景、新舉措、新標準發布,8家北京市重點實驗室、衛星互聯網產業園揭牌,國內首個低軌寬帶通信試驗星座...
日前,由中國人民銀行深圳市分行、中共深圳市委金融委員會辦公室、深圳市科技創新局指導,金融時報社主辦的...
新春伊始,企業紛紛開足馬力搶抓生產,京東政企業務以「開工即沖刺」之勢,聯合眾多品牌啟動「政企開工季」...
投資家網(m.51baobao.cn)是國內領先的資本與產業創新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創業企業、地方政府等提供專業的第三方信息服務,包括行業媒體、智庫服務、會議服務及生態服務。長按右側二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。
2016年注冊于北京的中氫新能技術有限公司,下設位于大興的裝備制造公司、位于海淀區的技術研究院、材料...
一度無比高光的理想汽車,猝不及防遭遇重挫。
2024年1月10日,由投資家網主辦,財經銳眼、有時間協辦,北京微金科技有限公司承辦的“第十二屆股權...
2024年1月10日,由投資家網主辦,財經銳眼、有時間協辦,北京微金科技有限公司承辦的“第十二屆股權...
2024年1月10日,由投資家網主辦,財經銳眼、有時間協辦,北京微金科技有限公司承辦的“第十二屆股權...