摘要:近日,BV百度風投被投企業——生數科技完成新一輪數億元融資,由啟明創投領投,達泰資本、鴻福厚德、智譜AI、老股東BV百度風投和卓源亞洲跟投。
近日,BV百度風投被投企業——生數科技完成新一輪數億元融資,由啟明創投領投,達泰資本、鴻福厚德、智譜AI、老股東BV百度風投和卓源亞洲跟投。
本輪融資將主要用于多模態基礎大模型的迭代研發、應用產品創新及市場拓展。
成立于2023年3月,生數科技是全球領先的多模態大模型公司,致力于圖像、3D、視頻等原生多模態大模型的研發。生數科技核心團隊來自清華大學人工智能研究院,此外還包括來自北京大學和阿里巴巴、騰訊、字節跳動等科技公司的多位技術人才。此前公司已完成近億元融資,過往股東還包括螞蟻集團和錦秋基金等知名機構。
DiT架構由伯克利團隊于2022年12月發表。但其實早在2022年9月,生數科技創始成員就提出了基于Transformer的網絡架構U-ViT,兩項工作在架構思路與實驗路徑上完全一致,均是將Transformer與擴散模型融合。 當時,U-ViT就在千萬至數億參數量級范圍內驗證了極強的可擴展性(scaling up),這項工作在CVPR 2023發表,早于DiT成為全球范圍內最早被提出的Diffusion Transformer架構。 對擴散模型融合架構的前瞻創新源自于團隊多年的深耕。團隊從事生成式人工智能和貝葉斯機器學習研究已有20余年,在深度生成模型突破的早期就開展了深入研究。在擴散模型方面,團隊于國內率先開啟了該方向的研究,成果涉及骨干網絡、高速推理算法、大規模訓練等全棧技術方向。 目前,團隊于ICML、NeurIPS、ICLR等人工智能頂會發表相關論文近30篇,其中提出的免訓練推理算法Analytic-DPM、DPM-Solver等突破性成果,獲得ICLR杰出論文獎,并被OpenAI、蘋果、Stability.ai等國外前沿機構采用,應用于DALL·E 2、Stable Diffusion等明星項目中。
在統一化架構的思路下,生數科技持續進行Scale up。在圖文模型的訓練中,參數量從最早開源版的1B不斷擴展至3B、7B、10B及以上,使得模型在美學性、多元風格、語義理解等方面實現快速穩定的提升。同時在此基礎上,通過拓展空間維度和時間維度,逐步實現3D生成和視頻生成模型的訓練。
依托底層U-ViT架構的創新嘗試,截至去年9月,生數科技推出了基于統一的多模態多任務框架的產業級通用基礎大模型(閉源版),全鏈路自主訓練、自主研發,在圖像生成、3D生成、視頻生成等多項任務中達到國際一流水平。
3D生成可實現高精度與最快10秒級的模型生成,并推出全球首個4D動畫生成、可控3D場景編輯等工作。視頻生成已實現短視頻的編輯與生成能力,在畫面美觀度、連貫性方面實現了突破。
此外,生數科技也積累了完整高效的工程化經驗,擁有在大規模GPU集群上實現高效兼容、低成本的模型訓練經驗,并搭建了完整的數據管理和使用體系。從算法原理、算法架構,到工程實現、數據準備,生數科技打造了多維度、全方位的基礎建設,這為后續多模態大模型,尤其長視頻生成的訓練奠定了重要基礎。
目前公司已與多家游戲公司、個人終端廠商、互聯網平臺等B端機構開展合作,開放模型服務,提供AIGC個性化體驗、定制化內容生產等方面的能力。 同時也于去年上線兩款工具產品:視覺創意設計平臺PixWeaver、3D資產創建工具VoxCraft,面向藝術設計、游戲制作、影視動畫、社交娛樂等創意領域提供賦能,提升創作效率,同時為創作者提供源源不斷的靈感和想象力。 對于未來的規劃,生數科技始終堅持“原生多模態”方向,基礎模型層面會持續優化,不斷提升語義理解、可控性、美觀度方面的生成效果,近期則將重點突破長視頻生成能力。在產品端,現有產品將持續迭代,不斷滿足用戶需求,實現用戶量的持續增長,同時公司也正在探索工具以外的全新產品形態,致力于提升每個人的創造力和生產力。
作為全球首款全系標配L2級駕駛輔助功能的重卡,一汽解放J7創領版牽引車一經上市便引起業界關注
現貨黃金上演"史詩級突破":周一金價單日飆漲2.77%,強勢突破3380美元/盎司整數關口
5月15日至19日,新東方直播間攜手敏寶媽媽代表@諾香麻麻,遠赴德國法蘭克福與薩爾布呂肯,深入inn...
6月1日,長城汽車股份有限公司(股票代碼:601633.SH,02333.HK,82333.HK;以...
投資家網(m.51baobao.cn)是國內領先的資本與產業創新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創業企業、地方政府等提供專業的第三方信息服務,包括行業媒體、智庫服務、會議服務及生態服務。長按右側二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。