摘要:1月15日,科大訊飛對外發布深度推理模型訊飛星火X1。
1月15日,科大訊飛對外發布深度推理模型訊飛星火X1。這是我國首個基于全國產算力平臺訓練的具備深度思考和推理能力的大模型,用更少的算力實現了業界一流效果,多項指標國內第一,中文數學能力國內第一,并已率先應用于教育、醫療等剛需場景。
深度推理模型是當下大模型最新發展方向之一。和過去人們熟知的大語言模型相比,深度推理模型著重強化了模型在邏輯推理、因果推斷以及結構化知識應用的能力,尤其在數學問題、代碼生成以及科學推理等方面更具優勢。
簡單來說,深度推理模型更切近人類的思考過程,在生成回答時更強調邏輯和推理,能夠給出明確的思考路徑,大大減少過去大語言模型“已讀亂回”的現象,更能應用于教育、醫療乃至科研等剛需場景。
此前,市面上已經涌現出不少推理模型,但一直沒有出現基于國產算力平臺訓練的模型。實際上,這也正是我國人工智能產業面臨的核心問題之一,我國人工智能發展在應用技術上更為成熟,算法并不落后,但在算力、芯片上等底層工具鏈上尚存在不足。
實現人工智能技術自主可控是產業生態健康發展的基石。此前,已有不少產業端人士積極呼吁國產算力底座的重要性,政策端也不斷引導鼓勵。2023年,科大訊飛與華為攜手自研算力底座,對外聯合發布了國內首個全國產算力平臺“飛星一號”,可常態化支持萬億參數的大模型訓練,實現算力層面真正的自主可控。
“中國大模型只有在國產技術底座上發展,才能有自主可控的大未來。”科大訊飛董事長劉慶峰說。自科大訊飛立項大模型以來,就一直堅定走國產化自主技術路線。訊飛星火至今仍然是國內唯一基于全國產算力的大模型,堪稱大模型競賽中的“國家隊”代表。
即便有了訊飛星火的成功經驗,在全國產上訓練推理模型仍然面臨諸多挑戰。這是一條幾乎沒有可參照范例、也從未有廠商走通的路徑。推理模型的訓練方法也和大語言模型有著顯著不同,比如架構上更注重邏輯和可解釋性,而大語言模型則基于Transformer,更關注上下文建模和大規模參數優化。
科大訊飛攜手華為,攻克了訓練推理強交互、高吞吐推理優化以及國產算子優化等一系列難題,最終成功訓練出完全基于全國產算力平臺的深度推理模型訊飛星火X1。
值得一提的是,訊飛星火X1近期還參加了小初高(含競賽)、大學(含競賽)、AIME、MATH 500等多項考試,交出了一份非常亮眼的“考試成績單”:用更少的算力,實現了業界一流的效果,多項指標國內第一。
更難能可貴的是,這些升級都建立在對行業的深度理解與應用上。在業內的推理模型們仍苦于技術比拼時,訊飛星火X1已經率先在教育、醫療等諸多場景實現落地應用。
比如搭載了訊飛星火X1數學高中數學智能教師助手,已被一線教研員和教師用來解答高中數學創新題和考試題,大獲好評。在醫療場景下,X1的相關技術和策略也取得了初步驗證成效,可使得專科輔助診斷和復雜病歷內涵質控的準確率均達90%。
同樣基于全國產算力平臺的訊飛星火4.0 Turbo也再度升級,七大核心能力全面提升,全面對標OpenAI最新版的GPT-4o。這次訊飛星火的底座升級,同樣來自于行業的真實反饋和痛點需求,著重升級的圖文、長文本以及混域知識搜索技術都可顯著提升大模型在日常使用中的效率,讓訊飛星火成為更懂行業的大模型。
這離不開此前訊飛星火在各行各業的廣泛應用。當前,訊飛星火已經成為央國企大模型的第一選擇2024年,無論是大模型招投標的全年總盤還是在央國企領域,科大訊飛的中標數量(91個中標項目)和中標金額(84780.8萬元)均居第一,成為2024年度大模型中標項目的“標王”。
中國人工智能產業發展起步快、應用廣,已經成為全球人工智能競賽中不可忽視的重要力量。但國內產業多年來在芯片、算力上的不足,仍然需要一段時間的追趕和攻堅。訊飛星火X1成功基于全國產算力平臺訓練,為我國實現人工智能技術自主可控提供了不少寶貴經驗和教訓積累。
去年10月24日,科大訊飛與華為、合肥大數據資產運營有限公司聯合打造的國產超大規模智算平臺“飛星二號”已正式啟動,將實現新模型新算法的持續適配和智算集群規模的再次躍遷。
日前,成都市貝瑞和康基因技術股份有限公司(簡稱“貝瑞基因”,股票代碼:000710)發布2024年度...
獲悉,2025開年抖音電商發布了九大扶持商家新舉措,商品卡免傭政策升級力度尤為硬核:平臺將拿出135...
來自中國的學而思學習機憑借卓越表現,成功斬獲業界重量級獎項“TWICE Picks”獎。
投資家網(m.51baobao.cn)是國內領先的資本與產業創新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創業企業、地方政府等提供專業的第三方信息服務,包括行業媒體、智庫服務、會議服務及生態服務。長按右側二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。