国产无遮挡色视频免费视频-国产五月色婷婷综合-国产五月婷婷-国产午夜不卡-曰批免费视频播放在线看片二-曰韩一级毛片

更多精彩 >

昆侖萬維「天工大模型4.0」o1版(Skyworko1)正式啟動邀請測試

2024-11-27 15:39:12   來源:中國網  作者: 

摘要:今天,昆侖萬維正式推出具有復雜思考推理能力的系列模型——“天工大模型4.0”o1版(Skyworko1)。

今天,昆侖萬維正式推出具有復雜思考推理能力的系列模型——“天工大模型4.0” o1版(Skywork o1)。


  Skywork o1是由昆侖萬維集團發布的具有慢思考推理能力的系列模型。這是國內第一款中文邏輯推理能力的o1模型。不同于現有的復現OpenAI o1模型的工作,Skywork o1不僅在模型輸出上內生了思考、計劃、反思等能力,同時,該開源模型在標準評測集上,對比普通模型推理能力大幅上升,真正讓模型擁有了思考和反思帶來的推理能力的提升。團隊復現o1的技術路線,使得初始推理能力較差的基座模型在基準測試集上成為生態位SOTA。

  此次發布的Skywork o1包括三款模型,既有回饋開源社區的開放版本,也有能力更強的專用版本:

  ?Skywork o1 Open:一款基于Llama 3.1 8B的開源模型,該模型在同生態位開源模型中評測指標大幅提升達到SOTA水平,并解鎖了許多輕量級模型無法解決的復雜數學任務。該模型的發布也將幫助加速國內開源社區復現o1的進程。

  ?Skywork o1 Lite:該模型具備完整的思考能力,具有更好的中文支持和更快的推理和思考速度。在數學、中文邏輯和推理類問題上表現突出。

  ?Skywork o1 Preview:這款模型是本次完整版的推理模型,搭配自研的線上推理算法,對比Skywork o1 Lite有著更多樣和“深度”的思考過程,更完善和更高質量的推理。

  其中,我們開源的Skywork o1 Open,在各項數學和代碼指標上均有大幅提高,將Llama-3.1-8B的性能拉到同生態位SOTA(超越Qwen-2.5-7B instruct)。同時,8B的Skywork o1 Open也解鎖了很多較大量級模型,如GPT 4o,無法完成的數學推理任務(如24點計算)。這也為推理模型在輕量級設備上部署提供了可能性。



  同時,我們也將開源兩個推理任務的Process Reward Model(PRM):Skywork o1 Open-PRM-1.5B 和Skywork o1 Open-PRM-7B,相比此前開源的Skywork-Reward-Model僅對整個模型回答進行打分,Skywork o1 Open-PRM能給模型回答中的每個步驟進行打分。

  對比開源社區現有的PRM,Skywork o1 Open-PRM-1.5B能達到開源社區8B的模型效果,例如RLHFlow的Llama3.1-8B-PRM-Deepseek-Data,OpenR的Math-psa-7B,Skywork o1 Open-PRM-7B能同時在大部分benchamrk上接近/超過10倍量級的Qwen2.5-Math-RM-72B。Skywork o1 Open-PRM也是第一款適配代碼類任務的開源PRM。下面表格為以Skywork-o1-Open-8B作為基礎模型,使用不同PRM在數學和代碼評測集上的評估結果。

  除Skywork-o1-Open-PRM外,其他開源PRM均未針對代碼類任務進行專門優化,故不進行代碼任務的相關對比。

  詳細技術報告也將在不久后發布。目前模型和相關介紹在Huggingface開源。

  強推理以及自我反思的能力是如何練成的?

  Skywork o1在邏輯推理任務上性能的大幅提升得益于天工三階段自研的訓練方案:

  ?推理反思能力訓練:通過自研的多智能體體系構造高質量的分步思考,反思和驗證數據。通過高質量的、多樣性的長思考數據對基座模型進行繼續預訓練和監督微調。

  ?推理能力強化學習:團隊研發了最新的適配分步推理強化的Skywork o1 Process Reward Model(PRM)。實驗證明Skywork-PRM可有效的捕捉到復雜推理任務中間步驟和思考步驟對最終答案的影響。結合自研分步推理強化算法進一步加強模型推理和思考能力。

  ?推理planning:基于天工自研的Q*線上推理算法配合模型在線思考,并尋找最佳推理路徑。這也是全球首次將Q*算法實現和公開。Q*算法落地也大大提升了模型線上推理能力。

  亮點功能與實測

  Skywork o1模型具有以下能力和亮點功能:

  ?模型思考和規劃能力

  ?模型自我反思能力

  ?模型自我驗證能力

  相較于此前(長文本任務)大模型,無論是常識推理問題、邏輯推理問題、數學推理問題、倫理決策問題、還是“弱智”(類似腦筋急轉彎)邏輯陷阱問題等,Skywork o1都處理的游刃有余。整體來說,Skywork o1 Lite和Skywork o1 Preview線上版本在復雜問題分析、思考反思過程、輸出答案質量上均有大幅提升。

  進階版的復雜人類思考能力的解鎖也將進一步在垂類領域增強大模型的應用,例如:

  ?中英文常見邏輯推理和復雜任務,如數學/代碼類任務,科學研究

  ?高質量內容生成,如創意寫作,行業報告寫作

  ?深度搜索,解鎖復雜搜索任務的拆解

  2024年以來,昆侖萬維天工AI持續進化,陸續發布了“天工2.0”、“天工3.0”、“天工大模型4.0”4o版——Skywork 4o,以及今天正式發布的“天工大模型4.0” o1版(Skywork o1),不僅是我們貫徹“All in AGI 與 AIGC” 戰略的重要舉措,更是我們構建AI技術棧的重要一步。我們將秉持“實現通用人工智能,讓每個人更好地塑造和表達自我”的使命,從模型層、應用層等全方位、多維度來構建公司技術競爭力和生態矩陣。

  測試地址

  “天工大模型4.0” o1版(Skywork o1)開啟測試


猜你喜歡

昆侖萬維開源R1V視覺思維鏈推理模型,開啟多模態思考新時代

昆侖萬維創新創業

3月18日,昆侖萬維正式開源首款工業界多模態思維鏈推理模型Skywork R1V,即日起開源模型權重...

2025-03-18

昆侖萬維開源面向AI短劇創作的視頻生成模型SkyReels-V1,重塑AI短劇行業格局

昆侖萬維創新創業

2月18日,昆侖萬維開源中國首個面向AI短劇創作的視頻生成模型SkyReels-V1、中國首個SOT...

2025-02-18

昆侖萬維發布Matrix-Zero世界模型,開啟空間智能新時代

昆侖萬維創新創業

2月14日,昆侖萬維正式推出 Matrix-Zero世界模型,成為中國第一家同時推出3D場景生成和可...

2025-02-14

昆侖萬維推出“天工大模型4”4o版(Skywork 4o)

昆侖萬維智能+

從「天工大模型1.0」的研發到「天工大模型3.0」的發布,再到今天的「天工大模型4.0」階段,我們堅...

2024-11-20

原創

保護個人征信,就是保護錢袋子

金融科技還唄

“遠離‘征信修復’騙局,維護自身合法權益。”此前,一則有央行征信中心官方發布的海報在各個媒體、社交平...

2025-06-12

原創

夢碎IPO,中國音頻之王賣了

喜馬拉雅

IPO市場異常熱鬧,“神仙妖魔”碰運氣。

2025-06-12

陽光新能源擘畫零碳新圖景,三大創新激活能源轉型“全場景密碼”

創新創業陽光新能源

6月11日,第十八屆國際太陽能光伏與智慧能源大會在上海舉行。

2025-06-12

父親節送上愛的守護,京東618智能馬桶品類滿5000減500

京東大消費

臨近父親節,為爸爸挑選什么禮物是眾多消費者頭疼的難題。

2025-06-12

安奈兒困局突圍:虧損不是終點,失去“未來敘事”才是—從控制權變更看童裝賽道的價值重構

上市公司安奈兒

在當下喧囂的資本市場,我們目睹了一個奇特現象:盈利穩健的傳統巨頭可能估值平平,而講述著增長故事、甚至...

2025-06-12

華納藥廠:擬使用募集資金4,760萬元布局吸入制劑產品研發

上市公司華納藥廠

湖南華納大藥廠股份有限公司(以下簡稱“公司”)于2025年6月11日召開第四屆董事會第六次臨時會議、...

2025-06-12

響應寶山區衛健委號召,上海叮當健康志愿者服務隊積極助力健康科普宣傳

上市公司叮當健康

近日,上海叮當快藥在寶山區衛健委的引領下正式組建起叮當健康科普宣傳志愿者服務隊,積極投身健康科普宣傳...

2025-06-12

賽博威產品創新協同平臺:全面賦能企業創新流程,打造卓越產品力

創新創業賽博威

在競爭白熱化的快消品市場,唯有高效創新才能贏得先機。

2025-06-12

萬商聚勢羊城論道,供需雙端熱力共振 | 2025世界電源產業博覽會激活全球能量網絡

創新創業2025世界電源產業博覽會

當電源技術成為數字時代的能量神經中樞,從芯片級元件到兆瓦級設備的每一次迭代,都在重塑科技產業的底層邏...

2025-06-12

投資家網(m.51baobao.cn)是國內領先的資本與產業創新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創業企業、地方政府等提供專業的第三方信息服務,包括行業媒體、智庫服務、會議服務及生態服務。長按右側二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。

分化浪潮中的堅守與突破 | 第19屆中國投資年會,即將啟幕

分化浪潮中的堅守與突破 | 第19屆中國投資年會,即將啟幕

在時代的浩渺長河中,“分化”宛如一條隱匿的脈絡,貫穿于萬物的生長、發展與變遷。從生命的進化到文明的演...

第二屆中匈可再生能源、新材料商業投資峰會將盛大啟幕

第二屆中匈可再生能源、新材料商業投資峰會將盛大啟幕

第二屆中匈可再生能源、新材料商業投資峰會于2025年4月9日在匈牙利布達佩斯盛大啟幕。

雕刻耐心|第18屆中國投資年會·有限合伙人峰會在滬召開

雕刻耐心|第18屆中國投資年會·有限合伙人峰會在滬召開

“中國投資年會”作為私募股權行業的年度盛會,已成功舉辦了18屆,吸引了全國VC/PE領域從業者的廣泛...

主站蜘蛛池模板: 美女被免费视频网站a国产 美女被免费网站视频软件 美女被免费网站在线软件 美女被免费网站在线视频软件 | 三级带黄色| 国产日韩欧美三级 | 国产一区二区三区免费在线视频 | a级毛片在线免费看 | 亚洲第一页在线视频 | 手机看片1024欧美日韩你懂的 | 国产成人精品一区二区免费 | 久久99国产一区二区三区 | 成人欧美午夜视频毛片 | 久久精品99毛片免费 | 亚洲香蕉一区二区三区在线观看 | 国产精品国产三级国产专区5o | 国产成人久久一区二区三区 | 爽爽爽爽爽爽a成人免费视频 | 一级一片在线播放在线观看 | 国产欧美一区二区三区久久 | 亚洲欧美自拍一区 | 日本aaaa精品免费视频 | 国产乱码精品一区二区三区中 | 日韩亚洲综合精品国产 | 国产九九在线观看播放 | 深夜福利网站在线观看 | jiucao在线观看精品 | 亚洲毛片免费在线观看 | 亚洲性视频网站 | 精品国产亚洲一区二区在线3d | 欧美xx在线观看 | 亚洲性xx| 精品久久久视频 | 国产日本欧美在线观看 | 亚洲精品一区二区三区五区 | 中文字幕在线视频网站 | 一本色道久久综合网 | 美女黄色在线观看 | 91久久国产精品 | 黄色作爱视频 | 亚洲成a人片在线观看中文 亚洲成a人片在线观看中文!!! | 国产高清国产专区国产精品 | 亚洲第一男人天堂 | 国产精品欧美一区二区在线看 |