国产无遮挡色视频免费视频-国产五月色婷婷综合-国产五月婷婷-国产午夜不卡-曰批免费视频播放在线看片二-曰韩一级毛片

更多精彩 >

趨境科技發(fā)布,首創(chuàng)“以存換算”和“全系統(tǒng)推理架構(gòu)”,助力企業(yè)高趨境科技

2024-10-12 16:02:54   來源:投資家網(wǎng)  作者: 

摘要:隨著大模型,尤其是開源大模型的持續(xù)進(jìn)化,具備復(fù)雜推理能力的模型正在逐步應(yīng)用于各行各業(yè),并展現(xiàn)出超越人類專家的潛力。

隨著大模型,尤其是開源大模型的持續(xù)進(jìn)化,具備復(fù)雜推理能力的模型正在逐步應(yīng)用于各行各業(yè),并展現(xiàn)出超越人類專家的潛力。得益于此,未來的算力建設(shè)將更加聚焦于推理場(chǎng)景,而不僅僅是訓(xùn)練算力。

華福證券的研究指出,到2027年,推理端的人工智能服務(wù)器預(yù)計(jì)將占整體工作負(fù)載的72.6%。同時(shí),OpenAI o1 所代表的大模型推理場(chǎng)景的 Scaling Law 也進(jìn)一步助推了這一趨勢(shì)的加速發(fā)展。

然而,盡管模型的效果有了顯著的提升,數(shù)百億參數(shù)、上百萬上下文的一線模型在實(shí)際部署中仍面臨高成本和低效率的挑戰(zhàn)。這一現(xiàn)象導(dǎo)致了難以破解的“不可能三角”。

 

image.png

 

為了應(yīng)對(duì)這一困境,亟需新型推理架構(gòu),打破傳統(tǒng)主要為訓(xùn)練場(chǎng)景設(shè)計(jì),以高端 GPU 為中心的算力架構(gòu)設(shè)計(jì)思路。

在此背景下,趨境科技推出了“大模型知識(shí)推理一體機(jī)”,其搭載的業(yè)界首創(chuàng)的全系統(tǒng)推理架構(gòu)能夠通過協(xié)同存儲(chǔ)、CPU、GPU、NPU等多種設(shè)備,充分釋放異構(gòu)算力,將推理成本降低10倍以上。

 

image.png

 

這一創(chuàng)新為企業(yè)實(shí)現(xiàn)大模型的高效落地提供了全新選擇,開啟了通向“推理自由”的新途徑。

趨境大模型知識(shí)推理一體機(jī)不僅支持本地部署數(shù)百億級(jí)別的一線大模型,還提供開放的API接口,便于第三方靈活調(diào)用。同時(shí),用戶可根據(jù)需求定制企業(yè)智能助手(assistant/copilot),實(shí)現(xiàn)真正的“開箱即用”。

協(xié)同 HBM/DRAM/SSD 和 CPU/GPU/NPU 全系統(tǒng)異構(gòu)設(shè)備,充分釋放異構(gòu)存力和算力資源

與當(dāng)前行業(yè)主要針對(duì) GPU 算力利用率進(jìn)行單點(diǎn)優(yōu)化的傳統(tǒng)方案相比,趨境科技大模型知識(shí)推理一體機(jī)采用了業(yè)界首創(chuàng)的全系統(tǒng)推理架構(gòu)。

 

image.png

 

其通過“以存換算”技術(shù)釋放存力作為算力的補(bǔ)充,降低對(duì)算力的需求;同時(shí)采用“異構(gòu)協(xié)同”的思路,緊密聯(lián)動(dòng) HBM/DRAM/SSD 和 CPU/GPU/NPU 全系統(tǒng)異構(gòu)設(shè)備,突破顯存容量的限制,充分釋放全系統(tǒng)的存力和算力。

這一創(chuàng)新方案突破了以往方案的理論優(yōu)化極限,實(shí)現(xiàn)了整合機(jī)器所有異構(gòu)算力資源的目標(biāo),使得推理吞吐量提升超過10倍,大幅降低了大模型的落地成本。

此外,據(jù)財(cái)通證券發(fā)布的行業(yè)深度分析報(bào)告統(tǒng)計(jì)顯示,國產(chǎn)GPU產(chǎn)品在單精度/半精度浮點(diǎn)算力、制程及顯存容量上都與英偉達(dá)有2-4倍的顯著差距。因此,僅依靠GPU單點(diǎn)優(yōu)化,短時(shí)間內(nèi)很難趕超英偉達(dá)GPU方案。

而采用全系統(tǒng)推理架構(gòu)可以大幅降低GPU性能差距的影響,顯著提升國產(chǎn)替代解決方案的競(jìng)爭力,打破在大模型推理場(chǎng)景下國產(chǎn)GPU“卡脖子”的困境。

以存換算新范式,從“死記硬背”到“融合推理”

早期的大模型推理架構(gòu)將每次推理視為獨(dú)立請(qǐng)求,缺乏高效處理所需的“記憶”能力。盡管后續(xù)引入了近似問題緩存(Semantic Query Cache)和前綴緩存(Prefix KVCache Cache),但仍主要依賴于“死記硬背”。這些方案要求新問題與已處理問題高度一致才能利用緩存去降低算力需求。

針對(duì)這一問題,趨境科技創(chuàng)新性地設(shè)計(jì)了“融合推理(Fusion Attention)”技術(shù),即便是面對(duì)全新的問題也可以從歷史相關(guān)信息中提取可復(fù)用的部分內(nèi)容,與現(xiàn)場(chǎng)信息進(jìn)行在線融合計(jì)算。這一技術(shù)顯著提升了可復(fù)用的歷史計(jì)算結(jié)果,進(jìn)而降低了計(jì)算量。

 

image.png

 

通過這一新思路,趨境大模型知識(shí)推理一體機(jī)充分利用了存儲(chǔ)資源。采用“以存換算”的方式釋放存力作為對(duì)于算力的補(bǔ)充,在RAG場(chǎng)景中,響應(yīng)延遲降低20倍,性能提升達(dá)10倍。

全系統(tǒng)異構(gòu)協(xié)同新架構(gòu),從GPU單點(diǎn)優(yōu)化到全系統(tǒng)協(xié)同優(yōu)化

除了通過“以存換算”降低算力需求外,趨境大模型知識(shí)推理一體機(jī)還進(jìn)一步通過全系統(tǒng)異構(gòu)協(xié)同架構(gòu)設(shè)計(jì),將來自存儲(chǔ)、CPU、GPU、NPU的算力高效融合,進(jìn)一步提升大模型推理性能,降低成本。

此前,趨境科技與清華 KVCache.AI 團(tuán)隊(duì)合作,開源了一部分異構(gòu)推理框架,項(xiàng)目名為“KTransformers”(GitHub鏈接:https://github.com/kvcache-ai/ktransformers),該開源框架僅需單個(gè)消費(fèi)級(jí) GPU 即可在本地運(yùn)行 Mixtral 8x22B 和DeepSeek-Coder-V2 等千億級(jí)大模型,性能數(shù)倍于 Llama.cpp。

在長達(dá) 1M 的超長上下文推理任務(wù)中,成為業(yè)界首個(gè)僅需單 GPU 卡的高性能推理框架,生成速度達(dá)到 16.91 token/s,比 Llama.cpp 快10倍以上,同時(shí)維持接近滿分的“大海撈針”能力。

 

image.png

 

趨境科技大模型知識(shí)推理一體機(jī)采用的全系統(tǒng)推理架構(gòu)是基于“KTransformers”進(jìn)一步完善的商業(yè)版本,在開源版的基礎(chǔ)上,協(xié)同性能更強(qiáng),加入了多卡高并發(fā)調(diào)度、RAG支持等策略。經(jīng)過測(cè)試及客戶合作驗(yàn)證,Prefill 和 Generate 性能大幅領(lǐng)先業(yè)界方案:

Prefill階段的 TTFT(響應(yīng)延遲)相比業(yè)界方案快6倍以上

Generate階段的 TPOT(生成速度)相比業(yè)界方案快3.48倍以上

趨境x長亭:為安全大模型開啟千億大模型時(shí)代

國內(nèi)頂尖的網(wǎng)絡(luò)信息安全公司長亭科技,使用趨境科技提供的全系統(tǒng)異構(gòu)推理架構(gòu)技術(shù)策略,無縫銜接到其原有的“問津(ChaitinAI)安全大模型”、MSS 安全托管服務(wù)等產(chǎn)品中,問津(ChaitinAI)安全大模型升級(jí)為千億大模型,安全性能全方位升級(jí):

核心指標(biāo)攻擊識(shí)別準(zhǔn)確率提升至95.8%,檢測(cè)時(shí)延降低至秒級(jí)。另外,其對(duì)漏洞的檢測(cè)能力增強(qiáng),不僅提升漏洞發(fā)現(xiàn)數(shù)量,對(duì)應(yīng)的修復(fù)建議也更準(zhǔn)確,還能基于不同場(chǎng)景選擇更合適的工具和策略。同時(shí),對(duì)不良內(nèi)容識(shí)別能力升級(jí),準(zhǔn)確率和召回率均有提升。安全報(bào)告內(nèi)容生成質(zhì)量和評(píng)分也顯著提高,綜合輸出更具健壯性和穩(wěn)定性。

此外,長亭科技的安全大模型的部署資源成本降低50%,助推其更多業(yè)務(wù)加入大模型能力。

技術(shù)的不斷進(jìn)步和市場(chǎng)需求為大模型的未來發(fā)展提供了廣闊的空間。隨著算力基礎(chǔ)設(shè)施的不斷完善,提升算力的利用效率,使大模型能與更多的行業(yè)實(shí)踐結(jié)合起來,未來大模型將在更多行業(yè)中發(fā)揮更大的作用。

趨境目前也正在和更多的大模型應(yīng)用廠商一同協(xié)作,希望助推全面智能化的到來。


猜你喜歡

宇通集團(tuán)與啟明創(chuàng)投等多家機(jī)構(gòu)表態(tài)看好文遠(yuǎn)知行長期價(jià)值

智能+文遠(yuǎn)知行

4月23日,全球自動(dòng)駕駛科技領(lǐng)軍企業(yè)文遠(yuǎn)知行(Nasdaq:WRD)原始股正式解禁,其核心股東宇通集...

2天前

人形機(jī)器人角逐半馬賽場(chǎng),我國現(xiàn)存機(jī)器人相關(guān)企業(yè)超86.3萬家

天眼查智能+

2025年4月19日,全球首個(gè)人形機(jī)器人半程馬拉松在北京亦莊舉辦。

2天前

智能家居需防“被監(jiān)聽”,全國現(xiàn)存智能家居相關(guān)企業(yè)近10萬家

天眼查智能+

智能家居的普及帶來了便捷,但也引發(fā)了隱私泄露的擔(dān)憂。

2天前

小度AI助手賦能Cleer ARC 5開放式AI耳機(jī),開啟AI無界體驗(yàn)

智能+小度Cleer

4月22日,Cleer重磅發(fā)布了新一代旗艦產(chǎn)品——Cleer ARC 5 音弧 開放式AI耳機(jī),據(jù)介...

5天前

啟明創(chuàng)投、上海國投孚騰資本聯(lián)合領(lǐng)投,未來智能場(chǎng)景化落地能力成關(guān)鍵

智能+未來智能

繼今年1月完成Pre A輪融資后,AI硬件企業(yè)未來智能再傳捷報(bào)。

2025-04-22

原創(chuàng)

“一城一非遺”花絲座談會(huì):以金絲織就藝術(shù)經(jīng)緯

文化傳媒北京故宮文化傳播

牽一絲而塑萬形,以順勢(shì)之柔,成就東方之美。花絲鑲嵌作為中國細(xì)金工藝的代表,背后承載著豐厚的歷史價(jià)值與...

2025-04-19

一“馬”當(dāng)先!人形機(jī)器人“天工”大賽奪金 百度智能云助力具身智能產(chǎn)業(yè)加速跑

金融科技百度智能云

4月19日,2025北京亦莊半程馬拉松暨人形機(jī)器人半程馬拉松鳴槍開跑。作為全球首個(gè)人形機(jī)器人半程馬拉...

2025-04-19

數(shù)勢(shì)科技SwiftAgent 3.0發(fā)布 從智能分析到智能決策

創(chuàng)新創(chuàng)業(yè)數(shù)勢(shì)科技

在全球數(shù)字化轉(zhuǎn)型浪潮中,企業(yè)數(shù)據(jù)價(jià)值挖掘的瓶頸日益凸顯:數(shù)據(jù)口徑混亂、分析門檻高、決策鏈路長等問題導(dǎo)...

2025-04-19

榮獲雙料大獎(jiǎng)+白皮書發(fā)布:數(shù)勢(shì)科技領(lǐng)跑AIGC決策智能賽道

創(chuàng)新創(chuàng)業(yè)數(shù)勢(shì)科技

4月16日,由量子位主辦的第三屆《中國AIGC產(chǎn)業(yè)峰會(huì)——萬物皆可AI》在京成功舉辦。

2025-04-18

追覓韓國首家旗艦店開業(yè),加速全球化線下渠道布局

大消費(fèi)追覓

日前,追覓韓國首家旗艦店在首爾漢南洞Nine-one盛大開業(yè),標(biāo)志著追覓在韓國市場(chǎng)邁出了堅(jiān)實(shí)且重要的...

2025-04-18

原創(chuàng)

暴增940%!中國App突然在美國爆火

APP

突然爆火!美國人爭相下載這款中國App

2025-04-18

投資家網(wǎng)(m.51baobao.cn)是國內(nèi)領(lǐng)先的資本與產(chǎn)業(yè)創(chuàng)新綜合服務(wù)平臺(tái)。為活躍于中國市場(chǎng)的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務(wù),包括行業(yè)媒體、智庫服務(wù)、會(huì)議服務(wù)及生態(tài)服務(wù)。長按右側(cè)二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動(dòng),趕快行動(dòng)吧。

分化浪潮中的堅(jiān)守與突破 | 第19屆中國投資年會(huì),即將啟幕

分化浪潮中的堅(jiān)守與突破 | 第19屆中國投資年會(huì),即將啟幕

在時(shí)代的浩渺長河中,“分化”宛如一條隱匿的脈絡(luò),貫穿于萬物的生長、發(fā)展與變遷。從生命的進(jìn)化到文明的演...

產(chǎn)業(yè)與技術(shù)雙向奔赴,具身智能產(chǎn)業(yè)供需交流會(huì)成功舉辦!

產(chǎn)業(yè)與技術(shù)雙向奔赴,具身智能產(chǎn)業(yè)供需交流會(huì)成功舉辦!

具身智能產(chǎn)業(yè)場(chǎng)景探索正當(dāng)時(shí)!

第二屆中匈可再生能源、新材料商業(yè)投資峰會(huì)將盛大啟幕

第二屆中匈可再生能源、新材料商業(yè)投資峰會(huì)將盛大啟幕

第二屆中匈可再生能源、新材料商業(yè)投資峰會(huì)于2025年4月9日在匈牙利布達(dá)佩斯盛大啟幕。

雕刻耐心|第18屆中國投資年會(huì)·有限合伙人峰會(huì)在滬召開

雕刻耐心|第18屆中國投資年會(huì)·有限合伙人峰會(huì)在滬召開

“中國投資年會(huì)”作為私募股權(quán)行業(yè)的年度盛會(huì),已成功舉辦了18屆,吸引了全國VC/PE領(lǐng)域從業(yè)者的廣泛...

主站蜘蛛池模板: 亚洲国产日韩精品 | 中文字幕精品一区二区2021年 | 美国毛片基地a级e片 | 青青热久久国产久精品 | 欧美一级毛片免费网站 | 收集最新中文国产中文字幕 | 久久两性视频 | 高清午夜线观看免费 | 国产99精品免费视频看6 | 国产看色免费 | 国产在视频线精品视频二代 | 在线中文字日产幕 | aaa欧美| 欧美精品在线视频 | 国产精品久久永久免费 | 久久免费国产精品一区二区 | 免费观看一级成人毛片软件 | a毛片全部播放免费视频完整18 | 久久99久久99| 最新国产美女一区二区三区 | 欧美人成在线视频 | 久久久精品免费热线观看 | 香蕉99国内自产自拍视频 | 欧美一级高清片在线 | 国产精品18久久久久久vr | 欧美一线视频 | 一级a级国产不卡毛片 | 欧美一级看片免费观看视频在线 | www.av在线.com | 高清成人爽a毛片免费网站 高清大学生毛片一级 | 欧美另类老妇 | 美女扒开腿让男人桶尿口 | 第四色成人网 | a级毛片毛片免费观看永久 a级毛片毛片免费很很综合 | 91精品国产综合久久久久 | 日本在线 | 中文 | 国产在线观看一区二区三区 | 天天爽夜夜操 | 久草手机在线 | 欧美日韩一区二区三区在线观看 | 成人免费视频软件网站 |