摘要:紅紅火火,恍恍惚惚,大模型從GPT開始爆發(fā)到現(xiàn)在,越來越多人加入這場(chǎng)科技界的“諸神之戰(zhàn)”。不可否認(rèn),大模型確實(shí)為我們展示出了人工智能的強(qiáng)大之處。
紅紅火火,恍恍惚惚,大模型從GPT開始爆發(fā)到現(xiàn)在,越來越多人加入這場(chǎng)科技界的“諸神之戰(zhàn)”。不可否認(rèn),大模型確實(shí)為我們展示出了人工智能的強(qiáng)大之處。但在當(dāng)下的狂熱氣氛中,大家仿佛都變成了“追星”的狂熱粉絲。
但技術(shù)終究要落地到垂直細(xì)分產(chǎn)業(yè)中,才能發(fā)揮其應(yīng)有價(jià)值,這是一個(gè)積淀、積累的過程,之后才能走向真正的成熟。從大模型在金融垂直細(xì)分領(lǐng)域的落地來看,馬上消費(fèi)正加速馴服大模型這匹“野馬”,為其套上“籠頭”,增加“馬鞍”、“馬鐙”。
馴服金融大模型“野馬”
大模型本質(zhì)上是一種更高壓縮比的知識(shí)庫(kù),這在當(dāng)下已經(jīng)成為共識(shí)。大模型不僅能存儲(chǔ)和運(yùn)用隱含于訓(xùn)練數(shù)據(jù)中的知識(shí),還能新生成有邏輯的組合知識(shí)。
具體來看,大模型之所以能表現(xiàn)出如此強(qiáng)悍的能力,主要經(jīng)歷了“原材料篩選”、“原材料配方”、“粗加工技術(shù)”“精加工技術(shù)”等四個(gè)步驟。大模型在對(duì)海量的網(wǎng)頁(yè)文本數(shù)據(jù)進(jìn)行質(zhì)量判斷和選取后,用于初步訓(xùn)練,然后將大量的知識(shí)編碼,再精調(diào)模型,選取問題供人工標(biāo)注。
對(duì)比搜索引擎,大模型可以更高效幫助我們提取有用的知識(shí)和信息,用“問題(prompt)”代替“傳統(tǒng)query”從大模型中查詢和提取知識(shí)。對(duì)于新知識(shí)的獲取從“主動(dòng)搜索”到“直接問專家”,就像從買菜做菜變成了直接用預(yù)制菜,而且專屬機(jī)器秘書可以記住你已有的知識(shí)水平,在此基礎(chǔ)上像老師一樣把你現(xiàn)在不知道的必要知識(shí)點(diǎn)自動(dòng)加入進(jìn)來,逐步教會(huì)你新知識(shí)。
作為重慶唯一獲得國(guó)家級(jí)高新技術(shù)企業(yè)認(rèn)定的金融機(jī)構(gòu),馬上消費(fèi)連續(xù)2年入圍國(guó)家工信部“新一代人工智能產(chǎn)業(yè)創(chuàng)新揭榜單位”,也正研究如何沿著Human Feedback這條ChatGPT已經(jīng)驗(yàn)證好的路徑將金融領(lǐng)域知識(shí)注入大模型。
馬上消費(fèi)人工智能研究院院長(zhǎng)陸全表示,“如果把通用大模型看作一匹資質(zhì)超群的‘野馬’,打造專注于金融垂直領(lǐng)域和細(xì)分場(chǎng)景的大模型應(yīng)用就相當(dāng)于對(duì)野馬的馴化。”
首先,需要用專有的經(jīng)過加工的垂直領(lǐng)域的數(shù)據(jù)作為“草料”來“喂養(yǎng)”它。當(dāng)前馬上消費(fèi)的整體數(shù)據(jù)量已經(jīng)超過40PB,服務(wù)器超過8000臺(tái),每日數(shù)據(jù)交換量超過950億,其中實(shí)時(shí)數(shù)據(jù)接入量350億,每日投放數(shù)據(jù)量超過190億,而風(fēng)控Hbase調(diào)用量超過40萬(wàn)次/s,相關(guān)指標(biāo)均在消費(fèi)金融領(lǐng)域處于領(lǐng)先位置。
其次,要在垂直領(lǐng)域?qū)δP瓦M(jìn)行精調(diào)對(duì)齊訓(xùn)練,相當(dāng)于為野馬套上“籠頭”,再用大模型的推理加速技術(shù)為它加上“馬鞍”、“馬鐙”,讓這匹駿馬跑得更快、更可控。
“由于100億以下參數(shù)的模型無法具備很多能力”,馬上消費(fèi)人工智能研究院李寬補(bǔ)充道,“為此我們必須克服GPU和經(jīng)驗(yàn)的不足,以獲得對(duì)這種大小模型的‘精調(diào)訓(xùn)練’和‘推理使用’的能力,并在自身數(shù)據(jù)上做模型精調(diào);其中包括:基于自身數(shù)據(jù),設(shè)計(jì)和訓(xùn)練“問答對(duì)”,以保證既要保留原有大語(yǔ)言模型的常識(shí)和通用推理能力,又要能在獨(dú)有的金融垂直細(xì)分?jǐn)?shù)據(jù)上產(chǎn)生類似的能力擴(kuò)展。”
最后,要有足夠的應(yīng)用場(chǎng)景來供這匹駿馬奔馳和迭代,使用的人越多,評(píng)估反饋越多,模型迭代越快,才會(huì)越來越好。而在這一方面,馬上消費(fèi)等大型消費(fèi)金融機(jī)構(gòu)具有先天優(yōu)勢(shì),能夠產(chǎn)生很強(qiáng)實(shí)際使用效果。
陸全院長(zhǎng)還表示,相比來說,擺在中小型金融機(jī)構(gòu)面前的首道難關(guān)就是資源門檻,在強(qiáng)大動(dòng)力需求的作用下,它們會(huì)向金融行業(yè)內(nèi)大型機(jī)構(gòu)或具備技術(shù)優(yōu)勢(shì)的金融科技平臺(tái)需求協(xié)助,建立起相關(guān)的科技能力。
據(jù)最新數(shù)據(jù)顯示,馬上消費(fèi)的注冊(cè)用戶已突破1.5億,累計(jì)發(fā)放消費(fèi)貸款超過4000億元,合作金融機(jī)構(gòu)超200個(gè),合作商戶超100萬(wàn),形式了全渠道全場(chǎng)景開放生態(tài)。
布萊恩·阿瑟在《技術(shù)的本質(zhì)》一書中曾提到,技術(shù)從本質(zhì)上來說是自創(chuàng)生的,所有新技術(shù)都不是無中生有被發(fā)明出來的,新技術(shù)都是從現(xiàn)存技術(shù)中組合出的一組新的要素。
在馬上消費(fèi)副總經(jīng)理兼首席信息官蔣寧看來,ChatGPT巧妙地疊加了Transformer、有監(jiān)督微調(diào)訓(xùn)練、強(qiáng)化學(xué)習(xí)等技術(shù),成功展現(xiàn)了由于模型規(guī)模帶來的突現(xiàn)能力,經(jīng)過近幾年不斷迭代部署,量變的積累產(chǎn)生質(zhì)變,形成了ChatGPT的語(yǔ)言智能。
大模型的“金融產(chǎn)業(yè)之戰(zhàn)”
需要注意的是,大模型對(duì)我們來說是做好賦能。陸全院長(zhǎng)認(rèn)為,大模型對(duì)我們社會(huì)生活的最終影響是“秘書平民化”。
比如,大模型可以幫助我們進(jìn)行各種寫作工作,講稿,郵件,論文,代碼等都可以先由AIGC生成供你修改的草稿;還可以進(jìn)行歸納性文字類工作,機(jī)器秘書可以按要求瀏覽大量指定文章,從中生成摘要;對(duì)于新知識(shí)的獲取從“主動(dòng)搜索”到“直接問專家”,而且專屬機(jī)器秘書可以記住你已有的知識(shí)水平,逐步教會(huì)你新知識(shí);專屬機(jī)器秘書會(huì)記住和更了解你的各種偏好,幫你做個(gè)性化復(fù)雜的決策建議等等。
當(dāng)然,大模型可能會(huì)淘汰掉一些物種,但也會(huì)讓一些原有物種獲得新能力,比如智能客服。在這方面,馬上消費(fèi)對(duì)待大模型有著更為清醒的認(rèn)知,高效的智能客服可以替換人工坐席。
陸全院長(zhǎng)還表示,在智能交互方面,通過配備機(jī)器人客服將金融知識(shí)及產(chǎn)品相關(guān)信息一條條添加到知識(shí)庫(kù)里,盡管“喂養(yǎng)”了很多數(shù)據(jù),也避免不了機(jī)器人回答的機(jī)械化和準(zhǔn)確性欠佳,因?yàn)樗淖R(shí)別能力是有限的,更多充當(dāng)協(xié)助人工客服的角色。而大模型本身具備大量通用知識(shí),除了金融常識(shí)外,對(duì)于其他特殊內(nèi)容,可以通過知識(shí)注入的方式給到大模型,并且通過持續(xù)、充分的訓(xùn)練,能夠使大模型具備更加精準(zhǔn)的語(yǔ)義理解能力和強(qiáng)大自然語(yǔ)言生成能力。自然而然,大模型可以成為懂金融的“專家”。
不久前,全國(guó)首個(gè)數(shù)字警察“警小靈”,在重慶防范經(jīng)濟(jì)犯罪宣傳啟動(dòng)儀式現(xiàn)場(chǎng)亮相。“警小靈”就是由馬上消費(fèi)提供的技術(shù)支持,可以實(shí)現(xiàn)24小時(shí)不間斷為群眾提供專業(yè)、精準(zhǔn)、高效的咨詢服務(wù)。
需要注意的是,隨著大模型的能力越來越強(qiáng)大,大模型標(biāo)準(zhǔn)的制定也越來越急迫,因?yàn)榇竽P偷目煽匦匀匀惠^差。
為此,馬上消費(fèi)積極推動(dòng)人工智能生成內(nèi)容(AIGC)標(biāo)準(zhǔn)的制定,從規(guī)范約束和風(fēng)險(xiǎn)監(jiān)控兩個(gè)方面來保證機(jī)器智能生成內(nèi)容的可信合規(guī)。截至目前,依托科技研發(fā)創(chuàng)新,馬上消費(fèi)已參與超30項(xiàng)金融科技標(biāo)準(zhǔn)編制工作,涉及研發(fā)運(yùn)營(yíng)一體化能力成熟度、開發(fā)平臺(tái)通用能力要求等,獲得28項(xiàng)人工智能與交易安全領(lǐng)域備案認(rèn)證,在標(biāo)準(zhǔn)及認(rèn)證方面表現(xiàn)優(yōu)秀。
在當(dāng)下這個(gè)充斥著技術(shù)誘惑的時(shí)代,我們更需要在技術(shù)工具面前保持足夠的清醒。正確認(rèn)識(shí)科技價(jià)值,才能實(shí)現(xiàn)“科技讓生活更美好”的目的。
為增強(qiáng)青少年金融素養(yǎng),提高風(fēng)險(xiǎn)識(shí)別能力。“2024年普及金融知識(shí)萬(wàn)里行”活動(dòng)期間,馬上消費(fèi)金融股份有...
針對(duì)這一嚴(yán)峻形勢(shì),金融監(jiān)管局近日發(fā)布了《2024年金融消費(fèi)者教育工作方案的通知》,并將5月15日定為...
近日,國(guó)家發(fā)展改革委、財(cái)政部、海關(guān)總署、國(guó)家稅務(wù)總局等聯(lián)合公布2023年新認(rèn)定(第30批)國(guó)家企業(yè)技...
大模型時(shí)代下,如何推動(dòng)數(shù)字金融創(chuàng)新?
智能客服在金融機(jī)構(gòu)服務(wù)中扮演著越來越重的角色,但“智能客服不智能”的情況,至今仍然是金融機(jī)構(gòu)和客戶之...
3月31日,中興通訊發(fā)布公告,當(dāng)日召開的第十屆董事會(huì)第一次會(huì)議審議通過《關(guān)于選舉第十屆董事會(huì)董事長(zhǎng)的...
3月27日,蒙牛乳業(yè)(2319.HK)在香港召開2024年全年業(yè)績(jī)發(fā)布會(huì)。
云知聲"基于大模型和語(yǔ)音交互技術(shù)的醫(yī)療文書自動(dòng)生成系統(tǒng)"成果入選未來信息方向典型應(yīng)用場(chǎng)景,成為全國(guó)智...
3月28日,2025星圖低空云發(fā)展大會(huì)(青島)成功舉辦。
作為擁有近三十年電力智能化研發(fā)經(jīng)驗(yàn)的高新技術(shù)企業(yè),煜邦電力始終肩負(fù)著行業(yè)革新使命。
根據(jù)公告,廣大特材2025年第一季度預(yù)計(jì)實(shí)現(xiàn)營(yíng)業(yè)收入約11.20億元,與上年同期相比,增加約2.28...
自誕生以來,GORE-TEX品牌憑借對(duì)科技創(chuàng)新的不竭探索,開發(fā)出滿足戶外、運(yùn)動(dòng)、休閑等場(chǎng)景細(xì)分性需求...
2025 年3月 28 日,世茂服務(wù)控股有限公司(873.HK)發(fā)布2024年全年業(yè)績(jī)報(bào)告。
近日,中復(fù)神鷹碳纖維股份有限公司(以下簡(jiǎn)稱“中復(fù)神鷹”或“公司”)發(fā)布了2024年年度報(bào)告。
投資家網(wǎng)(m.51baobao.cn)是國(guó)內(nèi)領(lǐng)先的資本與產(chǎn)業(yè)創(chuàng)新綜合服務(wù)平臺(tái)。為活躍于中國(guó)市場(chǎng)的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務(wù),包括行業(yè)媒體、智庫(kù)服務(wù)、會(huì)議服務(wù)及生態(tài)服務(wù)。長(zhǎng)按右側(cè)二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動(dòng),趕快行動(dòng)吧。