摘要:在科幻電影《超能陸戰(zhàn)隊(duì)》中,“大白”(Baymax)作為一個(gè)友伴式療愈機(jī)器人,展現(xiàn)了高度的適應(yīng)性和情感理解能力。
在科幻電影《超能陸戰(zhàn)隊(duì)》中,“大白”(Baymax)作為一個(gè)友伴式療愈機(jī)器人,展現(xiàn)了高度的適應(yīng)性和情感理解能力。他不僅能夠根據(jù)患者的身體狀況提供個(gè)性化的治療方案,還能通過識(shí)別患者的情感狀態(tài)和身份調(diào)整語氣和行為,給予人類足夠情感支持。
圖 1:受到觀眾喜愛的療愈機(jī)器人——“大白”
“大白”代表了人類對(duì)未來AI的完美設(shè)想:智能、高效且富有同理心。這樣的“夢中情 AI”究竟離我們有多遠(yuǎn)?7 月 31 日,SoundAI 聲智 AI 媒體溝通會(huì)在聲學(xué)未來館舉辦,答案似乎正在變得更加清晰。
本次活動(dòng)以“大模型·新交互”為主題,聲智科技副總裁黃赟賀公布了AzeroGPT 的算法技術(shù)升級(jí)成果,并發(fā)布了兩款新品——AI 交互新品“千面智語”和AI 硬件新品“聲智珍珠耳夾式耳機(jī)”。
圖 2: “大模型·新交互”聲智科技 AI 媒體溝通會(huì)
中國人自己的GPT-4o,給 GPT 加上“耳朵”
目前的智能體雖然已經(jīng)能夠理解復(fù)雜的指令,能通過文字識(shí)別基本的情緒,并能以文字的形式進(jìn)行自然對(duì)話,或者用合成語音進(jìn)行播報(bào),但對(duì)人類復(fù)雜情感的捕捉仍不夠精準(zhǔn),看起來不夠“智能”。
聲智科技在此次媒體溝通會(huì)上展示了AzeroGPT搭載的語音模型的算法升級(jí),在與AI進(jìn)行交互時(shí),它就像裝上了“耳朵”一樣,能迅速、準(zhǔn)確地“聽懂”用戶的意圖和需求,并且以語音對(duì)話的方式,進(jìn)行更快地響應(yīng),還能夠通過聲音傳遞出不同的情緒和情感。對(duì)標(biāo) GPT-4o,讓 AI 在對(duì)話中表現(xiàn)得像人類一樣絲滑。
圖 3:搭載 AzeroGPT 的小易能夠迅速、準(zhǔn)確地“聽懂”用戶的意圖和需求
該模型已經(jīng)通過國家網(wǎng)信辦算法備案和北京市生成式人工智能服務(wù)備案,在數(shù)據(jù)處理、隱私保護(hù)、技術(shù)的安全性和穩(wěn)定性等方面獲得了認(rèn)可。并已成功落地應(yīng)用于三甲醫(yī)院智能導(dǎo)診系統(tǒng)、機(jī)關(guān)單位智能助理、國家 5A 級(jí)景區(qū)、科技展廳智能講解、電信運(yùn)營商智能客服、大型樓宇智能電梯、公安反詐智能外呼系統(tǒng)等,積累了豐富的技術(shù)和服務(wù)經(jīng)驗(yàn),得到了客戶和用戶的認(rèn)可。
圖 4:聲智已經(jīng)順利完成“聲智壹元大模型算法”“Azero高級(jí)語音識(shí)別算法”“Azero高級(jí)語音合成算法”三項(xiàng)深度合成服務(wù)算法備案,以及一項(xiàng)“聲智壹元大模型”生成式人工智能服務(wù)備案。
超低成本部署,打造 AI 硬件與 AI 交互產(chǎn)業(yè)生態(tài)
傳統(tǒng)聲學(xué)模型在嘈雜環(huán)境中的表現(xiàn)往往不盡如人意,尤其是在重疊語音、多人說話等場景下,語音識(shí)別的準(zhǔn)確率和響應(yīng)速度都會(huì)被限制住。
聲智科技在本次媒體溝通會(huì)中展示了大模型在各種聲學(xué)環(huán)境下無縫交流的流暢體驗(yàn),通過對(duì)AI算法的升級(jí)以及Azero開發(fā)框架的優(yōu)化,顯著提升了聲學(xué)模型云計(jì)算的速度和準(zhǔn)確性。
此外,本次升級(jí)還將降噪算法、聲紋識(shí)別等聲學(xué)算法成功轉(zhuǎn)移到云計(jì)算,這一轉(zhuǎn)變打破了傳統(tǒng)設(shè)備端部署的局限性,提升了計(jì)算效率和安全性,還有效降低了AI設(shè)備的成本。
云計(jì)算的部署方式可以讓大模型接入各種硬件設(shè)備和交互軟件,用戶可以通過各種接入大模型的終端設(shè)備召喚屬于自己的全能 AI 伙伴。聲智面向不同的行業(yè)用戶,已經(jīng)開放了安全的私有化部署、可信的行業(yè)化訓(xùn)練,以及專業(yè)的生成式推理解決方案,打造人機(jī)交互產(chǎn)業(yè)生態(tài)升級(jí),助力企業(yè)進(jìn)行全域智能升級(jí)。
圖 5:搭載 AzeroGPT 的智能可穿戴硬件——聲智珍珠耳夾式耳機(jī)在百元級(jí)耳機(jī)上實(shí)現(xiàn)了同聲聽譯、語音轉(zhuǎn)寫、智能寫作等 AI 功能
此外,AzeroGPT 擁有超高級(jí)別的數(shù)據(jù)安全和隱私保護(hù)措施,通過了全球公認(rèn)的信息安全管理標(biāo)準(zhǔn)——ISO27001 認(rèn)證,還通過了多個(gè)行業(yè)內(nèi)公認(rèn)的技術(shù)安全認(rèn)證,如CCRC 信息安全服務(wù)資質(zhì)認(rèn)證、信息技術(shù)服務(wù)管理體系認(rèn)證、信息安全管理體系認(rèn)證和信息技術(shù)服務(wù)標(biāo)準(zhǔn)認(rèn)證等。聲紋識(shí)別技術(shù)及設(shè)備也通過了通過公安部許可認(rèn)證。這些認(rèn)證不僅是對(duì)聲智技術(shù)和管理能力的認(rèn)可,更是證明了 AzeroGPT 已經(jīng)具備了高水平的技術(shù)能力和管理體系,能夠提供穩(wěn)定可靠的服務(wù),減少因系統(tǒng)問題導(dǎo)致的業(yè)務(wù)中斷風(fēng)險(xiǎn)。
圖 6: 聲智壹元大模型 AzeroGPT 已經(jīng)通過多項(xiàng)備案。
“千面智語”——更通人性的交互智能體
實(shí)現(xiàn)“千人千面”的個(gè)性化服務(wù)一直是AI發(fā)展的重要方向。聲智科技的新產(chǎn)品“千面智語”數(shù)字人交互服務(wù),基于大模型和語音交互框架,能夠根據(jù)不同用戶的偏好和需求調(diào)整回應(yīng)方式。
圖 7: 聲智AI 交互智能體新品“千面智語”發(fā)布
媒體溝通會(huì)現(xiàn)場為觀眾展示了實(shí)時(shí)的擬人化交流效果。面對(duì)兒童的提問,Azero GPT 的回答會(huì)充滿童趣和簡單易懂的解釋,就像一個(gè)童年玩伴一樣滿足少年兒童探索未知的好奇心;而與老年人交流時(shí),會(huì)采用較慢的語速和更貼心的表達(dá)方式,輔助老年人進(jìn)行理解,充分展示了老年人。此外,媒體溝通會(huì)上還展示了心理醫(yī)生、反詐警官、稅務(wù)客服等角色,可以看到AI 在不同身份下都能進(jìn)行符合該角色風(fēng)格的表達(dá),風(fēng)格迥異的回答內(nèi)容和聲音語氣,可以讓機(jī)器人擁有足夠的專屬感和陪伴感,AI從此不再是一個(gè)簡單的工具,更是陪伴人類的好伙伴。
圖 8: AzeroGPT 面對(duì)不同的用戶需求,扮演多種角色
“AI 終極形態(tài)”——國內(nèi)首次在耳夾上實(shí)現(xiàn)人機(jī)交互
本次媒體溝通會(huì)上,國內(nèi)首款“AI 配飾”——“FairyClip 聲智珍珠耳夾式耳機(jī)”證明了大模型在可穿戴設(shè)備上實(shí)現(xiàn)的可能。這款耳機(jī)采用開放聆聽技術(shù),搭載了新一代AirAudio定向空氣傳音技術(shù),音質(zhì)清晰無漏音。此外,慢回彈耳夾的設(shè)計(jì)不僅美觀,而且戴起來絲毫沒有異物感,還不挑耳型,適合各種大小和形狀的耳朵。
圖 9: AzeroGPT 面對(duì)不同的用戶需求,扮演多種角色
耳機(jī)內(nèi)置的專屬AI助理,能夠隨時(shí)響應(yīng)用戶的指令,不僅可以實(shí)現(xiàn)轉(zhuǎn)寫、翻譯、內(nèi)容生成等針對(duì)辦公學(xué)習(xí)場景的功能,還針對(duì)運(yùn)動(dòng)健康、日常生活的需求,提供健康數(shù)據(jù)檢測、助眠音頻以及生活事項(xiàng)提醒等功能。
此外,最新版本的聲智APP-小易問問功能新增熱點(diǎn)資訊問答能力,在 2024 巴黎奧運(yùn)會(huì)期間還推出了奧運(yùn)特別版,不僅能進(jìn)行更加自然的實(shí)時(shí)對(duì)話,還能提供即時(shí)的賽事信息,用戶可以和小易一起,隨時(shí)隨地觀賽、追賽。
圖 10: 通過耳機(jī)可以在 2024 巴黎奧運(yùn)會(huì)期間實(shí)現(xiàn) AI 追賽
至此,百元級(jí)別的耳機(jī)也能擁有與千元機(jī)同等的 AI 功能。AI 算法的升級(jí)將用戶使用大模型的成本降到最低,真正做到技術(shù)普惠,人人都能享受到 AI 提供的專屬服務(wù)。
AI硬件與AI交互:全球AI落地的共識(shí)
人工智能技術(shù)發(fā)展至今,AI 硬件和 AI 交互已經(jīng)是全球AI技術(shù)落地的共識(shí)。未來人工智能與聲學(xué)技術(shù)的結(jié)合,將會(huì)創(chuàng)造出更完美的交互智能體。它足夠智能,可以無時(shí)無刻地陪伴在你的身邊;它足夠全能,讓你的學(xué)習(xí)工作更高效;極具同理心的它,對(duì)你的了解甚至超過你身邊的任何人,還能幫助你解決生活中遇到的各種問題……
就像聲智 AI媒體溝通上播放的創(chuàng)意短劇《戴上耳機(jī)開啟龍少寵溺新篇章》和《重生之我是耳機(jī)》那樣,通過一枚小小耳機(jī)的視角,展示了聲智團(tuán)隊(duì)對(duì) AI 事業(yè)的熱愛和追求,以及青年團(tuán)隊(duì)敢想敢做的態(tài)度,以當(dāng)下最流行短劇形式,表達(dá)產(chǎn)品設(shè)計(jì)的初心。
圖 11: 由聲智發(fā)布的短劇《戴上耳機(jī)開啟龍少寵溺新篇章》
圖 12: 由聲智發(fā)布的短劇《重生之我是耳機(jī)》
明確的戰(zhàn)略規(guī)劃與前瞻性的布局、長期持續(xù)的底層技術(shù)投入以及以用戶為核心的產(chǎn)品能力,推動(dòng)聲智科技勇敢前行,讓我們離夢想中的完美“大白”更近一步。
公司核心團(tuán)隊(duì)大多來自中科院,擁有十多年聲學(xué)和語音識(shí)別技術(shù)的研發(fā)經(jīng)驗(yàn),專注解決遠(yuǎn)場語音交互問題。
,積極治療高脂血癥及頸動(dòng)脈硬化斑塊可以降低心腦血管疾病的發(fā)病率、致殘率及致死率。
12 月 5 日,《財(cái)富》 500 強(qiáng)企業(yè)高管和多位世界頂尖設(shè)計(jì)師將匯集澳門,出席以“探索沉浸式體驗(yàn)...
近日,金融監(jiān)管總局發(fā)布《金融資產(chǎn)管理公司不良資產(chǎn)業(yè)務(wù)管理辦法》(以下簡稱《辦法》),其中,最受業(yè)內(nèi)關(guān)...
11月29日,由國家音樂產(chǎn)業(yè)基地、中國廣告協(xié)會(huì)聯(lián)合主辦的第三屆中國音樂營銷峰會(huì)在廈門舉行。
12月2日,一年一度的企業(yè)家博鰲論壇拉開序幕,以“改革新藍(lán)圖、增長新動(dòng)能”為主題,數(shù)百名優(yōu)秀企業(yè)家齊...
近日,海南銀塵網(wǎng)絡(luò)科技有限公司(以下簡稱“銀塵科技”)成功獲得云谷科技1000萬人民幣的天使輪融資。
11月27日至30日,第31屆中國國際廣告節(jié)在廈門國際會(huì)展中心隆重舉行。
投資家網(wǎng)(m.51baobao.cn)是國內(nèi)領(lǐng)先的資本與產(chǎn)業(yè)創(chuàng)新綜合服務(wù)平臺(tái)。為活躍于中國市場的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務(wù),包括行業(yè)媒體、智庫服務(wù)、會(huì)議服務(wù)及生態(tài)服務(wù)。長按右側(cè)二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動(dòng),趕快行動(dòng)吧。
2016年注冊(cè)于北京的中氫新能技術(shù)有限公司,下設(shè)位于大興的裝備制造公司、位于海淀區(qū)的技術(shù)研究院、材料...
一度無比高光的理想汽車,猝不及防遭遇重挫。
2024年1月10日,由投資家網(wǎng)主辦,財(cái)經(jīng)銳眼、有時(shí)間協(xié)辦,北京微金科技有限公司承辦的“第十二屆股權(quán)...
2024年1月10日,由投資家網(wǎng)主辦,財(cái)經(jīng)銳眼、有時(shí)間協(xié)辦,北京微金科技有限公司承辦的“第十二屆股權(quán)...
2024年1月10日,由投資家網(wǎng)主辦,財(cái)經(jīng)銳眼、有時(shí)間協(xié)辦,北京微金科技有限公司承辦的“第十二屆股權(quán)...