国产无遮挡色视频免费视频-国产五月色婷婷综合-国产五月婷婷-国产午夜不卡-曰批免费视频播放在线看片二-曰韩一级毛片

更多精彩 >

百度數據眾包,一門AI新基建的“基建”生意

2020-12-31 13:43:45   來源:投資家網專欄  作者:智能相對論 

摘要:AI成了新基建的C位,不論是原本就以AI立身的百度,還是紛紛在技術上加大投入以擁抱新基建的阿里、騰訊等巨頭,最近都顯出強化AI地位的態勢。

文/智能相對論(aixdlun)

作者/葉遠風

AI成了新基建的C位,不論是原本就以AI立身的百度,還是紛紛在技術上加大投入以擁抱新基建的阿里、騰訊等巨頭,最近都顯出強化AI地位的態勢。

在AI新基建浪潮下,其背后的動力和“靈魂”——AI數據行業正在快速增長。按照艾瑞咨詢《2019年中國人工智能基礎數據服務行業研究報告》,預計2025年市場規模將突破113億元,其中,原本就在AI技術和應用上領先的企業在數據業務上也更為積極。

有人曾稱5G是“新基建”的“基建”,是很多新基建項目的前置技術。事實上,以數據眾包為代表的AI數據行業,也可以看作AI新基建的“基建”型業務,為各行各業智能化轉型提供動能,加速智能經濟到來。反過來,當AI新基建蓬勃興起時,它背后的數據眾包產業也面臨急速膨脹的市場,這是一片門檻不算高的藍海,但并非人人都能做得好。

多重因素推動AI數據需求進一步增長

AI從行業架構上分為基礎層、技術層、平臺層以及應用層。無論是算力、算法、數據都只是在基礎層,海量的數據獲取和加工是AI發展的基石。

我們通常看到的那些AI智能化應用,在后端首先都需要足夠多、足夠好的數據對計算機進行訓練。

推動基礎層AI數據需求進一步增長,肯定來自于更上層的“倒逼”。總體看來,新基建的大背景下,整體AI行業的高速發展驅動了AI數據需求的增長“提速”,而具體來看,又有三重因素:

1、AI應用落地時對數據的強依賴

以人臉識別為例,一般的FaceID已經為人所熟知,其原理,是通過大量數據訓練,讓算法可以精準為整張臉標記特征,眼睛、鼻子、嘴、顴骨……從而識別不同的人物、確定身份(圖片來源:網絡):

但是,實際應用落地要想適用面更廣,又會有新的麻煩。

例如,疫情期間戴上了口罩,就沒辦法為鼻子以下的部位做特征標記進行比對。這時候,AI數據的價值就體現出來了,更復雜、更大量的數據訓練,讓系統在鼻子以上部位能標記出更多、更細致的特征,半邊臉就能完全區別出一個人來,甚至有科技公司開發出憑借眼部復雜特征的識別方式。

只有更高質量、更具有豐富度的數據,訓練出更細致的特征標注能力,系統識別的能力才會越強。在人臉識別之外,很多AI落地應用也有類似的邏輯。

2、AI應用場景深耕,垂直領域變為數據競逐

在AI走得更快、更遠的一些場景,數據的價值更為明顯。

例如,在自動駕駛領域,決定自動駕駛平穩性和安全性的,是系統對路況各種要素的識別,而它們都依賴于前期大量數據訓練,給機器標注各要素、教會它識別。

標注得越精細,機器的理解能力就會越強,發生意外的可能性就越低,就像學生學習知識一樣,“不知道”的東西越來越少(圖片來源:網絡)。

國內處在自動駕駛領先位置的百度,首先領先的就是數據,其ApolloScape數據集比Cityscapes、Kitty等同類的自動駕駛數據集大10倍以上,涵蓋更復雜的環境、天氣和交通狀況。

可以說,在那些深耕的場景里,AI的競逐首先甚至主要就是數據的競逐,AI新基建的深度落地,離不開對數據的索求。

3、“AI國情”側重于數據發展

與多數人想象不同的是,同為AI基礎層,看起來十分高深的算法,其門檻已經不算高,公開渠道上,論文、開源深度學習框架、各種各樣AutoML框架算法,可供獲取的很多。

除了百度這樣的AI巨頭還需要在算法上做一些突破和引領,對多數AI參與者來說,算法已經不是遙不可及。

而正如原南開大學校長龔克所言,中國在核心算法上的優勢不算明顯,但中國的數據和應用場景可以領先世界。

這方面,AI數據需要的應用采集源(例如人相、交通道路圖像等)、勞動力人口、需求市場,中國原本也十分有優勢。在這樣的“AI國情”下,AI新基建除了保證自有算法能力不被卡脖子,在已有大量落地場景的優勢下,大力發展AI數據就順利成章。

三大痛點,自建團隊已并非“AI新基建”最優選擇

AI數據的需求方,主要包括AI公司、科技公司、科研機構以及傳統意義上的行業企業(手機、汽車、安防等),這個群體越來越龐大。

AI數據的市場供給,主要由企業自建或直接獲取外包團隊的形式以及供應商組成,而按照艾瑞咨詢的報告,供應商模式占比高達79%。

問題在于,為什么需求方們都熱衷于選擇數據眾包這類供應商模式來獲得數據,在數據需求龐大的情況下,為什么不自建團隊采集和標注數據?這主要基于三個痛點:

1、數據需求的“潮汐現象”

春運期間,鐵路運力不夠,平時,又大量閑置。

如果自建團隊,很多AI需求方將產生與此類似的“潮汐現象”:受自身產品迭代周期的影響,在AI迭代期涌入大量數據需求,團隊難以承受;在日常維護期數據需求不是很旺盛,團隊又在閑置。

于是,數據供應商就成為彈性投入、增強企業適應力的必然,市場供給的主力軍變成各類AI基礎數據的服務提供者。

2、數據資源池不足

自建團隊往往面臨較為嚴重的數據資源池匱乏問題。舉例來說,如果你是一家做與人體有關的圖像識別的專業公司,或者需要這樣的技術來配合主業,你可能需要尋找不同膚色、不同外形特征的人物做AI數據采集,以提升AI的“認知”能力,而對很多企業而言,除了依賴那些有限的開源數據,沒有太多辦法。

這方面,專門做數據業務的平臺就有明顯的資源聚集優勢。例如,單就人物圖像來說,百度數據眾包的數據資源池在國內覆蓋30個省份,具備漢族、少數民族采集能力;在國外覆蓋22個國家,具備白人、黑人、印第安人等多人種采集能力。

3、數據輸出能力的“維度差距”

數據眾包平臺集中大量地熟悉數據采標業務,已經得到了充足的鍛煉,一些平臺,例如百度數據眾包還對內提供大量數據服務,自2011年起全面支持百度自動駕駛、小度助手等AI業務,它們對于外部需求,在能力上更容易應對。

這本質上體現在通用的“標準化”和專項的“定制化”區別上。AI數據有時候只需要一些標準化的泛化數據,例如道路要素標記,車、路燈、行人、斑馬線、雙黃線等,有些時候則需要定制化數據,例如專門針對鄉村小道的識別,其中可能有野狗、野貓等更復雜的要素。

但這種標準化和定制化只是相對的,對發展往往不夠充分的自建平臺而言是“定制化”(意味著需要花費大量精力),到了數據眾包平臺那里,可能只是“標準化”的一部分,像百度數據眾包的標注能力已經可以覆蓋市95%以上的主要標注場景。

AI新基建對數據采標有三大要求,數據眾包都滿足了嗎?

有龐大而快速增長的市場,也有供應商模式相對自建團隊的優勢,在AI新基建浪潮下,數據眾包成為了一門“更好的生意”,這些年也有不斷大量的玩家加入(圖片來源:艾瑞咨詢):

總體而言,最早的玩家大都已經取得較明顯的市場優勢,例如百度數據眾包已經成為在世界范圍內采標能力、流程標準化/工具智能化、數據安全等方面都處于領先位置的一站式AI數據服務平臺(這與中國AI領先、百度以AI為主戰略也有關系),覆蓋了智能駕駛、手機、互聯網、AI開發者等頭部客戶;

而新進入者亦有沖勁,像云測數據從云測試轉身到AI數據行業,對京東眾智、騰訊云數據、龍貓數據等都可能形成沖擊。

不過,從需求方的角度看,不論是誰,“一門更好的生意”要坐實,這三大基礎要求必須滿足。

1、安全:“銀行級合規”

AI數據不但是AI新基建的重要驅動力,它也是企業的重要資產,它的泄露和核心算法的泄露都是知識產權的重大損失,沒有根本區別。

只不過,算法可以自己蒙頭在家管死,而在數據眾包市場上,涉及到甲乙方原始數據交接、生產過程及成果交付,這其中存在著許多數據安全的口子。

一旦上升到新基建的高度,對很多賴以生存的需求方來說,說數據是命根子可能不為過,對數據的處理保證安全是第一位的,甚至需要“銀行級合規”避免出現任何紕漏。

對巨頭而言,出現安全問題就更加不能容忍,例如,百度數據眾包為此在數據確權、數據加密、實名認證、生產監控等方面進行全流程管控確保數據安全(圖片來源:網絡):

如果我們翻開各大平臺的官網主頁,即便最新進入的玩家云測數據,都能發現它們用了很大的篇幅先講安全。

不過,安全最終還是靠“不出事故”來檢驗,如同云計算穩定性說得再好,不宕機才是最好的證明。

2、“產量”:前沿科技下的密集的勞動力

雖然AI是頂尖的前沿技術,但AI數據確實一個不折不扣的勞動力密集行業。AI新基建首先驅動的是對數據產量的需求,這直接反應到勞動力規模是否足夠大上,畢竟,一張一張的圖、一句一句的話、一段一段的語音,都需要人力一個個標記好。

這是一個直觀的要求,它的實現又分自有團隊和代理全職團隊兩個部分,例如百度數據眾包宣稱自有2000人團隊、遍布全球22個國家的超過5萬名采標人員的代理商資源池——基本上,各平臺都在著力凸顯自己的團隊規模,龐大的勞動力群體是AI新基建的獲取足夠多數據的重要保障。

但是,正如工廠流水線有最優生產流程,有幫助工人更快、更好完成工作的輔助工具一樣,要提高產量、提升效率,流程和工具也必不可少,標準化、工業化的生產流程、高效易用的標注工具,也是百度等數據巨頭提升自我的重要著力點。只不過,這些只是起到“乘數作用”,底子還是看勞動力規模。

3、質量:“精益制造”級別的復雜管理體系

在安全、產量之外,質量是數據眾包成為一門可持續生意的根本,也是AI新基建真正落地的根本,質量不達標的數據不但不能推進系統識別能力的提升,甚至可能產生誤導,如同學生學習了低劣的習題集再去考試一樣。

而說白了,數據眾包可以看作一門以數據為產品的“制造業”,要提升質量,對應地,就要配以“精益制造”級別的復雜管理體系。

這個體系,通常包括嚴苛的審核體系(例如標注、審核、抽檢的層層把關)、人盡其用(不能混用CV、NLP等數據人員)、固定的例會總結問題提醒改進等,此外,還有一些工業化生產流程的濃重痕跡,例如百度數據眾包平臺的三階段“生產加工流程”——小流量測試跑通生產流程、正式生產不斷調優、交付時最終驗收審核。

可以說,AI數據對質量的要求,和精細化制造業實現更好的良品率,別無二致。

數據眾包,不止于AI新基建?

由于“勞動力需求”的特殊性,數據眾包在特殊的時代背景下還超出了AI新基建的價值范圍。

脫離行業角度,從穩就業來看,百度山西數據標注基地人員規模已近3000人,這些都是實實在在的就業人口容納能力,是應屆畢業生、其他行業分流人員(例如在山西的某傳統產業)甚至包括殘障人士的一份生計。加上其他工作人員,后疫情時期,一個數據眾包平臺已經幫助當地實現就業。百度方面表示未來要通過山西基地的示范作用,聚攏更多數據企業,為山西本地創造超過5萬個就業崗位。

甚至于,百度數據眾包還打算打通數據生產,數據交易和數據應用的三個環節,做一個開放的平臺,如果這個構想成功,在AI數據領域建立一個資源對接的市場,不僅是AI新基建背后的數據生態閉環問題,或還將匯聚起大量的就業機會和新的經濟增長點。

我們否定AI將摧毀就業機會時,理由常常是新的技術一定會帶來新的工作崗位,而AI數據產業毫無疑問就是正在發生的例證。數據眾包不僅將是一門更好的生意,也是下一個時代許多人的職業去處。

*本文圖片均來源于網絡

此內容為【智能相對論】原創,

僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。


猜你喜歡

百度與招商銀行達成戰略合作,大模型賦能金融創新

百度創新創業

招商銀行行長助理、北京分行行長徐明杰,百度集團執行副總裁、百度智能云事業群總裁沈抖代表雙方簽約。

2024-10-08

《百度Q3財報:營收344.47億元,AI原生應用數據指標顯著增長》

百度

北京時間11月21日,百度發布第三季度財務報告,顯示三季度營收達344.47億元,歸屬于百度的凈利潤...

2023-11-21

APUS成為百度「靈境矩陣」首批合作伙伴,構建大模型應用生態

百度APUS

10月17日,APUS出席百度世界大會2023。會上,百度公布了靈境矩陣業務進展,APUS作為靈境矩...

2023-10-20

原創

百度入股九合創投旗下基金

百度

【#百度入股九合創投旗下基金#】

2023-10-13

原創

百度入股AI基礎設施供應商中科加禾

百度

【#百度入股AI基礎設施供應商中科加禾#】

2023-09-21

美國最大人壽保險公司或將收購李澤楷海外資產

金融科技人壽集團

知情人士透露,美國最大的人壽保險公司大都會人壽集團(MetLife Inc.)正就收購PineBri...

2024-10-25

2024未來發布論壇:探尋 AI 為 “千行百業” 賦能的新路徑

峰會2024未來發布論壇

百舸爭流奮楫者先,千帆競發勇進者勝。我們身處變革時代,既要把握當下機遇,更要勇于開創未來,讓每一步前...

2024-10-25

濃香標準化大動作!“全方位體系”呼之欲出,五糧液領了新使命

上市公司五糧液

10月22日,全國白酒標準化技術委員會第三屆濃香型白酒分技術委員會正式成立,并召開第一次全體委員大會...

2024-10-25

2024財年EB5簽證發放創新高 美國移民迎來“黃金期”!

峰會EB5簽證

僑外美國移民專家表示,這些數據表明,在過去的一年里,美國移民局在EB5投資移民簽證的審批流程上取得了...

2024-10-25

控煙轉折點出現!報告稱2025年英國電子煙用戶數將首次超過煙民

大消費電子煙

近日,全球煙草減害組織GSTHR發表的最新報告顯示,英國吸煙率(卷煙用戶數/總人數*100%)近20...

2024-10-25

中金財富1018發布會再定義買方投顧 助力財富管理高質量發展

金融科技中金財富

10月18日,中國中金財富證券有限公司(簡稱“中金財富”)舉辦以“向新·同行”為主題的“2024中金...

2024-10-25

可定投能分紅!泰康中證A500ETF聯接基金來了

金融科技泰康中證A500ETF

泰康中證A500ETF聯接基金(A類:022426/C類:022427)于10月25日起正式發行,為...

2024-10-25

堅持以配置的思路做投資 宏利基金固收戰將高春梅新品正在發行

金融科技宏利基金

對投資者而言,投資純債基金,既要考察基金經理的從業經歷與過往業績,同時又要考察基金公司固收團隊的投研...

2024-10-25

精準卡位增混市場大電量需求 寧德時代以驍遙電池破解行業發展痛點

上市公司寧德時代

這是全球首款純電續航達400公里以上且兼顧4C超充的增混專用電池,滿足了增混市場對純電長續航和超快充...

2024-10-25

原創

中國超市之王,要被賣了

大潤發

步步高被申請破產后,轟動中國的大潤發,即將迎來命運拐點。

2024-10-24

投資家網(m.51baobao.cn)是國內領先的資本與產業創新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創業企業、地方政府等提供專業的第三方信息服務,包括行業媒體、智庫服務、會議服務及生態服務。長按右側二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。

沙特天空塔投資設立專項基金帶領中國氫能獨角獸扎根沙特

2016年注冊于北京的中氫新能技術有限公司,下設位于大興的裝備制造公司、位于海淀區的技術研究院、材料...

挑戰奔馳的明星車企,突然“翻車”了

一度無比高光的理想汽車,猝不及防遭遇重挫。

深圳天使母基金姚小雄:將來股權投資行業競爭是服務能力的競爭

2024年1月10日,由投資家網主辦,財經銳眼、有時間協辦,北京微金科技有限公司承辦的“第十二屆股權...

避免卡脖子,硬科技如何“逆境”突圍?

2024年1月10日,由投資家網主辦,財經銳眼、有時間協辦,北京微金科技有限公司承辦的“第十二屆股權...

VC/PE眼中的“專精特新”

2024年1月10日,由投資家網主辦,財經銳眼、有時間協辦,北京微金科技有限公司承辦的“第十二屆股權...

第二屆中匈可再生能源、新材料商業投資峰會將盛大啟幕

第二屆中匈可再生能源、新材料商業投資峰會將盛大啟幕

第二屆中匈可再生能源、新材料商業投資峰會于2025年4月9日在匈牙利布達佩斯盛大啟幕。

雕刻耐心|第18屆中國投資年會·有限合伙人峰會在滬召開

雕刻耐心|第18屆中國投資年會·有限合伙人峰會在滬召開

“中國投資年會”作為私募股權行業的年度盛會,已成功舉辦了18屆,吸引了全國VC/PE領域從業者的廣泛...

雕刻耐心|第18屆中國投資年會·有限合伙人峰會即將啟幕

雕刻耐心|第18屆中國投資年會·有限合伙人峰會即將啟幕

2024年的一級市場,“耐心”是最高命題,也引發了持續全年的討論。

不響不輟|第18屆中國投資年會·年度峰會在滬召開

不響不輟|第18屆中國投資年會·年度峰會在滬召開

5月8-10日,由投中信息、投中網主辦的“第18屆中國投資年會·年度峰會”在上海外灘W酒店盛大召開。

主站蜘蛛池模板: 成人亚洲视频在线观看 | 亚洲成人精品 | 午夜国产高清精品一区免费 | 波多野结衣一区二区在线 | 成人怡红院视频在线观看 | 噜噜噜狠狠夜夜躁精品 | 国产丝袜美女一区二区三区 | 精品在线视频播放 | 国产成人精品一区二三区在线观看 | 欧美成人tv在线观看免费 | 国产在线精品福利91香蕉 | 美女个护士一级毛片亚洲 | 亚洲悠悠色综合中文字幕 | 九色97 | 久久全国免费久久青青小草 | 成人满18在线观看网站免费 | 99在线精品视频免费观里 | 色伦网 | 自拍在线| 日韩在线二区全免费 | 免费国产不卡午夜福在线 | 免费播放巨茎人妖不卡片 | 韩国精品一区视频在线播放 | 最近手机高清中文字幕大全7 | 在线免费视频国产 | 国产国模福利视频 | 久草在线视频在线观看 | 成年人网站免费观看 | 国产精品视频久久久久 | 国产香蕉在线视频一级毛片 | 国产在线综合视频 | 国产精品永久免费视频观看 | 久久院线| 在线看片亚洲 | 成人黄网大全在线观看 | 欧美一级毛片高清视频 | 久久久久免费精品国产 | 亚洲第一页在线视频 | 日韩美女网站在线看 | 亚洲一区二区三区久久久久 | a一级网站 |