2024年的大模型賽事已過半程。
看過科技企業(yè)前半程的表現(xiàn),尤其是壓軸上場的華為開發(fā)者大會2024(HDC 2024),越發(fā)確認C端大模型和B端大模型的思路真是不一樣。C端大模型在“卷Token長度”、“卷價格”,其背后潛在目的是為了“卷數(shù)據(jù)”。他們希望以Token長度和價格,卷來更多的數(shù)據(jù),加速提升大模型的成熟度,進而增加生態(tài)黏性。
B端大模型的思路完全不一樣。
HDC 2024期間,華為云盤古大模型5.0正式發(fā)布。發(fā)布過程中,華為云用了一半時間講創(chuàng)新技術(shù),另一半時間講大模型的行業(yè)落地。而且華為云從下到上所有細節(jié)都沒一筆帶過,從AI基礎設施,到多模態(tài)大模型,再到行業(yè)大模型,以及具身智能,每一個環(huán)節(jié)的想法,華為云也都交代得清清楚楚。
華為云發(fā)布盤古大模型5.0
大模型到底在卷啥?
其實,在“百模大戰(zhàn)”最熱鬧的時候,也少有人提出“大模型泡沫”的質(zhì)疑。或者說,在這場關(guān)乎未來生產(chǎn)力的全球競爭中,現(xiàn)在多少卷些也無所謂。只不過進入2024年,大模型的競爭焦點開始分化。
“百模大戰(zhàn)”早期,科技企業(yè)是在卷參數(shù)量,千億參數(shù)和萬億參數(shù)大模型層出不窮。隨后,部分大模型又開始“卷Token長度”、“卷Token價格”,但這些都是典型C端大模型的思維。
B端大模型當然也缺數(shù)據(jù),尤其是缺高質(zhì)量的中文數(shù)據(jù)。好在,中國并不缺應用場景。兩會期間提出“人工智能+”行動計劃,并號召央企帶頭搶抓人工智能賦能傳統(tǒng)產(chǎn)業(yè),率先將應用場景開放出來。
這就釋放了相當積極的信號。
只不過,挑戰(zhàn)依然存在。企業(yè)中的文本、音頻、圖片、視頻等數(shù)據(jù),散落在不同角落;企業(yè)中的數(shù)據(jù)還要經(jīng)專家級的標注,才能成為高質(zhì)量的訓練語料;企業(yè)用戶對大模型的識別準確度,更提出了更高的入職標準。
或者說:“工作向左,生活向右”。從文理分班的那一刻起,企業(yè)用戶對B端大模型的能力結(jié)構(gòu),就提出了不一樣的需求。
不挑食,才能理解物理世界
華為云在此真下了不少功夫。
去年的這個時候,華為云盤古大模型3.0發(fā)布,它包括5+N+X三層架構(gòu),是一個完全面向行業(yè)的大模型系列;今年HDC 2024期間,華為云盤古大模型5.0正式發(fā)布,它在多模態(tài)、全系列、強思維等方面進行了全新升級。
其中,“多模態(tài)”能力尤其受到關(guān)注。原因很簡單,物理世界就是多種模態(tài)的,大模型要走進千行萬業(yè),大模型要看懂物理世界中的應用場景,就需要更多地理解及整合多模態(tài)的行業(yè)數(shù)據(jù)。
此方面的華為云盤古大模型5.0,主打的就是一個不挑食,營養(yǎng)均衡。它能夠更好地理解物理世界,更精準地識別和理解文本、圖片、視頻等數(shù)據(jù),甚至是雷達、紅外、遙感等更多的模態(tài)數(shù)據(jù)。
上述能力應用在圖片和視頻識別方面,盤古大模型5.0就能夠準確分析出衛(wèi)星遙感圖像中的農(nóng)作物生長情況,這可用于產(chǎn)量預估、病蟲害監(jiān)測等領域;它還能夠通過紅外影像,精準的識別夜間車輛的位置,這也將提升交通違停的管理效率。
同時,盤古大模型5.0的多模態(tài)生成能力,跟Sora關(guān)注點也不一樣。它聚焦于行業(yè)急需的應用場景。例如,在自動駕駛領域,它就通過創(chuàng)新的STCG技術(shù),大規(guī)模地生成和實際場景相一致的駕駛視頻數(shù)據(jù)。甚至,它還可以用模型生成晴天、雨天、黑夜的行車視頻。
B端大模型的“著陸點”
另一維度,關(guān)注“多模態(tài)”數(shù)據(jù)之外,B端大模型也更關(guān)注“落地點”。2023年,科技企業(yè)都在研究“大材小用”——將大模型落地于小場景。但之后他們發(fā)現(xiàn),“小材小用”或“量才適用”才是更好的思路。
本次HDC 2024,華為云盤古大模型5.0就推出了不同參數(shù)規(guī)格的模型,以適配不同的業(yè)務場景,例如,十億級參數(shù)的Pangu E系列,可支撐手機、PC等端側(cè)的智能應用,屬于典型的“小鋼炮”式大模型。
百億級參數(shù)的Pangu P系列,則適用于低時延、高效率的推理場景;千億級參數(shù)的Pangu U系列適用于處理復雜任務;萬億級參數(shù)的Pangu S系列超級大模型能夠幫助企業(yè)處理更為復雜的跨領域多任務。
毫無疑問,上述四個系列的大模型,都是典型B端大模型的思維。它們可落地在智能終端、智慧工廠、企業(yè)大腦、城市IOC等場景,也可以擔任辦公助理、質(zhì)檢員、網(wǎng)格管理員等職業(yè)角色。
B端大模型的制高點
當然,B端大模型的制高點在行業(yè)大模型,制高點上的明珠更是企業(yè)大模型。這也正如華為常務董事、華為云CEO張平安所說:“華為云盤古大模型是為解決行業(yè)難題而生?!?/p>
過去的一年,華為云盤古大模型已在30多個行業(yè)、400多個場景中落地,已在政務、金融、制造、醫(yī)藥研發(fā)、煤礦、鋼鐵、鐵路、自動駕駛、工業(yè)設計、建筑設計、氣象等領域發(fā)揮著巨大價值。
例如從去年關(guān)注貨運的鐵路大模型,到今年推出關(guān)注客運的高鐵大模型,就說明盤古大模型的能力又有精進。其中搭載了“盤古眼”的巡檢機器人,可精準識別一列動車的3.2萬個項點,覆蓋8大類、350+種復雜故障,故障識別準確率可達99%。
另一需要關(guān)注的是鋼鐵大模型。
寶鋼股份正在推動盤古大模型在熱軋、高爐等場景落地。實踐表明,在大模型的調(diào)節(jié)下,每減少10℃的溫度波動,每噸鐵水就可以減少1kg焦炭消耗,成本降低3塊錢。如此一來,預計每年可以為寶鋼股份降本超過10億元。
B端大模型知行合一
除此之外,B端大模型的另一思維特點是講究“知行合一”。復雜邏輯推理是大模型成為行業(yè)助手的關(guān)鍵,華為云則將思維鏈技術(shù)與策略搜索深度結(jié)合,極大提升了數(shù)學能力、復雜任務規(guī)劃能力,以及工具調(diào)用能力。
很明顯,華為云已經(jīng)在關(guān)注AI應用的更高階段。過去三年,AI應用多停留在感知智能、互動智能、理解智能階段,典型的應用包括人臉識別、智能客服、智能營銷、辦公助手、營銷助手等。
此次,華為云升級大模型的多模態(tài)能力,以及強思維、復雜邏輯推理能力,其實已經(jīng)是瞄準了AI Agent智能體和具身智能,這是AI應用的更高階段?;蚩扇绱吮扔鳎绻竽P褪恰按竽X”,智能體就是“手腳”,具身智能則代表AI應用的“知行合一”。
HDC 2024期間,華為云就展示了諸多具身智能應用。盤古大模型能夠讓機器人完成10步以上的復雜任務規(guī)劃,并且在任務執(zhí)行中實現(xiàn)多場景泛化和多任務處理。同時盤古大模型還能生成機器人需要的訓練視頻,讓機器人更快地學習各種復雜場景。
更重要的是,華為云還有殺手锏。HDC 2024期間,華為正式發(fā)布HarmonyOS NEXT版,“盤古”和“鴻蒙”也首次聯(lián)袂亮相。而且不同于ChatGPT與蘋果iOS的集成,“盤古”與“鴻蒙”之間,智能時代的操作系統(tǒng)與萬物智聯(lián)的操作系統(tǒng)之間,實現(xiàn)了深度集成。
這其中典型的應用,就包括云助小藝,以及云手機等。而且類似的應用,已更多地出現(xiàn)在行業(yè)端。據(jù)華為云合作伙伴介紹:如此的深度集成,系統(tǒng)調(diào)用AI能力將更為流暢,用戶的數(shù)據(jù)安全也將得到保障,這都是企業(yè)用戶關(guān)注的核心。
AI全棧能力創(chuàng)新
B端大模型的最后一個典型思維是,關(guān)注從AI基礎設施、AI算力,到AI開發(fā)平臺、AI大模型的全棧服務。
HDC 2024期間,華為云透露了一組數(shù)據(jù):
業(yè)界萬億參數(shù)模型訓練無中斷時長是2.8天,華為云昇騰AI云服務可以做到40天無中斷;業(yè)界集群故障恢復的平均時間約60分鐘,昇騰AI云服務可以縮短到10分鐘。同時,昇騰AI云服務還能將大模型的資源開通時間從月級縮短到天級。
不僅如此。當前云平臺在大模型的訓練和使用過程中,一直存在“算力墻”、“內(nèi)存墻”、“能效墻”等問題。對此,華為云CTO張宇昕說:“為了解決這個難題,打造了下一代的云基礎設施CloudMatrix,改變了傳統(tǒng)數(shù)據(jù)中心的架構(gòu)和算力供給模式?!?/p>
這一基礎設施,將傳統(tǒng)的以CPU為中心的主從架構(gòu),演進為多元算力對等全互聯(lián)架構(gòu);并通過高速互聯(lián)網(wǎng)絡協(xié)議,將CPU、NPU、GPU等算力資源全部互聯(lián)和池化,從而把AI算力從單體算力演進到矩陣算力,開啟智能算力新紀元。
同時,針對云平臺在大模型的訓練和使用中存在的“內(nèi)存墻”問題,華為云首創(chuàng)EMS彈性內(nèi)存存儲,基于Memory Pooling專利技術(shù),通過顯存擴展、算力卸載、以存代算等三大手段來打破內(nèi)存墻。
解行業(yè)難題、做行業(yè)難事
由此可見,華為云就代表了典型B端大模型的思維。此思維是“不挑食”,努力理解物理世界;是關(guān)注垂類模型,尋找更多業(yè)務“著陸點”;是搶占行業(yè)大模型的業(yè)務“制高點”;也是講究“執(zhí)行合一”;更是關(guān)注從AI基礎設施、AI算力,到AI開發(fā)平臺、AI大模型的全棧技術(shù)創(chuàng)新。
正是在五個方面持續(xù)投入,華為云才能年年在開發(fā)者大會上拿出新東西,給開發(fā)者、企業(yè)使用;遵循此五個方面的業(yè)務路線和技術(shù)路線,華為云也才敢說:“盤古將繼續(xù)堅定在行業(yè)里解難題、做難事?!?/p>