2024年的大模型賽事已過半程。
看過科技企業(yè)前半程的表現(xiàn),尤其是壓軸上場(chǎng)的華為開發(fā)者大會(huì)2024(HDC 2024),越發(fā)確認(rèn)C端大模型和B端大模型的思路真是不一樣。C端大模型在“卷Token長(zhǎng)度”、“卷價(jià)格”,其背后潛在目的是為了“卷數(shù)據(jù)”。他們希望以Token長(zhǎng)度和價(jià)格,卷來更多的數(shù)據(jù),加速提升大模型的成熟度,進(jìn)而增加生態(tài)黏性。
B端大模型的思路完全不一樣。
HDC 2024期間,華為云盤古大模型5.0正式發(fā)布。發(fā)布過程中,華為云用了一半時(shí)間講創(chuàng)新技術(shù),另一半時(shí)間講大模型的行業(yè)落地。而且華為云從下到上所有細(xì)節(jié)都沒一筆帶過,從AI基礎(chǔ)設(shè)施,到多模態(tài)大模型,再到行業(yè)大模型,以及具身智能,每一個(gè)環(huán)節(jié)的想法,華為云也都交代得清清楚楚。

華為云發(fā)布盤古大模型5.0
大模型到底在卷啥?
其實(shí),在“百模大戰(zhàn)”最熱鬧的時(shí)候,也少有人提出“大模型泡沫”的質(zhì)疑。或者說,在這場(chǎng)關(guān)乎未來生產(chǎn)力的全球競(jìng)爭(zhēng)中,現(xiàn)在多少卷些也無所謂。只不過進(jìn)入2024年,大模型的競(jìng)爭(zhēng)焦點(diǎn)開始分化。
“百模大戰(zhàn)”早期,科技企業(yè)是在卷參數(shù)量,千億參數(shù)和萬億參數(shù)大模型層出不窮。隨后,部分大模型又開始“卷Token長(zhǎng)度”、“卷Token價(jià)格”,但這些都是典型C端大模型的思維。
B端大模型當(dāng)然也缺數(shù)據(jù),尤其是缺高質(zhì)量的中文數(shù)據(jù)。好在,中國(guó)并不缺應(yīng)用場(chǎng)景。兩會(huì)期間提出“人工智能+”行動(dòng)計(jì)劃,并號(hào)召央企帶頭搶抓人工智能賦能傳統(tǒng)產(chǎn)業(yè),率先將應(yīng)用場(chǎng)景開放出來。
這就釋放了相當(dāng)積極的信號(hào)。
只不過,挑戰(zhàn)依然存在。企業(yè)中的文本、音頻、圖片、視頻等數(shù)據(jù),散落在不同角落;企業(yè)中的數(shù)據(jù)還要經(jīng)專家級(jí)的標(biāo)注,才能成為高質(zhì)量的訓(xùn)練語(yǔ)料;企業(yè)用戶對(duì)大模型的識(shí)別準(zhǔn)確度,更提出了更高的入職標(biāo)準(zhǔn)。
或者說:“工作向左,生活向右”。從文理分班的那一刻起,企業(yè)用戶對(duì)B端大模型的能力結(jié)構(gòu),就提出了不一樣的需求。
不挑食,才能理解物理世界
華為云在此真下了不少功夫。
去年的這個(gè)時(shí)候,華為云盤古大模型3.0發(fā)布,它包括5+N+X三層架構(gòu),是一個(gè)完全面向行業(yè)的大模型系列;今年HDC 2024期間,華為云盤古大模型5.0正式發(fā)布,它在多模態(tài)、全系列、強(qiáng)思維等方面進(jìn)行了全新升級(jí)。
其中,“多模態(tài)”能力尤其受到關(guān)注。原因很簡(jiǎn)單,物理世界就是多種模態(tài)的,大模型要走進(jìn)千行萬業(yè),大模型要看懂物理世界中的應(yīng)用場(chǎng)景,就需要更多地理解及整合多模態(tài)的行業(yè)數(shù)據(jù)。
此方面的華為云盤古大模型5.0,主打的就是一個(gè)不挑食,營(yíng)養(yǎng)均衡。它能夠更好地理解物理世界,更精準(zhǔn)地識(shí)別和理解文本、圖片、視頻等數(shù)據(jù),甚至是雷達(dá)、紅外、遙感等更多的模態(tài)數(shù)據(jù)。
上述能力應(yīng)用在圖片和視頻識(shí)別方面,盤古大模型5.0就能夠準(zhǔn)確分析出衛(wèi)星遙感圖像中的農(nóng)作物生長(zhǎng)情況,這可用于產(chǎn)量預(yù)估、病蟲害監(jiān)測(cè)等領(lǐng)域;它還能夠通過紅外影像,精準(zhǔn)的識(shí)別夜間車輛的位置,這也將提升交通違停的管理效率。
同時(shí),盤古大模型5.0的多模態(tài)生成能力,跟Sora關(guān)注點(diǎn)也不一樣。它聚焦于行業(yè)急需的應(yīng)用場(chǎng)景。例如,在自動(dòng)駕駛領(lǐng)域,它就通過創(chuàng)新的STCG技術(shù),大規(guī)模地生成和實(shí)際場(chǎng)景相一致的駕駛視頻數(shù)據(jù)。甚至,它還可以用模型生成晴天、雨天、黑夜的行車視頻。
B端大模型的“著陸點(diǎn)”
另一維度,關(guān)注“多模態(tài)”數(shù)據(jù)之外,B端大模型也更關(guān)注“落地點(diǎn)”。2023年,科技企業(yè)都在研究“大材小用”——將大模型落地于小場(chǎng)景。但之后他們發(fā)現(xiàn),“小材小用”或“量才適用”才是更好的思路。
本次HDC 2024,華為云盤古大模型5.0就推出了不同參數(shù)規(guī)格的模型,以適配不同的業(yè)務(wù)場(chǎng)景,例如,十億級(jí)參數(shù)的Pangu E系列,可支撐手機(jī)、PC等端側(cè)的智能應(yīng)用,屬于典型的“小鋼炮”式大模型。
百億級(jí)參數(shù)的Pangu P系列,則適用于低時(shí)延、高效率的推理場(chǎng)景;千億級(jí)參數(shù)的Pangu U系列適用于處理復(fù)雜任務(wù);萬億級(jí)參數(shù)的Pangu S系列超級(jí)大模型能夠幫助企業(yè)處理更為復(fù)雜的跨領(lǐng)域多任務(wù)。
毫無疑問,上述四個(gè)系列的大模型,都是典型B端大模型的思維。它們可落地在智能終端、智慧工廠、企業(yè)大腦、城市IOC等場(chǎng)景,也可以擔(dān)任辦公助理、質(zhì)檢員、網(wǎng)格管理員等職業(yè)角色。
B端大模型的制高點(diǎn)
當(dāng)然,B端大模型的制高點(diǎn)在行業(yè)大模型,制高點(diǎn)上的明珠更是企業(yè)大模型。這也正如華為常務(wù)董事、華為云CEO張平安所說:“華為云盤古大模型是為解決行業(yè)難題而生?!?/p>
過去的一年,華為云盤古大模型已在30多個(gè)行業(yè)、400多個(gè)場(chǎng)景中落地,已在政務(wù)、金融、制造、醫(yī)藥研發(fā)、煤礦、鋼鐵、鐵路、自動(dòng)駕駛、工業(yè)設(shè)計(jì)、建筑設(shè)計(jì)、氣象等領(lǐng)域發(fā)揮著巨大價(jià)值。
例如從去年關(guān)注貨運(yùn)的鐵路大模型,到今年推出關(guān)注客運(yùn)的高鐵大模型,就說明盤古大模型的能力又有精進(jìn)。其中搭載了“盤古眼”的巡檢機(jī)器人,可精準(zhǔn)識(shí)別一列動(dòng)車的3.2萬個(gè)項(xiàng)點(diǎn),覆蓋8大類、350+種復(fù)雜故障,故障識(shí)別準(zhǔn)確率可達(dá)99%。
另一需要關(guān)注的是鋼鐵大模型。
寶鋼股份正在推動(dòng)盤古大模型在熱軋、高爐等場(chǎng)景落地。實(shí)踐表明,在大模型的調(diào)節(jié)下,每減少10℃的溫度波動(dòng),每噸鐵水就可以減少1kg焦炭消耗,成本降低3塊錢。如此一來,預(yù)計(jì)每年可以為寶鋼股份降本超過10億元。
B端大模型知行合一
除此之外,B端大模型的另一思維特點(diǎn)是講究“知行合一”。復(fù)雜邏輯推理是大模型成為行業(yè)助手的關(guān)鍵,華為云則將思維鏈技術(shù)與策略搜索深度結(jié)合,極大提升了數(shù)學(xué)能力、復(fù)雜任務(wù)規(guī)劃能力,以及工具調(diào)用能力。
很明顯,華為云已經(jīng)在關(guān)注AI應(yīng)用的更高階段。過去三年,AI應(yīng)用多停留在感知智能、互動(dòng)智能、理解智能階段,典型的應(yīng)用包括人臉識(shí)別、智能客服、智能營(yíng)銷、辦公助手、營(yíng)銷助手等。
此次,華為云升級(jí)大模型的多模態(tài)能力,以及強(qiáng)思維、復(fù)雜邏輯推理能力,其實(shí)已經(jīng)是瞄準(zhǔn)了AI Agent智能體和具身智能,這是AI應(yīng)用的更高階段?;蚩扇绱吮扔?,如果大模型是“大腦”,智能體就是“手腳”,具身智能則代表AI應(yīng)用的“知行合一”。
HDC 2024期間,華為云就展示了諸多具身智能應(yīng)用。盤古大模型能夠讓機(jī)器人完成10步以上的復(fù)雜任務(wù)規(guī)劃,并且在任務(wù)執(zhí)行中實(shí)現(xiàn)多場(chǎng)景泛化和多任務(wù)處理。同時(shí)盤古大模型還能生成機(jī)器人需要的訓(xùn)練視頻,讓機(jī)器人更快地學(xué)習(xí)各種復(fù)雜場(chǎng)景。
更重要的是,華為云還有殺手锏。HDC 2024期間,華為正式發(fā)布HarmonyOS NEXT版,“盤古”和“鴻蒙”也首次聯(lián)袂亮相。而且不同于ChatGPT與蘋果iOS的集成,“盤古”與“鴻蒙”之間,智能時(shí)代的操作系統(tǒng)與萬物智聯(lián)的操作系統(tǒng)之間,實(shí)現(xiàn)了深度集成。
這其中典型的應(yīng)用,就包括云助小藝,以及云手機(jī)等。而且類似的應(yīng)用,已更多地出現(xiàn)在行業(yè)端。據(jù)華為云合作伙伴介紹:如此的深度集成,系統(tǒng)調(diào)用AI能力將更為流暢,用戶的數(shù)據(jù)安全也將得到保障,這都是企業(yè)用戶關(guān)注的核心。
AI全棧能力創(chuàng)新
B端大模型的最后一個(gè)典型思維是,關(guān)注從AI基礎(chǔ)設(shè)施、AI算力,到AI開發(fā)平臺(tái)、AI大模型的全棧服務(wù)。
HDC 2024期間,華為云透露了一組數(shù)據(jù):
業(yè)界萬億參數(shù)模型訓(xùn)練無中斷時(shí)長(zhǎng)是2.8天,華為云昇騰AI云服務(wù)可以做到40天無中斷;業(yè)界集群故障恢復(fù)的平均時(shí)間約60分鐘,昇騰AI云服務(wù)可以縮短到10分鐘。同時(shí),昇騰AI云服務(wù)還能將大模型的資源開通時(shí)間從月級(jí)縮短到天級(jí)。
不僅如此。當(dāng)前云平臺(tái)在大模型的訓(xùn)練和使用過程中,一直存在“算力墻”、“內(nèi)存墻”、“能效墻”等問題。對(duì)此,華為云CTO張宇昕說:“為了解決這個(gè)難題,打造了下一代的云基礎(chǔ)設(shè)施CloudMatrix,改變了傳統(tǒng)數(shù)據(jù)中心的架構(gòu)和算力供給模式?!?/p>
這一基礎(chǔ)設(shè)施,將傳統(tǒng)的以CPU為中心的主從架構(gòu),演進(jìn)為多元算力對(duì)等全互聯(lián)架構(gòu);并通過高速互聯(lián)網(wǎng)絡(luò)協(xié)議,將CPU、NPU、GPU等算力資源全部互聯(lián)和池化,從而把AI算力從單體算力演進(jìn)到矩陣算力,開啟智能算力新紀(jì)元。
同時(shí),針對(duì)云平臺(tái)在大模型的訓(xùn)練和使用中存在的“內(nèi)存墻”問題,華為云首創(chuàng)EMS彈性內(nèi)存存儲(chǔ),基于Memory Pooling專利技術(shù),通過顯存擴(kuò)展、算力卸載、以存代算等三大手段來打破內(nèi)存墻。
解行業(yè)難題、做行業(yè)難事
由此可見,華為云就代表了典型B端大模型的思維。此思維是“不挑食”,努力理解物理世界;是關(guān)注垂類模型,尋找更多業(yè)務(wù)“著陸點(diǎn)”;是搶占行業(yè)大模型的業(yè)務(wù)“制高點(diǎn)”;也是講究“執(zhí)行合一”;更是關(guān)注從AI基礎(chǔ)設(shè)施、AI算力,到AI開發(fā)平臺(tái)、AI大模型的全棧技術(shù)創(chuàng)新。
正是在五個(gè)方面持續(xù)投入,華為云才能年年在開發(fā)者大會(huì)上拿出新東西,給開發(fā)者、企業(yè)使用;遵循此五個(gè)方面的業(yè)務(wù)路線和技術(shù)路線,華為云也才敢說:“盤古將繼續(xù)堅(jiān)定在行業(yè)里解難題、做難事?!?/p>