五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

炫科技
芥子納須彌,大模型實(shí)現(xiàn)端云協(xié)同難度有多大?

大模型炙手可熱,不過(guò)正在形成兩大陣營(yíng)。

一方面,是越來(lái)越強(qiáng)的云側(cè)大模型。從文生視頻的Sora,到最近在實(shí)時(shí)語(yǔ)音交互上令人印象深刻的GPT-4o,以及國(guó)內(nèi)上百款大模型都是這樣。在華為開發(fā)者大會(huì)2024(HDC 2024)上,華為云重磅發(fā)布的盤古大模型5.0,在多模態(tài)理解、復(fù)雜邏輯推理等方面的表現(xiàn),更是備受矚目。

另一方面,是大模型走向端側(cè)。包括華為、榮耀、OPPO、vivo等手機(jī)廠商,以及聯(lián)想等PC廠商,都推出了AI端側(cè)大模型。最近舉行的WWDC24上,蘋果也發(fā)布了本地運(yùn)行的Apple Intelligence。

那么問(wèn)題來(lái)了,端側(cè)大模型和云側(cè)大模型到底誰(shuí)代表著未來(lái)?AI時(shí)代的發(fā)展方向到底是什么?

大模型時(shí)代的終極范式 

“深度學(xué)習(xí)之父” Geoffrey Hinton曾經(jīng)暢想過(guò)這樣的場(chǎng)景:“會(huì)有一個(gè)階段,一旦某個(gè)AI系統(tǒng)訓(xùn)練完畢,我們會(huì)將其運(yùn)行在非常低功耗的系統(tǒng)上,所以,如果你想讓你的烤面包機(jī)能和你對(duì)話,你需要一個(gè)只花費(fèi)幾美元的芯片,而且它能運(yùn)行像ChatGPT這樣的程序?!?/p>

端側(cè)大模型之所以會(huì)出現(xiàn),歸結(jié)起來(lái)有這么幾個(gè)原因:一是云側(cè)大模型推理成本比較高;二是在端側(cè)運(yùn)行的大模型可以保護(hù)數(shù)據(jù)隱私;三是在一些沒(méi)有網(wǎng)絡(luò)連接的場(chǎng)景下,可以使用本地算力來(lái)支持大模型的運(yùn)行。IDC預(yù)測(cè),到2026年中國(guó)市場(chǎng)近50%的終端設(shè)備處理器將帶有AI引擎,由此可以看到端側(cè)大模型的發(fā)展迅速。

不過(guò),端側(cè)大模型也有其不足。IDC中國(guó)高級(jí)分析師郭天翔表示,目前端側(cè)的算力要求比較高,功耗比較大,更為重要的是端側(cè)大模型的參數(shù)量級(jí)無(wú)法和云側(cè)的通用大模型相比??v觀市面上的大模型,相比云測(cè)大模型動(dòng)輒百億、千億參數(shù),端側(cè)大模型大多參數(shù)量級(jí)比較小,如蘋果的端側(cè)大模型為30億參數(shù)。

目前業(yè)界越來(lái)越認(rèn)同,端側(cè)大模型和云側(cè)大模型并不是競(jìng)爭(zhēng)關(guān)系,而是協(xié)同關(guān)系。部分智能推理任務(wù)或者推理任務(wù)的部分階段放到端側(cè)進(jìn)行處理,可以發(fā)揮端側(cè)大模型本地即時(shí)處理的優(yōu)勢(shì),而且用戶原始數(shù)據(jù)不離開本地,可以保護(hù)數(shù)據(jù)安全隱私。同時(shí),需要更強(qiáng)能力、更深思考的時(shí)候,可以使用云側(cè)大模型。雙方優(yōu)勢(shì)互補(bǔ),相得益彰,最大程度地發(fā)揮端側(cè)大模型和云側(cè)大模型的優(yōu)勢(shì)。

舉個(gè)例子,如果你對(duì)某篇文章做摘要,可以使用端側(cè)大模型,而要寫一篇論文查閱該領(lǐng)域的歷史性資料,就只能使用云側(cè)大模型。IDC在預(yù)測(cè)2024年AI發(fā)展趨勢(shì)時(shí),也將端云結(jié)合確定為其中之一,其指出端側(cè)大模型的安全性和及時(shí)性與云側(cè)大模型的豐富功能和算力將實(shí)現(xiàn)很好結(jié)合。

以華為為例,小藝背后的大模型就擁有端側(cè)和云側(cè)兩種形態(tài),可以針對(duì)不同設(shè)備和場(chǎng)景的需求進(jìn)行處理。端側(cè)大模型會(huì)對(duì)用戶請(qǐng)求和上下文信息做預(yù)處理,然后將需求發(fā)到云端,最大化發(fā)揮端側(cè)的速度與云側(cè)的強(qiáng)大。同樣,蘋果入局大模型,也是采用端云協(xié)同的方式。

在HDC 2024上,鴻蒙原生智能(Harmony Intelligence)發(fā)布,就是采用端云協(xié)同的架構(gòu)。端側(cè)的個(gè)人數(shù)據(jù)與用戶意圖,和云側(cè)的智能中樞互相配合,高效協(xié)同。

端云協(xié)同才是大模型時(shí)代的終極范式。

端云協(xié)同的大模型,有多難?

不過(guò),端云協(xié)同說(shuō)起來(lái)容易,實(shí)際實(shí)現(xiàn)起來(lái)難度很大。

端側(cè)大模型的實(shí)現(xiàn)路徑大致是這樣的,通常是云側(cè)大模型通過(guò)剪枝、量化、蒸餾等模型壓縮和加速技術(shù),給大模型減重,然后再根據(jù)終端的特點(diǎn)和用戶需求進(jìn)行針對(duì)性的訓(xùn)練。例如,華為小藝的端側(cè)大模型就重點(diǎn)針對(duì)語(yǔ)音對(duì)話、設(shè)備操作、購(gòu)物、生活常識(shí)等場(chǎng)景進(jìn)行訓(xùn)練,而且還對(duì)提示詞和輸出格式進(jìn)行了壓縮,將推理時(shí)延縮短了一半。

顯然,這個(gè)過(guò)程就要求廠商對(duì)于云側(cè)大模型和端側(cè)大模型都需要有深刻理解和豐富經(jīng)驗(yàn)。而且,如何將任務(wù)在兩種大模型間進(jìn)行分配,如何實(shí)現(xiàn)端側(cè)和云側(cè)的良好配合,如何保護(hù)數(shù)據(jù)隱私等等,對(duì)于廠商來(lái)說(shuō)都是極大的考驗(yàn)。華為常務(wù)董事、終端BG董事長(zhǎng)、智能汽車解決方案BU董事長(zhǎng)余承東表示,華為早在2017年就開啟Mobile AI時(shí)代,持續(xù)耕耘終端AI體驗(yàn)創(chuàng)新,從2018-2020年的個(gè)人終端AI化,以及2021-2022年的全場(chǎng)景設(shè)備AI化,到2023-2024年以AI大模型賦能終端,都是這樣。

站在這個(gè)角度看華為云,就可知其在端云協(xié)同上的獨(dú)特性。因?yàn)槿A為幾乎是業(yè)界唯一同時(shí)擁有云側(cè)大模型和端側(cè)大模型,以華為云作為統(tǒng)一云底座,打造了昇騰、鯤鵬、鴻蒙、歐拉、GaussDB等根技術(shù)及相關(guān)生態(tài),并實(shí)現(xiàn)領(lǐng)先的廠商。在云側(cè),早在2021年華為就發(fā)布了盤古大模型,包括NLP大模型和CV大模型,并在這幾年持續(xù)迭代,最新發(fā)布的盤古大模型5.0最大的特點(diǎn)是在多模態(tài)上有了突飛猛進(jìn)的進(jìn)步,能夠更好更精準(zhǔn)地理解物理世界,包括文本、圖片、視頻、雷達(dá)、紅外、遙感等更多模態(tài)。在圖片和視頻識(shí)別方面,可支持10K超高分辨率;在內(nèi)容生成方面,采用業(yè)界首創(chuàng)的STCG(Spatio Temporal Controllable Generation,可控時(shí)空生成)技術(shù),聚焦自動(dòng)駕駛、工業(yè)制造、建筑等多個(gè)行業(yè)場(chǎng)景,可生成更加符合物理規(guī)律的多模態(tài)內(nèi)容。

在端側(cè),華為在盤古L0大模型的基礎(chǔ)上,專門針對(duì)終端消費(fèi)者場(chǎng)景中涉及的數(shù)據(jù)進(jìn)行了精細(xì)調(diào)優(yōu),構(gòu)建出一個(gè)L1的對(duì)話大模型,應(yīng)用到了小藝上,小藝在端側(cè)大模型的加持下,不僅可以通過(guò)自然語(yǔ)言對(duì)話更聰明地理解并執(zhí)行用戶指令,而且可以實(shí)現(xiàn)文本生成、摘要總結(jié)、多語(yǔ)種翻譯等功能,堪稱是一個(gè)高效的生產(chǎn)力工具。同時(shí),小藝是越用越懂你,可以通過(guò)學(xué)習(xí)不斷進(jìn)步,儼然是一個(gè)私人智能助手。

在華為自主新一代盤古大模型5.0的加持下,小藝的能力也得到全面提升,擁有上萬(wàn)億tokens的知識(shí)量,可以智能感知23類主要場(chǎng)景,提供300多種重點(diǎn)服務(wù),任務(wù)推理規(guī)劃的成功率高達(dá)90%。

今年4月華為發(fā)布的華為MateBook X Pro不僅首次應(yīng)用盤古大模型,還精選100+智能體,用戶可以一鍵直達(dá)豐富的AI應(yīng)用。在熱銷的問(wèn)界M9上,車載智慧助手小藝在AI大模型的加持下具有用車知識(shí)問(wèn)答、熱點(diǎn)資訊總結(jié)、百科知識(shí)問(wèn)答等功能,是車主用車過(guò)程中的得力助手。

在華為Mate60系列手機(jī)中備受用戶好評(píng)的AI云增強(qiáng),同樣體現(xiàn)出華為云在端云協(xié)同上的能力。用戶拍攝圖片后,可以點(diǎn)擊圖片右上角的魔法棒圖標(biāo),從而對(duì)照片進(jìn)行智能分析,并將照片上傳到云端進(jìn)行優(yōu)化,提升照片的清晰度和美感度。據(jù)了解,這項(xiàng)突破手機(jī)硬件限制的獨(dú)特功能,背后是通過(guò)華為云KooVerse全球存算網(wǎng)調(diào)用云端強(qiáng)大的算力,在云端進(jìn)行AI推理,從而讓用戶在手機(jī)上實(shí)現(xiàn)專業(yè)級(jí)的照片效果。

除了云拍照增強(qiáng)外,云助端的典型場(chǎng)景還有云助小藝及云手機(jī)等,云助小藝可以調(diào)用云上千萬(wàn)級(jí)參數(shù)大模型,支撐千萬(wàn)級(jí)用戶在線推理,語(yǔ)音對(duì)話、AIGC在線創(chuàng)作及個(gè)性化推薦能力全面提升;云手機(jī)場(chǎng)景下,通過(guò)華為云全球存算網(wǎng)讓算力在近端部署,端到端時(shí)延<150ms,全面助力鴻蒙生態(tài)的繁榮。

事實(shí)上,盤古大模型的架構(gòu)天然契合端云協(xié)同的特性。盤古大模型并不是一個(gè)大模型,而是一個(gè)大模型系列,包括“5+N+X”三層架構(gòu):L0層包括自然語(yǔ)言、視覺(jué)、多模態(tài)、預(yù)測(cè)、科學(xué)計(jì)算五大基礎(chǔ)大模型,可以滿足行業(yè)場(chǎng)景中的多種技能需求;L1層是N個(gè)行業(yè)大模型,基于通用大模型訓(xùn)練;L2層是更多細(xì)化場(chǎng)景的模型,場(chǎng)景包括政務(wù)熱線、網(wǎng)點(diǎn)助手、臺(tái)風(fēng)路徑預(yù)測(cè)等。在HDC 2024上,可以看到盤古大模型5.0包含不同參數(shù)規(guī)格的模型,以適配不同的業(yè)務(wù)場(chǎng)景。十億級(jí)參數(shù)的Pangu E系列可支撐手機(jī)、PC等端側(cè)的智能應(yīng)用;百億級(jí)參數(shù)的Pangu P系列,適用于低時(shí)延、高效率的推理場(chǎng)景;千億級(jí)參數(shù)的Pangu U系列適用于處理復(fù)雜任務(wù);萬(wàn)億級(jí)參數(shù)的Pangu S系列超級(jí)大模型能夠幫助企業(yè)處理更為復(fù)雜的跨領(lǐng)域多任務(wù)。

盤古大模型的三層架構(gòu)完全解耦設(shè)計(jì),從而可以快速適配、快速滿足行業(yè)需求。華為之所以可以快速?gòu)腖0的盤古大模型訓(xùn)練出L1的小藝端側(cè)大模型就是如此。

佛經(jīng)中常有“須彌納芥子”、“芥子納須彌”的說(shuō)法,巨大如須彌山這樣的存在都可以放入芥子這樣微小的東西里面,意指佛法博大精深,以及修行之難。將云側(cè)大模型放到端側(cè),不也是如此嗎?不僅要放進(jìn)去,而且要能滿足特定場(chǎng)景需求,還要實(shí)現(xiàn)云側(cè)和端側(cè)的協(xié)同配合,對(duì)廠商考驗(yàn)之大可想而知。

端云協(xié)同的混合大模型才是AI的未來(lái)

總而言之,端云協(xié)同的混合大模型才是AI的未來(lái)。

混合大模型,不僅可以結(jié)合端側(cè)和云側(cè)的各自優(yōu)勢(shì),更是可以形成一種彼此促進(jìn)的飛輪效應(yīng)。云側(cè)大模型可以向端側(cè)大模型輸出能力,而端側(cè)大模型可以向云側(cè)大模型反饋執(zhí)行成效和端側(cè)新知識(shí),進(jìn)而促進(jìn)云側(cè)大模型不斷進(jìn)化,彼此推動(dòng),飛輪越轉(zhuǎn)越快。

這種混合大模型,不僅適用于C端,更是適用于B端。實(shí)際上,企業(yè)自己的專有大模型就像手機(jī)或者PC上的端側(cè)大模型一樣,擁有更好的安全以及更低的時(shí)延。對(duì)于企業(yè)來(lái)說(shuō),混合大模型既能打消其對(duì)于數(shù)據(jù)保護(hù)的顧慮,又能兼顧大模型在能力上的優(yōu)勢(shì)。如果說(shuō)手機(jī)和PC上的混合大模型加速了大模型進(jìn)入尋常百姓家,那么,無(wú)疑,端云協(xié)同的大模型可以加速大模型在千行萬(wàn)業(yè)上的落地。

在這方面,盤古大模型無(wú)疑具有獨(dú)特優(yōu)勢(shì)。就像華為常務(wù)董事、華為云CEO張平安所說(shuō),“一直以來(lái),華為云盤古大模型都堅(jiān)定的聚焦行業(yè),在解難題、做難事的道路上不斷攻堅(jiān)克難,砥礪前行”,盤古大模型生來(lái)就是深入千行萬(wàn)業(yè)的具體場(chǎng)景中,幫助客戶解決難題。

一方面,L0層的盤古大模型持續(xù)進(jìn)化,最新發(fā)布的盤古5.0在多模態(tài)、全系列、強(qiáng)思維三方面進(jìn)行升級(jí),越來(lái)越強(qiáng)大;另一方面,從L0到L1,盤古大模型可以結(jié)合行業(yè)公開數(shù)據(jù)訓(xùn)練出行業(yè)通用大模型,也可以基于行業(yè)客戶自有數(shù)據(jù)訓(xùn)練出企業(yè)專有大模型;L2層則為客戶提供“開箱即用”的模型服務(wù)。不同層級(jí)的大模型也是彼此促進(jìn),形成飛輪效應(yīng)。

可以預(yù)計(jì),越來(lái)越多的企業(yè)、行業(yè)都將能在端云協(xié)同的混合大模型的加持下,加速數(shù)字化、智能化。混合大模型,必將為AI落地千行萬(wàn)業(yè)按下加速鍵。

  • 本期雜志

  • 往期推薦