從2023年的ChatGPT,到2024年的Sora橫空出世,大模型技術(shù)在短短一年內(nèi),給整個世界帶來了極強(qiáng)的震撼效應(yīng),但同時也帶來了很多亂象。
剛剛在5月末,斯坦福大學(xué)的一個AI團(tuán)隊(duì),在全球最大的AI開源社區(qū)HuggingFace上發(fā)布了一款名為Llama3-V的多模態(tài)大模型,被證實(shí)是抄襲清華系大模型創(chuàng)企面壁智能剛發(fā)布的開源大模型,引起軒然大波,也將大模型“套牌”問題引向了風(fēng)口浪尖。今年1月,國內(nèi)大模型打假維權(quán)還出現(xiàn)了首例勝訴判決。飛游網(wǎng)絡(luò)假冒“通義千問”的山寨APP、賬號,還打著官方的旗號向用戶收費(fèi),因此被阿里云、阿里巴巴起訴并勝訴。
相似的案例還有很多,自大模型時代到來之后,抄襲,山寨、套牌,假融資等等亂象紛至沓來,在大模型時代的AI創(chuàng)新要站穩(wěn)腳跟,勢必要加速自主創(chuàng)新,堅(jiān)守本心,方能正道成功。
“百模大戰(zhàn)”一年,市場亂象頻出
過去一年,“百模大戰(zhàn)”讓大模型技術(shù)站上了市場“風(fēng)口”,和所有風(fēng)口上的技術(shù)一樣,不僅引來了資本和市場的追逐也引發(fā)了很多亂象。
首先,質(zhì)量和數(shù)量的矛盾始終伴隨著大模型的“井噴式”發(fā)展,一大批所謂AI創(chuàng)業(yè)公司,一味追逐熱點(diǎn),導(dǎo)致市場上的大模型多而不精,陳次不齊,同質(zhì)化嚴(yán)重。
公開的數(shù)據(jù)顯示:截至于今年4月底,國內(nèi)共計(jì)推出了305個大模型;截至于5月16號,大概有140個大模型完成了生成式人工智能的服務(wù)備案。這種大模型數(shù)量的快速增長多為盲目跟風(fēng),對大模型本身的創(chuàng)新毫無助益。
其次,套牌、造假和虛假宣傳事件縈繞不斷。一些公司為了快速實(shí)現(xiàn)融資或市場化的目的,將開源大模型進(jìn)行“改造”后就冠以自有產(chǎn)品之名,也導(dǎo)致了國內(nèi)大模型原創(chuàng)性的缺失和知識產(chǎn)權(quán)等潛在問題的隱患。
更有一些企業(yè),通過硬造技術(shù)術(shù)語、夸大價值等方式進(jìn)行宣傳,甚至將不是大模型技術(shù)的項(xiàng)目包裝成大模型,讓用戶陷入選擇困難。
第三,大模型同質(zhì)化,缺乏多樣性,導(dǎo)致應(yīng)用端效果欠佳。不少大模型采用同樣的數(shù)據(jù)集、訓(xùn)練方法等,導(dǎo)致輸出雷同的問題答案,無法滿足多樣化的市場需求。同時,高質(zhì)量數(shù)據(jù)的缺失,也嚴(yán)重制約著大模型的發(fā)展,這也是為什么大模型“幻覺”問題總是無法根除的原因之一。
第四,過度競爭,價格戰(zhàn)讓大模型創(chuàng)新陷入短視之局。經(jīng)歷長達(dá)一年多的“百模大戰(zhàn)”,大模型行業(yè)迅速陷入價格亂戰(zhàn)。一些企業(yè)接連調(diào)整旗下大模型產(chǎn)品的定價策略,采取“直降97%”的按厘計(jì)價甚至“全面免費(fèi)”的策略,進(jìn)一步抑制了行業(yè)用戶對大模型的使用信心。
第五,刷分、打榜等無意義的“評測秀”充斥市場。有些大模型的開發(fā)只關(guān)注短期利益,如“打榜刷分型大模型”和“結(jié)項(xiàng)為主型大模型”,它們不考慮應(yīng)用場景與后續(xù)更新,只追求短期的宣傳效果或結(jié)項(xiàng)成功,對整個行業(yè)的長期發(fā)展造成傷害。
在風(fēng)口之上,這些亂象盡管很容易被忽視,但卻真實(shí)存在。我們相信,在風(fēng)口過后,必然是去偽存真的時候,唯有堅(jiān)持走自主創(chuàng)新的技術(shù)能夠活下來,唯有原創(chuàng)的產(chǎn)品會獲得持續(xù)的發(fā)展。
AI創(chuàng)新要如何走向成功?
實(shí)際上,在大模型時代之前,AI的風(fēng)口已經(jīng)出現(xiàn)過好幾輪。每一次風(fēng)口的輪轉(zhuǎn),從波峰到波谷,都必然伴隨著市場的洗牌,大量的跟風(fēng)者和投機(jī)者被淘汰,真正創(chuàng)新的公司和技術(shù)才能穿越周期。
那么從AI創(chuàng)新的角度,要如何才能走向成功?
首先,要制定全面而長遠(yuǎn)的戰(zhàn)略規(guī)劃,明確的AI發(fā)展戰(zhàn)略,包括短期、中期和長期目標(biāo)。因?yàn)锳I的技術(shù)變革速度極快,新的算法、框架、硬件和應(yīng)用不斷涌現(xiàn),長期的規(guī)劃能夠堅(jiān)守清晰的方向,確保資源投入與技術(shù)趨勢相匹配。在面對大模型等技術(shù)風(fēng)口時,更能站在自身發(fā)展策略的角度上,去調(diào)整技術(shù)方向和產(chǎn)品策略,不至于偏離目標(biāo)。
其次,賽道的選擇十分關(guān)鍵。以大模型為例,市場的機(jī)會是否屬于每一家大模型技術(shù)的提供商呢?答案顯然不會是肯定的。通用大模型的迭代速度飛快,GPT的演進(jìn)速度快的令人咋舌,國內(nèi)的通用大模型,仍舊保持傳統(tǒng)的創(chuàng)新模式,要追上GPT的創(chuàng)新步伐是非常不現(xiàn)實(shí)的。
所以,選擇垂直領(lǐng)域的大模型方向,這就是一個好的賽道選擇。以華為云的盤古大模型為例,在政務(wù)、在礦山、在鐵路和氣象等領(lǐng)域的落地,證明了行業(yè)大模型比通用大模型,在現(xiàn)階段有更強(qiáng)的實(shí)際價值。
第三,要加強(qiáng)核心技術(shù)的自主研發(fā),打造更多原創(chuàng)性技術(shù)。因?yàn)閾碛凶灾鞯暮诵募夹g(shù),企業(yè)才可以自主決定技術(shù)發(fā)展的方向,而不受外部供應(yīng)商或合作伙伴的限制,也可以避免技術(shù)依賴帶來的潛在風(fēng)險。另外,從AI創(chuàng)業(yè)的角度,原創(chuàng)性是技術(shù)創(chuàng)新和突破的重要驅(qū)動力,強(qiáng)調(diào)原創(chuàng)性是研發(fā)團(tuán)隊(duì)不斷挑戰(zhàn)現(xiàn)有技術(shù)邊界的根本。
當(dāng)然,加強(qiáng)原創(chuàng)性技術(shù)研發(fā),也會面臨成本和資源等問題,這就需要有好的創(chuàng)新平臺來輔助開發(fā)者。
華為云其實(shí)已經(jīng)在構(gòu)建這種生態(tài),比如以華為云昇騰AI云服務(wù)為算力底座,目前華為云已原生孵化自然語言、計(jì)算機(jī)視覺、多模態(tài)等5大基礎(chǔ)大模型,并與伙伴聯(lián)創(chuàng)多個行業(yè)大模型,已落地30多個行業(yè),為開發(fā)者提供了強(qiáng)大的工具和資源;2023年,華為云也上線昇騰AI云服務(wù)百模千態(tài)專區(qū)和開發(fā)者模型社區(qū),全面基于昇騰AI云服務(wù)進(jìn)行適配和優(yōu)化,精度和性能顯著提升。
第四,邁向多元創(chuàng)新,而不是擠上大模型的獨(dú)木橋。其實(shí),不僅是大模型,中國人工智能產(chǎn)業(yè)要發(fā)展,從算力、算法,到大模型、應(yīng)用都需要自主創(chuàng)新。這是有志于AI創(chuàng)新的中國企業(yè)的機(jī)會,也是中國AI創(chuàng)新整個體系能夠做大做強(qiáng)的關(guān)鍵。
做中國AI創(chuàng)新的“沃土”
所有天馬行空的念頭,回歸到中國的AI創(chuàng)新,就一定要考慮到實(shí)際的落地場景,當(dāng)然就要面對“最后一公里”的難題。每一個系統(tǒng)、每一處體驗(yàn)、每一段代碼的背后,都有開發(fā)者的影子。
開發(fā)者就像是整個AI創(chuàng)新系統(tǒng)中的“毛細(xì)血管”,補(bǔ)齊了落地的最后一公里,讓生態(tài)活起來。開發(fā)者也是深入基礎(chǔ)研究、補(bǔ)齊產(chǎn)業(yè)鏈短板、走向核心技術(shù)創(chuàng)新的關(guān)鍵力量。
華為云一直有志于做開發(fā)者的“沃土”,并以最新的技術(shù)做AI創(chuàng)新的“燈塔”。比如華為云盤古大模型方面,華為云已推出礦山、藥物分子、電力、氣象、海浪、鐵路、政務(wù)、金融、制造等多個行業(yè)的大模型,為業(yè)界貢獻(xiàn)了先進(jìn)的算法和解決方案。
據(jù)悉,華為開發(fā)者大會(HDC 2024)6月21日-23日在東莞松山湖舉行,華為云發(fā)布了盤古大模型5.0,仍然是本著“專為行業(yè)而生,致力于為行業(yè)客戶服務(wù),解決實(shí)際問題”的理念,賦能千行萬業(yè)的開發(fā)者,做中國AI創(chuàng)新的“沃土”。
中國AI創(chuàng)新從“套牌”,走向正牌,其實(shí)需要的正是華為云這種力量,以原創(chuàng)的精神,務(wù)實(shí)的風(fēng)格和對技術(shù)演進(jìn)的遠(yuǎn)見,對行業(yè)場景的深刻理解,足以引領(lǐng)中國AI創(chuàng)新,更加貼近實(shí)用價值,更符合中國行業(yè)發(fā)展的需要。