&

中國(guó)大模型肉搏：得技術(shù)者勝，得產(chǎn)業(yè)者強(qiáng): 2023-07-24 16:28 來源：次閱讀; 分享：

中國(guó)大模型肉搏：得技術(shù)者勝，得產(chǎn)業(yè)者強(qiáng)

　　大模型，洗牌開始了AI大模型扇動(dòng)翅膀，掀起了歷史的波瀾。但沒人想到，浪潮僅僅卷過半年，就將迎來一次徹底的大洗牌。去年11月30日，ChatGPT正式發(fā)布，2個(gè)月用戶過億。今年6月，ChatGPT流量開始下滑。網(wǎng)站與移動(dòng)客戶端流量環(huán)比下跌9.7%，用戶在網(wǎng)站的使用時(shí)長(zhǎng)下降8.5%。這被解讀成AI泡沫的一個(gè)征兆：初期新鮮感消失，AI要回到現(xiàn)實(shí)；另一猜測(cè)，是OpenAI的對(duì)手強(qiáng)者如云，它并沒有真正的技術(shù)護(hù)城河。

　　谷歌內(nèi)部文件泄密泄露：我們沒有護(hù)城河，OpenAI也沒有OpenAI迅速給GPT-4安排上Code Interpreter功能，賺足一波眼球。“這就是GPT-4.5！”人們歡呼。然而，Meta（前Facebook）突然動(dòng)手，直接將自己的大語(yǔ)言模型Llama 2開源了。Llama 2的水平在GPT-3之上。它的免費(fèi)開源商用，簡(jiǎn)直是一次殺手級(jí)的突襲，堪稱“AI大模型的安卓時(shí)刻”。這意味著，許多公司尚在研發(fā)的大模型，已被淘汰了。因?yàn)閯e人可以直接用開源模型，免費(fèi)的。國(guó)內(nèi)的AI進(jìn)程，更加熱火朝天。今年3月，百度首個(gè)發(fā)布了“文心一言”，開啟國(guó)產(chǎn)大模型“超越ChatGPT”之路。120天狂飆突進(jìn)，互聯(lián)網(wǎng)科技公司、學(xué)術(shù)界大牛、大廠創(chuàng)業(yè)者、地方國(guó)家隊(duì)紛紛下場(chǎng)。國(guó)內(nèi)發(fā)布了79款10億參數(shù)以上的大模型。

　　不過，行業(yè)和專家都提出了質(zhì)疑：這么多的大模型，同質(zhì)化嚴(yán)重嗎？誰(shuí)的技術(shù)更強(qiáng)？誰(shuí)在更快進(jìn)入產(chǎn)業(yè)，解決問題？這個(gè)風(fēng)頭上，國(guó)際數(shù)據(jù)公司IDC發(fā)布了《AI大模型技術(shù)能力評(píng)估報(bào)告，2023》，想要設(shè)立一些標(biāo)準(zhǔn)。IDC圍繞產(chǎn)品技術(shù)、行業(yè)應(yīng)用、服務(wù)生態(tài)三個(gè)維度，設(shè)計(jì)了36項(xiàng)評(píng)估標(biāo)準(zhǔn)，對(duì)頭部大模型進(jìn)行測(cè)評(píng)。目前，國(guó)內(nèi)的百度、阿里、騰訊、華為、科大訊飛、360、商湯等14家廠商都在評(píng)估之中。

　　從結(jié)果看，百度的文心大模型3.5綜合評(píng)分最高。并且，在算法模型、行業(yè)覆蓋上，都拿到唯一的滿分。文心從發(fā)布后一直在迭代。文心大模型3.5相比之前，模型效果已提升了50%，訓(xùn)練速度提升2倍，推理速度提升了30倍。多個(gè)公開測(cè)評(píng)顯示，文心3.5的綜合能力已超過ChatGPT 3.5。在中文能力上，已有超出GPT-4的表現(xiàn)，拉平了中美的技術(shù)差。AI大模型第一戰(zhàn)正式結(jié)束，參賽者站在十字路口。超越GPT-3的開源模型，還會(huì)繼續(xù)出現(xiàn)。通用大模型注定是少數(shù)人的游戲，留下技術(shù)最頂尖的。更多創(chuàng)業(yè)者將集中到中間層、應(yīng)用層，在這些基礎(chǔ)模型之上做創(chuàng)新。IDC中國(guó)高級(jí)分析師楊雯表示：

　　AI大模型的主要價(jià)值體現(xiàn)在技術(shù)、應(yīng)用以及商業(yè)化3個(gè)方面：在技術(shù)方面，AI大模型帶來了認(rèn)知智能技術(shù)跨越式發(fā)展；在應(yīng)用方面，AI大模型可以為人類提供更加精準(zhǔn)和高效的服務(wù)；在商業(yè)化方面，AI大模型將會(huì)帶來軟件入口級(jí)的顛覆，并促進(jìn)上層生態(tài)發(fā)展。

　　國(guó)內(nèi)大模型公司，在迅速形成共識(shí)：技術(shù)差距追平后，產(chǎn)業(yè)縱深和商業(yè)化能力，是下一階段的戰(zhàn)場(chǎng)。

　　大模型，扎堆進(jìn)產(chǎn)業(yè)前幾天，我們?cè)赪AIC世界人工智能大會(huì)上，幾乎只能看到中美的公司。行業(yè)客戶們圍在各個(gè)大廠的展臺(tái)前，最想知道兩件事：AI到底能解決什么問題？怎么賣，賣多少錢？

　　WAIC的現(xiàn)場(chǎng)目前的大模型參數(shù)規(guī)模太大，加上算力成本極高，暫時(shí)還無法降低價(jià)格。動(dòng)輒千萬(wàn)、上億的部署成本，讓人望而卻步。在具體的行業(yè)場(chǎng)景，尤其是一些專業(yè)性強(qiáng)、知識(shí)密度高的領(lǐng)域，大模型的表現(xiàn)也還不夠精準(zhǔn)。行業(yè)大模型、產(chǎn)業(yè)落地、賦能千行百業(yè)，成為各大廠商給出的標(biāo)準(zhǔn)答案。百度文心大模型，提出源于產(chǎn)業(yè)實(shí)踐，服務(wù)于產(chǎn)業(yè)實(shí)踐；華為云的盤古大模型，喊出了“不做詩(shī)，只做事”，聚焦行業(yè)場(chǎng)景和垂直領(lǐng)域；騰訊云也認(rèn)為，“企業(yè)需要的，是在實(shí)際場(chǎng)景中真正解決了某個(gè)問題，而不是在100個(gè)場(chǎng)景中，解決了70-80%的問題”，他們探索了超50個(gè)行業(yè)大模型的應(yīng)用解決方案；京東言犀大模型，也是立足做產(chǎn)業(yè)大模型，要“把供應(yīng)鏈做透，把大模型做實(shí)”。這些廠商身上，透出一股極為務(wù)實(shí)、“接地氣”的氣質(zhì)。這有些反常的。更多想象的AI研究者，在科研機(jī)構(gòu)、實(shí)驗(yàn)室里把技術(shù)打磨成熟，像ChatGPT，而非直接到行業(yè)中應(yīng)用。背后真相是，僅在過去10年，國(guó)內(nèi)就經(jīng)歷了兩輪AI創(chuàng)業(yè)潮。但幸存者寥寥。

　　“AI教父”Geoffrey Hinton2012年的ImageNet大賽，“圖靈三巨頭”中的杰弗里·辛頓以卷積神經(jīng)網(wǎng)絡(luò)奪冠，讓深度學(xué)習(xí)火了。學(xué)院派們下場(chǎng)創(chuàng)業(yè)，如科大訊飛、商湯、曠視、云從等AI公司成為資本寵兒。

　　紀(jì)錄片AlphaGo劇照2016年，AlphaGo戰(zhàn)勝圍棋冠軍李世石，AI真正意義上出圈了。AI創(chuàng)業(yè)和融資進(jìn)入高峰期，互聯(lián)網(wǎng)大廠全部入局。

　　2012-2023人工智能融資趨勢(shì)70%的中國(guó)AI公司成立于2014-2018年，但90%的公司到2019年還深陷虧損。在技術(shù)研發(fā)和產(chǎn)業(yè)落地之間，隔著一個(gè)復(fù)雜的現(xiàn)實(shí)鴻溝。大部分創(chuàng)業(yè)者沒熬到今年的AI潮。而“活下來”的AI公司，也都領(lǐng)悟到了：人工智能一定要落地去解決問題，才能形成良性的商業(yè)模式，才能持續(xù)創(chuàng)造價(jià)值。所以AI大模型們，都爭(zhēng)先恐后往行業(yè)里鉆。

　　千行百業(yè)，用大模型重做一遍產(chǎn)業(yè)落地跑在前面的公司，都已布局了十幾年。他們從之前的云計(jì)算、互聯(lián)網(wǎng)+、企業(yè)軟件、新基建潮、產(chǎn)業(yè)互聯(lián)網(wǎng)時(shí)期，就在積累行業(yè)合作者和高質(zhì)量數(shù)據(jù)。在幫助行業(yè)數(shù)字化期間，他們就是從一線場(chǎng)景、復(fù)雜問題、龐雜需求的摔打里練出來的。在IDC評(píng)估中，百度文心拿到了唯一的行業(yè)覆蓋度滿分，因?yàn)槠銩I在能源、金融、教育、城市、工業(yè)、醫(yī)療等領(lǐng)域都有布局和落地。

　　制造業(yè)的產(chǎn)業(yè)升級(jí)，是大家的期待。在2008年，中國(guó)有4500種商品要靠進(jìn)口，很多是技術(shù)和工業(yè)品，比如集成電路、屏幕、汽車、工業(yè)設(shè)備。到今天，我們很多技術(shù)實(shí)現(xiàn)了自立自強(qiáng)，比如大飛機(jī)、新能源汽車、液晶顯示面板。很多工廠的智能化，是從質(zhì)檢環(huán)節(jié)開始的。過去，一條流水線要十幾個(gè)質(zhì)檢工人，人工的效率很低，即便之后有了工業(yè)視覺的輔助，也是一份辛苦、附加值很低的工作。顯示面板又是典型的高精產(chǎn)品，生產(chǎn)工序復(fù)雜、精密，良品率極為關(guān)鍵，幾微米的瑕疵也無法容忍。TCL與百度文心合作，構(gòu)建了電子制造行業(yè)大模型。將訓(xùn)練樣本減少30%-40%，還讓TCL兩個(gè)產(chǎn)線檢測(cè)mAP指標(biāo)平均提升10%+，新產(chǎn)線冷啟動(dòng)效率提升3倍，產(chǎn)線上線開發(fā)周期降低30%。而在汽車制造，百度與長(zhǎng)安汽車的合作又不同。汽車設(shè)計(jì)需要經(jīng)驗(yàn)豐富的工程師，在2萬(wàn)多種零部件、幾十萬(wàn)個(gè)參數(shù)里，去尋找滿足需求的排列組合，再寫成文檔、畫出圖紙。通過百度大模型，可以迅速進(jìn)行信息組合，自動(dòng)生成設(shè)計(jì)文檔，大幅減少了汽車研發(fā)的時(shí)間和成本。如果把行業(yè)大模型的能力，從一個(gè)工廠放大到一座城市，就是百度打造的智能交通解決方案。今年的五一，居民旅游出行達(dá)到高峰。假期前的最后一個(gè)工作日，北京城市的擁堵指數(shù)暴增了2.5倍，從二環(huán)堵到了六環(huán)。亦莊，成了當(dāng)時(shí)北京唯一不堵車的“綠洲”。因?yàn)楫?dāng)?shù)夭渴餉I全域信控方案，亦莊300多個(gè)智能路口，都能根據(jù)車流量自動(dòng)調(diào)節(jié)紅綠燈。

　　同樣的AI交通已經(jīng)在國(guó)內(nèi)69個(gè)城市落地。根據(jù)百度測(cè)算，這能讓通行效率提升15%-30%，從而拉動(dòng)GDP2.4%-4.8%的增長(zhǎng)。除此之外，百度文心還和浦發(fā)銀行打造金融行業(yè)大模型，與國(guó)家電網(wǎng)做電力大模型，還打造了政務(wù)、汽車、城市、航天、傳媒等11個(gè)行業(yè)大模型。數(shù)字化程度高的企業(yè)，有數(shù)據(jù)積累、人才團(tuán)隊(duì)、基礎(chǔ)設(shè)施，落地大模型應(yīng)用相應(yīng)也會(huì)走得更快。絕大部分中小企業(yè)還未數(shù)字化，他們并非沒有機(jī)會(huì)，但更需要低成本、低門檻、開箱即用的系列產(chǎn)品。湖北襄陽(yáng)一位鐵路工人，靠自學(xué)使用百度飛槳的開發(fā)套件，獨(dú)立實(shí)現(xiàn)了從建設(shè)數(shù)據(jù)集、到模型訓(xùn)練、再到模型部署的整套流程，做了一個(gè)自動(dòng)識(shí)別火車車號(hào)的應(yīng)用程序。以前檢查貨運(yùn)火車的車號(hào)，往往要人工核對(duì)數(shù)小時(shí)，襄陽(yáng)車輛段用了這個(gè)程序后，只用3分鐘就能做完，給當(dāng)?shù)剀囕v段節(jié)省了20多萬(wàn)的成本。研究機(jī)構(gòu)Epoch估算，AI和大模型訓(xùn)練，要不了3年時(shí)間，在2026年就會(huì)耗盡所有高質(zhì)量數(shù)據(jù)。

左起：低質(zhì)量文本、高質(zhì)量文本、圖像數(shù)據(jù)耗盡時(shí)間數(shù)據(jù)是未來AI競(jìng)爭(zhēng)的一個(gè)勝負(fù)點(diǎn)。把AI普及的門檻不斷降低，到產(chǎn)業(yè)落地中去，產(chǎn)生和積累更多高質(zhì)量數(shù)據(jù)。這個(gè)過程中，AI能力也會(huì)不斷迭代，更符合行業(yè)需求，從而開啟增長(zhǎng)的飛輪。

　　百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖說，未來所有企業(yè)都將強(qiáng)依賴大模型，所有產(chǎn)品都會(huì)基于大模型開發(fā)。

　　百度文心，AI十年技術(shù)+產(chǎn)業(yè)落地的先跑，是百度過去十年All in AI，戰(zhàn)略轉(zhuǎn)向最好的嘉獎(jiǎng)。現(xiàn)如今，百度是全球少數(shù)在芯片、架構(gòu)、大模型、產(chǎn)業(yè)應(yīng)用上，都擁有先進(jìn)自研技術(shù)的企業(yè)。與微軟、谷歌、Meta一起，被評(píng)為全球四大AI公司。算力和芯片是當(dāng)下焦點(diǎn)。大模型的基礎(chǔ)層需要數(shù)以萬(wàn)計(jì)的芯片，而英偉達(dá)GPU面臨斷供。百度自研有昆侖芯，目前已部署幾萬(wàn)片，并對(duì)外向行業(yè)輸出。第三代的昆侖芯片預(yù)計(jì)在2024年初就會(huì)量產(chǎn)。同時(shí)，百度智能云在山西陽(yáng)泉修建了亞洲最大單體智算中心，每秒可以完成4EFLOPS（400億億次浮點(diǎn)運(yùn)算），滿足文心的訓(xùn)練和推理。在框架層，百度的飛槳PaddlePaddle是中國(guó)首個(gè)開源的產(chǎn)業(yè)級(jí)深度學(xué)習(xí)框架，替代谷歌TensorFlow和Meta的Pytorch，在中國(guó)的市場(chǎng)綜合份額排第一。

　　模型層的文心大模型，包含30多個(gè)大模型，分為基礎(chǔ)大模型、任務(wù)大模型、行業(yè)大模型三級(jí)體系，全面滿足產(chǎn)業(yè)需求。

　　百度內(nèi)部的產(chǎn)品，如搜索、信息流、地圖等，都已在進(jìn)行AI原生重構(gòu)。同時(shí)，飛槳長(zhǎng)期深耕產(chǎn)業(yè)落地，連接著750萬(wàn)的開發(fā)者，20萬(wàn)家企事業(yè)單位。文心共享飛槳生態(tài)，解決了大模型研發(fā)和部署難題，加快文心的產(chǎn)業(yè)落地。作為AI的領(lǐng)軍者，百度不但培育出本土化的中國(guó)AI平臺(tái)和工具，還在搭建一個(gè)教育、產(chǎn)業(yè)、開發(fā)社區(qū)的AI生態(tài)，要在5年為社會(huì)培養(yǎng)500萬(wàn)AI人才，補(bǔ)充國(guó)內(nèi)AI人才缺口。今年5月，百度也宣布設(shè)立10億元的百度文心投資基金，鼓勵(lì)投資中國(guó)的AI創(chuàng)業(yè)者，鼓勵(lì)他們文心大模型的能力、百度智能云的算力，去開發(fā)和創(chuàng)新。

　　百度創(chuàng)始人李彥宏說：

　　新的國(guó)際競(jìng)爭(zhēng)戰(zhàn)略關(guān)鍵點(diǎn)，不是一個(gè)國(guó)家有多少個(gè)大模型，而是你的大模型上有多少原生的AI應(yīng)用，這些應(yīng)用在多大程度上提升了生產(chǎn)效率。

　　如果我們能擠上牌桌，獲得競(jìng)賽入場(chǎng)券，中國(guó)將擁有更壯大的數(shù)字化產(chǎn)業(yè)，數(shù)字經(jīng)濟(jì)規(guī)模將獲得巨大增長(zhǎng)。”我們總是高估未來2年的變化，而又低估未來10年的變革。不管你叫它智能時(shí)代、第四次工業(yè)革命，人工智能是用技術(shù)變革，打破一切格局的難得機(jī)遇。大模型推動(dòng)的歷史車輪，才剛剛開始。接下來的十年，注定也屬于AI。先期的泡沫會(huì)不斷釋放，大模型公司不斷洗牌，這是必然的過程。在產(chǎn)業(yè)落地的進(jìn)程中，留下那些能真正走進(jìn)行業(yè)，去解決問題、創(chuàng)造生態(tài)的公司。

點(diǎn)贊()

上一條：新時(shí)代青年展風(fēng)采，中國(guó)十七冶集團(tuán)優(yōu)秀青年崗位能手用匠心精神照亮追夢(mèng)征程2023-07-24

下一條：三星“綠色經(jīng)營(yíng)”之道：技術(shù)創(chuàng)新為環(huán)境可持續(xù)發(fā)展添翼2023-07-24

相關(guān)稿件: 唯品會(huì)與得物各執(zhí)一詞奢侈品鑒別存真空？ 2021-04-12; 康得新瀕臨退市退市制度改革加快A股優(yōu)勝劣汰生態(tài)形成 2021-03-17; 關(guān)于公布2022中國(guó)大企業(yè)創(chuàng)新100強(qiáng)的通知 2022-09-06; 康得新重大違法被強(qiáng)制退市法律界人士稱“不存在余地” 2021-04-07; 2010年中國(guó)500強(qiáng)：中國(guó)大企業(yè)實(shí)現(xiàn)“Ｖ”型反轉(zhuǎn) 2010-09-05

中國(guó)大模型肉搏：得技術(shù)者勝，得產(chǎn)業(yè)者強(qiáng)