學(xué)習(xí)或挑戰(zhàn)ChatGPT的“正確姿勢”,或許還是在更基礎(chǔ)、更底層的原始創(chuàng)新中尋找力量。一些中國企業(yè)在芯片、操作系統(tǒng)、AI大模型等方面持續(xù)投入,并且有所產(chǎn)出,ChatGPT的出現(xiàn),也是中國AI企業(yè)加速奔跑,迎來新一輪發(fā)展的契機(jī)。
最近,AI(人工智能)圈一股以“ChatGPT”為核心的熱潮從美國“硅谷”涌入中國。
2022年11月底,初創(chuàng)公司OpenAI發(fā)布了名為ChatGPT的對話式聊天機(jī)器人模型,一經(jīng)推出,便在網(wǎng)絡(luò)上迅速走紅。美國科技公司微軟的聯(lián)合創(chuàng)始人比爾·蓋茨高度評價這項技術(shù),認(rèn)為它的出現(xiàn)不亞于互聯(lián)網(wǎng)和個人電腦(PC)的誕生。
進(jìn)入2023年,微軟推新,谷歌入局,“ChatGPT”熱潮迅速升溫,國內(nèi)的科技巨頭也陸續(xù)涌入潮中。ChatGPT發(fā)布后,包括百度、科大訊飛、京東等在內(nèi)的多家企業(yè)紛紛公布自己在AI領(lǐng)域的布局。
近日,360創(chuàng)始人周鴻祎在一場直播中表示,如果企業(yè)搭不上ChatGPT這班車,很可能會被淘汰。確實,作為一個現(xiàn)象級的應(yīng)用(模型),ChatGPT的出現(xiàn)為AI領(lǐng)域的技術(shù)發(fā)展和產(chǎn)業(yè)布局帶來新的變化。
回溯ChatGPT的誕生過程,可以發(fā)現(xiàn)這是一個創(chuàng)業(yè)團(tuán)隊先“活下來”,再實現(xiàn)“服務(wù)所有人”目標(biāo)的故事,這也是一個從某個企業(yè)閉環(huán)研發(fā)到整個行業(yè)開源共創(chuàng)的AI大模型,更是一個利用超大數(shù)據(jù)、超強(qiáng)算力、超強(qiáng)算法“喂養(yǎng)”出來的跨越式AI產(chǎn)品,是量變引起質(zhì)變的產(chǎn)物。
梳理人工智能產(chǎn)業(yè)的歷史和現(xiàn)實,可以看到數(shù)據(jù)背后是廣泛的應(yīng)用場景,算力背后靠的是完善的信息基礎(chǔ)設(shè)施,算法背后需要深厚的人才儲備。這些方面中國已經(jīng)有所準(zhǔn)備,甚至可以說已經(jīng)積累了龐大的數(shù)據(jù)、算力和人才優(yōu)勢。而在ChatGPT浪潮洶涌而至?xí)r,盲目跟風(fēng)、“Copy To China”早已落伍,甚至只是在應(yīng)用層面“搭車”也顯得不合時宜。
學(xué)習(xí)或挑戰(zhàn)ChatGPT的“正確姿勢”,或許還是在更基礎(chǔ)、更底層的原始創(chuàng)新中尋找力量。一些中國企業(yè)在芯片、操作系統(tǒng)、AI大模型等方面持續(xù)投入,并且有所產(chǎn)出,ChatGPT的出現(xiàn),也是中國AI企業(yè)加速奔跑,迎來新一輪發(fā)展的契機(jī)。
ChatGPT潮涌
“今天我們推出了ChatGPT,嘗試在這里與它交談”。
2022年11月30日,熱潮來襲。OpenAI首席執(zhí)行官山姆·阿爾特曼當(dāng)天發(fā)布了一則推特,推特中除了上述文字,還包括一個鏈接,任何人都可以點擊鏈接、注冊賬戶,免費與ChatGPT交談。
與Siri、小愛同學(xué)等語音助手類似,ChatGPT也是人機(jī)交互應(yīng)用的一種。但在與ChatGPT“對話”的過程中,人們發(fā)現(xiàn)它的“智慧程度”遠(yuǎn)超其他的人工智能機(jī)器人。除了聊天,ChatGPT被網(wǎng)友們用來寫文案、翻譯文本、為代碼糾錯,甚至用來編寫代碼。
據(jù)OpenAI官網(wǎng)介紹,ChatGPT能夠連續(xù)回答問題、承認(rèn)錯誤、質(zhì)疑不正確的前提和拒絕不適當(dāng)?shù)恼埱蟆!暗谝淮?#xff0c;它(指ChatGPT)答錯了,我告訴它正確信息后,再問同樣的問題,它的答案就被改正了過來了。”一位曾嘗試與ChatGPT對話的程序員對記者說,“它甚至為此對我說‘抱歉’”。
憑借出色的表現(xiàn),ChatGPT僅用兩個月便吸引了超過1億用戶的關(guān)注,一躍成為20年來互聯(lián)網(wǎng)領(lǐng)域增長最快的消費類應(yīng)用。
北京時間2月7日凌晨,美國科技巨頭谷歌緊急入局,宣布基于LaMDA大模型的人工智能對話式機(jī)器人“Bard”正在進(jìn)行內(nèi)測。次日,微軟宣布推出由ChatGPT支持的最新版本Bing搜索引擎和Edge瀏覽器,熱潮升溫并迅速觸及中國。
就在谷歌官宣Bard內(nèi)測的當(dāng)天下午,百度官宣了大模型新項目“文心一言”(ERNIE Bot),并表示預(yù)計在3月完成內(nèi)測。隨后一段時間,阿里巴巴、360、科大訊飛、騰訊等多家國內(nèi)企業(yè)紛紛表示對AI技術(shù)發(fā)展的關(guān)注。2月10日,京東云宣布旗下言犀人工智能應(yīng)用平臺將推出產(chǎn)業(yè)版ChatGPT--ChatJD。
從科技巨頭,到行業(yè)龍頭,中國企業(yè)競逐AI賽道,AIGC(利用人工智能技術(shù)來生成內(nèi)容)等人工智能概念在股市一路狂飆,雖然在監(jiān)管出手后很快平息躁動,但漲勢依然存在。中信證券研究報告認(rèn)為,ChatGPT在全球的流行正在推動AIGC產(chǎn)業(yè)化全面提速,將引領(lǐng)創(chuàng)成式AI新變革。
“ChatGPT”熱潮涌動,正處于冷靜期的人工智能投資和產(chǎn)業(yè)布局迎來小陽春。
用大數(shù)據(jù)、大算力、強(qiáng)算法“喂養(yǎng)”
商企入局,資本關(guān)注。“ChatGPT”熱潮涌動的背后,是AI大模型的一次場景化落地。“ChatGPT的成功,意味著AI大模型之路的發(fā)展成熟。”中國信通院云計算與大數(shù)據(jù)研究所所長何寶宏日前在一篇評論文章中寫道。
AI大模型是人工智能邁向通用智能的里程碑技術(shù),模型可以自動從數(shù)據(jù)中學(xué)習(xí)知識,提升性能。GPT是OpenAI推出的AI大模型系列。從2018年到2022年,OpenAI先后迭代并推出了GPT-1、GPT-2、GPT-3和InstructGPT,此次發(fā)布的ChatGPT就是在GPT-3的基礎(chǔ)上通過指令微調(diào)后得到的。
2022年初,OpenAI團(tuán)隊開始用GPT-3構(gòu)建ChatGPT。據(jù)《財富》雜志報道,通過GPT-3訓(xùn)練ChatGPT的過程并不順利,對話的效果并不理想,因此OpenAI決定將ChatGPT放到“野外”供大眾使用。
結(jié)果,2022年年底ChatGPT實現(xiàn)了現(xiàn)象級的傳播,這出乎制作團(tuán)隊所料。“這絕對令人驚訝。”O(jiān)penAI首席技術(shù)官米拉·穆拉蒂在接受媒體采訪時說。OpenAI用了5年時間在GPT大模型迭代上完成了一場自我革命,在對話的場景中實現(xiàn)爆發(fā)。
“ChatGPT通過一種非常簡單的對話方式,構(gòu)造了非常好的應(yīng)用場景。”360創(chuàng)始人周鴻祎認(rèn)為,ChatGPT提供的這些應(yīng)用場景非常貼近大多數(shù)人日常的剛需和痛點,所以它才會火起來,能出圈。
出圈是偶然的,但ChatGPT的成功卻并非偶然,“OpenAI在GPT系列模型的基礎(chǔ)上,對算法、算力、數(shù)據(jù)等人工智能關(guān)鍵要素都進(jìn)行了一定的升級和優(yōu)化。”中國信通院云計算與大數(shù)據(jù)研究所人工智能部副主任董曉飛說。
在算法層面,ChatGPT的基礎(chǔ)是世界上最強(qiáng)大的LLM(大語言模型)之一——GPT-3,同時引入了基于人類反饋的強(qiáng)化學(xué)習(xí)方法,提高了對話的質(zhì)量。“從GhatGPT的表現(xiàn)上來看,它的精確性和整個性能效果確實提高了。”董曉飛說。
同時,AI的訓(xùn)練和使用也需要強(qiáng)大的算力支持。ChatGPT的訓(xùn)練是在微軟云上進(jìn)行的,在全球云計算市場,微軟云的市場份額排名第二。高水平、高市場份額,再加上芯片技術(shù)的高速發(fā)展,這都為ChatGPT的橫空出世奠定了堅實的算力基礎(chǔ)。
除了算法和算力,AI大模型的進(jìn)步迭代,需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練。2020年發(fā)布的GPT-3,其訓(xùn)練參數(shù)量已經(jīng)達(dá)到了驚人的1750億個,“大量的數(shù)據(jù)被反復(fù)‘喂’給ChatGPT。”一位目前在北京大學(xué)從事人工智能研究的博士生對記者說。
而且,ChatGPT的訓(xùn)練成本支出巨大。據(jù)Lambda Labs首席科學(xué)官Chuan li介紹,擁有1750億個參數(shù)的GPT-3單次訓(xùn)練成本達(dá)到460萬美元。在知乎上,網(wǎng)友在討論ChatGPT時,也都認(rèn)為它很“燒錢”。因此,可以說ChatGPT是一個靠大算力、高成本,用大規(guī)模的數(shù)據(jù)“喂”出來的AI模型。
董曉飛指出,雖然國內(nèi)外企業(yè)在算法研發(fā)上基本保持同等水平,但國內(nèi)更注重大模型技術(shù)與行業(yè)場景的融合,對于數(shù)據(jù)標(biāo)注和模型訓(xùn)練等高成本的人力投入更為謹(jǐn)慎。
“我們真正缺乏的是技術(shù)積累,包括數(shù)據(jù)怎么清洗、標(biāo)注以及模型的結(jié)構(gòu)設(shè)計,怎么訓(xùn)練、推理,這個地方很多都需要經(jīng)驗和積累。”網(wǎng)上一篇爆火的《ChatGPT專家深度解讀》這樣解釋。
搜狐創(chuàng)始人張朝陽在一場直播中說:“ChatGPT的產(chǎn)生是量變到質(zhì)變的過程,積累了很多年,涉及到算力要有多少服務(wù)器,知識庫、標(biāo)注等很多問題,若沒有這些能力的公司跟風(fēng)入局,會消耗掉許多資源。”
把握優(yōu)勢,競逐“生成式AI”浪潮
熱潮已經(jīng)襲來,有技術(shù)基礎(chǔ)的企業(yè)在強(qiáng)勢突圍,沒有技術(shù)基礎(chǔ)的企業(yè)準(zhǔn)備發(fā)力,尚待進(jìn)場。而等熱潮退去,能否留在場上,還需看清自己的優(yōu)勢和短板。
ChatGPT是AIGC的一種實現(xiàn)。董曉飛認(rèn)為,在AIGC的大模型建設(shè)和應(yīng)用層面,國內(nèi)企業(yè)在技術(shù)基礎(chǔ)和創(chuàng)新環(huán)境上都存在著相對優(yōu)勢。
首先,國內(nèi)持續(xù)投入大模型研發(fā)、技術(shù)基礎(chǔ)扎實。目前,阿里達(dá)摩院的多模態(tài)大模型M6參數(shù)量已達(dá)10萬億,是全球最大的AI預(yù)訓(xùn)練模型;華為盤古、百度文心等大模型的參數(shù)量都超過了千億,其中百度文心模型參數(shù)量已經(jīng)達(dá)到2600億,不遜于GPT-3。“國內(nèi)有關(guān)企業(yè)、研究機(jī)構(gòu)近幾年在大模型方面已經(jīng)有了技術(shù)積淀。”董曉飛說。
其次,國內(nèi)加快“產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型”、實現(xiàn)人工智能與實體經(jīng)濟(jì)融合等政策為人工智能提供了創(chuàng)新發(fā)展環(huán)境。近日,國務(wù)院國資委印發(fā)《關(guān)于做好2023年中央企業(yè)投資管理進(jìn)一步擴(kuò)大有效投資有關(guān)事項的通知》,指出要加大對5G、人工智能、數(shù)據(jù)中心等新基建投入。近年來,我國發(fā)布了一系列政策文件,為人工智能核心技術(shù)攻關(guān)、產(chǎn)品落地應(yīng)用以及探索發(fā)展新模式新路徑提供支持。
把握優(yōu)勢的同時,也要看到目前面臨的一些挑戰(zhàn)。如AI領(lǐng)軍人才相對短缺,AI與實體經(jīng)濟(jì)的融合程度仍需進(jìn)一步加深等等。對此,董曉飛建議,要特別關(guān)注一些底層技術(shù)的發(fā)展,如大模型框架、算法等,還要進(jìn)一步拓展AI的應(yīng)用場景。同時他也表示,要進(jìn)一步提升大眾對AI的認(rèn)知,“這對于AI的發(fā)展是有好處的。”
但董曉飛也指出,基于大模型的聊天機(jī)器人成本投入巨大,“企業(yè)前期投入需保持一定的謹(jǐn)慎,且需要看清方向。”
中國新一代人工智能發(fā)展戰(zhàn)略研究院發(fā)布的《中國新一代人工智能科技產(chǎn)業(yè)發(fā)展報告(2022)》數(shù)據(jù)顯示,中國人工智能企業(yè)布局側(cè)重在應(yīng)用層和技術(shù)層。其中,應(yīng)用層人工智能企業(yè)數(shù)占比最高,達(dá)85.18%;技術(shù)層和基礎(chǔ)層企業(yè)數(shù)分別占比12.41%和2.41%。由此可以看出,我國人工智能發(fā)展在應(yīng)用層面有較大優(yōu)勢。
在董曉飛看來,ChatGPT的成功出圈模式為企業(yè)提供了大模型、生成式AI、智能對話等技術(shù)的商業(yè)化應(yīng)用路徑,尤其將助力“生成式AI”通過更多形式實現(xiàn)在更多行業(yè)的探索和應(yīng)用。
“目前來看,國內(nèi)大模型開發(fā)廠商一是布局以大模型為基礎(chǔ)的通用對話、生成等能力;二是將其能力整合到搜索引擎、智能客服、智能音箱等產(chǎn)品線中;三是通過能力調(diào)用為中小企業(yè)滿足具體場景落地需求。”董曉飛說。
隨著ChatGPT的爆火,隨之而來的安全、隱私保護(hù)、知識產(chǎn)權(quán)等問題也值得關(guān)注。“目前國外出現(xiàn)有學(xué)生使用ChatGPT寫論文作弊的情況。模型使用大量的數(shù)據(jù)進(jìn)行訓(xùn)練,也存在使用過程中可能提供他人創(chuàng)作的侵權(quán)行為風(fēng)險。”董曉飛認(rèn)為,如何防止ChatGPT類產(chǎn)品的濫用對社會產(chǎn)生潛在負(fù)面影響亟須得到重視,“更希望我們目前的一些主流企業(yè)、科研機(jī)構(gòu),在生成式AI上發(fā)力,能引領(lǐng)新時代的AI發(fā)展。”(中青報·中青網(wǎng)見習(xí)記者 賈驥業(yè) 記者 王林)
相關(guān)稿件