近日,2024全球開發者先鋒大會在上海舉行。為期兩天的大會,匯聚了國內外超過100家開發者社區、100余家知名投資機構。OpenAI前高管扎克·卡斯、硅谷“創投之父”史蒂夫·霍夫曼等“大咖”也來滬與全球開發者交流。在此次大會的舉辦地徐匯濱江,上海首個大模型創新生態社區已然成形。僅僅成立半年,就吸引了近60家大模型企業,以及200余家產業鏈上下游企業資源匯聚。
以應用牽引,發布市級應用場景;培育生態,做好算力、數據等關鍵要素供應;加大開源、開放力度,降低廣大創新創業團隊和中小企業的大模型訓練門檻……近年來,上海積極培育人工智能產業沃土,逐漸成為大模型產業高密度創新的苗圃基地。
大模型產業“風起云涌”
大會上,上海人工智能實驗室領軍科學家林達華用“風起云涌”來形容近幾年全球大模型產業的發展。
2022年,ChatGPT橫空出世,大模型開始走入大眾視野,成為全球焦點。2023年2月,Meta公司發布LLaMa并催生發展出開源社區,大模型從“只會聊天的工具”,變成了有可能會進入到“嚴肅生產領域”的生產力。邁入2024年,Sora的出世、Claude 3.0展現出的強大推理能力,以及馬斯克剛剛開源的Grok,都代表著整個行業處在“方興未艾”的賽道。
“大模型行業的發展有兩個非常重要的驅動力量。一個是源于所有研究者和從業者對于技術理想的追求,不斷突破邊界,尋求越來越接近AGI(Artificial General Intelligence,人工通用智能)的大模型;同時產業界也看到了大模型帶來產業革命的可能性,無數企業投入巨大資源到這個賽道中。兩股力量交織在一起,形成了我們今天看到的大模型產業‘波瀾壯闊’的局面。”林達華表示。
而在國內,大模型產業的發展同樣突飛猛進。去年3月份,百度發布“文心一言”,此后,阿里巴巴的“通義千問”、科大訊飛星火大模型、騰訊混元大模型陸續發布上線。互聯網大廠之外,華為、京東、字節跳動、商湯科技,乃至三大電信運營商、各科研院所和高校的大模型產品也不斷推出。有統計數據顯示,中國研發大模型的公司已有100多家,邁入“百模大戰”階段。
同時,大模型行業也在不斷涌現出新的課題。以算力為例,微軟原全球執行副總裁沈向洋稱,發展大模型產業,算力是門檻。隨著大模型參數的增加,對算力的需求幾乎是幾何級增長的。另外,包括ChatGPT在內,大模型還帶來了“一本正經地胡說八道”、“深度偽造”等倫理問題,需要各方加強治理。
此外,當前主流的大模型都是建立在Transformer架構堆疊的基礎上,但這一架構對計算資源的消耗特別大。騰訊混元大模型算法負責人康戰輝表示,當下越來越多的企業看到了MoE(即:混合專家模型)展現出來的優良特性,未來可能還會有更加高效的架構出來。
產業應用“繁花綻放”
有行業人士將2024年比作大模型應用的“元年”,認為行業的競爭焦點正在從基礎模型到應用遷移。從目前來看,大模型確實已經落地到各行各業,生根發芽。
“大模型+科學”可以產生哪些化學反應?上海人工智能實驗室青年科學家白磊介紹,實驗室發布“風烏”大模型,可用以預測氣象。由于大氣系統的復雜性,全球中期天氣預報的有效性每10年才提高1天。此前,全球范圍內最好的物理模型有效預報時長最大為8.5天,而“風烏”達到了10.75天,且預測時間僅需30秒。
機器人與大模型的結合領域“具身智能”也是熱點。“傳統的機器人需要編程,需要寫固定的代碼,造成之前的人機交流非常僵硬。現在,我們告訴機器人它的手臂快碰到天花板了,在沒有任何方向性指示的情況下,它能夠理解,且做出正確反應。這在傳統的機器人編程中,是不可想象的。我們期待,大模型能給機器人一顆通用的大腦。” 中電科21所高級專家劉一帆表示。
“過去藝術家們通過AI軟件進行藝術作品的設計,今天有更多的藝術家通過AI完成藝術作品的創作。此外,從去年下半年開始,包括電商、營銷等領域,也有非常多的大模型產品涌現出來。”智象未來產品總監弓子健說。
林達華認為,圍繞大模型應用,產業分工會逐漸形成。“做基礎模型的企業并不會壟斷一切。如果從業者能夠憑借自己在行業里積累的數據和經驗,并基于自身的資源稟賦和數據優勢積極尋找差異化發展路徑,最終形成競爭力,我們的大模型產業一定會‘一路繁花’。”
著力建設“大模型之都”
人工智能是上海重點發展的三大先導產業之一。伴隨著新一代人工智能的發展,大模型熱潮掀起,上海正在著力建設“大模型之都”。
懷著“栽好梧桐樹,引得鳳凰來”的美好愿景,上海以徐匯西岸為核心,啟動了首個人工智能發展集聚區建設。如今,作為上海首個大模型創新生態社區,誕生于徐匯人工智能產業沃土的“模速空間”,已成為大模型產業高密度創新的苗圃基地。
上海徐匯區委常委、副區長俞林偉對“模速空間”名字的由來進行了解釋。他說,“‘模’意味著成千上萬的開發者在這里創新創業,百花齊放。這里是場景的試驗田,也是應用的孵化器。‘速’則指通過市、區攜手,為企業提供全方位的加速服務。”
轉眼間,“模速空間”掛牌已近半年。如今有超過60家大模型企業與他們身后200余家產業鏈上下游企業的資源匯聚在黃浦江畔這一方天地。
對于大模型企業來說,數據的體量、質量、多樣性缺一不可,均對大模型能力的提升有重要意義。如何能夠生產大規模、高質量的數據,也是各個大模型研發機構某種意義上“競爭壁壘”所在。
此外,算力同樣重要,不管是大模型研發企業,還是應用類公司,高算力成本都令人頭痛。如何提供普惠的算力,通過較低成本把大模型在垂直行業真正用起來,讓更多的中小企業、個人開發者加入大模型的開發中,也是行業關注的問題。
記者了解到,“模速空間”五個公共服務平臺作為“土壤雨露”,可為創新企業提供開放數據、算力調度、能力評測、備案輔導、融資服務等公共服務,提供關鍵要素保障。
以算力調度平臺為例,“模速空間”聯合運營商和云廠商共同保障大模型企業算力,目前商湯、儀電、火山超5萬張GPU可供調配。其開放數據平臺依托浦江實驗室牽頭的大模型語料數據聯盟,持續開源發布高質量數據集,數據總量近5TB,下載量近14萬次,行業覆蓋10余類。
面向未來,大模型產業的發展尚有許多挑戰。對此,上海已明確,未來將加強核心技術的突破,推動智能芯片關鍵技術和應用適配,打造更多元開放的智能計算生態。同時,完善標準體系、安全準則、倫理規范,推動人工智能、區塊鏈、元宇宙等前沿技術的開發和應用。
上海市副市長陳杰表示,未來上海將進一步加大開源開放的力度,探索大模型的新型開源和推廣模式,以降低廣大創新創業團隊、中小企業等大模型訓練的門檻,推出更多具有示范性、標志性的應用場景,來牽引大模型在金融、教育、醫療、制造等典型領域的垂直應用。(記者 杜康 上海報道)
相關稿件