算力是數字經濟的底座,一個國家適度超前布局算力基礎設施建設,有重要意義。
第三方市場調研機構IDC在《2021-2022全球計算力指數評估報告》中分析了包括美國、中國等15個重點國家的算力指數(根據多項指標測算的算力綜合指數)得出的結論是:算力指數平均每提高1點,國家的數字經濟和GDP將分別增長3.5‰和1.8‰。
每一代網絡基礎設施都會催生新一代產業。不同算力基礎設施上,也會誕生不同的軟件。3G、4G網絡讓移動互聯網誕生。在傳統的CPU算力上誕生了云。以GPU為代表的AI算力,則催生了ChatGPT和AI大模型。
2022年12月,微軟投資的AI創業公司OpenAI推出了聊天機器人ChatGPT。ChatGPT本質是OpenAI自主研發的GPT-3.5語言大模型,該大模型包含近1800億個參數。2023年3月15日,OpenAI將該大模型迭代至GPT-4.0。GPT-3.5只是單模態大模型,只能回復文本。但GPT-4.0是多模態大模型,能同時實現圖像、文本輸入。GPT-4.0的回復準確度、語義理解力大幅提升。
今年2月,阿里、百度等中國企業宣布將研發類ChatGPT產品,或將投入生成式AI的研發。3月16日,百度發布了對標ChatGPT的大語言模型“文心一言”。不過,目前中國企業對外發布的大模型普遍是單模態的,且普遍面臨GPU算力不足的挑戰。
《財經》在3月初與三位技術背景出身的專家進行了一場對話。他們經歷了中國產業技術發展的不同階段,擁有不同領域的專業視角。這場對話的主題是,“中國離算力自由有多遠”。我們在這場對話中探討了三大問題:
智能算力是什么,為何興起?智能算力會帶來哪些產業變革?中國要如何科學規劃算力產業?
對話人簡介:
新華三集團副總裁、計算存儲產品線總裁 徐潤安(新華三是國內重要的數字化解決方案提供商。新華三提供計算、存儲、網絡、5G、安全、終端等數字化基礎設施,客戶覆蓋百行百業)
百度杰出系統架構師 王雁鵬(百度智能云業務2022年營收177億元,正在成為集團的第二增長曲線。3月16日,百度發布了對標ChatGPT的大語言模型“文心一言”)
獨立分析師,數字化行業專家 寧宇
主持人:《財經》雜志副主編 謝麗容
以下是對話實錄精華版:
智能算力是什么,為何興起?
《財經》謝麗容:ChatGPT的風靡讓大家關注智能算力,就像多年前谷歌的AlphaGo戰勝圍棋世界冠軍時,讓普通人認識了人工智能,算力是什么?尤其智能算力是什么?它是一種什么樣的資源?
寧宇:算力是通過對信息數據進行處理,實現目標結果輸出的計算能力。算力會和算法、存儲一起構成我們數字社會的基礎。
徐潤安:大眾意義上理解的通用算力是CPU(中央處理器)。無論個人使用的電腦、手機,企業使用的服務器都最關心CPU主頻性能。這是衡量算力的一個重要指標。但數字化正在讓算力需求發生變化。CPU作為通用算力,已經無法完全滿足新需求。異構算力,比如GPU(圖形處理器)、DPU(深度學習處理器)、NPU(神經網絡處理器)通常被用來處理AI計算的需求。所以通常也被稱為智能算力。
王雁鵬:智能算力和通用算力采用了不同的計算方法。以CPU為代表的通用算力,善于執行邏輯指令進行高效率的計算。GPU為代表的智能算力,善于處理大量無邏輯關系數據的并行計算。
AI訓練和推理通常不涉及復雜控制指令,卻又依賴大量數據的并行運算。GPU/DPU/NPU這些專用處理器因此誕生。在過去的計算體系結構中,CPU要處理所有工作。現在的計算體系結構形成了不同的分工。GPU/DPU/NPU會針對不同的場景去做深度的優化定制。
《財經》謝麗容:ChatGPT這類AI應用正在讓智能算力需求爆發。2022年中國服務器出貨量約380萬臺,AI服務器出貨量超25萬臺,在大盤中占比約6.5%。哪些行業、哪些領域對智能算力有強需求?
徐潤安:典型的使用場景包括互聯網的搜索和推薦、零售電商業務數據分析;政府的智慧城市及治理,比如新華三已經為杭州濱江、呼和浩特等60余個地市通過城市大腦進行公共事務的輔助決策;自動駕駛的仿真訓練,需要大量真實道路數據進行模擬學習。
王雁鵬:百度在AI領域投入很久,云業務標簽是“智能云”。我們提出了一個理念,叫AINative(AI原生)。也就是說,千行百業都可以使用AI算力和模型訓練。例如,金融機構反欺詐、鋼鐵工廠AI質檢、能源企業的線路檢修都采用了百度類似深度應用。這個趨勢未來會給各行業帶來翻天覆地的變化。不過,這需要一段時間。
《財經》謝麗容:這么多領域都要用到智能算力,那么資源相對充沛的通用算力是不能用,還是效率跟不上?從客戶需求來看,智能算力占比已經超過甚至替代通用算力了?
徐潤安:這是計算效率的問題。最常見的CPU算力是x86服務器芯片。x86芯片單核性能強、通用性好,但是AI場景通常需要多核、高并發、高帶寬的芯片。綜合考慮成本、效率,GPU/DPU/NPU這些專用處理器通常會處理得更好。
現代計算機是遵循馮·諾依曼架構設計的,這套架構已經延續70多年。可以確定的是,CPU作為中央處理器的地位在短期內不會改變。只是在數據挖掘等場景下,CPU的職能被其他專用芯片分擔了。CPU、GPU及其他AI芯片,這三種蛋糕的比例會有變化。不過未來會誕生新的計算機架構。
現在有一種理念叫做“多元算力”。過去10年大家通常只談x86計算架構。但計算芯片和計算進程都在多元化,這是必然的趨勢。
王雁鵬:簡單理解的話,CPU像是大腦,它需要完成復雜的邏輯。GPU/DPU/NPU這些專用芯片就像四肢。它們不需要腦子太發達,只需要四肢足夠強壯,去解決需要解決的工作。
《財經》謝麗容:把CPU/GPU/DPU/NPU這些算力資源組合在一起,什么樣的組合才是效率最高的?專用芯片是不是需要足夠大的規模,成本才會下降?
寧宇:通常情況下,特殊需求一定要足夠大的規模,才能支撐起專用芯片。專用芯片,需要規模化運作,才能更經濟。多元算力持續增長,專用需求規模化擴張。這才會讓專用芯片的研發、生產、制造需求也不斷擴大。另一種場景是,傳統芯片無法完成新的工作。因此,哪怕成本更高,也需要用專用芯片去解決,企業自然而然也會去使用專用芯片。
徐潤安:是否使用專用芯片其實是種商業考量。所有活動都要考慮投入產出比,追根溯源還是效率問題。專門為一個算法或一個場景研發專用芯片,前提是可以產生足夠的效益,最終能覆蓋研發和制造成本。過去幾十年,x86架構芯片的生產成本降到了很低,因此CPU無法被替代。但是大模型和其他業務場景的出現,專用芯片的綜合計算效率更高,使得其他廠商有機會研發生產專用芯片。
《財經》謝麗容:專用芯片需要面臨成本、效率這個矛盾。ChatGPT背后的AI大模型和生成式AI是不是也需要面臨類似的矛盾?如何解決這些問題?
王雁鵬:阻礙上一代AI技術大規模落地的瓶頸有三個。一是企業需要針對不同業務場景,定制不同的算法,研發成本很高。二是,AI的后面是人工,企業需要耗費大量人工去標注數據,人力有限且成本高昂。三是,語音、圖像、自然語言分別有不同的研究框架,三者無法融合。
大模型代表了新一代AI技術,帶來了里程碑式的變化,解決了三個核心問題。一是,一個通用的算法就可以應對過去數十種場景,落地空間變得更大。二是,數據無需人工標注,大量數據可以得到自動訓練,而且模型結構是統一的。三是,語音、圖像、自然語言可以實現多模態融合,三者互相關聯。AI的思考方式會更符合人類認知方式。上述三個變化,更通用的模型、大規模數據訓練、多模態融合,會帶來AI技術的井噴和AI應用的爆發。
寧宇:過去AI模型往往用于專業領域、專業場景。大模型讓AI能夠成為通用工具平臺,應對足夠多的場景。上層AI應用使用規模變大,會激發AI算力的需求,進而會使得下層硬件可以衍生出專用AI場景的芯片、服務器。這是一個從專業到通用再到專業的產業循環。
徐潤安:AI從水平場景影響到了應用、硬件一個個不同的層次,這使得業務既解耦又打通。比如,底層的智能算力可以提供專用芯片,進一步降低上層AI應用的成本。
智能算力會帶來哪些產業變革?
《財經》謝麗容:AI技術這輪演變和創新會帶來大量新的機會,其中誰會受益?是不是會有一批優秀的創業公司誕生?未來會形成怎樣的產業生態?
徐潤安:生成式AI爆發會帶來巨大的算力消耗,那么第一輪機會是ICT企業的。頭部企業投入大模型研發,對新華三這種ICT企業來說就是機會。我們有更多機會服務好這些頭部客戶,為他們建設基礎設施。
第二輪機會是頭部大公司的。頭部廠商開發出大模型之后,可以利用平臺對外賦能。對外服務的過程,也是這些大公司受益的過程。
第三輪機會是各類創業公司的。大公司研發出大模型后,會形成平臺生態。大量公司在平臺上,針對千行百業研發上層AI應用。黃教主(英偉達CEO黃仁勛)說,ChatGPT相當于iPhone。iPhone帶來了移動互聯網的爆發,大模型也是類似的。這個過程中會有起有伏,有人成功有人失敗,但一定會有最終的受益者。
王雁鵬:在AI領域,百度有芯片、框架、大模型和應用的全面積累。
我認為未來可能會形成三層生態。基礎層是提供基礎大模型服務的企業,只有大公司才有能力。因為這需要長期投入,如資金、人力和技術積淀。第二層主要是各領域的公司。一些公司有較強的行業研究能力,可以基于大模型做各領域的專業應用。第三層是開發者。他們只需要放開手腳,把應用做好。開發者一定是更繁榮和開放的生態。
寧宇:大模型可能會讓AI產業出現類似移動互聯網誕生前后的產業變革。早年通信設備商為電信運營商提供硬件,中國移動、中國聯通、中國電信鋪設3G、4G高速通信網絡。基礎設施建設完成后,移動互聯網群雄并起。微信、淘寶、支付寶這些APP都因此誕生。
AI產業在中國發展很快,現在新華三這類企業為大廠提供硬件,助力建設算力中心,大廠建成大模型,大模型上會雨后春筍般孵化出AI應用。AI產業鏈會重構,大中小企業都可以找到自己的定位。所以,黃教主才會說,ChatGPT出現不亞于iPhone誕生給產業帶來的沖擊。
要如何科學規劃算力產業?
《財經》謝麗容:ChatGPT出現后,國內部分企業正在開始追趕。但也有人質疑,我們的算力、算法、數據實力能不能支撐中國做好類似的應用?
王雁鵬:在AI領域,中國和美國是絕對領先的。當前中國算力的確受到了一定制約。但從長線來看,一定可以突破,我對此有信心。接下來的挑戰是,數據是不是夠多。客觀現狀是,中文數據豐富度小于英文,但模型的邏輯推理能力可以彌補這個短板。
寧宇:算力、算法、數據,這些要素其實中國都有。我們未來的問題是監管這類非技術因素。訓練內容如何監管、應用場景如何適配、社會如何跟進技術發展,這都是挑戰。
《財經》謝麗容:ChatGPT這類生成式AI應用和大模型正在涌現。面向未來,中國應該如何科學地規劃自己的算力產業?
王雁鵬:我們希望,算力的供給能像水電一樣簡單。以CPU為代表的通用算力有標準的軟件、接口,在云上已接近水電。但是GPU/DPU/NPU這些異構算力,軟件復雜度越來越高。它的使用并不像CPU那樣簡單。這意味著我們需要芯片、框架、模型、應用都一體化整合發展。這樣才能把智能算力也變成CPU算力一樣標準化的水電資源。
徐潤安:我們需要摒棄過去幾十年看待算力的視角。過去是攤大餅似的買設備,堆砌算力,這種發展模式太粗放了。一方面我們需要應對多元算力的發展趨勢,讓算力得到更高效使用。另一方面,算力對電力消耗很大,所以這也催生了東數西算這樣的政策規劃。
此外,中國一直在提“算力網絡”概念,思考如何把國內的數據中心跨區域連接在一起。這是個系統工程。如果算力網絡建成,算力、存儲、網絡都可以統一調度,那么它會成為數字化變革的核心。新華三在去年推出了H3CUniServerG6新一代AI服務器,為此還搭配了智能管理中樞,這就像是算力操作系統。現在的異構算力太多了,我們希望彌補這些鴻溝,讓企業能更簡單、高效地使用AI算力。
寧宇:算力作為資源需要整體分配。對企業來說,需要不斷降低算力成本。對國家來說,需要對產業鏈的不同角色進行重新定位。東數西算與碳中和等其他國家戰略是相互匹配的。就像中國建設高鐵、4G/5G網絡一樣,算力基礎設施建設也要有規劃。既要讓成本足夠經濟,又要讓地區平衡發展,還要協調算力基建、AI應用的供需節奏。
把分散的服務器、數據中心簡單匯總計算出中國總體算力,這種統計方式便于操作。但我個人并不完全贊同拿浮點運算總數去衡量一個國家的算力能力。政策方提“算力網絡”、“云網融合”概念,是因為算力相連成網絡之后才有意義。這就像局域網不成體系,互聯網才能創造產業價值。
《財經》謝麗容:以電信行業為例,中國普通人的的通信自由,不為流量資費發愁的日子似乎是從4G開始的。對中國來說,什么是算力自由?算力自由是什么狀態?
王雁鵬:我理解的算力自由是,算力要支撐算法的發展,不要限制人類的想象力。從歷史發展來看,大型機/小型機被x86架構芯片取代,原因是大型機/小型機太昂貴,無法建成互聯網和云計算。互聯網讓廉價的x86架構芯片最終一統天下。Google在2003年-2006年發表的三篇論文又為云計算奠定理論基礎——用廉價的通用計算設備(x86架構,Linux系統)搭建低成本的計算集群。每個時代都可以重構不同的計算模式。這需要百度、新華三等企業在不同領域跨產業層的努力。
寧宇:第一是便宜,第二是易用。每一代通信技術迭代的周期是10年左右。電信運營商在這個周期內,一方面要保證經營能夠覆蓋基站的建設、維護成本,另一方面要讓用戶增長和網絡規模同步發展。在這兩個平衡的前提下提速降費,實現通信自由。未來如果有算力運營商,或者說是今天的云計算廠商,國家需要有宏觀政策指導產業演進。讓資源供給、市場需求以及運營商的收入能夠實現良好的匹配。
徐潤安:算力自由不是簡單的攤大餅,核心是供需平衡。和通信產業不同的是,通信技術10年一次迭代,但算力是3年-5年一次,因為服務器的平均使用周期大約是4年。這會導致算力運營商的成本是偏高的。算力設備采購后,3年內必須充分發揮作用。如果算經濟賬,這會帶來很大的挑戰。
關于算力的技術演進,這需要端到端的優化,產業鏈從上到下打破這壁壘。新華三和這類云計算廠商、三大電信運營商都需要探討這些需求。我們不能只生產、提供設備,我們需要對未來做出預測,進行適當的投入,提前做技術布局。
相關稿件