AI大模型會變傻嗎?
這事或正在發生!
頂級科學期刊《自然》發表的最新研究給似乎將變得無所不能的大模型判了“死緩”,將這種糟糕情況描述為“大模型崩潰”。
《自然》雜志最新一期封面,圖源:Nature
除了變傻,大模型還面臨發展路線分歧。一條傾向于把通用大模型做到盡可能完善,然后自上而下實現產業、商業場景全覆蓋;一條則是扎根產業,從實際應用中自下而上催生成熟的產業大模型,為通用大模型的完善積累“智慧”。
有意思的是,根據《全球數字經濟白皮書(2024)》統計,目前全球的基礎大模型有1328個,美國最多,中國第二。而產業大模型,中國表現了極大的熱忱。更有意思的是,美國企業多傾向第一條路線,而中國開發者則越來越扎堆第二條路線。很難說兩條路線誰更具優勢。不過對《自然》的最新警告,很可能不會出現在走第二條路線的中國開發者身上。
人們期待AI大模型引領人類開啟新紀元的愿望有多熱切,“大模型崩潰”帶來的打擊就有多強烈。
下一次大模型泡沫說不定就是被它引爆的。這種事在互聯網與資本的蜜月期也屢見不鮮。
如果訓練大模型時,只用AI生成的內容,會導致大模型出現不可逆的缺陷。一些在第一代數據中出現的低頻詞,在以后的迭代中出現的頻率會更低,而一些常見詞匯出現的頻率則逐漸增加。久而久之,模型逐漸無法正確模擬真實世界的復雜性。錯誤被層層累積、逐漸放大,最終導致“模型崩潰”。
很像生物學中“近親繁殖”導致后代缺陷的過程。
如何規避“模型崩潰”陷阱,讓大模型更好的成長呢?
接地氣是選擇之一。事實上,許多中國大模型開發者就是這么做的。
比如京東推出的言犀大模型,以及基于大模型產生的京醫千詢、京點點、小哥智能終端助手等一系列智能體應用。
截至目前,京東大模型落地超過100個場景,支持了23萬+商家,2萬+京東采銷,1萬+研發人員;不但涵蓋零售、供應鏈等核心領域,還能兼顧辦公自動化、法務、風控、合同審核、數據分析的解決方案,并拓展到了健康領域。
京東大模型開發最大特色就是從實踐中來到實踐中去,大模型在京東基本實現了祛魅,即使是普通的業務人員都能自己定制、拿來就用。
能用、好用的大模型,緣于京東對供應鏈的深耕。
回溯歷史,供應鏈可謂歷次產業革命的集大成者。諸多巨型企業、經濟學家、管理學家、還有產業研究者早早就把供應鏈整體協同優化,視為企業更上層樓的關鍵。
舉個簡單的例子,一輛汽車的零部件通常超過3萬件,核心工廠很難生產全部零部件,會把大部分零部件交給上下游企業生產。但汽車裝配對零部件供貨時間要求極高,協同不好就會影響交貨。
所以,最早的產業互聯網就是由美國汽車四巨頭聯手締造。
而京東產業大模型的橫空出世,似乎有一點歷史宿命的意味。
供應鏈是產業中數據最集中、協同最復雜的場景,通過數據實現管理優化即可提升供應鏈效率,通過落地大模型能夠快速釋放供應鏈效能,相比其它場景能最快發揮智能的優勢。
京東有一個公式,大模型的價值=算法×算力×數據×產業厚度的平方。第四個乘數,正好呼應了我們前文中提到的第二條路線的特質,能極大彌補AI生成數據的先天不足,從而為大模型的成長提供了一個更平衡、更全面的路徑。
圖源:數字基礎設施技術趨勢白皮書(2023)
大模型誕生到現在,人們早已不再滿足于其強大的自然語言(含圖形)理解、語言生成和語音識別等能力,在聊天、娛樂等通識屬性較強的場景上的表現,更寄希望于實際用起來產業落地,商業落地。
正如中國工程院院士鄔賀銓所說的:對話、寫詩、作畫絕不是大模型的全部。我們需要將大模型切實投入到城市發展、金融科技、生物醫藥、工業制造、科學研究等領域,也需要專業的企業和組織加速其在實體產業落地,為產業剛需帶來實實在在的價值,真正意義大規模服務社會。
京東就走在這條路上。京東集團技術委員會主席、京東云事業部總裁曹鵬認為“通用大模型靠算力堆出來,企業大模型靠業務跑出來”, 并表示“京東供應鏈是大模型應用的超級孵化器。”
2024京東云峰會上,京東云展示了京東言犀大模型落地行業的領先技術與最新實踐,并重磅發布京東云企業大模型服務、言犀智能體平臺、智能編程助手JoyCoder、言犀數字人3.0等八大產品。
當大模型遇上供應鏈,產業互聯網的歷史一幕也許會在京東身上重現?
京東言犀大模型的成長,還能讓我們可以對世界工廠的全面刷新暢想一番。
中國擁有聯合國工業名錄門類劃分中的39個大類、191個中類、525個小類的全部門類。構成這個龐大工業體系的是40萬家企業,其中超過90%的企業是中小微企業。
圖源:鈦媒體
都知道數智化是方向,但常規的研發者不會去鉆研不同產業的技術訣竅,以至于基礎大模型讓很多中小企業覺得高不可攀,彼此之間誰仿佛都覺得對方離自己還遠著呢。
京東云為產業締造了一個全新的關鍵容易上手的系統,還是相對繁雜偏偏還離不開的供應鏈方面。
從生產到流通,從原料供應、倉儲,到運輸、分銷,以及最終的消費者,傳統供應鏈的節點繁復,交織成的網絡結構復雜,流通環節也總是層層障礙。
京東云本身就扎根于供應鏈,加上之前的積淀,在零售、物流、倉儲、金融、健康、工業等產業擁有深入實踐,還參與了城市、政務、金融、制造、工業、航空、交通、園區、能源等產業。
京東云很多年前就確定了數智供應鏈的目標。其核心理念是產業聯結、數智創新和生態融合,通過數智供應鏈建設,企業能夠從產業鏈全局優化效率,以數智技術驅動數實融合,同時聯結更多生態伙伴,實現更高效的數字化轉型。
大模型的落地,讓數智供應鏈再次蛻變,線性鏈條連接“孤島”,交織成一個復雜網絡,進而實現有限的自主呼應,有點類似藤曼纏繞的雨林結構,如今這個系統又有了高級統御的智慧。
AI智能體(AI Agent)被視為過往技術發展的集大成者,在工業界已得到共識,能夠廣泛適配各類應用場景。AI智能體以大型語言模型(LLM)作為核心控制器構建,可以構建出強大的問題解決器。
言犀智能體平臺
京東云言犀智能體平臺是新一代一站式 AI Agent 開發平臺,目前已接入數十個大模型,它幾乎就是一個為使用而生的平臺。無論用戶是否有編程基礎,從解決簡單的問答到處理復雜邏輯的業務問題,都可以在平臺上低成本快速搭建基于 AI 模型的各類快捷應用。
比如外貿供應鏈的報關場景,會產生大量報關碼(HS code),需要人工尋找到每個code,還要手動輸入商品描述。京東云言犀智能體平臺通過workflow反向RAG,描繪商品,找到對應code。另外還有智能體低代碼開發的應用構件,輸入一段描述的自然語言,就可以基于Agent生成應用。
還有外貿中的訂單履約場景,過去需要通過客服問詢,京東云通過言犀智能體平臺調用API,就能查到訂單履約到哪了;通過Agent調用對應的foundation,就能查到物流訂單到哪了。而且拆單狀態、履約情況、合同審核等場景在國際貿易時不能只用中文,還需要多種語言,基于AgentAIG就能輕松實現多語言問答。
通用大模型要做到這一步,往往會出現開發冗余、貨不對板或者成本高企,而針對性強的產業大模型卻能夠同時對齊了成本、效率、體驗三方面要求。
對業務場景的理解與觸達,對產業數據的積淀與運用,是京東言犀大模型保持精度的重要前提。實際上,言犀大模型數據就是由70%的通用數據與30%供應鏈場景生長的原生數據構成。
你能想象京東的小哥都在自如實現與大模型的對接嗎?
多場景智能助手 特定角色提供專業服務
小哥的崗前培訓,比如具體到服務過程中如何處理異常?哪些違禁品不能郵寄?以及耗材等問題……
過去他們需要記住大量專業知識,過程長,還容易出錯,現在京東云基于言犀大模型為小哥量身訂制了終端智能助手,這位“助手”能牢記從攬收、派送、站內、輔助、客戶服務等143項標準作業動作,到貨物處理規程、安全操作標準、KA客戶等915個服務要求都能回答。
對于物流、派送地址等常規操作,小哥甚至只需要動動嘴,小哥助手就能優化流程,給出優化方案。
如今物流的小哥終端智能助手已服務近35萬京東自有配送員。
京東集團副總裁何曉冬將這比作培養一個人,“如果一個人高中畢業后直接出去打工,似乎也行,但專業性會差一點。要是能讀完四年本科再出去工作,就既有通識能力又有足夠的專業知識,這是產業大模型應該具備的能力”。
至此,京東供應鏈與大模型,形成了一對奇特耦合且螺旋上升關系:一方面,大模型的出現為供應鏈的深化、優化、數智化提供了新的增長點;另一方面,京東供應鏈的復雜場景產生的真實數據可以訓練大模型,讓大模型在供應鏈上先跑起來;進而,不斷成長的大模型又將賦能供應鏈,激發更大的改變。
這種結構像極了DNA,不斷延伸延展,孕育無限可能。也在述說著,更適合企業的大模型真的可以一邊跑一邊訓出來。
DNA結構,圖源:University of Minnesota Libraries
種一棵樹最好的時間是十年前,其次是現在。
京東云對大模型深耕落地產業的理解,不是種樹,而是種森林。
這種“森林思維”很契合大模型的養成。
以往我們發展大模型,尤其是通用大模型,缺芯片導致算力不足,算法也有差距也就罷了,連原本應該最豐富的數據,也因為數據標準化等諸多問題,而變得無法用于大模型的訓練。
甚為可惜。
不過,京東云做產業大模型的歷程展示了一條因地制宜的發展國產大模型的新的路徑。
和生產場景無限接近,加上互聯網企業的基因,讓京東云在特定的領域積累了大量優質的數據,這些數據對于產業、垂類大模型是再優質不過的養料。
多年以前,面對復雜的消費和零售價值鏈,劉強東將每個環節總結成“十節甘蔗”,隨后京東選擇滲透進入更多的甘蔗節數——將業務延伸至倉儲、配送、售后、營銷之外的生產、研發等供應鏈其他環節。
如今吃透每個環節,讓京東的產業大模型在應對具體的場景時就仿佛含著金鑰匙出生。
中國企業有望證實大模型第二條商業路徑的合理性。
如今,全球通用大模型競爭白熱化,對高端GPU的追求,堆爆了英偉達的股價,讓其一度超越蘋果、微軟,登頂全球最大市值企業,也同時讓大多數渴望大模型引發傳統產業嬗變的企業開始望洋興嘆。
因為它們既不好用,更加用不起。
國際通行的評判大模型的標準是算力、算法、數據。以京東云為代表的一部分中國企業則以自己與產業的高度融合,提出了大模型產業落地“新三要素”:場景、產品、算力。
復雜的交互智能場景及其產生的動態數據、從單一算法競爭到形成可以牽引成體系算法創新與突破的產品和能支撐這樣的場景與系統的新型算力。
基本理念是基座大模型靠堆卡訓練,企業大模型靠人用出來。
本次2024京東云峰會,京東云發布三大智能平臺、五大領先技術產品,從基礎設施到Agent應用,構建全場景的大模型服務能力,持續推動大模型落地產業:
· 京東云企業大模型服務,支持一站式打造企業專屬大模型,將垂直領域知識注入到模型的同時,不損失模型的通用能力,且更加經濟適用;
· 言犀AI開發計算平臺2.0,內置20余種開源模型和豐富的數據集,提供100余種算法和工具鏈,提供低門檻、高性價比的大模型開發服務;
· 京東云大模型安全可信平臺,涵蓋超過200種特有的紅藍對抗攻擊手法,覆蓋監管合規要求的全部31類風險類型,風險分析準確率高達95%以上;
· 京東云云艦AI算力云,支持多地域分布式算力的統一調度,提供高性價比的算力供給;
· 新一代分布式存儲云海3.0,支持千億級參數AI大模型,4K隨機寫IOPS達到1000萬級,平均延遲在100微秒級,極致性能更好地支持大模型落地應用。
真正適合企業的越來越多的大模型應用,正在京東供應鏈上生長出來。在內部業務中根據實際需求找到大模型落地的場景后,京東云已能對外輸出能力。
今年京東618期間,京東云言犀數字人在5000+品牌穩定開播,在汽車、跨境美妝、珠寶首飾、3C數碼、家電家居、醫療健康等多品類播間帶動閑時轉化率提升超30%,直播累計時長超40萬小時,累計觀看人次超1億,互動頻次500萬+次。
京東云言犀數字人依托全新升級的3.0版本,以超100個性化角色、超50行業特定屬性場景,表現超過行業80%的主播。除電商直播場景外,言犀數字人還在文旅、金融、智能服務、政務咨詢等更廣泛的場景應用落地,與億級用戶智能交互,帶來下一代交互體驗。
健康大模型京醫千詢成為基于行業內首個實物與服務相聯通、知識與數據相融合的醫療大模型。免費智能醫生“康康”結合京東健康億級醫患會話和豐富的實物、服務、內容等供應鏈資源,提供專業咨詢服務;專屬個人醫助支持病情收集、診斷推薦、治療方案推薦、病情解釋、智能病歷等功能,全流程輔助醫生提升問診效率。如今京東健康皮膚醫院基于大模型的AI輔診準確率超過95%。
“道生一,一生二,二生三,三生萬物。”《道德經》認為天地萬物的始基與母源在于“道”。在供應鏈和大模型的“宇宙”中,京東云尋到了“道”。
2017年京東戰略會上,劉強東高喊“技術、技術、技術”的戰略。7年過去了,京東云在大模型產業應用實踐中,成為這家企業戰略遠見與定力的力證。
什么是新質生產力?
什么是最優的產業轉型升級路徑?
在新技術激蕩的時代,其實就是用新技術把你熟悉的一切從頭到腳重新做一遍。
當大模型落地離我們越來越近,京東云再次選擇把大模型做實,把供應鏈做透。
其實腳踏實地,與仰望星空并不沖突。京東云能讓大模型與有史以來最龐大的世界工廠的融合得多一點,更順滑一點,那樣的情景都足以令人心潮澎湃。
相關稿件