大廠需要證明,他們投入的數十億元甚至數百億資金并沒有打水漂。
文|《中國企業家》記者 閆俊文?
與張一鳴熬夜讀論文、王興收購初創公司不同,劉強東帶領京東高管捕捉大模型的方式是在真實場景中不斷嘗試產品和服務。
劉強東在2017年就說過,AI既是一種技術,也是一種思考方式,他甚至暢想過,京東未來將實現無人辦公場景。
技術大變革期,也是公司興衰交替的關鍵期。他不可能無視大模型這種顛覆性技術所產生的影響,京東將如何參與這場游戲呢?
面對這場底層沖擊,各家均有不同的應對方式,對于京東來說,它的實體業務基因更濃厚,自1998年創立,已從中關村的一張柜臺發展到如今旗下5家上市公司,還有3家正在尋求上市——京東工業、京東產發和京東科技,員工人數擴張至超56萬,業務場景比阿里巴巴、騰訊與字節跳動都要復雜和多元,覆蓋物流、零售、金融、健康、工業等等。
產業場景多元以及天然的to B場景,讓京東對大模型服務產業的渴求更強烈,天然成為了大模型落地產業最好的“練兵場”。
在京東之前,騰訊、百度以及阿里巴巴都發布了行業大模型方案,但一位SaaS行業人士感慨,只聽到雷聲,不見下雨,暗示這些互聯網巨頭不會輕而易舉攻下行業山頭。
京東的雷聲和雨點在哪里?
全集團共建
大模型正在變成京東公共環境的一部分。它以視頻與海報的形式,出現在總部電梯間電視里、辦公走廊的墻上。
2023年2月份,京東對外宣布將發布服務產業的大模型。很快,大模型在京東集團內部也被提升到了更高的優先級,并很快成立了大模型項目組,至少已向劉強東匯報過5次。
何曉冬博士是京東探索研究院院長及京東科技智能服務與產品部總裁,也是京東自研“言犀大模型”的核心科學家。他說,以零售為例,人們購物的行為是事件驅動,以“我要買什么”開始,但大模型技術加入后,可能以“我要干什么”開始,這意味著,購物行為包括了小紅書的種草、抖音的內容以及京東的貨架,混合了多種形態。
內容以及交互的變革不斷驅動新產品以及巨頭公司的興起。從雅虎的衰落到谷歌的崛起,從淘寶再到抖音的崛起,王座權力的轉移總是伴隨著這條鐵律。如今,大模型為代表的AI則重寫這條鐵律。
大模型訓練需要大量的產業數據做預訓練,這些數據分布在京東零售、健康、物流、金融等各個產業線。于是,集團協調,各個BG(事業群)和BU(事業部)都參與大模型項目,最后,大模型項目組的人數達到了100人左右。
“他們把零售、物流、健康等業務數據帶進來,也會把大模型的功能帶回去用。”何曉冬說。
這構成了京東言犀大模型30%的訓練數據來源——京東圍繞著數智供應鏈積累下的高質量原生數據,而剩下70%來源于通用數據。何曉冬形容這個過程就像對大模型進行高等教育——學習了通用知識后開始在大學學習專業知識。
行業數據進來了,對數據還要做脫敏、分類以及加權處理,比如經營、營銷、特有知識的數據;針對不同行業,不同數據的加權系數是不一樣的,比如金融領域,業務數據權重會多一些,要幫助員工更好地把控風險;零售領域,又分倉儲、商城、社區團購、到家、超市等業務單元,不同類型數據對細分的業務場景的重要性也是不同的。
何曉冬強調,要做行業大模型,企業必須在這個行業做到足夠的頭部以及沉浸數年以上,才能吃透這個行業,了解行業發展的痛點。
在基礎設施上,京東云此前就建立了一個1000多張(A100)顯卡的機房,這是他們在2021年購入的,集成了英偉達最先進的計算和連接設備,保障大模型的訓練和迭代。
京東也在同步采用大模型改造內部流程,他們發起了名為“效能提升”的項目,讓程序員運用大模型產品工具,提升敲代碼、寫注釋以及測試案例的效率。綜合評估下來,業績平均估計提升20%以上。
在產品層面,除了智能客服,京東開始內部測試言犀大模型在諸多業務場景中的應用。比如產品搜索與推薦上,電商將很快從“萬事皆搜索”進入到“萬事皆服務” 的時代。
以搜索“帳篷”為例,未來,搜索結果里不僅僅看到帳篷這個產品,更能看到露營上下游配套的產品和服務,比如上游的旅行地推薦,下游的配套“燒烤”“鞋帽”等產品,加入了類似小紅書或者攜程的功能。它還可以自動生成一些文案,用戶露營完之后,可以發送至朋友圈。
還有金融營銷,通過自動化營銷助手“AI增長營銷平臺”提升營銷活動方案生產效率。這種全新的交互模式,讓人機交互次數從2000次降低至少于50次,操作效率可提升超過40倍。
何曉冬認為,通過人機多輪溝通,機器能更好地理解用戶的意圖,將意圖轉化為需求。傳統互聯網領域里有“注意力經濟學”理論,它主要靠設計、折扣、廣告等客觀條件來吸引用戶,但在“意圖理解”的場景下,通過多輪對話,用戶自己就會沉浸其中,并產生消費以及內容。
這是一個比當下垂類APP更龐大復雜的形態。如果搜索時代是信息聚合與匹配,那么大模型的時代則進入了內容精準生成,用戶隨時隨地 “Ask Me Anything(隨便問)”。
打磨毛刺
7月,京東推出言犀大模型之后,并沒有急于推向市場,尋求落地,他們的時間路線圖是今年下半年內部錘煉,并針對重點場景和客戶進行打磨,2024年初對外開放大模型能力。
何曉冬將言犀大模型錘煉的過程稱之為“打磨毛刺”。他以健康問診為例解釋,京東計劃在8月正式上線健康行業大模型。現在內部更多是Beta(測試)版本,比如會遇到如何保護病人自尊心的問題,這涉及到溝通的語速、方式,小概率情況下,會測出產品說話不合適的現象。
“技術和產品之間其實是有鴻溝的,產品一定是用戶角度,技術是創新角度。”何曉冬說。技術體系的人一定要往前走一步,主動貼近產品體系的人。
他預測,現在已經到了大模型技術要通過產品來證明自己價值的階段。AI技術有點像云業務一樣,它是提高生產力的,最后必然為各種各樣的行業服務,因此一定是往行業走。
大模型與行業結合越深,其產生的價值也就越大。目前ChatGPT也在摸索對外的商業化,包括通過API(應用程序編程接口)訂閱服務等,就如谷歌在互聯網時代基于流量的廣告模式。
API價值偏低,它的技術理解門檻也比較高,需要企業專人負責調用。而對于大模型開發企業來說,很容易陷入API價格戰,變成一門負向的業務。
由此而論,大模型時代,API接口未必是主流的商業化路徑,原因在于,它與行業連接太淺,對產業的技術要求也太高,賣產品和私有化部署大模型或許才是正路。據悉,已有人開始叫賣大模型,1000萬元就能買到一個完整數據、算法、算力的大模型。
在上海,也有一些“云買手”嘗試用大模型為客戶服務。以往,他們通過人工服務數十個客戶,人均年盈利在二三十萬元之間,這就到了天花板。但用上大模型之后,他們人均服務的客戶量翻了10倍,釋放了大量的生產力以及利潤空間。
與業內資深人士的看法類似,何曉冬也認為生成式人工智能是一個完全不同于移動互聯網時代的物種。相較于移動互聯網時期,京東的探索要更前置,更貼合業務,更不能回避競爭。
事實上,此次大模型之爭,大公司競爭的中心點不在資本、地推或者補貼策略,而是各自的研究院或者實驗室以及落地場景。
不管是京東還是阿里巴巴、騰訊,他們都有自己的研究院或者人工智能實驗室,比如2017年成立的阿里達摩院,2012年成立的騰訊優圖實驗室,2014年成立的百度研究院,2017年成立的京東人工智能研究院和2020年成立的京東探索研究院。
當前技術大咖們走到了價值創造階段,他們需要驗證,大公司投入的數十億元甚至數百億資金不是泡影。
騰訊成立了專門的技術委員會協調各大實驗室。騰訊對于研發的態度是,不會取消所有冒險研究,始終會保留一支小分隊探索前沿,留下火種。
何曉冬說,他給了京東探索研究院三個任務,第一,要在重要的競爭激烈的領域做到前沿,不回避競爭,愿意挑戰和競爭;第二,對重要業務和產品要形成支撐,對公司有價值;第三,要有足夠的前瞻性。
創始人與一號項目
從2月高舉大旗到6月病退,王慧文的軌跡似乎預示著此次大模型創業熱暫告一段落,他創立的光年之外最終被美團收購。坐到牌桌上的,只剩下大公司。
巨頭公司爭斗往往表面悄無聲息,但碰撞在一起的剎那,所產生的能量也是驚人的,甚至會掀翻某個旁觀者, BAT時代曾發生的邊界大戰,就如同今日的一個序章。
外部環境急劇變化,既有宏觀層面的挑戰,也有AI浪潮的興起,這些正在讓大公司的CEO或者創始人重回一線。
張勇將于今年9月卸任阿里巴巴集團董事會主席兼CEO職務,專職擔任阿里云智能集團董事長兼CEO,他希望在那里再造一個阿里巴巴。李彥宏、周鴻祎等紛紛出場,為自家大模型產品代言和推介。
京東集團新任CEO許冉說:“當產業效率和產業的邊界拓展得到質的提升后,大模型才有更重要的實際價值和意義,將不亞于又一次工業革命。”在此前召開的2023京東全球科技探索者大會上,她提出了京東對于大模型價值的公式,大模型的價值=算法×算力×數據×產業厚度的平方。
創始人與CEO的關注,既能讓項目在公司內部獲得大量資源支持,但也會帶來壓力,那就是盡快產生營收、利潤回報。
何曉冬坦言,京東言犀大模型的當下還是一個成本中心,但集團對大模型項目還沒有盈利要求;具體到自己負責的智能服務板塊,則已經實現了盈利,這也是大模型產業化應用價值的縮影。
如果說,AI是一條河,那么各家公司的產品方案有的是架橋,有的是鋪路,有的是造船,各有不同。誰最終越過科學研究到實際產品轉化鴻溝的這片“達爾文之海”,只能留給時間來驗證。
相關稿件