原標(biāo)題:京東推出言犀大模型數(shù)百億條數(shù)據(jù)扎根產(chǎn)業(yè)應(yīng)用
工人日報—中工網(wǎng)記者 車輝
7月13日,京東言犀大模型在2023京東全球科技探索者大會暨京東云峰會上推出。與通用大模型相比,這一源于產(chǎn)業(yè)、服務(wù)產(chǎn)業(yè)的大模型,融合70%通用數(shù)據(jù)與30%數(shù)智供應(yīng)鏈原生數(shù)據(jù),具有“更高產(chǎn)業(yè)屬性、更強泛化能力、更多安全保障”的優(yōu)勢,致力于深入零售、物流、金融、健康、政務(wù)等知識密集型、任務(wù)型產(chǎn)業(yè)場景,解決真實產(chǎn)業(yè)問題。
為夯實產(chǎn)業(yè)應(yīng)用,京東推出了一套大模型的完整工具,包括支撐大模型研發(fā)的基礎(chǔ)設(shè)施——言犀AI開發(fā)計算平臺、向量數(shù)據(jù)庫、混合多云操作系統(tǒng)云艦、高性能存儲平臺云海、軟硬一體虛擬化引擎京剛等核心產(chǎn)品。
依托京東言犀大模型,以及京東在產(chǎn)業(yè)和供應(yīng)鏈側(cè)的優(yōu)勢,京東還發(fā)布了兩大服務(wù)平臺,包括全新升級的優(yōu)加DaaS和言犀智能服務(wù)平臺,以及面向零售、金融、城市、健康、物流五大領(lǐng)域的行業(yè)解決方案。
京東集團CEO許冉表示:“京東的大模型技術(shù)演進,遵循了京東的技術(shù)追求:成本、效率、體驗、可信、普惠、突破。成本、效率和體驗是從京東的經(jīng)營理念傳承而來,也是零售的第一性原理。可信、普惠和突破則是技術(shù)服務(wù)于產(chǎn)業(yè)和社會的承諾。”
京東相信,京東關(guān)于技術(shù)追求的內(nèi)涵,在以大模型為代表的AI技術(shù)領(lǐng)域,能夠讓產(chǎn)業(yè)伙伴更加放心和低門檻地使用技術(shù)創(chuàng)新的成果,幫助技術(shù)走出實驗室和公司的圍墻,真正推動行業(yè)生產(chǎn)效率的提升,在產(chǎn)業(yè)場景發(fā)揮更大價值。
“大模型真正實現(xiàn)自己的價值,一定是在產(chǎn)業(yè)應(yīng)用中。”許冉表示,大模型的價值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方。“前三個指標(biāo)固然重要,但技術(shù)在產(chǎn)業(yè)場景落地應(yīng)用,創(chuàng)造實際價值才是關(guān)鍵。當(dāng)產(chǎn)業(yè)效率和產(chǎn)業(yè)的邊界拓展得到質(zhì)的提升以后,大模型才有了更重要的實際價值和意義,這將不亞于又一次工業(yè)革命。”
“從產(chǎn)業(yè)端切入大模型,如同從北坡攀登技術(shù)珠峰,道路雖然更加艱難,卻有更波瀾壯闊的風(fēng)景。”許冉說。
產(chǎn)業(yè)場景是京東非常擅長的領(lǐng)域。京東作為一家新型實體企業(yè),自身發(fā)展就來自產(chǎn)業(yè)場景歷練,擁有包括零售、物流、科技、健康、工業(yè)、產(chǎn)發(fā)等豐富的產(chǎn)業(yè)布局。這為京東積累下每年數(shù)百億條優(yōu)質(zhì)交互數(shù)據(jù),訓(xùn)練言犀大模型的數(shù)據(jù)庫,就由70%通用數(shù)據(jù)和30%供應(yīng)鏈原生數(shù)據(jù)組成。
深厚的產(chǎn)業(yè)數(shù)據(jù)積累,以及千行百業(yè)Know-How,成為京東布局大模型的核心優(yōu)勢,訓(xùn)練出的大模型天然具備“產(chǎn)業(yè)基因”。此外,言犀大模型還具備行業(yè)泛化能力,并能夠保障客戶在云上云下安全使用。
“數(shù)智供應(yīng)鏈訓(xùn)練了產(chǎn)業(yè)大模型,而大模型則依托供應(yīng)鏈深入產(chǎn)業(yè)”,京東集團技術(shù)委員會主席、京東云事業(yè)部總裁曹鵬如是說。
對于大模型的應(yīng)用實踐,京東也有明確的“三步走”規(guī)劃。目前,京東云已經(jīng)基于內(nèi)部實踐構(gòu)建了通用大模型;到今年年底這段時間,京東將經(jīng)由高度復(fù)雜場景大規(guī)模錘煉,迭代出扎實的產(chǎn)業(yè)服務(wù);預(yù)計在2024年初,會將大模型能力向外部嚴(yán)肅商業(yè)場景開放。目前,京東已經(jīng)走到第二步,并在內(nèi)部取得了豐富的實踐成果。
相關(guān)稿件