中國經濟網北京10月18日訊(記者 李方) 文心大模型4.0昨日在百度世界2023上正式發布,百度首席技術官王海峰對文心大模型4.0背后的關鍵技術和最新進展進行了解讀。他表示,文心大模型4.0的理解、生成、邏輯、記憶四大能力都有顯著提升,9月已開始小流量上線,過去一個多月效果又提升了近30%。8月31日文心一言面向全社會開放至今,用戶規模已經達到4500萬,開發者5.4萬,場景4300個,應用825個,插件超過500個。
今年3月16日,百度發布知識增強大語言模型文心一言。文心一言從數萬億數據和數千億知識中融合學習,得到預訓練大模型,在此基礎上采用有監督精調、人類反饋強化學習、提示等技術,具備知識增強、檢索增強和對話增強的技術優勢。
王海峰表示,相比3.5版本,文心大模型4.0的理解、生成、邏輯、記憶四大能力都有顯著提升。其中理解和生成能力的提升幅度相近,而邏輯和記憶能力的提升則更大,邏輯的提升幅度達到理解的近3倍,記憶的提升幅度也達到了理解的2倍多。
此外,文心大模型4.0在輸入和輸出階段都進行知識點增強。一方面,對用戶輸入的問題進行理解,并拆解出回答問題所需的知識點,然后在搜索引擎、知識圖譜、數據庫中查找準確知識,最后把這些找到的知識組裝進Prompt送入大模型,準確率好,效率也高;另一方面,對大模型的輸出進行反思,從生成結果中拆解出知識點,然后再利用搜索引擎、知識圖譜、數據庫,以及大模型本身進行確認,進而對有差錯的點進行修正。
王海峰表示,在強大的基礎大模型的基礎上,百度進一步研制了智能體機制,包括理解、規劃、反思和進化,能夠做到可靠執行、自我進化,并一定程度上將思考過程白盒化,讓機器像人一樣思考和行動,自主完成復雜任務,在環境中持續學習實現自主進化。
目前,文心一言也已應用在了更實用的地方。中國國家圖書館擁有全球最大的古代方志,百度與其展開戰略合作,利用文心大模型學習古代方志與家譜數據,幫助全球華人獲取更多尋根線索。此外,中國國家跳水隊與百度從2019年就開展了深入的技術合作,基于文心一言等百度大模型技術,中國國家跳水隊AI輔助訓練系統全面升級,對動作實時打分、精準量化分析,提供最有價值的指導信息,助力中國國家跳水隊高效訓練。
在人工智能人才培養方面,王海峰公布,百度在2020年提出5年為全社會培養500萬AI人才,截至目前,百度已經培養了420萬AI人才。
17日,王海峰發布了百度人才培養星河計劃,“我們將與產學研各界密切合作,深化產教融合,為社會再培養500萬大模型人才,讓人工智能科技的‘創新之花’,結出更多‘產業之果’,服務國家戰略,服務社會發展,服務人民福祉。”
相關稿件