數字時代,以大模型為代表的新一代人工智能作為國家重大戰略需求,是支撐并強化更高水平人機智能協同的關鍵技術方向。特別地,大模型在數據、信息、知識、智慧的跨鏈增值上,已呈現“智能涌現”的規模化優勢,并且這些功能可以輔助并強化人類工作的知識性助益。基于大模型的知識助手,是當前商業價值最大化而潛在風險最小化的大模型落地場景,能夠廣泛提升人與AI應用協同工作的體驗與效率,實現工作效益的切實變革。
北京中關村科金技術有限公司(簡稱“中關村科金”),已實現大模型知識助手在企服賽道的成功切入。中關村科金通過自主研發的領域大模型、大數據智能搜索、多模態文檔解析等關鍵技術,在知識問答、知識構建、知識歸納、知識推薦等核心場景,實現高效率、低成本、規模化的強人工智能創新應用,打通企業知識應用的“最后一公里”。
一、大模型時代下的新型人機協同,知識助手成功開啟商業藍海
當前,以大模型為代表的通用人工智能正在飛速演進,正在成為重組數據要素資源、重塑人機協同新型生產關系的關鍵力量。較短時間內,基礎大模型的研究和發布呈蓬勃發展態勢,接下來將進一步呈現商業落地的競速比拼。
然而,大模型的落地時間表還與具體場景要求息息相關。大模型的商業化變現仍面臨幻覺傾向、數據偏向、準確率不足等挑戰,需根據具體商用場景甄別實際風險,從而制定相關技術路線和制度規范體系。
根據落地場景的容錯性和通用性要求,大模型知識助手將率先開啟商業藍海。具體而言,可以按照容錯性、通用性兩個維度將應用場景劃分為以下四個象限(如圖1所示)。其中,服務企業內部員工的知識助手,既具備專業性、又具有較高的容錯性,是短時間內大模型技術落地應用的最佳切入點。
圖1:應用場景劃分
二、聚焦效率與體驗,大模型知識助手已成三大應用模式
基于大模型的知識助手,能夠提供面向搜索的精準問答,從而打造企業知識應用的新范式。尤其是,對比傳統企業知識庫、QA機器人等傳統知識管理手段,大模型知識助手能夠帶來知識歸納、構建、問答、推薦等全流程效率和體驗變革。一方面降低知識歸納和構建過程的成本,特別是現有信息抽取模型技術的大量標注、定制化開發模型時間長、純人工總結的私域數據規模太大等難題;另一方面提升服務問答和推薦環節的問題覆蓋范圍,避免語義理解環節的匹配度低、無法覆蓋長尾等問題。
圖2:傳統知識庫架構
大模型知識助手,可以由淺至深分為三種應用模式,如圖3所示:
一是“通用大模型+提示工程”。對于知識總量有限、專業性要求不高的企業,可以直接使用通用大模型,針對企業具體的場景需求,由業務專家探索出提示詞,此時企業需要的是一套靈活好用的提示詞管理工具。
二是“通用大模型+領域知識庫+提示工程”。對于長尾碎片知識(如SKU)較多的企業,需要在通用大模型的基礎上,外掛領域知識庫,針對具體場景、企業特有的問題可以讓大模型去知識庫里找答案,最后再在提示詞的引導與約束下返回輸出結果。
三是“領域大模型+領域知識庫+提示工程”。對于領域常識總量大的企業,需要構建企業專屬的領域大模型,將領域里的通識輸入到大模型的“大腦”里,既保持通用的常識和推理,又具備領域內的專業知識和技能,讓大模型由本科生變成領域專家。
圖3:大模型知識助手的三種模式與四項挑戰
目前,中關村科金基于領域大模型的知識助手產品已在和諾亞財富的合作中得以應用。中關村科金通過融合自研的金融領域大模型、智能客服等人工智能技術,為諾亞財富打造的智能知識庫,具備多模態文檔分析、QA問答對自動抽取、知識內容自動標簽化處理能力。通過集成諾亞財富的企業微信和旗下財富管理平臺iNoahAPP應用,為其員工和用戶提供基于企業知識文檔的智能問答查詢功能。通過大模型技術為智能客服產品賦能,大幅提升客服系統問答意圖識別準確率和回復準確率,預期后期可減少70%以上的系統運營工作,有效幫助企業降本增效。
三、風險與價值的雙向平衡,核心攻關四大技術能力
中關村科金憑借領先的AI技術實力、系統的解決方案能力、深度的行業服務經驗,研發與企業用例的整體風險容忍度相一致的知識助手,并且完善相關技術路線和參與共建行業制度規范以減輕相應風險。在知識助手的基礎上,公司研發“基于大規模語言模型的營銷助手”,榮獲中國信通院2023可信AI案例大模型研發應用和工具平臺優秀案例,并且設計“企業超級員工”成功入選“2023WAIC全球創新項目路演TOP20榜單”。目前,中關村科金可為企業提供開箱即用、系統無縫銜接、成本可負擔的大模型服務。
圖4:知識助手產品示意圖
中關村科金聚焦形成四項核心技術能力,以平衡大模型的風險防范與價值創造。
一是避免產生幻覺(Hallucination)傾向的外掛知識庫技術。幻覺傾向是指大模型經常生成一些看似合理、實在不符合事實的語句。有時杜撰出來的信息一看便知真假,有時則讓人一時無法分清事實。幻覺是目前大模型的一項固有屬性,中關村科金通過外掛知識庫在很大程度上杜絕該現象。
二是領先的多模態文檔解析技術。企業內高頻、事實性知識(KnowWhat)往往存儲于結構化數據庫中,流程性知識(KnowHow)和一些低頻事實性知識往往存在于非結構文檔中,如:產品手冊、操作規章、培訓視頻等。這類數據以往只能打上一些粗粒度標簽,中關村科金通過自研的ASR、OCR等預處理后,能夠做結構化的解析和表示,輸入到大模型中實現細粒度的語義理解和流程挖掘。
三是基于大數據智能的思維鏈歸納技術。企業內外部真實問答場景中,往往流程性知識問答占比較高,中關村科金通過自主研發的領域大模型,從文檔中的顯性文字描述中理解這類知識、從日志中的隱性事件中挖掘出這類知識,實現了優于傳統技術的增值點。
四是避免災難性遺忘的領域模型訓練技術。領域常識注入通用大模型的過程中,往往造成大模型通用能力的下降,中關村科金通過訓練數據和訓練任務等一系列技巧,可以使其在具體任務上性能顯著提升且保持通用性。
大模型是大勢所趨,所有業務或場景都會涉及其中。目前,知識助手是企業服務賽道上最佳的切入點。未來,在其合規性、安全性、可解釋性等得到保障并贏得用戶的數字信任后,可進一步布局營銷、客服、運營等全鏈業務生態,實現新型人機協同的價值釋放。
相關稿件