10月14日,雙態IT烏鎮用戶大會成功舉辦。其間由百度智能云與鼎茂科技聯合舉辦的專場分論壇,聚集了百度智能云、鼎茂科技、建信金科、上海人工智能研究院、國方創新等企業、機構的各領域專家,以“利用AI大模型技術加速推進智能運維大腦建設”為主題,圍繞AI大模型在技術維度、智能運維領域的應用維度、安全合規等多個角度,分享了最新的實踐經驗和前沿探索。
主題專場由躍為資本副總裁宋芃主持。他提到:“當下AI大模型成為多個產業領域關注的技術重點;同時智能運維也在向企業IT管理的核心發展,從IT管理擴容到更多的企業支持領域,新一代的智能運維系統快速向企業級智能運維大腦升級。此次百度智能云與鼎茂科技等多家機構的專場研討,是大模型先鋒技術和智能運維行業實踐領域的一次深度結合,將帶來更多有突破、好借鑒的精彩分享。”
—— 嘉賓分享內容梗概 ——
AI技術,尤其是近期熱點的大語言模型突破,能夠給智能運維領域帶來怎樣的加速發展,備受行業關注和期待。如何結合智能運維相關的領域知識、聚焦行業場景,持續落地相應AI智能化解決方案,已成為業界探索的目標和方向。這其中有哪些挑戰和可能的技術路徑?
圍繞這些挑戰和解題思路,鼎茂科技CTO 何誠,分享了《企業級AIOps落地挑戰及與大模型結合發展趨勢》。演講主要圍繞企業級AIOps端到端智能化解決方案落地的問題和挑戰,提出了技術和解決方案應對思路。同時對AI大模型技術在智能運維領域的落地探索以及未來發展趨勢進行了分享。
何誠總首先基于鼎茂多年的實踐經驗,剖析了企業在有效應用AIOps端到端智能化解決方案的過程中面臨的三個挑戰:
數據的價值密度和標準化程度低,導致實際可用的樣本和數據相對較少。
隨著業務和環境的變化,數據分布和內容動態變化,使得智能化應用方案的動態適配以及應用經驗和領域知識的平滑遷移難度大增。
從IT軟硬件資源到業務各層之間關系復雜并且相互影響,跨層多模態數據的統一整合分析極為困難。
接著何誠總分享了鼎茂在應對這些挑戰中采用的有效技術解決方案以及實踐探索,包括:
設計并實現鼎茂的可觀測指標中心,內置IT運維領域豐富的知識體系,以不同角色管理的IT運維對象為視角和運維核心,結合特定運維數據體系實際狀況,分析并優化數據治理的管理體系和價值體系,實現IT對象之間、對象指標之間、指標數據之間的依存和影響狀態可追查,為智能運維場景降本增效,從而極大提升了數據資產價值。
采用多種前沿的終生學習方案,包括在線學習(Online Learning)、增量學習(Incremental Learning)、遷移學習(Transfer Learning)、強化學習(Reinforcement Learning)等,實現智能運維解決方案的持續學習和接收反饋迭代提升。并將上述關鍵技術作為基礎算子能力,集成到鼎茂的AI服務引擎ARCANA-AI Engine中,縮短業務理解和智能化解決方案實現并落地部署時間。
提出”一橫、一縱、一深入“的跨層根因分析方法體系,通過鼎茂Di-RCA解決方案實現復雜問題,多模態數據跨層根因分析,縮小問題定界范圍,快速提升解決問題效率。
在探討智能運維解決方案與AI大模型結合升級的發展趨勢上,何誠總分析了大語言模型在AIOps領域應用的三個變化階段,包括直接調用外部開放大模型,結合知識圖譜構建本地行業大模型以及未來通過本地行業大模型構建智能運維大腦。通過調研和分析,明確指出當前企業級大模型應用,應該以結合行業知識圖譜,構建本地行業大模型(Foundation Model)為主要目標和方向,以此解決計算資源瓶頸、數據安全、缺乏領域知識產生幻覺等核心問題。
何誠總還介紹了鼎茂在智能運維領域AI大模型方向探索的路徑和進展,主要涵蓋在支持結構化數據多任務分析的時序大模型框架,支持非結構化數據多任務分析以及知識圖譜增強的語言大模型框架,以及最終實現支持多模態復雜問題綜合分析的統一領域大模型框架。
何誠總最后表示,AI技術和應用域將快速發展,鼎茂也將始終在AI驅動的數智平臺的基礎上,構建支持企業IT運維到業務決策端到端的智能化解決方案的智能運維大腦,協助更多企業客戶進行數字化和智能化變革。
百度文心大模型是國內首屈一指的AI大模型,在各個產業的應用正不斷擴大和深化。百度智能云作為國內引領AI技術發展的先鋒企業,其AI大模型和解決方案在各個產業的應用中發揮著重要作用。
百度智能云私有云部高級產品經理王發,分享《AI原生思維下的大模型智能運維實踐和展望》。演講闡述了在前沿技術視角下,對于大模型和AIOps領域的探索和展望。
王發總首先強調了AI原生思維的重要性。隨著生成式AI技術的不斷發展,我們應改變傳統思維方式,以適應這個AI時代。AI原生應用是利用生成、推理、記憶等AI能力,并能自然地與其他系統進行交互。這不僅簡化了操作流程,而且還能提供更高效的工作方式。
百度在智能運維領域也做出了重大貢獻。自2000年以來,百度已經經歷了四個階段:人工運維時代、自動化運維時代、AIOps領域和利用大模型加持AIOps。在這個過程中,百度推出了一系列AIOps產品,如異常檢測、告警收斂和故障傳播圖等。但盡管現有的AIOps產品已經做得很好,專家們仍然發現了其局限性。
王發總提到,為了解決現有問題,專家們開始探索如何利用大模型加持AIOps。由于大模型具有出色的評價能力、復雜任務拆解和執行能力以及出色的生成能力,它們可以更好地解決運維中的復雜問題。例如,大模型可以評價并優化巡檢腳本;將復雜問題分解成更小的任務,以便更有效地執行;以及通過文生文、文生圖和文生視頻等方式,快速解決問題。
王發總最后表示:隨著AI原生應用的發展,我們有理由相信,未來的智能運維將更加便捷、高效和智能化。通過很多領先公司的努力,我們期待看到更多創新和突破,以推動智能運維的發展。
AIOps技術和應用領域正在進入一個新的發展階段,其價值從傳統的運維管理走向全域智能。隨著AI技術的發展,結合當下AI大模型技術的新一代AIOps行業解決方案,正在成為許多行業未來的技術戰略。新一代的AIOps將以智能運維大腦的形態出現,并為企業的發展提供深度服務。
鼎茂科技AIOps解決方案總監 郭順友,分享《智能運維大腦的建設思路》。詳細介紹了如何構建企業級的智能運維大腦,并分享了在多個行業的落地實踐。
他指出:智能運維大腦是以豐富的運維項目最佳實踐經驗為基礎,結合強大的AI算法引擎作為核心能力,融入客戶真實運維場景,沉淀出的一套全域運維能力集合。
鼎茂根據落地實踐經驗,將智能運維大腦的建設路徑歸集為四個階段:
1.多維多模態數據的精細化治理;
2.顛覆傳統運維模式,基于指標中心進行統一運維對象模型建設;
3.基于AI引擎閉環賦能智能化運維場景;
4.實現智能運維大腦上層的故障檢測、故障分析、故障處置、資源優化、知識圖譜等智能化場景建設。
通過智能運維大腦的建設,助力用戶從傳統運維到一體化智能運維發展方向的進階,全面提升企業運維效能和數智化運營能力。實現問題的高準確性發現和風險隱患的提前感知、高效的故障檢測和分析診斷能力、全域閉環AI算法引擎覆蓋,以及精細化的數據價值體現,最終實現運維效率可達到1分鐘發現、5分鐘診斷、10分鐘處置。
基于對行業的深刻洞察,建信金科的DAK運維理念-運維數字能力、算法能力、運維知識體系,也被包括建行在內的眾多大型金融機構采納為智能運維體系建設的關注要素。
建信金科智能云解決方案專家趙崢,分享《基于DAK的智能運維探索與實踐》。
本次分享中,趙崢總介紹了在技術趨勢、信創監管、業務發展三方面需求的驅動下,金融行業運維數字化轉型面臨著環境多、數據多、要求高的巨大挑戰,同時為大家明晰了DAK運維數字能力、算法能力、運維知識體系的三大建設思路,分享了通過“平臺化+場景+知識”模式搭建全棧式智能運維工具產品的經驗。
他指出,在企業智能運維體系架構中,知識、AI和數據三個平臺構成了運維大腦的核心。在知識內容生命周期中的知識收集、知識管理、知識挖掘、知識應用四個領域,自動化與人工智能技術的快速發展,大量抽象而復雜的知識場景,可以不再依賴人力,通過信息技術的融合能夠形成巨大的知識賦能,構建知識生產力的第二載體。
最后趙崢總總結:向研發和業務交付價值、重視數據和知識、建立智能化思維,將作為智能運維實踐的重中之重。
AI大模型從誕生以來就伴隨著隱私性、安全性的討論。從數據隱私、模型訓練過程的商業機密泄露、大模型公平性要求的監管審查,以及對抗攻擊等等層面,都受到關注。
上海人工智能研究院總工程師,王資凱,分享《合規條件下的生成式人工智能落地》。
王資凱總結合目前的實際生產現狀:訓練大的模型需要大量的高質量訓練數據;龐大的算力需求直接提升了驚人的成本;模型效果的保障需要在算法模型的細節不斷地嘗試和優化;推理速度是限制大模型落地應用的重要瓶頸;黑盒體質導致滿足不了垂直領域所要求的安全性和可解釋性……
針對這些現狀,他對AIGC的發展可能提出了一些預見性的想法:構造高質量的領域/產業數據集?圍繞場景推出小模型?推出“模型既服務”模式?針對細分領域/產業的推理設施?針對細分行業的模型測試集?圍繞細分內容做可控生成和檢索增強?
全面就AIGC的缺陷、監管、影響和落地幾個方面,系統性闡述了如何在道德和倫理規范的前提下,滿足合規條件,將生成式AI技術應用于實際場景中的前景和可能性。
智能運維領域幾年前就吸引了資本的關注,隨著技術的不斷進步和應用場景的擴大,智能運維領域也在持續演進和創新,資本也在重新觀測行業的趨勢和未來。
國方創新投資總監,張治,分享《資本視角下智能運維領域的前景》。
他指出數字化轉型進入深水區,云化、云原生化的趨勢不可逆,再疊加上信創的推動,客戶的IT復雜度在急劇提升,這帶動了IT運維逐漸從人工運維往自動化運維方向發展,在此背景下以IT運維管理軟件與分析軟件為代表的IT運維產品在市場規模也在快速提升。
通過與成熟海外市場的發展對比,他還為智能運維行業的賽道者指出:因為中國的現實情況,現階段智能運維企業的核心競爭力在于從服務高IT水平客戶中產品、技術與場景的打磨,這會有一個共建的過程。這兩年我們也看到部分頭部玩家已經完成最佳實踐方案打磨,下一階段,智能運維企業需要尋找高質量發展的路徑,從與客戶共建進入到建議客戶,引領客戶的過程。
會議最后,來自用戶側和同業側的業內人士也就大模型在領域內的應用難點和價值量化向與會專家進行了互動探討。
值得期待的是,智能化從技術到產業落地正在加速。對IT和業務決策的影響價值來看,也已經從代碼生成、效率工具升級發展到多環節、多領域的賦能。同樣值得期待和關注的是,在to B智能運維領域,AIGC的產品化時代。
相關稿件