9月11日,2024 IDC中國年度盛典暨頒獎典禮在上海盛大啟幕。本次峰會以「AI時刻,歡迎來到下一個大事件」為主題,匯聚行業專家、意見領袖,深度探討生成式AI、中國企業出海、創新業務模式、科技可持續發展、數據安全、數字工業、數字金融等熱門話題。天翼云科技有限公司市場營銷部總經理王彥丹出席峰會主論壇并發表演講,分享了云智一體時代背景下,天翼云如何以堅實的國云智算底座驅動產業數智化轉型加速,開創數字經濟高質量發展新未來。
以大模型為代表的生成式AI飛速發展,人工智能產業化、商業化進程不斷提速,這不僅對基礎設施提出了全新挑戰,更促使云廠商加速布局智算基礎設施建設,不斷提升算力與存力,以滿足海量數據處理和模型訓練等需求。云智一體,已經成為云計算產業發展的必然趨勢。作為云服務國家隊,天翼云構建領先的“息壤”一體化智算服務體系,以豐富的智算資源供給、強大的智算服務能力和開放的模型應用生態,為千行百業轉型升級注智賦能。
豐富的智算資源供給,高效實現算力供需匹配
天翼云自建豐富、形態多樣的智能算力資源。圍繞AI產業集聚地區,天翼云規劃建設北京、上海、廣東、浙江、安徽人工智能公共算力中心,并先后建成上海、北京萬卡池,這也是全國最早建成并真正投產運行的兩個國產化、全液冷、單集群萬卡公共智算中心;在內蒙古、貴州、寧夏等清潔能源集聚地建設智算中心,為用戶提供綠色算力。此外,天翼云還在280多個地市的一城一池節點和1000多個邊緣節點按需下沉AI云電腦算力和推理算力;提供國內外主流的GPU、NPU算力方案,面向不同場景為用戶提供公有云、私有云、邊緣云多種形態服務。
在自建算力的同時,天翼云發揮“息壤”的強大算網調度能力,大規模匯聚社會各方算力,促進算力互聯互通、高效利用和供需匹配。基于在算力統一接入、算數網整體調度、算力便捷使用三個方面的顯著技術突破,“息壤”可服務于三大算力場景:一是天翼云自營公共算力服務平臺,目前已接入39家算力伙伴,實現三方各類算力可調度,顯著擴大算力規模和品類,滿足公有云客戶的多元算力需求;二是幫助客戶構建行業算力互聯網,例如高校算力聯盟等,實現行業內算力利用率的有效提升;三是幫助地方政府構建城市算力互聯網,實現區域內多方算力的一體化統籌調度,助力地方經濟和產業發展。
強大的智算服務能力,降低大模型應用創新開發門檻
“息壤”具備高效的異構計算能力,可為萬億參數基礎大模型提供高性能計算服務。在大算力需求方面,天翼云建設PB級并行文件存儲,并組建低延時超大規模RDMA網絡,通過計算、內存和通訊的多維優化,提升綜合算效。在性能方面,對AI框架進行升級、存儲加速,實現checkpoint文件快速保存、加載,將國產算力的綜合算效提升到了行業可比水平。在穩定性方面,通過多項指標的監控分析,實現故障訓前發現,有效控制大模型訓練中斷恢復時長,實現訓練任務長期穩定、高可用運行。基于國產萬卡智算集群和自研智算平臺,天翼云已具備支撐萬億參數基礎大模型訓練的能力。
“息壤”一站式訓推服務能力,可降低大模型應用創新開發門檻。天翼云將大模型精調場景簡化操作至選數據、選硬件和選模型三個步驟,顯著提升部署效率;通過自研AI框架、3D并行加速、自研訓練加速庫、容器調度優化等核心技術,大幅提升訓練效率;通過模型量化壓縮、自研推理加速算子庫、自研AI推理加速框架等核心技術,提高推理效率;通過全鏈路故障檢測、定位、告警,全鏈路日志監控與可視化、斷點續訓快速恢復等核心技術,實現訓推過程全鏈路監控。
開放的模型應用生態,加快推動AI應用落地
開放合作共享的生態是產業進一步繁榮發展的基礎。天翼云全新升級AI電腦,開放AI云電腦平臺,打造AI應用中心,具備AI助手、AI空間、AI客服、AI低代碼等AI創新應用,使AI應用能夠更廣泛地接入和使用。
此外,天翼云魔樂(Modelers)開發者社區,攜手伙伴為開發者提供一個交流、學習和創新的平臺。魔樂社區集成了開發工具鏈、模型庫、數據集和體驗空間等核心組件,覆蓋自然語言處理、視覺、音頻等領域,提供原生模型、易用開發工具、豐富的生態資源,致力于聚合優質中文AI資源,使能AI應用創新,加速伙伴商業閉環,通過提供極致易用的工具鏈,端到端支持AI應用開發的全流程。
伴隨新一輪人工智能浪潮涌動以及AI規模化落地應用,智算基礎設施的重要性愈發凸顯。作為云計算原創技術策源地、數字中國建設主力軍,天翼云將不斷夯實國云智算底座,持續突破技術創新的邊界,強化服務能力,以普惠智能算力賦能千行百業蝶變,攜手各界伙伴共繪數智化新藍圖。
相關稿件