核心技術是國之重器,加速推進核心領域關鍵技術突破,完成核心網絡中的軟硬件國產替代是國家長期戰略。
“十四五”規劃更是明確,聚力攻堅基礎軟件,加速分布式數據庫/混合事務分析處理數據庫等產品研發推廣。強化基礎組件供給,大力發展云計算/大數據/人工智能/區塊鏈等平臺軟件開發框架。
自主可控和國產化替代刻不容緩。過去微軟“黑屏悶”事件、美國“棱鏡門”事件、中興制裁事件已經說明了沒有核心技術就會受制于人,今年俄烏事件發生后,200多家科技公司宣布暫停在俄羅斯的所有業務,包括芯片、軟件、云服務等斷供,哪里還有“科技無國界”?要擺脫被科技制裁的風險唯一出路就是自主研發、自主可控。
星環科技自2013年成立以來,就以自主研發為己任,不僅自主研發了大數據與云基礎平臺、分布式關系型數據庫、數據開發與智能分析工具的軟件產品全系列產品,為企業數字化轉型提供了真正的國產數字底座,以提供數據集成、存儲、治理、建模、挖掘、分析和流通能力,可以推動數據規范化、資產化、業務化,推進業務數據化、智能化,而且產品能力更強更全,領先于國外,在基于容器的數據云技術、分布式技術、數據庫技術、多模型數據的統一處理技術、SQL編譯技術、大數據開發與智能分析技術等6大類技術上擁有31項具備先進性的核心技術,擁有了一大批發明專利。參加并且通過了工信部自主代碼掃描測試,完全符合信創驗收標準,多個產品進入了國家軟硬件技術圖譜。
在自主研發創新的同時,星環科技也在積極參與國家信創工作。星環科技作為信創工委會WG24大數據工作組的小組組長及副組長單位,牽頭制定信創大數據行業標準及規范,并深度參與產品圖譜編制、產業白皮書、案例集編撰等工作。
星環科技全系列產品替代國外進口產品 星環科技擁有成熟的基礎軟件替代解決方案,完全滿足信創驗收要求,取得了眾多的成果。
大數據基礎平臺TDH可以完美的替代CDH/HDP和CDP,提升功能、性能、穩定性、易用性、擴展性、可靠性、安全、國產生態支持等能力,提供多種模型支持能力,性能的提升可以達到5到100倍,原廠專業服務能力更強。
分布式交易型數據庫KunDB可以在交易型OLTP的業務場景、高并發在線數據服務場景,替代Oracle/DB2,并且提升存儲計算能力、高可用能力、跨分區事務能力。
分布式分析型數據庫ArgoDB可以在批處理和OLAP、Ad hoc分析等場景,替代Oracle/DB2/TD/SAP HANA,提供海量數據分析能力,提升混合負載、實時數據分析等能力,軟硬件綜合性價比得到10到100倍的提升。
分布式圖數據庫StellarDB可以在圖查詢、圖分析的場景替代Neo4j,提升圖數據存儲檢索能力,支持萬億頂點以上的圖存儲與毫秒級檢索性能,提供近30種分布式圖算法和10層以上深度鏈路分析能力。
搜索引擎Scope可以在全文檢索、日志分析等場景替代ElasticSearch,提升穩定性、性能、集群擴展性等能力。
智能分析工具Sophon可以在可視化建模分析場景替代SAS/SPSS,獲得200+算子支撐,提升功能和性能(將本增效)。
國產化替代的10大關鍵評價指標 星環科技的一體化替代方案擁有獨一無二的優勢
在功能上,星環科技基礎軟件產品多模架構,支持關系表、文本、時空地理、圖數據、文檔、時序等在內的10種數據模型;離線數據批處理、高并發的在線數據服務、數據集市、數據倉庫、數據湖、圖存儲分析、空間數據存儲、實時數據處理、數據中臺、數據治理等各類大數據業務場景一站解決。
在性能上,星環科技基礎軟件產品自研高性能分布式計算和存儲引擎,整體性能是CDP 5~25倍。整體性價比是DB2 20倍,是TD 100倍。
在成本上,星環科技產品高度兼容CDH/HDP、TD、Oracle、DB2,兼容TD、Oracle、DB2的SQL和方言,提供成熟的遷移工具,有大量低成本成功遷移案例。
在安全上,星環科技基礎軟件產品提供的容器隔離、災備、訪問控制、聯邦學習、隱私保護、可信計算等技術保障網絡層、加固層、治理層、流通層全方位數據安全。
在架構上,星環科技基礎軟件產品提供統一SQL引擎、統一計算引擎、統一分布式存儲管理、統一資源調度,統一內聯的架構高效搞定湖倉集一體、HTAP等復雜場景,而不是拼湊組件成散裝架構。
在開發上,星環科技基礎軟件產品提供統一SQL引擎,無需每個場景一套接口;完整支持SQL2003標準,支持PLSQL存儲過程,兼容Oracle、DB2、TD等方言。
在運維上,星環科技基礎軟件產品提供開箱即用的可視化運維監控、安全管控工具,容器技術帶來極致的安裝、升級、補丁體驗。
在售后上,星環科技原廠有超過1100人的研發與支持團隊,超過3萬名星環科技認證的大數據工程師,專業性更強。
在國產化上,星環科技的軟件產品自主研發,通過了工信部代碼自主研發率掃描測試,滿足信創驗收要求。
在國產生態上,星環基礎軟件產品已完成與主流信創生態廠商的適配互認工作,適配長城飛騰、華為泰山、浪潮等服務器,鯤鵬、飛騰CPU,麒麟、統信等操作系統,并有官方認證,支持基于ARM與X86服務器服務器混合部署并有落地案例。
星環科技有在大數據平臺、數據庫產品、數據分析平臺等領域有大量成功替代國外進口產品的案例。目前,星環科技的大數據基礎軟件系列產品已在十幾個行業1000+用戶應用落地。
大數據平臺國產化替代平滑遷移方案 (CDH/HDP/CDP->TDH)
Cloudera(Cloudera 和Hortonworks 合并后)所有產品不再提供社區版,用戶無法獲取新的功能。2021年1月31日開始,所有Cloudera軟件都需要有效的訂閱,且訂閱費昂貴(50個節點,一年訂閱費50萬美元)。此外,CDH 6和HDP 3將是CDH和HDP的最后企業版本,企業版用戶無法繼續獲取新的功能和性能提升。至2022年3月份,CDH/HDP全部停止服務(EoS),用戶沒辦法獲取售后支持。
Transwarp Data Hub(TDH) 是星環科技自主研發的企業級一站式多模型大數據基礎平臺,基于其領先的多模型統一技術架構,8種異構存儲引擎可以支持包括關系表、文本、時空地理、圖數據、文檔、時序等在內的10種數據模型。TDH能夠存儲 PB 級別的海量數據,同時能夠提供高性能的查詢搜索、實時分析、統計分析、預測性分析等數據分析功能,被廣泛應用在離線數據批處理、高并發的在線數據服務、數據集市、數據倉庫、數據湖、圖存儲分析、空間數據存儲、實時數據處理等各類大數據業務場景,幫助企業,更全面、更便捷、更智能、更安全地運用數據,加速企業數字化轉型。
TDH基礎存儲與計算組件兼容CDH/HDP,可以實現平滑遷移,大大降低企業遷移成本低。
同時,星環科技提供專業的遷移工具Transwarp? Backup (TBAK),幫助用戶通過簡單的三步即可實現數據與業務的一鍵遷移,高效便捷。整個遷移過程操作簡單,配置靈活,通過3步即可完成所有的遷移工作,同時用戶可以對遷移過程進行全流程實時監控,保障整個遷移過程順利進行。
第一步,基于TBAK提供可視化的界面進行CDH和TDH的集群配置。
第二步,創建CDH遷移方案。TDH提供服務級和表級的遷移策略,以及對源集群,災備集群,調度策略等進行配置。在調度策略中用戶可以根據實際情況進行配置,例如可以設置在業務空窗期的每天凌晨2點進行數據遷移。同時,用戶可以設置相應的告警策略,當遷移發生問題時可以第一時間收到告警信息并對問題進行排查和恢復。
第三步,執行遷移任務和結果檢查。當集群配置完成后,所有的遷移方案將在遷移方案界面進行管理和操作。用戶可以選擇相應的遷移方案進行操作,例如立即執行和設置執行策略。若點擊執行遷移任務,系統會進入到自動遷移狀態,同時可以監測遷移任務執行的整體狀態信息,并且可以對每一步的執行情況進行實時監測。當遷移發生故障時,系統會發出執行故障的告警,方便用戶對故障發生的階段進行排查和故障恢復。
此外,星環科技積累了大量的遷移成功案例,經驗豐富,可以保障整個遷移過程安全可靠。
相比于遷移到CDP或者國內封裝的Hadoop商業版,用戶遷移到星環科技TDH后,TDH多模型統一架構提供統一SQL引擎、統一計算引擎、統一分布式存儲管理、統一資源調度,統一內聯架構高效搞定湖倉集一體、HTAP等復雜場景,無需拼湊組件散裝架構。同時在技術領先性、性能、易用性、穩定性、安全性等方面得到全面的提升。此外,TDH由星環科技自主研發,通過工信部自主代碼掃描測試,完全自主可控,并且與已完成與主流信創生態廠商的適配互認工作,滿足信創驗收要求,幫助各行業用戶提升大數據系統的國產化水平。
數據庫國化產替代平滑遷移方案 (Oracle/DB2/MySQL/Teradata/SAP HANA->TDH/ArgoDB/KunDB)
傳統數據庫如Oracle,DB2等存在成本高、擴容難、性能受限、運維難等問題給很多企業用戶造成了困擾。
前段時間俄烏事件中,Oracle宣布暫停在俄業務,其他眾多科技公司也相繼宣布斷供俄羅斯。這些事件再次給國人敲響了警鐘,建設國產數據平臺迫在眉睫。
星環科技大數據基礎平臺和數據庫產品支持完整的SQL標準語法,兼容Oracle、IBM DB2、Teradata方言,兼容Oracle和DB2等的存儲過程,可以實現平臺間的平滑遷移。同時能夠提供統一的架構,一站式幫忙用戶解決所有業務場景,從降低成本、提升效能、平臺創新、應用創新等多個方面為用戶帶來收益。
星環科技建立了一整套從老牌數據庫到星環產品的平滑遷移方法論,大致可以分為分析與設計、遷移實施和上線保障三個階段。
第一階段,分析和設計。結合用戶的現場情況和需求進行分析,并對數據流轉和整體架構設計。如將Oracle遷移到星環科技TDH,TDH支持多種數據源接入,并對于不同的接入方式提供專業的組件工具。例如星環科技Transporter支持定時批量抽取,實時流計算引擎Slipstream支持實時數據接入,可用于實時數倉等場景。
第二階段,遷移實施。遷移分為數據遷移和業務兩大部分。在數據遷移方面,星環科技可以實現三種遷移方式,1:1平移、按照大數據平臺特性重新設計和遷移種選重點進行優化,用戶可以根據實際情況和自身需求進行選擇。在業務遷移方面,星環科技平臺能夠提供完整的配套產品和組件,同時又能完整支持SQL標準,兼容像Oracle存儲過程等特征,在保障業務的同時實現低成本、平滑遷移。
第三階段,上線保障。星環科技可以提供雙軌試運行機制,定期進行兩邊的數據核對,觀察平臺的運行情況,進行后期的細致調優等相關工作,保障遷移后能夠順利上線投產。
以金融行業為例,星環科技可替換的場景包含:風險控制、數據倉庫、報表平臺、ODS、數據集市、投資交易分析回放、客戶分析和客戶畫像等等。例如風控的指標管理、實時預警、合規管理、數據維度一直是金融行業中券商最依賴于數據處理的部分,可結合市場風險、信用風險、反洗錢、投資人適當性管理等應用場景,星環科技能夠在機器學習算法和風險模型上提供解決方案。其他例如投資交易、行情預測、業務運營等場景,星環科技都能夠提供全面的支撐能力。
星環科技提供完整的數據庫平滑遷移方案能夠全方位保障數據與業務遷移,大大降低企業遷移成本和遷移風險。同時相對于傳統數據庫,星環科技大數據平臺以及數據庫產品能夠在架構、性能、可擴展性、以及對云和AI的支持等能力上獲得極大的提升,幫助企業快速實現國產化替代,構建自主可控的高性能數據平臺。
圖數據庫國化產替代平滑遷移方案 (Neo4j->星環分布式圖數據庫StellarDB)
Neo4j是一款知名的開源圖數據庫,但用戶在使用過程中發現Neo4j存在一定的局限性,例如Neo4j不支持多數據庫實例應用,每個應用都需要單獨的服務器部署,不便于管理。當數據量較大時,Neo4j計算能力存在瓶頸,無法滿足較高要求的計算需求。此外,Neo4j不滿足高可用的要求,且缺乏統一的資源管理和權限管理。
Transwarp StellarDB是星環科技自主研發的分布式圖數據庫,兼容openCypher查詢語言,提供海量圖數據的存儲和分析能力,支持原生圖存儲結構,支持萬億邊PB級數據存儲。同時,StellarDB具備毫秒級點邊查詢能力,10+層的深度鏈路分析能力,提供近30種的圖分析算法,具備數據2D和3D展示能力。
在遷移方面,StellarDB支持MySQL、Greenplum等關系型數據庫、HDFS、Hive等大數據平臺數據源接入,在4.0版本中StellarDB新增通過Kafka、Flink、Spark Streaming等方式接入流式數據源,可以覆蓋所有場景數據源。同時提供專業的數據遷移工具實現數據的快速高效遷移。此外,StellarDB與Neo4j的Cypher語法高度兼容,低成本、安全地實現原有業務的平滑遷移和上線。
相比Neo4j,StellarDB在存儲能力、高性能、圖算法、國產化兼容、運維管理能力、知識圖譜能力、接口工具等方面表現優異。
StellarDB支持海量圖數據的存儲與檢索,可以支持至少萬億頂點以上的圖存儲,在某地電信關系圖譜場景實現了9700億邊規模的存儲和穩定運行,真正意義上將萬億級圖數據庫能力應用落地。
替換Neo4j以后,用戶可獲得更高的性能。批量數據導入性能提高2倍以上,在深度鏈路查詢能力方面,StellarDB能夠支持12度以上關聯查詢,秒級返回,經測試驗證,6跳查詢相對于Neo4j提高了50倍以上。在圖算法性能方面,StellarDB4.0具有很大性能優勢,PageRank算法和強連通子圖算法性能提升3-6倍,LPA算法性能提升8倍以上,在十億級邊Twitter-2010數據集下,StellarDB秒級響應,Neo4j在30min內無響應結果。
相比于Neo4j,StellatDB支持分布式集群部署,實現一站式集群管理,同時提供企業級便捷的管理工具,實現高效的統一資源管理和權限管理。
StellarDB提供統一調度和API接口管理能力,相比之前依賴第三方調度工具,更方便高效。
在可視化能力方面,StellarDB支持2D和3D的圖可視化展示,利用可視化技術幫助用戶快速獲取數據基于關聯性的深度洞察,并且提供可視化的數據導入、集群監控、圖查詢任務和圖計算任務監控等功能。
在國產化方面,StellarDB是星環科技自研圖數據庫,且兼容國產化軟硬件,幫助企業提高國產化水平,滿足信創要求。
此外,星環科技是國內具備圖數據庫、知識圖譜平臺、圖挖掘應用開發能力的企業,其全棧自研的圖技術能力可以助力企業快速挖掘圖數據價值,推動業務高效高質量發展。
搜索產品國產化替代平滑遷移方案 (ElasticSearch->星環分布式搜索引擎Scope)
ES在2021年宣布變更 Elasticsearch 和 Kibana 的其中一項開源許可協議Apache License 2.0,變更為雙授權許可,即 Server Side Public License (SSPL) + Elastic License,在一定程度上對許可協議加以限制。
此外,隨著數據量的劇增以及性能要求的不斷提高,ES在集群擴展性、可靠性、數據讀寫性能、以及數據恢復速度等方面越來越難以滿足用戶的需求。例如,ES單節點實例支持的數據量有限,當集群超過100節點,會出現連續失聯等穩定性問題。當節點磁盤損壞時,需要采取全量數據拷貝的方式恢復數據,工作量大,TB級別可達小時級別,數據恢復速度比較慢,無法滿足客戶快速實現數據恢復的需求。
Transwarp Scope是星環科技自主研發的分布式搜索引擎,提供PB級海量數據的交互式多維檢索分析服務,能夠實現高可靠、高擴展性的全文搜索與靈活查詢。能夠兼容常用的ES讀寫接口,比ES更強的數據一致性和可靠性,同時比ES有更強的穩定性,實現分鐘級快速恢復單點故障。在性能方面,Scope可以毫秒級快速響應用戶的檢索需求,入庫與查詢能力有發幅度的提升。此外,Scope是星環科技自主研發的搜索引擎,可以滿足信創驗收要求。
基于星環平滑遷移方案論,從ES到Scope的遷移過程可以分為三個階段,調研評估、方案測試和上線保障。同時星環科技支持多種數據遷移方式保障數據順利遷移,Scope支持ES接口可以實現原先ES業務的平滑遷移。
在數據遷移方面,星環科技支持三種數據遷移方案,使用部分ES遷移工具遷移數據、通過HDFS將數據遷移到Scope和使用Logstash進行數據遷移,用戶可以根據需求靈活選擇。
在業務遷移方面,Scope支持ES接口,可以實現ES的業務平滑遷移,同時針對部分用戶習慣使用SQL的方式,Scope支持SQL 2003和全文檢索SQL擴展,滿足傳統數據庫遷移到ES的需求。
相較于ES,用戶遷移到Scope之后,可以實現海量存儲能力確保百節點以上規模集群穩定運行,強一致性寫入能力確保讀寫數據不丟。在高可用能力方面也有非常大的提升,可以確保錯誤分鐘級重啟恢復。此外,用戶還可獲得多進程架構,內存精細化控制、負載均衡、數據分區等能力。
星環科技Scope在政府、金融等行業有很多ES國產替代落地經驗,幫助用戶在海量數據檢索和分析、可擴展性、可靠性、數據恢復等能力上獲得極大的提升,幫助企業完成搜索產品的國產化替代。
分析工具國產化平滑遷移方案 (SAS/SPSS->星環智能分析工具Sophon)
大數據分析工具可以幫助用戶更靈活、更高效地進行數據分析,挖掘數據價值。隨著數據量的劇增,以及深度學習算法的不斷迭代以及創新,市面上如SAS/SPSS等分析工具越來越難以滿足企業用戶更快速、更高效、更靈活以及更低成本的需求。
例如,用戶在使用SAS過程中可能會遇到如下幾個問題:首先,其相對比較封閉,用戶無法針對單個功能授予許可證,使用成本高昂;其次,SAS自建機器學習算法有限,深度學習算法依賴外部如Python嵌入支持,用戶無法靈活地獲取新的算法;再次,SAS對分布式讀寫和計算存在局限性,對海量數據處理及大規模機器學習難以有效支撐,對實時計算更是無能為力。
此外,SAS是過程性語言,代碼量偏多,加上閉源特性,SAS社區不及開源語言活躍。隨著R、Python的流行,SAS人才日漸稀缺,導致企業難以組織高質量團隊。
星環科技Sophon Base是具備統計、機器學習、深度學習等完備算法和豐富算子的企業級分布式機器學習平臺,支持從數據接入、數據處理,到模型訓練、服務部署、線上監控的一站式可視化流程。
在多年的行業積累和項目實踐上,星環科技建立了一套模型遷移方法論,整個過程被定義為8個階段——業務理解、數據理解、元模型理解、數據準備、模型遷移、評估報告、應用和檢測。星環科技SAS平滑遷移過程強調針對實際業務問題,解決客戶的業務痛點,產生實際價值。
通過對用戶業務、數據、元模型的理解后,進行相應的數據準備,包括框架設計、數據處理、方案設計等。當數據準備好后就會進行模型遷移,這一階段主要是進行代碼邏輯架構梳理設計、模型驗證等。模型遷移完成后會對遷移效果進行評估,確認遷移前后的準確性、一致性、以及優化效果驗證。最后是部署上線來支持業務,對業務進行持續跟蹤,不斷優化模型,并對效果進行評估。通過一整套完整的遷移流程,保障SAS平滑、安全的遷移到星環Sophon。
星環科技Sophon可以提供完整的SAS模型遷移能力。相較于SAS,遷移到Sophon后可以支持多源異構數據的接入、豐富的數據處理、多個框架的模型訓練及發布、模型部署和維護等全過程,多源數據和建模流程靈活組合確保綜合性場景高效支撐。用戶可以獲得Sophon自建的200多個高性能分布式AI算子以及對自定義算子的支持,完全覆蓋SAS原有的建模能力。同時,Sophon還能帶來模型可解釋性、聯邦學習等額外的支持,更好地支撐模型的業務應用。此外,在模型的統一管理、發布及監控方面,Sophon也為企業客戶提供了簡潔、易用、穩定的解決方案,幫助用戶更好地獲取數據價值。