• <u id="j7xcw"><thead id="j7xcw"></thead></u>

    <wbr id="j7xcw"><table id="j7xcw"><button id="j7xcw"></button></table></wbr>
    <u id="j7xcw"></u>

      1. <wbr id="j7xcw"></wbr>
        <input id="j7xcw"></input>

        中國企業報集團主管主辦

        中國企業信息交流平臺

        微博 微信

        10分鐘完成模型開發!合合信息智能文字識別服務平臺亮相1024程序員節

        2022-10-25 16:16 來源:中國企業網 次閱讀
         
        10分鐘完成模型開發!合合信息智能文字識別服務平臺亮相1024程序員節

          1024是2的十次方,也是二進制計數的基本計量單位之一,每年的10月24日因此成為了中國程序員的盛會。近期,CSDN(中國開發者網絡)第三屆“1024程序員節”(簡稱“大會”)順利舉辦,來自Linaro等開源組織的領導者和微軟、騰訊、華為、合合信息等企業的技術專家接連登陸主論壇重磅活動《全體大會:2022技術英雄會》,與觀眾云端話科技。

          生產生活中,被整齊記錄在二維表結構里的“結構化”數據只是少數。據國際數據公司(IDC)預測,全球非結構化數據將在2025年占據數據總量的80%至90%。智能文檔處理技術能夠對各種文件、圖片中的非結構化數據進行內容識別和抽取,對推進企業數字化轉型意義重大。

          怎樣從數據中發現更多的價值,找到更實用的開發工具,是程序員群體重點關注的話題。合合信息智能創新事業部總經理唐琪受邀分享智能文檔處理的技術優化方法及開源渠道介紹,獲得了眾多開發者的認可。


        “智能文檔處理”在開發者群體中熱度攀升(圖源:CSDN官網)


          文檔處理之困:識別文字還不夠,版式理解是基礎

          智能文檔處理技術本質上是把文檔里的信息從載體中剝離出來,將其對接到其他系統,以數據的流轉實現流程自動化的技術。典型場景如單據的自動審核,就是先對單據進行圖像檢測,從中提取所需信息并錄入到系統里,經過結構化處理,“翻譯”成機器能理解的內容后再進行自動判別,達到節省人工成本、提高工作效率的目的。

          唐琪在分享中指出,采集設備的不確定性和文檔版式的多樣性,導致文檔在處理過程中經常遇到“看不清、看不準、認不全、難理解”四大類問題。合合信息在彎曲矯正、去摩爾紋(屏幕紋)等圖像質量增強領域進行了深入研究,為信息的提取、存儲、檢索、管理等后續工作創造良好的環境。

        合合信息去摩爾紋(屏幕紋)技術處理效果

        合合信息彎曲矯正技術處理效果


          “在各種場景的實踐中我們發現,單純的文字識別不足以支撐更細致的文檔處理需求,版面元素分析才是基礎。”唐琪提到,文檔處理過程中要重點關注對印章、logo、水印、頁眉、二維碼、公式等元素的檢測,根據檢測結果采取對應的版式分析方式,可得到更精準的識別結果。

        合合信息對智能文檔處理的關鍵要素的思考


          如何讓已經接受過市場檢驗的技術產品惠及更多的開發者?技術服務的共享是促進科技創新的重要渠道。合合信息將在制造業、金融業、物流業等30個行業應用里打磨出的核心技術產品“智能文字識別服務平臺”(簡稱“平臺”)以SaaS的形式免費開放給個人開發者,助力使用者們低成本、高效率獲取貼合個性化需求的定制模型。

          合合信息開源平臺:10分鐘完成模型構建,10張樣本即可做訓練

          受遠程辦公趨勢發展和環保“無紙化”倡導的影響,社會對智能文檔處理技術的需求不斷增加。合合信息智能文檔處理技術可支持全球超過50種主流語言的印刷體、手寫體的高精度識別,以及增值稅發票、出租車票等20多種票據的識別,這些通用識別、信息抽取能力被搭載于合合信息智能文字識別服務平臺SaaS版中,并于大會上開放試用。

          該平臺提供了海量訓練數據快速生成、自動化模型生成、完整的模型訓練和測試等功能,具備低使用門檻、所需樣本少、開發周期短的優勢,使用者通過云端的簡單操作,即可定制提取標準和非標準版式文檔的結構化信息,僅需10張樣本就可以開始訓練。

        合合信息智能文字識別服務平臺工作流程


          現階段,企業對于OCR的需求趨向于定制化和多樣化,卻為高昂的開發成本所限,平臺可為中小企業的數字化轉型提供助力。比起傳統的技術方案,企業更希望被賦予人工智能產品開發能力,去搭建基于自有業務場景的識別模型。在平臺上,企業可通過簡單的配置快速產出結構化識別模型,無需服務器資源與運維投入便可獲取技術支持,降低開發、部署與運維環節中的門檻。

          據悉,實測中應用人員最短可在10分鐘內完成抽取模型開發全流程,可視化界面設計讓沒有算法基礎的業務人員也可順利使用。

        點贊()
        上一條:銷量回彈“多級跳”,北京現代覓轉機譜新篇2022-10-25
        下一條:國產數據庫企業GBASE南大通用完成新一輪融資2022-10-25

        相關稿件

        亮相CCIG2022,合合信息以智能文字識別技術挑戰傳統OCR應用難題 2022-08-24
        挑戰“大師級”閱讀理解,合合信息智能文字識別技術亮相2022世界人工智能大會 2022-09-01
        合合信息加入元腦生態 攜手浪潮信息推動金融AI應用創新 2022-08-05
        表格識別總是不夠精準?合合信息旗下掃描全能王這樣“解題” 2022-09-21
        達碩董事長鐘浩:打造“AE+”創新公共服務平臺 2022-01-12
        國務院國有資產管理委員會 中國企業聯合會 中國企業報 中國社會經濟網 中國國際電子商務網 新浪財經 鳳凰財經 中國報告基地 企業社會責任中國網 杭州網 中國產經新聞網 環球企業家 華北新聞網 和諧中國網 天機網 中貿網 湖南經濟新聞網 翼牛網 東莞二手房 中國經濟網 中國企業網黃金展位頻道 硅谷網 東方經濟網 華訊財經 網站目錄 全景網 中南網 美通社 大佳網 火爆網 跨考研招網 當代金融家雜志 借貸撮合網 大公財經 誠搜網 中國鋼鐵現貨網 證券之星 融易在線 2014世界杯 中華魂網 納稅人俱樂部 慧業網 商界網 品牌家 中國國資報道 金融界 中國農業新聞網 中國招商聯盟 和訊股票 經濟網 中國數據分析行業網 中國報道網 九州新聞網 投資界 北京科技創新企業誠信聯盟網 中國白銀網 炣燃科技 中企媒資網 中國石油化工集團 中國保利集團公司 東風汽車公司 中國化工集團公司 中國電信集團公司 華為技術有限公司 廈門銀鷺食品有限公司 中國恒天集團有限公司 濱州東方地毯集團有限公司 大唐電信科技股份有限公司 中國誠通控股集團有限公司 喜來健醫療器械有限公司 中國能源建設股份有限公司 內蒙古伊利實業集團股份有限公司 中國移動通信集團公司 中國化工集團公司 貴州茅臺酒股份有限公司
        亚洲黄色无码免费网站_亚洲国产精品综合久久久_国产成人观看免费全部完_亚洲日韩精品中文字幕第21页
      1. <u id="j7xcw"><thead id="j7xcw"></thead></u>

        <wbr id="j7xcw"><table id="j7xcw"><button id="j7xcw"></button></table></wbr>
        <u id="j7xcw"></u>

          1. <wbr id="j7xcw"></wbr>
            <input id="j7xcw"></input>
            夜夜久久国產精品亚洲 | 亚洲精品国产五月综合网 | 亚洲综合色在线观看一区 | 亚洲喷奶水中文字幕视频 | 精品国产在天天在线观看 | 免费一区二区中文字幕 |