國內首份OCR白皮書公佈 全面盤點OCR産業發展態勢

2020-09-29 17:51:38 | 來源:中央廣電總臺國際在線 | 責編:馮實

  國際在線消息:9月28日,在中華人民共和國工業和信息化部、北京市人民政府、國際電信聯盟(ITU-T)指導的2020 AIIA人工智能開發者大會上,主辦方正式發佈國內首份智慧文字識別(OCR)能力測評與應用白皮書。該白皮書從OCR發展背景、技術沿革、産業發展現狀、技術標準化、發展趨勢等多個維度,對當前國內OCR産業進行了梳理,全面助推OCR技術産業化加速落地及可持續發展。

  據了解,OCR是光學字符識別(Optical Character Recognition)的縮寫,指利用機器將圖像中手寫體或印刷體的文本轉換為計算機直接處理格式。作為計算機視覺領域的重要分支,OCR的典型應用是通過圖像文字識別實現信息錄入。由於文字和符號包含豐富的語義信息,基於OCR提取文字信息繼而進行分析,能夠幫助機器更好地理解圖像。

國內首份OCR白皮書公佈 全面盤點OCR産業發展態勢_fororder_圖片1

  AIIA 2020人工智能開發者大會現場

  據了解,這份白皮書是由中國信息通信研究院、中國人工智能産業發展聯盟、騰訊雲AI計算機視覺中心、騰訊安全戰略研究部、騰訊優圖實驗室聯合起草。

  新基建帶來新機遇,OCR技術發展三大趨勢

  借助人工智能技術,近年來OCR性能的提升為産業數字化催生出更複雜的OCR應用場景提供了堅實支撐,覆蓋包括手機、電子産品以及雲服務在內的更加多樣化的服務載體,進一步加快OCR的普及,持續滲透社會生産生活的更多領域。

  作為人工智能應用中最接“地氣”、商業推廣較為成熟的領域,OCR産業在“新基建”背景下將迎來新的發展機遇,相關技術將迎來新一輪變革。白皮書指出,OCR技術未來發展的三大方向主要包括一體化端到端的OCR模型,兼具高性能高效率的OCR,從感知到認知的智慧OCR。

  構建一體化的端到端網絡,對文字檢測和識別進行訓練將成為OCR技術發展的重要趨勢之一。端到端的網絡設計不僅能減少重復計算而且能夠提高特徵品質,促進任務性能改善。當前,移動端OCR演算法大多以犧牲一定的演算法精度來換取運行速度,針對移動設備設計兼顧性能和效率的輕量OCR模型將是未來發展的重要方向。

  對智慧OCR而言,OCR技術通常從計算機視覺領域出發,通過與自然語言處理技術、知識圖譜等更廣領域的交叉融合,語義及知識的深度挖掘提升OCR性能將成為未來發展的重要趨勢。此外,在OCR中引入強化學習和元學習等新的學習範式,讓機器自主學習如何識別文字將成為研究熱點。

  2025年全球OCR市場規模將達到133.81億美元

  目前,OCR技術已在金融、保險、醫療、交通、教育等諸多行業有了深入成熟的應用。隨著傳統行業的數字化轉型,OCR應用範圍和場景將進一步擴展,市場規模將進一步增大。有機構預測,2025年全球OCR市場規模將達到133.81億美元。

  早期受限于技術發展水準,OCR廠商通常從特定應用切入,例如車牌識別系統等,形成了一系列專用設備。近年來,越來越多的終端設備及應用均嵌入了OCR技術並逐漸形成了從基礎設施、基礎能力到終端應用的完整産業鏈生態,衍生出了卡證、票據等一系列細分OCR能力,通過組合的方式服務於各個行業。

國內首份OCR白皮書公佈 全面盤點OCR産業發展態勢_fororder_圖片2

  OCR産業生態圖

  如今,OCR技術逐漸“下沉”為一項基本能力,為上層不同業務應用提供底層技術支撐。以騰訊雲為代表的科技機構和雲計算廠商正紛紛加速佈局OCR,在滿足自身內部業務需求的同時不斷對外開放先進的OCR能力。

  多行業場景成熟落地 OCR評測標準首次發佈

  在具體的落地應用層面,目前,卡證識別、票據識別等標準場景文字識別已經相對成熟,手寫文字識別在教育、物流等行業的應用不斷擴大。複雜動態場景下的OCR技術和應用成為近兩年的熱門研究方向,例如,無人駕駛、機器人等場景。

  在此次發佈的白皮書中,騰訊雲公佈了其多項OCR領域的典型落地案例。豐巢快遞櫃通過使用騰訊雲聯合騰訊優圖實驗室提供的身份證OCR技術,身份證字段識別準確率高達99%,提高了用戶寄件、取件效率;寧波銀行通過採用騰訊雲聯合騰訊優圖實驗室打造的智慧票據OCR解決方案,將識別的字段準確率提升至90%以上,更好滿足銀行業務場景的需要;搜狗廣告圖片文本審核借助OCR産品服務幫助客戶自動識別海量的圖片文字內容,從而高效進行廣告圖片違法內容識別,降低客戶業務的違規風險。

  為全面降低OCR相關領域的應用門檻,白皮書首次公佈OCR評測標準和規範。今年4月,中國人工智能産業發展聯盟制定了《OCR服務智慧化分級技術要求和評估方法》。該方法規定了OCR服務在功能、性能、安全等方面的技術要求以及評估方法。7月,OCR服務要求及評估方法在國際電信聯盟(ITU-T)SG16組成功立項,標誌著深度學習背景下的OCR評測方法已逐漸被國際標準組織接受。

  騰訊深度參與推動OCR領域技術革新和標準制定,幫助企業客觀、全面地評價不同OCR服務能力。目前,由中國人工智能産業發展聯盟指導,騰訊雲開發的天鑒OCR服務引擎自動化評測平臺,不僅能夠為OCR技術供給方提供技術測試服務,而且將發佈OCR技術或産品的測試結果,為需求方提供客觀公正的選型依據。(圖/文 陳東)

聲明:國際在線作為信息內容發佈平臺,頁面展示內容的目的在於傳播更多信息,不代表國際在線網站立場;國際在線不提供金融投資服務,所提供的內容不構成投資建議。如您瀏覽國際在線網站或通過國際在線進入第三方網站進行金融投資行為,由此産生的財務損失,國際在線不承擔任何經濟和法律責任。市場有風險,投資需謹慎。

  • GE Ontime_fororder_123_副本