檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務網站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
950808 轉 1
預約咨詢
工單提交
我有建議
未實名認證
已實名認證
自動文字識別OCR提供在線文字識別服務,將圖片、掃描件或PDF、OFD文檔中的文字識別成可編輯的文本。OCR文字識別支持證件識別、票據識別、定制模板識別、通用表格文字識別等。華為云OCR產品優(yōu)勢? 文字識別精度高:采用先進的自研深度學習算法,結合億萬級海量標注數據樣本訓練,針對各種業(yè)務場景優(yōu)化?自動文字識別穩(wěn)定服務:華為云OCR成功應用于各類場景,基于華為等企業(yè)客戶的長期實踐,經受過復雜場景考驗? 自動文字識別支持復雜場景:證件支持復雜背景、扭曲、傾斜等場景下的文字識別;表單支持蓋章、錯行等場景? 自動文字識別簡單易用:提供符合RESTful規(guī)范的API訪問接口,兼容性強,使用方便
自動文字識別OCR提供在線文字識別服務,將圖片、掃描件或PDF、OFD文檔中的文字識別成可編輯的文本。OCR文字識別支持證件識別、票據識別、定制模板識別、通用表格文字識別等。
華為云OCR產品優(yōu)勢
? 文字識別精度高:采用先進的自研深度學習算法,結合億萬級海量標注數據樣本訓練,針對各種業(yè)務場景優(yōu)化
?自動文字識別穩(wěn)定服務:華為云OCR成功應用于各類場景,基于華為等企業(yè)客戶的長期實踐,經受過復雜場景考驗
? 自動文字識別支持復雜場景:證件支持復雜背景、扭曲、傾斜等場景下的文字識別;表單支持蓋章、錯行等場景
? 自動文字識別簡單易用:提供符合RESTful規(guī)范的API訪問接口,兼容性強,使用方便
支持表格、文檔、網絡圖片、健康碼、核酸檢測記錄等任意格式圖片上文字信息的自動化識別,自適應分析各種版面和表格,快速實現各種文檔電子化
支持身份證、駕駛證、行駛證、護照等證件圖片上有效信息的自動識別和關鍵字段結構化提取
支持增值稅發(fā)票、機動車銷售發(fā)票、火車票、出租車發(fā)票等各種發(fā)票以及發(fā)票驗真,支持圖片及PDF、OFD文檔上有效信息的自動識別和結構化提取。
支持物流面單、醫(yī)療化驗單據等多種行業(yè)特定類型圖片的結構化信息提取和識別,助力行業(yè)自動化效率提升
? OCR服務通過RestFul API調用,計費以Https請求返回的狀態(tài)碼為準,當返回狀態(tài)碼為2xx(如200/201)時,表示調用成功并進行扣費。
? OCR服務通過套餐包計費方式,來降低調用成本,從絕大部分客戶的使用來看,客戶上傳錯誤樣本導致計費的占比非常非常小,幾乎可忽略不計。
? 在客戶使用OCR能力,進行二次開發(fā)時,可以盡可能的通過頁面可視化提醒等方式,引導使用者盡量拍攝符合人眼易于識別的圖片,以保障數據質量提升同時識別準確率。
? 由于圖片的輸入非常開放,因此為了避免惡意攻擊,在公有云上對有效識別的信息(即便部分不準)也會計費,類似于在通話質量不佳時通常也是要求計費。
? OCR服務只支持調用一次接口識別一張圖片,批量識別需要進行二次開發(fā),編碼循環(huán)調用API,實現批量調用服務識別圖片。
?OCR提取之后返回的結果是JSON格式,需要用戶通過編程,將結果保存為Word、TXT、pdf格式。
文字識別服務屬于公有云服務,線上用戶資源共享,并發(fā)量會根據線上用戶的調用情況動態(tài)調整。
如遇到突發(fā)高峰導致的并發(fā)量不夠用的情況,您可以嘗試以下兩種解決方法:
?通過重試機制,在代碼里檢查返回值,碰到并發(fā)錯誤可以延時一小段時間(如2-5s)重試請求.
?后端檢查上一個請求結果,上一個請求返回之后再發(fā)送下一個請求,避免請求過于頻繁。
目前OCR提供的SDK有Java、Python、Node.js、PHP、C++、Go、.NET版本。具體請參考文字識別服務《SDK參考》手冊,該手冊詳細介紹了SDK支持的版本及使用方法。
? OCR服務SDK供用戶免費下載,并依據API調用次數進行收費。
? 使用OCR服務時,如果您需要使用華為云對象存儲服務(OBS)中的數據,請開通對象存儲服務OBS授權,可在控制臺進行開通。
?OCR服務支持IAM細粒度劃分策略。可以為子用戶設置OCR服務的使用權限,詳細權限說明和配置過程請參見權限管理。
目前OCR服務不支持上傳圖片后直接導出結果,需要通過調用API的方式使用。具體操作請參考《文字識別服務快速入門》。
文字識別服務支持輸入圖片的base64編碼或圖片的url路徑。
如果您使用圖片的url路徑,可以將圖片上傳至華為云對象存儲服務(OBS)中,使用OBS提供的圖片url。
同時,您也可以不使用華為云存儲,使用公網http/https url傳入圖片。
? 增值稅發(fā)票識別API支持使用pdf、ofd文件進行識別。其他API不能直接識別word、pdf、excel等文件,可將此類文件轉換為圖片進行識別。
文字識別(Optical Character Recognition,簡稱OCR)是指將圖片、掃描件或PDF、OFD文檔中的打印字符進行檢測識別成可編輯的文本格式,以JSON格式返回識別結果。
通用表格識別:提取表格內的文字和所在行列位置信息,適應不同格式的表格。同時也識別表格外部的文字區(qū)域。用于各種單據和報表的電子化,恢復結構化信息。
智能分類識別服務可以一次性對同張圖片中的多個卡證、票據進行檢測和識別,并返回每個卡證、票據的類別及結構化數據。本文還將介紹更多智能分類文字識別
身份證識別:自動識別身份證上的全部信息,支持身份證正反面識別,一次掃描即可識別身份證號碼、姓名、地址等全部信息,在暗光、傾斜、過曝光、陰影等異常條件下均可準確識別身份證信息。
增值稅發(fā)票識別:通過對增值稅發(fā)票圖片預處理、表格提取、文字提取、文字識別、結構化信息輸出等一系列技術化手段,快速將增值稅發(fā)票上的文字信息識別出來
計費項:按API調用次數計費,計費價格請參見價格計算器。只有調用成功才會計算調用次數,其中返回的2xx狀態(tài)碼表示調用成功,調用失敗不計費。
OCR提供兩種計費方式下不同區(qū)域、不同應用場景的文字識別服務,含功能場景包括不僅限于以下類別:通用文字識別、機動車銷售發(fā)票識別、行駛證識別、發(fā)票驗真等數十種文字識別服務,價格表請參見文字識別價格詳情。
OCR以公有云服務為主,線上用戶資源共享,并發(fā)量會根據線上用戶的調用情況動態(tài)調整。如遇到突發(fā)高峰導致的并發(fā)量不夠用的情況,您可以嘗試以下兩種解決方法
若套餐包提前使用完,您需要進行手動續(xù)費,防止欠費影響您的業(yè)務正常使用。套餐包到期后,您可以手動續(xù)費以延長套餐包的有效期,也可以提前設置到期自動續(xù)費。續(xù)費相關操作,請參見續(xù)費管理。
本節(jié)定義了文字識別服務上報云監(jiān)控服務的監(jiān)控指標的命名空間,監(jiān)控指標列表和維度定義,用戶可以通過云監(jiān)控服務提供管理控制臺或API接口來檢索文字識別服務產生的監(jiān)控指標和告警信息。
文字識別是指對圖像文件的打印字符進行檢測識別,將圖像中的文字轉換成可編輯的文本格式。OCR通過API提供服務能力,用戶需要通過編程來處理識別結果。
本章節(jié)通過網絡圖片識別API介紹如何解讀調API返回的JSON格式識別結果。請參照API參考“響應參數”章節(jié)比對查看。以下圖識別結果為例,講解圖片內容如何與API的返回字段對應。
文字識別OCR使用SDK
06:38
文字識別 OCR使用API
03:04
7*24
多渠道服務支持
備案
提供免費備案服務
專業(yè)服務
云業(yè)務全流程支持
退訂
享無憂退訂服務
建議反饋
優(yōu)化改進建議
售前咨詢熱線
sales@huaweicloud.com
beian@huaweicloud.com
partner@huaweicloud.com
關注我們
4000 955 988
950808
華為云微信
掃描二維碼
華為云微信小程序
華為云微博
華為云App
掃描下載華為云App
增值電信業(yè)務經營許可證:B1.B2-20200593 | 域名注冊服務機構許可:黔D3-20230001 | 代理域名注冊服務機構:新網、西數