檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
950808 轉(zhuǎn) 1
預(yù)約咨詢
工單提交
我有建議
未實名認證
已實名認證
什么是圖片文字識別轉(zhuǎn)換?圖片文字識別轉(zhuǎn)換是指將圖片、掃描件或PDF、OFD文檔中的打印字符進行檢測識別成可編輯的文本格式,以JSON格式返回識別結(jié)果。為什么選擇華為云文字識別OCR?文字識別OCR提供在線文字識別服務(wù),將圖片、掃描件或PDF、OFD文檔中的文字識別成可編輯的文本。OCR文字識別支持證件識別、票據(jù)識別、定制模板識別、通用表格文字識別等。識別精度高:采用先進的自研深度學習算法,結(jié)合億萬級海量標注數(shù)據(jù)樣本訓練,針對各種業(yè)務(wù)場景優(yōu)化。穩(wěn)定服務(wù):華為云OCR成功應(yīng)用于各類場景,基于華為等企業(yè)客戶的長期實踐,經(jīng)受過復(fù)雜場景考驗。支持復(fù)雜場景:證件支持復(fù)雜背景、扭曲、傾斜等場景下的文字識別;表單支持蓋章、錯行等場景。簡單易用:提供符合RESTful規(guī)范的API訪問接口,兼容性強,使用方便。
什么是圖片文字識別轉(zhuǎn)換?
圖片文字識別轉(zhuǎn)換是指將圖片、掃描件或PDF、OFD文檔中的打印字符進行檢測識別成可編輯的文本格式,以JSON格式返回識別結(jié)果。
為什么選擇華為云文字識別OCR?
文字識別OCR提供在線文字識別服務(wù),將圖片、掃描件或PDF、OFD文檔中的文字識別成可編輯的文本。OCR文字識別支持證件識別、票據(jù)識別、定制模板識別、通用表格文字識別等。
識別精度高:采用先進的自研深度學習算法,結(jié)合億萬級海量標注數(shù)據(jù)樣本訓練,針對各種業(yè)務(wù)場景優(yōu)化。
穩(wěn)定服務(wù):華為云OCR成功應(yīng)用于各類場景,基于華為等企業(yè)客戶的長期實踐,經(jīng)受過復(fù)雜場景考驗。
支持復(fù)雜場景:證件支持復(fù)雜背景、扭曲、傾斜等場景下的文字識別;表單支持蓋章、錯行等場景。
簡單易用:提供符合RESTful規(guī)范的API訪問接口,兼容性強,使用方便。
通用類OCR(General OCR),支持表格識別、文檔識別、網(wǎng)絡(luò)圖片識別、手寫文字識別、智能分類識別、健康碼識別、核酸檢測記錄識別等任意格式圖片上文字信息的自動化識別,自適應(yīng)分析各種版面和表格,快速實現(xiàn)各種文檔電子化。
按次計費,提供多種規(guī)格的預(yù)付費套餐包。
證件類OCR(Card OCR),支持身份證識別、行駛證識別、駕駛證識別、護照識別、營業(yè)執(zhí)照識別、銀行卡識別、道路運輸證識別、車牌識別、名片識別、VIN碼識別、道路運輸從業(yè)資格證識別等卡證圖片上有效信息的自動識別和關(guān)鍵字段結(jié)構(gòu)化提取。
票據(jù)類OCR(Receipt OCR),支持增值稅發(fā)票識別、機動車銷售發(fā)票識別、出租車發(fā)票識別、火車票識別、定額發(fā)票識別、車輛通行費發(fā)票識別、飛機行程單識別以及發(fā)票驗真;支持圖片及PDF、OFD文檔上有效信息的自動識別和結(jié)構(gòu)化提取。
行業(yè)類(Domain OCR),支持物流電子面單識別、保險單識別、財務(wù)報表識別、醫(yī)療化驗單據(jù)識別等多種行業(yè)特定類型圖片的結(jié)構(gòu)化信息提取和識別,助力行業(yè)自動化效率提升。
文字識別使用簡介
服務(wù)以開放API(Application Programming Interface,應(yīng)用程序編程接口)的方式提供文字識別能力,用戶調(diào)用API接口需要具備一定的編程開發(fā)基礎(chǔ),文字識別后返回的結(jié)果為JSON格式,用戶需要通過編程來處理識別結(jié)果。
文字識別功能體驗與試用
在開通文字識別 OCR 前,請先使用 OCR體驗館 體驗服務(wù)功能。該方式無需編程,只需在網(wǎng)頁端上傳圖片,即可體驗識別效果。開通OCR后,默認按API調(diào)用次數(shù)進行收費。說明:使用OCR體驗館前,請先注冊華為云帳號,并實名認證。
在開通文字識別 OCR 前,請先使用 OCR體驗館 體驗服務(wù)功能。該方式無需編程,只需在網(wǎng)頁端上傳圖片,即可體驗識別效果。開通OCR后,默認按API調(diào)用次數(shù)進行收費。
文字識別使用流程
使用文字識別服務(wù)前需注冊華為云賬號,并實名認證。第一步:開通文字識別OCR服務(wù);第二步,準備數(shù)據(jù);第三步,調(diào)用API或SDK;最后,獲取識別結(jié)果。用戶需要具備編程能力,熟悉Java、Python、iOS、Android、Node.js編程語言。
文字識別 開通服務(wù)
在“總覽”頁面,選擇需要使用的服務(wù),在操作列單擊“開通服務(wù)”。服務(wù)開通成功后,開通狀態(tài)將顯示為“已開通”。如果您需要使用存儲在對象存儲服務(wù)(OBS)上的數(shù)據(jù),請在開通服務(wù)頁面進行服務(wù)授權(quán)。
文字識別 準備數(shù)據(jù)
受技術(shù)與成本多種因素制約,文字識別服務(wù)存在一些約束限制。只支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片;支持圖像任意角度的水平旋轉(zhuǎn);圖像各邊的像素大小在15px到8192px之間等。
文字識別 在線調(diào)試
文字識別 API Explorer 在線調(diào)試工具提供API的檢索、調(diào)試、代碼示例生成功能。同時,集成開發(fā)環(huán)境CloudIDE,可完成代碼的構(gòu)建、調(diào)試、運行。前提:已注冊帳號,并實名認證,帳號不能處于異常狀態(tài)。
文字識別 本地調(diào)用
該接口可以識別表格圖片中的文字內(nèi)容,并將識別結(jié)果以JSON格式返回給用戶。返回結(jié)果包含兩類:純文本區(qū)(text)和表格區(qū)(table),并返回表格結(jié)構(gòu)(row, column)和文本信息。
文字識別 解讀識別結(jié)果
本章節(jié)通過網(wǎng)絡(luò)圖片識別API介紹如何解讀調(diào)API返回的JSON格式識別結(jié)果。調(diào)用成功后,在“JSON返回結(jié)果”中,可見result字段,包含了圖片中的文字塊數(shù)目、文字塊排列順序、具體文本內(nèi)容、所在位置等信息。
文字識別 識別結(jié)果后處理
提取特定字段導入Excle需開通身份證識別,安裝OCR Python SDK。并執(zhí)行pip install xlsxwriter命令安裝依賴包,登錄訪問秘鑰頁面,獲取AK、SK??梢孕略鲈L問秘鑰,或使用已有的訪問秘鑰。
文字識別 OCR SDK使用指導
06:38
文字識別 OCR API使用指導
03:04
活動對象:華為云電銷客戶及渠道伙伴客戶可參與消費滿送活動,其他客戶參與前請咨詢客戶經(jīng)理
活動時間: 2020年8月12日-2020年9月11日
目前文字識別 OCR 服務(wù)不支持上傳圖片后直接導出結(jié)果,需要通過調(diào)用API的方式使用。具體操作請參考《文字識別服務(wù)快速入門》。
文字識別 OCR 不支持讀取視頻流數(shù)據(jù),您可將視頻流進行提取幀圖片操作,提取出圖片后進行識別,或者使用 視頻內(nèi)容分析VCR 提取視頻中的文字信息。
通用表格識別支持將表格內(nèi)容轉(zhuǎn)換成可編輯的Excel格式,傳入?yún)?shù)return_excel為true時,將返回的表格轉(zhuǎn)換為Microsoft Excel對應(yīng)的base64編碼,可用Python函數(shù) base64.b64decode 解碼后保存為.xlsx文件。
文字識別服務(wù)支持輸入圖片的base64編碼或圖片的url路徑。
如果您使用圖片的url路徑,可以將圖片上傳至華為云對象存儲服務(wù)(OBS)中,使用OBS提供的圖片url。
同時,您也可以不使用華為云存儲,使用公網(wǎng)http/https url傳入圖片。
增值稅發(fā)票識別API支持使用pdf、ofd文件進行識別。其他API不能直接識別word、pdf、excel等文件,可將此類文件轉(zhuǎn)換為圖片進行識別。pdf轉(zhuǎn)圖片識別示例請參見 識別結(jié)果后處理。
不支持離線使用,調(diào)用SDK必須能夠訪問公網(wǎng)才可以的,因為文字識別 OCR 接口部署在華為云云端,所以需要您的網(wǎng)絡(luò)可以訪問公網(wǎng)才可以調(diào)用服務(wù)接口。
不支持判斷身份證的真假,該服務(wù)可以識別身份證圖片中的文字內(nèi)容,并將識別的結(jié)果以json格式返回給用戶。
目前已經(jīng)支持增值稅專用發(fā)票和增值稅普通發(fā)票(含電子普通發(fā)票)。卷式發(fā)票和通行費發(fā)票即將上線,并且支持發(fā)票備注、監(jiān)制章、專用章、發(fā)票聯(lián)次等字段。具體請參見 增值稅發(fā)票識別 章節(jié)。
使用文字識別 OCR 服務(wù)時,如果您需要使用華為云對象存儲服務(wù)(OBS)中的數(shù)據(jù),請開通對象存儲服務(wù)OBS授權(quán),可在控制臺進行開通。
文字識別 OCR 服務(wù)支持IAM細粒度劃分策略??梢詾樽佑脩粼O(shè)置文字識別 OCR 服務(wù)的使用權(quán)限。
1、文字識別 OCR 服務(wù)堅持“華為云始終把可信作為產(chǎn)品質(zhì)量的第一要素”的理念,我們基于安全、合規(guī)、隱私、韌性、透明,為您提供有技術(shù)、有未來、值得信賴的云服務(wù)。
2、文字識別 OCR 服務(wù)承諾用戶識別的圖片與識別結(jié)果全部不作任何形式留存,識別返回后立即釋放。
7*24
多渠道服務(wù)支持
備案
提供免費備案服務(wù)
專業(yè)服務(wù)
云業(yè)務(wù)全流程支持
退訂
享無憂退訂服務(wù)
建議反饋
優(yōu)化改進建議
售前咨詢熱線
sales@huaweicloud.com
beian@huaweicloud.com
partner@huaweicloud.com
關(guān)注我們
4000 955 988
950808
華為云微信
掃描二維碼
華為云微信小程序
華為云微博
華為云App
掃描下載華為云App
增值電信業(yè)務(wù)經(jīng)營許可證:B1.B2-20200593 | 域名注冊服務(wù)機構(gòu)許可:黔D3-20230001 | 代理域名注冊服務(wù)機構(gòu):新網(wǎng)、西數(shù)