檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片。 圖像各邊的像素大小在15px到8192px之間。單個圖片對應的Base64編碼不超過10MB。 支持圖像中行程單任意角度的水平旋轉(zhuǎn)。 能處理反光、暗光等干擾的圖片但影響識別精度。 調(diào)用方法 請參見如何調(diào)用API。 前提條件 在使用之前,
不動產(chǎn)證識別 功能介紹 識別不動產(chǎn)證中的文字信息,并返回識別的結(jié)構(gòu)化結(jié)果。 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務。 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片。 圖像各邊的像素大小在15到8192px之間。單個圖片對應的Base64編碼不超過10MB。
id_card_with_url:根據(jù)圖片的URL路徑,識別身份證。目前僅支持華為云上,OBS提供的臨時授權或匿名公開授權訪問的URL。 id_card_with_image:根據(jù)base64編碼后的圖像數(shù)據(jù),識別身份證。要求base64編碼后大小不超過10MB,圖像各邊的像素大小在15到8000之
框選識別區(qū) 在文字識別過程中,需要確定圖片中識別的文字位置,這就需要在圖片模板中框選識別區(qū)。 識別區(qū)指圖片中待識別的文字位置。所有需要識別的圖片中都會包含此識別區(qū)的字段,且位置固定不變,因此模型可以通過識別區(qū)找到需要識別內(nèi)容的位置。 前提條件 已在自定義OCR控制臺選擇“通用單模
框選識別區(qū) 在文字識別過程中,需要確定圖片中識別的文字位置,這就需要在圖片模板中框選識別區(qū)。 識別區(qū)指圖片中待識別的文字位置。所有需要識別的圖片中都會包含此識別區(qū)的字段,且位置固定不變,因此模型可以通過識別區(qū)找到需要識別內(nèi)容的位置。 前提條件 已在自定義OCR控制臺選擇“多模板分
VIN碼識別 功能介紹 識別圖片中的車架號信息,并將識別結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。 圖1 VIN碼示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在1
保險單識別 功能介紹 識別保險單圖片上的文字信息,并將識別的結(jié)構(gòu)化結(jié)果返回給用戶。支持對多板式保險單的掃描圖片及手機照片進行結(jié)構(gòu)化信息提取。 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素在15px到8192px之間。單個圖片對應的Base64編碼不超過10MB。
泰國車牌識別 功能介紹 識別泰國車牌圖片中的車牌信息,返回識別結(jié)果和車牌的區(qū)域位置信息。該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。 圖1 泰國車牌示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片。 圖像各邊的像素大
營業(yè)執(zhí)照識別 功能介紹 識別營業(yè)執(zhí)照首頁圖片中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。 圖1 營業(yè)執(zhí)照示例圖 圖2 營業(yè)執(zhí)照示例圖-橫版 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片及PDF。
DF默認識別第一頁,或者您可以指定要識別的頁碼。 圖像各邊的像素大小在15px到8192px之間。單個圖片、PDF文件其對應的Base64編碼不超過10MB。 支持單圖多印章識別。 支持圖像中印章任意角度的水平旋轉(zhuǎn)。 支持圓形章、橢圓章、方形章、三角章和菱形章的檢測和識別。 能處
TIFF格式的圖片。 圖像各邊的像素大小在15px到8192px之間。單個圖片對應的Base64編碼不超過10MB。 圖像中發(fā)票區(qū)域有效占比超過25%,保證整張發(fā)票內(nèi)容及其邊緣包含在圖像內(nèi)。 支持少量扭曲,扭曲后圖像中的發(fā)票長寬比與實際發(fā)票相差不超過10%。 支持圖像中出租車發(fā)票任意角度的水平旋轉(zhuǎn)。
支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片。 圖像各邊的像素大小在15px到8192px之間。單個圖片對應的Base64編碼不超過10MB。 圖像中發(fā)票區(qū)域有效占比超過25%。 支持圖像中車輛通行費發(fā)票任意角度的水平旋轉(zhuǎn)。 目前只支持中華人民共和國境內(nèi)的車輛通行費發(fā)票識別。
1.2.8 文字識別計算機文字識別,俗稱光學字符識別(Optical Character Recognition),是利用光學掃描技術將票據(jù)、報刊、書籍、文稿及其他印刷品的文字轉(zhuǎn)化為圖像信息,再利用文字識別技術將圖像信息轉(zhuǎn)化為可以使用的計算機輸入技術。該技術可應用于如表1-4所示
如何選購合適的API 文字識別服務(OCR)提供四種類型的API:通用類、證件類、票據(jù)類、智能分類。 通用類 通用表格識別:提取表格內(nèi)的文字和所在行列位置信息。 通用文字識別:提取圖片內(nèi)的文字及其對應位置信息。 手寫文字識別:識別手寫文字、印刷文字信息。 網(wǎng)絡圖片識別:識別網(wǎng)絡圖片內(nèi)的所有文字及其對應位置信息。
增值稅發(fā)票識別 功能介紹 識別增值稅發(fā)票的類別,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果,支持識別圖片、PDF、OFD文件。該接口的使用限制請參見約束與限制,詳細使用指導請參見OCR服務使用簡介章節(jié)。 發(fā)票驗真API請參見發(fā)票驗真。 圖1 增值稅發(fā)票示例圖 圖2 區(qū)塊鏈發(fā)票示例圖 圖3 全電發(fā)票示例圖(專用發(fā)票)
識別結(jié)果容易漏字或多識別出內(nèi)容怎么辦? 識別結(jié)果是根據(jù)識別區(qū)來進行提取的,識別區(qū)的位置和大小均會影響識別結(jié)果。 若結(jié)果漏字,可能是由于識別區(qū)太小導致的,需在相應模板的"框選識別區(qū)"頁面,把漏字的識別區(qū)調(diào)大一些。 若多識別出文字,可能是識別區(qū)太大,將周邊無關的文字也框進來了,需將識別區(qū)改小一點。
OCR服務需要用戶通過調(diào)用API接口,將圖片或掃描件中的文字識別成可編輯的文本,然后返回JSON格式的識別結(jié)果,用戶需要通過編碼將識別結(jié)果對接到業(yè)務系統(tǒng)或保存為TXT、Excel等格式。 關于文字識別的相關聲明請參見文字識別服務聲明。 文字識別服務等級協(xié)議請參見華為云服務等級協(xié)議。
身份證識別可以判斷身份證真假么 不支持判斷身份證的真假,該服務可以識別身份證圖片中的文字內(nèi)容,并將識別的結(jié)果以json格式返回給用戶。 父主題: 產(chǎn)品咨詢類
網(wǎng)絡圖片識別 智能分類識別 手寫文字識別 身份證識別 行駛證識別 駕駛證識別 護照識別 銀行卡識別 營業(yè)執(zhí)照識別 道路運輸證識別 車牌識別 名片識別 VIN碼識別 增值稅發(fā)票識別 發(fā)票驗真 機動車銷售發(fā)票識別 出租車發(fā)票識別 火車票識別 定額發(fā)票識別 車輛通行費發(fā)票識別 飛機行程單識別 電子面單識別
1對1咨詢 通用類文字識別 表格、文檔、網(wǎng)絡圖片等任意格式圖片識別 支持表格、文檔、網(wǎng)絡圖片等任意格式圖片文字識別 1對1咨詢 智能分類文字識別 檢測定位圖片上指定要識別的票證的文字信息 表格的文字與表格信息識別,可轉(zhuǎn)換成能編輯的Excel 1對1咨詢 證件類文字識別 身份證、駕駛證、行