檢測到您已登錄華為云國際站賬號,為了您更好的體驗(yàn),建議您訪問國際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
電子面單識別 OCR電子面單識別已于2025.09.04正式下架,為避免影響您目前的業(yè)務(wù),請您及時(shí)進(jìn)行相關(guān)遷移工作,詳見下架公告。 功能介紹 識別用戶上傳的電子面單圖片中的文字內(nèi)容,并將識別的結(jié)果以JSON格式返回給用戶。 圖1 電子面單示例圖 約束與限制 電子面單支持的版式以樣例為準(zhǔn)。
OCR服務(wù)可以識別文本格式文件嗎 增值稅發(fā)票識別API支持使用pdf、ofd文件進(jìn)行識別。其他API不能直接識別word、pdf、excel等文件,可將此類文件轉(zhuǎn)換為圖片進(jìn)行識別。pdf轉(zhuǎn)圖片識別示例請參見識別結(jié)果后處理。 父主題: 產(chǎn)品咨詢類
如何提高識別精度 盡量使用文字清晰度高、無反光的圖片。進(jìn)行圖片采集時(shí),盡量提高待識別文字區(qū)域占比,減少無關(guān)背景占比,保持圖片內(nèi)文字清晰人眼可辨認(rèn)。 若圖片有旋轉(zhuǎn)角度,算法支持自動(dòng)修正,建議圖片不要過度傾斜。 圖片尺寸方面,建議最長邊不超過8192像素,最短邊不小于15像素,圖像長寬比例維持常見水平
給子賬戶授予權(quán)限請參考權(quán)限管理。 圖4 設(shè)置用戶組 開通服務(wù): 單擊“控制臺”>“服務(wù)列表”,找到“文字識別OCR”,進(jìn)入文字識別控制臺。 圖5 文字識別控制臺 在文字識別控制臺“總覽”頁面,選擇對應(yīng)產(chǎn)品的“終端節(jié)點(diǎn)”。不同區(qū)域OCR產(chǎn)品部署情況請參考終端節(jié)點(diǎn)。 圖6 終端節(jié)點(diǎn) 選擇產(chǎn)品類
創(chuàng)建用于存儲(chǔ)發(fā)票識別與驗(yàn)真結(jié)果的對象存儲(chǔ)服務(wù) OBS桶,企業(yè)業(yè)務(wù)系統(tǒng)定時(shí)從該桶中獲取結(jié)果并處理。 函數(shù)工作流 FunctionGraph:用于實(shí)現(xiàn)調(diào)用文字識別服務(wù)的業(yè)務(wù)邏輯,當(dāng)OBS桶收到上傳的發(fā)票文件后,會(huì)自動(dòng)通知函數(shù)調(diào)用文字識別服務(wù),并將結(jié)果存放到指定的OBS桶里。 文字識別 OCR
為24小時(shí)。 圖4 獲取Token 步驟4:調(diào)用服務(wù) 在Postman左側(cè)導(dǎo)航欄中單擊“OCR_idcard”配置文件。 根據(jù)自身文字識別服務(wù)需求選擇相應(yīng)的POST類型。(OCR_idcard:身份證識別,OCR_auto_classification:智能分類識別,OCR-webimage:網(wǎng)絡(luò)圖片識別)
華為云語音交互服務(wù) 華為云語音交互服務(wù) 語音識別轉(zhuǎn)文字、文本實(shí)時(shí)轉(zhuǎn)語音 用戶通過調(diào)用語音識別類接口,將口述音頻、普通話或者帶有一定方言的語音文件識別成可編輯的文本;同時(shí)也支持通過調(diào)用語音合成接口將文本轉(zhuǎn)換成逼真的語音等。 用戶通過調(diào)用語音識別類接口,將口述音頻、普通話或者帶有一定
財(cái)務(wù)報(bào)表識別 功能介紹 識別用戶上傳的表格圖片中的文字內(nèi)容,并將識別的結(jié)果返回給用戶。 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對應(yīng)的Base64編碼不超過10MB。 圖像中識別區(qū)域有效占
# -*- coding: utf-8 -*-"""新手測試筆記文字識別 OCR:通用表格識別"""from huaweicloudsdkcore.auth.credentials import BasicCredentialsfrom huaweicloudsdkocr.v1.region
不動(dòng)產(chǎn)證識別 功能介紹 識別不動(dòng)產(chǎn)證中的文字信息,并返回識別的結(jié)構(gòu)化結(jié)果。 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片。 圖像各邊的像素大小在15到8192px之間。單個(gè)圖片對應(yīng)的Base64編碼不超過10MB。
票據(jù)類 功能介紹 增值稅發(fā)票識別 通過對增值稅發(fā)票圖片預(yù)處理、表格提取、文字提取、文字識別、結(jié)構(gòu)化信息輸出等一系列技術(shù)化手段,快速將增值稅發(fā)票上的文字信息識別出來,用于后續(xù)的進(jìn)一步處理,節(jié)省大量的人工錄入成本。 機(jī)動(dòng)車銷售發(fā)票識別 自動(dòng)識別機(jī)動(dòng)車銷售發(fā)票圖片內(nèi)的文本內(nèi)容,并返回結(jié)構(gòu)化
營業(yè)執(zhí)照識別 功能介紹 識別營業(yè)執(zhí)照首頁圖片中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 營業(yè)執(zhí)照示例圖 圖2 營業(yè)執(zhí)照示例圖-橫版 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片及PDF。
OCR服務(wù)支持批量識別嗎 OCR服務(wù)只支持調(diào)用一次接口識別一張圖片,批量識別需要進(jìn)行二次開發(fā),編碼循環(huán)調(diào)用API,實(shí)現(xiàn)批量調(diào)用服務(wù)識別圖片。 父主題: API使用類
泰國車牌識別 功能介紹 識別泰國車牌圖片中的車牌信息,返回識別結(jié)果和車牌的區(qū)域位置信息。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 泰國車牌示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式的圖片。 圖像各邊的像素
銀行卡識別 功能介紹 識別銀行卡上的關(guān)鍵文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 銀行卡示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 只支持識別JPG、JPEG、PNG、BMP、TIFF格式圖片。
火車票識別 功能介紹 識別火車票中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 火車票示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
DF默認(rèn)識別第一頁,或者您可以指定要識別的頁碼。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片、PDF文件其對應(yīng)的Base64編碼不超過10MB。 支持單圖多印章識別。 支持圖像中印章任意角度的水平旋轉(zhuǎn)。 支持圓形章、橢圓章、方形章、三角章和菱形章的檢測和識別。 能處
至業(yè)務(wù)系統(tǒng)。 語音識別與語音合成 將口述音頻、語音文件識別成可編輯的文本,并支持多音色語音合成。 文字識別 匯聚行業(yè)場景,提供自動(dòng)化識別能力 API參考:通用類OCR,實(shí)現(xiàn)表格、文檔、網(wǎng)絡(luò)圖片識別 API參考:證件類OCR,實(shí)現(xiàn)身份證、駕駛證、行駛證、護(hù)照識別 API參考:票據(jù)類
開始使用 1、網(wǎng)絡(luò)圖片識別:支持圖片格式等約束信息詳網(wǎng)絡(luò)圖片識別文檔 2、電子面單識別:支持圖片格式等約束信息詳電子面單識別文檔 登錄對象存儲(chǔ)服務(wù) OBS控制臺,在桶列表選擇快速部署 步驟三創(chuàng)建的用于上傳快遞圖片的OBS桶,可直接上傳圖片或上傳壓縮包(支持zip及tar格式),如
片對應(yīng)的Base64編碼不超過10MB。 圖像中識別區(qū)域有效占比超過80%,保證所有文字及其邊緣包含在圖像內(nèi)。 不支持角度旋轉(zhuǎn)的圖片識別。 支持電子承兌匯票,對于拍照場景、復(fù)雜背景支持欠佳。 文字識別服務(wù)屬于公有云服務(wù),線上用戶資源共享,如果需要多并發(fā)請求,請?zhí)崆奥?lián)系我們。 調(diào)用方法