檢測(cè)到您已登錄華為云國(guó)際站賬號(hào),為了您更好的體驗(yàn),建議您訪問(wèn)國(guó)際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
如上是圖片數(shù)字0的矩陣值, 可以發(fā)現(xiàn)一個(gè)現(xiàn)象: 矩陣中的每一個(gè)值都代表圖片中的一個(gè)像素,沒(méi)有筆畫的地方是0像素值,有筆畫的地方是非零像素,而且按照常理,同樣大小的圖片中,數(shù)字0的筆畫面積一般會(huì)比數(shù)字1的筆畫面積要多 由此產(chǎn)生一個(gè)思路: 能否根據(jù)筆畫產(chǎn)生的非零像素在整幅圖像中的占比來(lái)區(qū)分?jǐn)?shù)字0和1?
應(yīng)用場(chǎng)景票據(jù)識(shí)別:自動(dòng)提取發(fā)票、收據(jù)中的文字及其位置。內(nèi)容分析:定位社交媒體圖片中的關(guān)鍵文字(如廣告文案)。文檔數(shù)字化:重建掃描文檔的版式,保留文字位置信息。5. 注意事項(xiàng)坐標(biāo)原點(diǎn):Tesseract 的坐標(biāo)原點(diǎn)默認(rèn)在圖片左上角,y 軸向下延伸。圖像預(yù)處理:對(duì)低質(zhì)量圖片(如模糊、傾
classification(img_bytes) print(res) 12345678 c.png為你需要識(shí)別的圖片 比如: 識(shí)別效果: 做著玩玩,套代碼就是,后面你肯定會(huì)用到的。
了圖片中的文字塊數(shù)目、文字塊排列順序、具體文本內(nèi)容、所在位置、置信度等信息。 result字段僅在API調(diào)用成功后返回。 words_block_count表示文字塊識(shí)別結(jié)果,本示例中,識(shí)別出2個(gè)文字塊,分別代表圖片中的2行文字。 words_block_list表示文字塊列表,按照?qǐng)D片文字從上到下、從左到右排列。
駕駛證識(shí)別 功能介紹 識(shí)別駕駛證圖片中主頁(yè)與副頁(yè)的文字內(nèi)容,并將識(shí)別的結(jié)果以JSON格式返回給用戶。該接口的使用限制請(qǐng)參見(jiàn)約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見(jiàn)OCR服務(wù)使用簡(jiǎn)介章節(jié)。 圖1 駕駛證示例圖 圖2 電子駕駛證示例圖 如果圖片中包含多張卡證票據(jù),請(qǐng)調(diào)用智能分類識(shí)別服務(wù)。 約束與限制
上傳模板圖片 在使用多模板分類工作流開(kāi)發(fā)應(yīng)用之前,必須要明確文字識(shí)別的模板類型,明確以哪幾種板式圖片作為模板訓(xùn)練文字識(shí)別模型,基于自己的業(yè)務(wù)需求制定針對(duì)性的文字識(shí)別模型。例如上傳兩種不同格式的發(fā)票圖片作為模板,訓(xùn)練的文字識(shí)別模型就能識(shí)別并提取這兩種格式發(fā)票上的關(guān)鍵字段。 前提條件
如何獲取圖片base64編碼 OCR服務(wù)的輸入圖片參數(shù)是圖片的base64編碼,介紹如何將本地圖片,轉(zhuǎn)換為base64編碼。您也可以使用在線的圖片轉(zhuǎn)base64工具。 Python示例: 使用時(shí),需要將代碼的d:\demo.jpg替換為實(shí)際圖片路徑。 import base64 with
只支持中國(guó)大陸行駛證的識(shí)別。 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在100px到8000px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。 圖像中行駛證區(qū)域有效占比超過(guò)50%,保證整張行駛證內(nèi)容及其邊緣包含在圖像內(nèi)。 支持圖像中行駛證任意角度的水平旋轉(zhuǎn)。
保險(xiǎn)單識(shí)別 功能介紹 識(shí)別保險(xiǎn)單圖片上的文字信息,并將識(shí)別的結(jié)構(gòu)化結(jié)果返回給用戶。支持對(duì)多板式保險(xiǎn)單的掃描圖片及手機(jī)照片進(jìn)行結(jié)構(gòu)化信息提取。 約束與限制 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。
上傳模板圖片 在使用單模板工作流開(kāi)發(fā)應(yīng)用之前,必須確保需要識(shí)別的圖片都屬于同一類型的模板。同一類模板的圖片,它們有相同的版面排布,且要識(shí)別的文字類型和位置均要求固定。如果您的圖片具有多種模板,請(qǐng)考慮使用“多模板工作流”。 確認(rèn)模板類型后,要準(zhǔn)備一張文字清晰的圖作為模板圖片,模板圖中要
文字識(shí)別的監(jiān)控指標(biāo) 功能說(shuō)明 本節(jié)定義了文字識(shí)別服務(wù)上報(bào)云監(jiān)控服務(wù)的監(jiān)控指標(biāo)的命名空間,監(jiān)控指標(biāo)列表和維度定義,用戶可以通過(guò)云監(jiān)控服務(wù)提供管理控制臺(tái)或API接口來(lái)檢索文字識(shí)別服務(wù)產(chǎn)生的監(jiān)控指標(biāo)和告警信息。 命名空間 SYS.OCR 監(jiān)控指標(biāo)詳情 表1 OCR支持的監(jiān)控指標(biāo) 指標(biāo)ID
和歐文上的識(shí)別能力相當(dāng)出色,且識(shí)別準(zhǔn)確率高達(dá)97%以上,高于市面上識(shí)別工具的平均水準(zhǔn),支持安卓、IOS、Win等多途徑的調(diào)用識(shí)別。目②是否夠快→云脈文檔識(shí)別測(cè)試集識(shí)別速度:(下圖)加快識(shí)別速度是提高實(shí)際錄入工作效率的重點(diǎn)所在,根據(jù)測(cè)驗(yàn),云脈文檔識(shí)別速度最快小于3秒(500W中英文
智能分類識(shí)別 功能介紹 自動(dòng)分類識(shí)別17+種票證,支持指定票證的結(jié)構(gòu)化識(shí)別和印章檢測(cè),并以JSON格式返回識(shí)別的結(jié)構(gòu)化結(jié)果。 接口以列表形式返回圖片上要識(shí)別票證的位置坐標(biāo)、結(jié)構(gòu)化識(shí)別的內(nèi)容以及對(duì)應(yīng)的類別。該接口支持的票證類型請(qǐng)見(jiàn)表1,該接口的使用限制請(qǐng)參見(jiàn)約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見(jiàn)OCR服務(wù)使用簡(jiǎn)介章節(jié)。
道路運(yùn)輸從業(yè)資格證識(shí)別 功能介紹 識(shí)別道路運(yùn)輸從業(yè)資格證上的關(guān)鍵文字信息,并返回識(shí)別的結(jié)構(gòu)化結(jié)果。 圖1 道路運(yùn)輸從業(yè)資格證示例圖 約束與限制 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。
OCR服務(wù)進(jìn)行電子面單識(shí)別、網(wǎng)絡(luò)圖片識(shí)別并將結(jié)果存放在OBS桶內(nèi)。 3. 使用文字識(shí)別 OCR,提供電子面單識(shí)別和網(wǎng)絡(luò)圖片識(shí)別。用戶只需要將電子面單圖片或含有收/寄件信息的截圖上傳至OBS桶,即可自動(dòng)識(shí)別提取收/寄件人的姓名、電話、地址,面單上的物流編碼、三段碼、條形碼等信息。 架構(gòu)描述 該解決方案會(huì)部署如下資源:
使用OCR服務(wù)是否必須使用華為云存儲(chǔ)圖片 文字識(shí)別服務(wù)支持輸入圖片的base64編碼或圖片的url路徑。 如果您使用圖片的url路徑,可以將圖片上傳至華為云對(duì)象存儲(chǔ)服務(wù)(OBS)中,使用OBS提供的圖片url。 關(guān)于OBS的使用請(qǐng)參考配置OBS訪問(wèn)權(quán)限。 OCR識(shí)別OBS私有桶中的圖片時(shí)需要保證調(diào)用O
提取圖片中的文字暗水印 功能介紹 對(duì)已嵌入文字暗水印的圖片進(jìn)行水印提取,用戶以formData的格式傳入待提取水印的圖片,DSC服務(wù)以JSON的格式返回從圖片里提取的出的文字暗水印。目前支持的圖片格式為:*.jpg, *.bmp, *.png, *.jpeg, *.tiff, *
護(hù)照識(shí)別 功能介紹 識(shí)別護(hù)照首頁(yè)圖片中的文字信息,并以JSON格式返回識(shí)別的結(jié)構(gòu)化結(jié)果。 當(dāng)前版本支持2012年及以后發(fā)行的中國(guó)普通電子護(hù)照的全字段識(shí)別。中國(guó)-港澳臺(tái)地區(qū)、外國(guó)護(hù)照支持護(hù)照下方兩行國(guó)際標(biāo)準(zhǔn)化的機(jī)讀碼識(shí)別,并可從中提取7個(gè)關(guān)鍵字段信息。該接口的使用限制請(qǐng)參見(jiàn)約束與限
OCR服務(wù)支持上傳圖片后直接導(dǎo)出結(jié)果嗎 目前OCR服務(wù)不支持上傳圖片后直接導(dǎo)出結(jié)果,需要通過(guò)調(diào)用API的方式使用。具體操作請(qǐng)參考《文字識(shí)別服務(wù)快速入門》。 父主題: 產(chǎn)品咨詢類
網(wǎng)絡(luò)圖片識(shí)別 智能分類識(shí)別 手寫文字識(shí)別 身份證識(shí)別 行駛證識(shí)別 駕駛證識(shí)別 護(hù)照識(shí)別 銀行卡識(shí)別 營(yíng)業(yè)執(zhí)照識(shí)別 道路運(yùn)輸證識(shí)別 車牌識(shí)別 名片識(shí)別 VIN碼識(shí)別 增值稅發(fā)票識(shí)別 發(fā)票驗(yàn)真 機(jī)動(dòng)車銷售發(fā)票識(shí)別 出租車發(fā)票識(shí)別 火車票識(shí)別 定額發(fā)票識(shí)別 車輛通行費(fèi)發(fā)票識(shí)別 飛機(jī)行程單識(shí)別 電子面單識(shí)別