檢測到您已登錄華為云國際站賬號,為了您更好的體驗(yàn),建議您訪問國際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
上傳模板圖片 在使用多模板分類工作流開發(fā)應(yīng)用之前,必須要明確文字識別的模板類型,明確以哪幾種板式圖片作為模板訓(xùn)練文字識別模型,基于自己的業(yè)務(wù)需求制定針對性的文字識別模型。例如上傳兩種不同格式的發(fā)票圖片作為模板,訓(xùn)練的文字識別模型就能識別并提取這兩種格式發(fā)票上的關(guān)鍵字段。 前提條件
圖片質(zhì)量類報錯處理辦法 問題現(xiàn)象 調(diào)用文字識別API時,產(chǎn)生以下圖片質(zhì)量類報錯。 錯誤碼AIS.0102:圖片格式不支持。 錯誤碼AIS.0103:圖片尺寸不滿足要求。 錯誤碼AIS.0104:非支持的圖片類型或圖片質(zhì)量差。 解決方法 請參考產(chǎn)品介紹 > 約束與限制章節(jié)檢查圖片的格式、像素是否符合規(guī)范。
這個識別圖片的原理是分析像素點(diǎn),計算平均顏色,大于平均顏色則為1,小于則為0,然后進(jìn)行比對 精確度很低,只能匹配形狀和比例一樣的圖片 class img { //比較圖片相似度 public function cpimg($img1, $img2, $rate = '2')
需要定制識別的字段。例如上傳某一格式的發(fā)票圖片作為模板,配置文字識別模型就能識別并提取同格式發(fā)票上的關(guān)鍵字段。 前提條件 已在“自定義OCR”控制臺選擇“通用單模板工作流”創(chuàng)建應(yīng)用,詳情請見6.2新建應(yīng)用。 提前準(zhǔn)備待識別的圖片,圖片要求請見圖片要求。 圖片要求 保證圖片質(zhì)量:不
之間。單個圖片對應(yīng)的Base64編碼不超過10MB。 圖像中識別區(qū)域有效占比超過80%,保證所有文字及其邊緣包含在圖像內(nèi)。 支持圖像任意角度的水平旋轉(zhuǎn)(需開啟方向檢測)。 目前不支持復(fù)雜背景(如戶外自然場景、防偽水印等)和表格線扭曲圖像的文字識別。 文字書寫越工整,識別率越高。 調(diào)用方法
提取圖片中的文字暗水印 功能介紹 對已嵌入文字暗水印的圖片進(jìn)行水印提取,用戶以formData的格式傳入待提取水印的圖片,DSC服務(wù)以JSON的格式返回從圖片里提取的出的文字暗水印。目前支持的圖片格式為:*.jpg, *.bmp, *.png, *.jpeg, *.tiff, *
名片識別 功能介紹 識別名片圖片上的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。支持對多種不同版式名片進(jìn)行結(jié)構(gòu)化信息提取。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 名片示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
提取圖片中的圖片暗水?。ㄎ募刂钒姹荆?功能介紹 對指定存儲地址信息(目前支持OBS)的已嵌入圖片暗水印的圖片提取圖片暗水印,提取出的水印圖片將存放在用戶指定的位置(目前支持OBS),支持的圖片格式為:*.jpg, *.bmp, *.png, *.jpeg, *.tiff, *.tif
的范圍是[-1,1]當(dāng)SSIM=-1時表示兩張圖片完全不相似當(dāng)SSIM= 1時表示兩張圖片非常相似。即該值越接近1說明兩張圖片越相似。'''def compare_images(imageA, imageB, title): # 分別計算輸入圖片的MSE和SSIM指標(biāo)值的大小 m = mse(imageA
如何在含有多張人臉的圖片中實(shí)現(xiàn)多人臉識別 當(dāng)前人臉識別服務(wù)中,如果傳入的圖片中包含多個人臉,則只能選取最大的一個人臉進(jìn)行識別。但是可以使用如下方法,實(shí)現(xiàn)一張圖片中多張人臉的識別(比對/搜索): 調(diào)用人臉檢測接口,可以得到多張人臉在圖片中的像素位置。 通過獲取到的人臉位置信息,從原圖中將人臉圖片截出,可以參考多人臉識別Demo。
駕駛證識別 功能介紹 識別駕駛證圖片中主頁與副頁的文字內(nèi)容,并將識別的結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 駕駛證示例圖 圖2 電子駕駛證示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制
行駛證識別 功能介紹 識別行駛證圖片中主頁和副頁的文字內(nèi)容,并將識別的結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 行駛證示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 只支持中國大陸行駛證的識別。
主體識別 功能介紹 用戶傳入圖片通過后臺算法判斷圖片主體,并返回主體坐標(biāo),具體識別的主體請參考應(yīng)用場景。 前提條件 使用主體識別服務(wù)之前需要您完成服務(wù)申請和認(rèn)證鑒權(quán)。 圖像識別服務(wù)屬于公有云服務(wù),線上用戶資源共享,如果需要多并發(fā)請求,請?zhí)崆奥?lián)系我們。 調(diào)試 您可以在API Exp
解讀識別結(jié)果 本章節(jié)通過網(wǎng)絡(luò)圖片識別API介紹如何解讀調(diào)API返回的JSON格式識別結(jié)果。請參照API參考“響應(yīng)參數(shù)”章節(jié)比對查看。 以下圖識別結(jié)果為例,講解圖片內(nèi)容如何與API的返回字段對應(yīng)。 調(diào)用網(wǎng)絡(luò)圖片API成功后,在“JSON返回結(jié)果”中,可見result字段,該字段包含
表1 參數(shù)名 說明 src 源圖,必須為NV21的格式。寬度范圍[64, 1920], 2的倍數(shù);高度范圍[64, 1080], 2的倍數(shù)。 如果輸入不是NV21格式,請把輸入的源圖片轉(zhuǎn)換為NV21格式,詳情請參見轉(zhuǎn)換圖片顏色格式。 dst 目的圖片。 x 裁剪區(qū)域左上角x坐標(biāo),范圍[0
前邊的步驟都非常順利,但是在創(chuàng)建“圖像分類”和“物體檢測”項(xiàng)目時遇到的一個莫名其妙的 Bug,未標(biāo)注頁面不停的刷新,讓我很懵圈。 ? 后來重試了幾次又沒有問題啦。 ? 手動標(biāo)注,先來8張。 ? 開始自動訓(xùn)練,點(diǎn)擊下圖的按鈕 。
-成長地圖 | 華為云
= ocr.classification(img_bytes) print(res) 12345678 c.png為你需要識別的圖片 比如: 識別效果: 做著玩玩,套代碼就是,后面你肯定會用到的。
OBS的語音文件識別成可編輯的文本,支持中文普通話的識別和合成,其中語音識別還支持帶方言口音的普通話識別以及方言(四川話、粵語和上海話)的識別。適用于如下場景:識別客服、客戶的語音,進(jìn)一步通過文本檢索,檢查有沒有違規(guī)、敏感詞、電話號碼等信息。對會議記錄的音頻文件,進(jìn)行快速的識別,轉(zhuǎn)化成文字,方便進(jìn)行會議記錄等場景。
使用OCR服務(wù)是否必須使用華為云存儲圖片 文字識別服務(wù)支持輸入圖片的base64編碼或圖片的url路徑。 如果您使用圖片的url路徑,可以將圖片上傳至華為云對象存儲服務(wù)(OBS)中,使用OBS提供的圖片url。 關(guān)于OBS的使用請參考配置OBS訪問權(quán)限。 OCR識別OBS私有桶中的圖片時需要保證調(diào)用O