檢測(cè)到您已登錄華為云國(guó)際站賬號(hào),為了您更好的體驗(yàn),建議您訪問(wèn)國(guó)際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
FF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。 圖像中名片的有效占比超過(guò)60%,保證整張名片內(nèi)容包含在圖像內(nèi)。 支持圖像中名片的任意角度的水平旋轉(zhuǎn)(需開(kāi)啟方向檢測(cè))。 能處理反光、暗光、防偽標(biāo)識(shí)等干擾的圖片但影響識(shí)別精度。
文字識(shí)別的監(jiān)控指標(biāo) 功能說(shuō)明 本節(jié)定義了文字識(shí)別服務(wù)上報(bào)云監(jiān)控服務(wù)的監(jiān)控指標(biāo)的命名空間,監(jiān)控指標(biāo)列表和維度定義,用戶可以通過(guò)云監(jiān)控服務(wù)提供管理控制臺(tái)或API接口來(lái)檢索文字識(shí)別服務(wù)產(chǎn)生的監(jiān)控指標(biāo)和告警信息。 命名空間 SYS.OCR 監(jiān)控指標(biāo)詳情 表1 OCR支持的監(jiān)控指標(biāo) 指標(biāo)ID
只支持中國(guó)大陸道路運(yùn)輸證的識(shí)別。 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。 支持圖像中道路運(yùn)輸證任意角度的水平旋轉(zhuǎn)。 能處理反光、暗光、防偽標(biāo)識(shí)等干擾的圖片但影響識(shí)別精度。 調(diào)用方法
識(shí)別輸入圖片中的車牌信息,并返回其坐標(biāo)和內(nèi)容 文字識(shí)別 識(shí)別圖片上的文字信息,返回識(shí)別的文字和坐標(biāo)。支持掃描文件、電子文檔、書(shū)籍、票據(jù)和表單等多種場(chǎng)景的文字識(shí)別。 手寫(xiě)文字識(shí)別 識(shí)別文檔中的手寫(xiě)文字信息,并將識(shí)別的結(jié)構(gòu)化結(jié)果返回給用戶。 車輛通行費(fèi)發(fā)票識(shí)別 識(shí)別車輛通行費(fèi)發(fā)票中的文字信息,并返回識(shí)別的結(jié)構(gòu)化結(jié)果。 銀行卡識(shí)別
page2pix(self, doc, page, trans): """ 根據(jù)給定的參數(shù),解析當(dāng)前頁(yè)作為圖片數(shù)據(jù) """ # 獲取指定頁(yè)面的pdf格式,注意:頁(yè)面參數(shù)是事先解析出來(lái)的,不然會(huì)存在問(wèn)題。 return doc[page].getPixmap(matrix=trans
通過(guò)該服務(wù),可以同時(shí)識(shí)別出圖片中包含的不同傾角正臉及側(cè)臉。 圖1 人臉檢測(cè)示意圖 人臉比對(duì) 通過(guò)對(duì)人臉區(qū)域的特征進(jìn)行對(duì)比,該服務(wù)可以返回給用戶兩張圖片中人臉的相似度。如果兩張圖片中包含多張人臉,則在兩張圖片中選取最大的人臉進(jìn)行相似度比對(duì)。 圖2 人臉比對(duì)示意圖 人臉?biāo)阉?人臉?biāo)阉?/p>
圖解文字識(shí)別
提取圖片中的文字暗水印 功能介紹 對(duì)已嵌入文字暗水印的圖片進(jìn)行水印提取,用戶以formData的格式傳入待提取水印的圖片,DSC服務(wù)以JSON的格式返回從圖片里提取的出的文字暗水印。目前支持的圖片格式為:*.jpg, *.bmp, *.png, *.jpeg, *.tiff, *
識(shí)別字符出現(xiàn)錯(cuò)誤如何優(yōu)化? 不同的錯(cuò)誤情形需要具體分析: 情形1:大部分文字識(shí)別正確,部分形近符號(hào)的識(shí)別錯(cuò)誤。 解決辦法:產(chǎn)品提供了預(yù)置字段類型可以對(duì)結(jié)果進(jìn)行處理,同時(shí)也提供了自定義(正則)類型、字典類型,用于糾正識(shí)別結(jié)果中的錯(cuò)誤,適用范圍詳見(jiàn)字段類型。此外,您也可以在調(diào)用程序中
道路運(yùn)輸從業(yè)資格證識(shí)別 功能介紹 識(shí)別道路運(yùn)輸從業(yè)資格證上的關(guān)鍵文字信息,并返回識(shí)別的結(jié)構(gòu)化結(jié)果。 圖1 道路運(yùn)輸從業(yè)資格證示例圖 約束與限制 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。
智能分類識(shí)別 功能介紹 自動(dòng)分類識(shí)別17+種票證,支持指定票證的結(jié)構(gòu)化識(shí)別和印章檢測(cè),并以JSON格式返回識(shí)別的結(jié)構(gòu)化結(jié)果。 接口以列表形式返回圖片上要識(shí)別票證的位置坐標(biāo)、結(jié)構(gòu)化識(shí)別的內(nèi)容以及對(duì)應(yīng)的類別。該接口支持的票證類型請(qǐng)見(jiàn)表1,該接口的使用限制請(qǐng)參見(jiàn)約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見(jiàn)OCR服務(wù)使用簡(jiǎn)介章節(jié)。
機(jī)動(dòng)車銷售發(fā)票識(shí)別 功能介紹 識(shí)別機(jī)動(dòng)車銷售發(fā)票、二手車銷售發(fā)票圖片中的文字內(nèi)容,服務(wù)能自動(dòng)分辨兩種類型,并將識(shí)別的結(jié)果以JSON格式返回給用戶。該接口的使用限制請(qǐng)參見(jiàn)約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見(jiàn)OCR服務(wù)使用簡(jiǎn)介章節(jié)。 圖1 機(jī)動(dòng)車銷售發(fā)票示例圖 圖2 機(jī)動(dòng)車銷售發(fā)票示例圖 圖3 二手車銷售發(fā)票示例圖
財(cái)務(wù)報(bào)表識(shí)別 功能介紹 識(shí)別用戶上傳的表格圖片中的文字內(nèi)容,并將識(shí)別的結(jié)果返回給用戶。 約束與限制 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。 圖像中識(shí)別區(qū)域有效占
定額發(fā)票識(shí)別 功能介紹 識(shí)別定額發(fā)票中的文字信息,并以JSON格式返回識(shí)別的結(jié)構(gòu)化結(jié)果。該接口的使用限制請(qǐng)參見(jiàn)約束與限制,詳細(xì)使用指導(dǎo)請(qǐng)參見(jiàn)OCR服務(wù)使用簡(jiǎn)介章節(jié)。 圖1 定額發(fā)票示例圖 如果圖片中包含多張卡證票據(jù),請(qǐng)調(diào)用智能分類識(shí)別服務(wù)。 約束與限制 支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。
認(rèn)證”。 圖1 統(tǒng)一身份認(rèn)證 單擊“創(chuàng)建用戶”,并設(shè)置IAM賬戶的用戶名、密碼,創(chuàng)建IAM用戶。 圖2 創(chuàng)建用戶 圖3 設(shè)置用戶名、密碼 給子賬戶授予權(quán)限請(qǐng)參考權(quán)限管理。 圖4 設(shè)置用戶組 開(kāi)通服務(wù): 單擊“控制臺(tái)”>“服務(wù)列表”,找到“文字識(shí)別OCR”,進(jìn)入文字識(shí)別控制臺(tái)。 圖5
票據(jù)類 功能介紹 增值稅發(fā)票識(shí)別 通過(guò)對(duì)增值稅發(fā)票圖片預(yù)處理、表格提取、文字提取、文字識(shí)別、結(jié)構(gòu)化信息輸出等一系列技術(shù)化手段,快速將增值稅發(fā)票上的文字信息識(shí)別出來(lái),用于后續(xù)的進(jìn)一步處理,節(jié)省大量的人工錄入成本。 機(jī)動(dòng)車銷售發(fā)票識(shí)別 自動(dòng)識(shí)別機(jī)動(dòng)車銷售發(fā)票圖片內(nèi)的文本內(nèi)容,并返回結(jié)構(gòu)化字
與url二選一 圖片的Base64編碼,單個(gè)圖片其對(duì)應(yīng)的Base64編碼不超過(guò)10MB。圖片在Base64編碼后會(huì)大于圖片原本大小,請(qǐng)注意做好邊界判斷,建議圖片大小不超過(guò)7MB。 圖像各邊的像素大小在15到8192px之間。支持JPG/PNG/BMP/TIFF格式。 圖片Base64
IFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。 圖像中火車票區(qū)域有效占比超過(guò)25%。 支持圖像中火車票任意角度的水平旋轉(zhuǎn)。 支持少量扭曲,扭曲后圖像中的火車票長(zhǎng)寬比與實(shí)際火車票相差不超過(guò)10%。 支持識(shí)別鐵路電子客票(含OFD格式)。
tesseract是谷歌的一個(gè)對(duì)圖片進(jìn)行識(shí)別的開(kāi)源框架,免費(fèi)使用,現(xiàn)在已經(jīng)支持中文,而且識(shí)別率非常高,這里簡(jiǎn)要來(lái)個(gè)helloworld級(jí)別的認(rèn)識(shí) 下載地址:http://code.google.com/p/tesseract-ocr/downloads/detail
FF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。 只支持識(shí)別銀行卡正面,不支持識(shí)別背面。 只支持識(shí)別85.60×53.98 mm常規(guī)大小的銀行卡,不支持迷你卡和形狀不規(guī)則的異形卡。 支持圖像中銀行卡任意角度的水平旋轉(zhuǎn)。