什么是文字識別OCR?
文字識別OCR服務(wù)介紹
文字識別(Optical Character Recognition,簡稱OCR)是指將圖片、掃描件或PDF、OFD文檔中的打印字符進(jìn)行檢測識別成可編輯的文本格式,以JSON格式返回識別結(jié)果。
OCR以開放API(Application Programming Interface,應(yīng)用程序編程接口)的方式提供給用戶,用戶使用Python、Java等編程語言調(diào)用OCR服務(wù)API將圖片識別成文字,幫助用戶自動采集關(guān)鍵數(shù)據(jù),打造智能化業(yè)務(wù)系統(tǒng),提升業(yè)務(wù)效率,API獲取詳情請參考《API參考》。
OCR還提供多種編程語言的SDK供您使用,SDK使用方法請參考《SDK參考》。
OCR平臺有哪些能力?
1、通用類 OCR:通用類OCR(General OCR),支持表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片上文字信息的自動化識別,自適應(yīng)分析各種版面和表格,快速實(shí)現(xiàn)各種文檔電子化。
2、證件類 OCR:證件類OCR(Card OCR),支持身份證、駕駛證、行駛證、護(hù)照等證件圖片上有效信息的自動識別和關(guān)鍵字段結(jié)構(gòu)化提取。
3、票據(jù)類 OCR:票據(jù)類OCR(Receipt OCR),支持增值稅發(fā)票、機(jī)動車銷售發(fā)票、醫(yī)療發(fā)票等各種發(fā)票和表單圖片上有效信息的自動識別和結(jié)構(gòu)化提取。
4、行業(yè)類 OCR:行業(yè)類OCR(Domain OCR),支持物流面單、醫(yī)療化驗(yàn)單據(jù)等多種行業(yè)特定類型圖片的結(jié)構(gòu)化信息提取和識別,助力行業(yè)自動化效率提升。
5、定制模板 OCR:定制模板OCR(Custom OCR),支持用戶自定義識別模板,指定需要識別的關(guān)鍵字段,實(shí)現(xiàn)用戶特定格式圖片的自動識別和結(jié)構(gòu)化提取。
首次使用文字識別OCR工具
華為云文字識別OCR有哪些功能?
文字識別OCR通用類功能介紹:
1、通用表格識別:提取表格內(nèi)的文字和所在行列位置信息,適應(yīng)不同格式的表格。同時也識別表格外部的文字區(qū)域。用于各種單據(jù)和報表的電子化,恢復(fù)結(jié)構(gòu)化信息。
2、通用文字識別:提取圖片內(nèi)的文字及其對應(yīng)位置信息,并能夠根據(jù)文字在圖片中的位置進(jìn)行結(jié)構(gòu)化整理工作。
3、手寫文字識別:識別文檔中的手寫文字信息,并將識別的結(jié)構(gòu)化結(jié)果返回給用戶。
4、網(wǎng)絡(luò)圖片識別:自動識別網(wǎng)絡(luò)圖片內(nèi)的所有文字及其對應(yīng)位置信息,并能根據(jù)識別出來的結(jié)果進(jìn)行聯(lián)系人信息的提取,同時可供進(jìn)一步的數(shù)據(jù)挖掘后處理操作。
5、智能分類識別:自動檢測定位圖片上指定要識別的票證,一次掃描即可識別票證的位置坐標(biāo)、結(jié)構(gòu)化識別的內(nèi)容以及對應(yīng)的類別。
文字識別OCR智能分類功能介紹:
智能分類識別服務(wù)可以一次性對同張圖片中的多個卡證、票據(jù)進(jìn)行檢測和識別,并返回每個卡證、票據(jù)的類別及結(jié)構(gòu)化數(shù)據(jù)。
文字識別OCR證件類功能介紹:
1、身份證識別:自動識別身份證上的全部信息,支持身份證正反面識別,一次掃描即可識別身份證號碼、姓名、地址等全部信息,在暗光、傾斜、過曝光、陰影等異常條件下均可準(zhǔn)確識別身份證信息。
2、駕駛證識別:自動識別駕駛證正頁與副頁上的全部信息,自動提取出姓名、性別、領(lǐng)證日期、準(zhǔn)駕車型、有效期限、檔案編號等結(jié)構(gòu)化信息,在暗光、傾斜、過曝光、防偽標(biāo)志干擾、陰影等異常條件下均可準(zhǔn)確識別駕駛證信息。
3、行駛證識別:自動識別行駛證正頁與副頁上的全部信息,自動提取出號牌號碼、車輛類型、所有人、使用性質(zhì)、品牌型號、車輛識別代號、發(fā)動機(jī)號碼、注冊日期、檔案編碼、核定載人數(shù)、總質(zhì)量、整備質(zhì)量、核定載質(zhì)量、外廓尺寸、準(zhǔn)牽引總質(zhì)量、備注、檢驗(yàn)記錄、條碼號等結(jié)構(gòu)化信息,在暗光、傾斜、過曝光、防偽標(biāo)志干擾、陰影等異常條件下均可準(zhǔn)確識別行駛證信息。
4、護(hù)照識別:針對中國護(hù)照,可識別護(hù)照上的全部信息;針對其他國家護(hù)照,可根據(jù)兩行國際標(biāo)準(zhǔn)化的機(jī)讀碼識別出6-7個關(guān)鍵字段信息,包括姓名、性別、出生日期、護(hù)照號碼、簽發(fā)國國家碼、護(hù)照有效期等。在暗光、傾斜、過曝光、陰影等異常條件下均可準(zhǔn)確識別護(hù)照信息。
5、營業(yè)執(zhí)照識別:識別營業(yè)執(zhí)照中的公司名稱、注冊號、法人代表、地址、注冊資本、營業(yè)期限、經(jīng)營范圍等字段。 在暗光,傾斜、水印等異常條件下均可正常識別執(zhí)照信息。
6、銀行卡識別:自動識別銀行卡正面的信息,識別信息包括卡片類型(借記卡或信用卡)、銀行卡卡號、有效日期、發(fā)卡行、持卡人姓名(限信用卡)。省去手動錄入過程。
文字識別OCR票據(jù)類功能介紹:
1、增值稅發(fā)票識別:通過對增值稅發(fā)票圖片預(yù)處理、表格提取、文字提取、文字識別、結(jié)構(gòu)化信息輸出等一系列技術(shù)化手段,快速將增值稅發(fā)票上的文字信息識別出來,用于后續(xù)的進(jìn)一步處理,節(jié)省大量的人工錄入成本。
2、機(jī)動車銷售發(fā)票識別:自動識別機(jī)動車銷售發(fā)票圖片內(nèi)的文本內(nèi)容,并返回結(jié)構(gòu)化字段信息,用于后續(xù)的進(jìn)一步處理,節(jié)省大量的人工錄入成本。
3、飛機(jī)行程單識別:自動識別飛機(jī)行程單的全部信息,一次掃描即可識別旅客姓名、有效身份證件號碼、訂單號、票價等全部信息。
4、定額發(fā)票識別:自動識別定額發(fā)票的全部信息,一次掃描即可識別發(fā)票號碼、發(fā)票代碼、地址、發(fā)票金額等全部信息。
5、火車票識別:自動識別火車票的全部信息,一次掃描即可識別一張車票的ID、檢票口信息、車次等全部信息。
6、出租車發(fā)票識別:自動識別出租車發(fā)票的全部信息,一次掃描即可識別歸屬地區(qū)、發(fā)票代碼、發(fā)票號碼、電話(包括電話、監(jiān)督電話)等全部信息。
文字識別OCR在線體驗(yàn)的計費(fèi)項(xiàng)有哪些?
按API調(diào)用次數(shù)計費(fèi),計費(fèi)價格請參見價格計算器。
只有調(diào)用成功才會計算調(diào)用次數(shù),其中返回的2xx狀態(tài)碼表示調(diào)用成功,調(diào)用失敗不計費(fèi)。
文字識別OCR的計費(fèi)模式:
按需計費(fèi):默認(rèn)計費(fèi)方式,指按照API調(diào)用次數(shù)收費(fèi),按次進(jìn)行結(jié)算。
套餐包計費(fèi):
1、相比“按需計費(fèi)”具有更大折扣。
2、套餐包有效期為1年,到期不會自動順延,請在有效期內(nèi)使用完。
3、套餐包到期后或套餐包使用完后,如果沒有及時續(xù)費(fèi)或購買新的套餐包,系統(tǒng)將自動轉(zhuǎn)為按需計費(fèi)方式。
4、套餐包費(fèi)用為一次性支付,即刻生效,暫不支持指定日期生效。
5、套餐包可疊加使用,如果您購買了多個套餐包,則套餐包的扣減規(guī)則如下:
按照套餐包來源類型扣費(fèi),扣減優(yōu)先級由高到低為:免費(fèi)額度->套餐包計費(fèi)->按需計費(fèi)。
按套餐包創(chuàng)建、生效、失效時間扣費(fèi)。
多個套餐包,創(chuàng)建時間相同時,優(yōu)先抵扣先生效的。
多個套餐包,生效時間相同時,優(yōu)先抵扣先失效的。
多個套餐包,失效時間相同時,優(yōu)先抵扣先創(chuàng)建的。