什么是文字識(shí)別OCR?
文字識(shí)別OCR服務(wù)介紹
文字識(shí)別(Optical Character Recognition,簡(jiǎn)稱OCR)是指將圖片、掃描件或PDF、OFD文檔中的打印字符進(jìn)行檢測(cè)識(shí)別成可編輯的文本格式,以JSON格式返回識(shí)別結(jié)果。
OCR以開(kāi)放API(Application Programming Interface,應(yīng)用程序編程接口)的方式提供給用戶,用戶使用Python、Java等編程語(yǔ)言調(diào)用OCR服務(wù)API將圖片識(shí)別成文字,幫助用戶自動(dòng)采集關(guān)鍵數(shù)據(jù),打造智能化業(yè)務(wù)系統(tǒng),提升業(yè)務(wù)效率,API獲取詳情請(qǐng)參考《API參考》。
OCR還提供多種編程語(yǔ)言的SDK供您使用,SDK使用方法請(qǐng)參考《SDK參考》。
OCR平臺(tái)有哪些能力?
1、通用類 OCR:通用類OCR(General OCR),支持表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片上文字信息的自動(dòng)化識(shí)別,自適應(yīng)分析各種版面和表格,快速實(shí)現(xiàn)各種文檔電子化。
2、證件類 OCR:證件類OCR(Card OCR),支持身份證、駕駛證、行駛證、護(hù)照等證件圖片上有效信息的自動(dòng)識(shí)別和關(guān)鍵字段結(jié)構(gòu)化提取。
3、票據(jù)類 OCR:票據(jù)類OCR(Receipt OCR),支持增值稅發(fā)票、機(jī)動(dòng)車銷售發(fā)票、醫(yī)療發(fā)票等各種發(fā)票和表單圖片上有效信息的自動(dòng)識(shí)別和結(jié)構(gòu)化提取。
4、行業(yè)類 OCR:行業(yè)類OCR(Domain OCR),支持物流面單、醫(yī)療化驗(yàn)單據(jù)等多種行業(yè)特定類型圖片的結(jié)構(gòu)化信息提取和識(shí)別,助力行業(yè)自動(dòng)化效率提升。
5、定制模板 OCR:定制模板OCR(Custom OCR),支持用戶自定義識(shí)別模板,指定需要識(shí)別的關(guān)鍵字段,實(shí)現(xiàn)用戶特定格式圖片的自動(dòng)識(shí)別和結(jié)構(gòu)化提取。
首次使用文字識(shí)別OCR工具
如果您是首次使用文字識(shí)別OCR的用戶,建議您學(xué)習(xí)并了解如下信息:
1、功能介紹
通過(guò)功能介紹章節(jié)的內(nèi)容,了解文字識(shí)別OCR不同類別的功能,包括通用類文字識(shí)別、證件類文字識(shí)別、票據(jù)類文字識(shí)別。
2、入門使用
OCR以開(kāi)放API的方式提供給用戶,您可以參考《快速入門》學(xué)習(xí)并使用OCR服務(wù)。
3、使用方式
如果您是一個(gè)開(kāi)發(fā)工程師,熟悉代碼編寫(xiě),想要直接調(diào)用OCR服務(wù),您可以參考《API參考》或《SDK參考》獲取詳情。
4、由淺入深學(xué)習(xí)
您可以參考成長(zhǎng)地圖,由淺入深學(xué)習(xí)使用OCR。
華為云文字識(shí)別OCR有哪些功能?
文字識(shí)別OCR通用類功能介紹:
1、通用表格識(shí)別:提取表格內(nèi)的文字和所在行列位置信息,適應(yīng)不同格式的表格。同時(shí)也識(shí)別表格外部的文字區(qū)域。用于各種單據(jù)和報(bào)表的電子化,恢復(fù)結(jié)構(gòu)化信息。
2、通用文字識(shí)別:提取圖片內(nèi)的文字及其對(duì)應(yīng)位置信息,并能夠根據(jù)文字在圖片中的位置進(jìn)行結(jié)構(gòu)化整理工作。
3、手寫(xiě)文字識(shí)別:識(shí)別文檔中的手寫(xiě)文字信息,并將識(shí)別的結(jié)構(gòu)化結(jié)果返回給用戶。
4、網(wǎng)絡(luò)圖片識(shí)別:自動(dòng)識(shí)別網(wǎng)絡(luò)圖片內(nèi)的所有文字及其對(duì)應(yīng)位置信息,并能根據(jù)識(shí)別出來(lái)的結(jié)果進(jìn)行聯(lián)系人信息的提取,同時(shí)可供進(jìn)一步的數(shù)據(jù)挖掘后處理操作。
5、智能分類識(shí)別:自動(dòng)檢測(cè)定位圖片上指定要識(shí)別的票證,一次掃描即可識(shí)別票證的位置坐標(biāo)、結(jié)構(gòu)化識(shí)別的內(nèi)容以及對(duì)應(yīng)的類別。
文字識(shí)別OCR智能分類功能介紹:
智能分類識(shí)別服務(wù)可以一次性對(duì)同張圖片中的多個(gè)卡證、票據(jù)進(jìn)行檢測(cè)和識(shí)別,并返回每個(gè)卡證、票據(jù)的類別及結(jié)構(gòu)化數(shù)據(jù)。
文字識(shí)別OCR證件類功能介紹:
1、身份證識(shí)別:自動(dòng)識(shí)別身份證上的全部信息,支持身份證正反面識(shí)別,一次掃描即可識(shí)別身份證號(hào)碼、姓名、地址等全部信息,在暗光、傾斜、過(guò)曝光、陰影等異常條件下均可準(zhǔn)確識(shí)別身份證信息。
2、駕駛證識(shí)別:自動(dòng)識(shí)別駕駛證正頁(yè)與副頁(yè)上的全部信息,自動(dòng)提取出姓名、性別、領(lǐng)證日期、準(zhǔn)駕車型、有效期限、檔案編號(hào)等結(jié)構(gòu)化信息,在暗光、傾斜、過(guò)曝光、防偽標(biāo)志干擾、陰影等異常條件下均可準(zhǔn)確識(shí)別駕駛證信息。
3、行駛證識(shí)別:自動(dòng)識(shí)別行駛證正頁(yè)與副頁(yè)上的全部信息,自動(dòng)提取出號(hào)牌號(hào)碼、車輛類型、所有人、使用性質(zhì)、品牌型號(hào)、車輛識(shí)別代號(hào)、發(fā)動(dòng)機(jī)號(hào)碼、注冊(cè)日期、檔案編碼、核定載人數(shù)、總質(zhì)量、整備質(zhì)量、核定載質(zhì)量、外廓尺寸、準(zhǔn)牽引總質(zhì)量、備注、檢驗(yàn)記錄、條碼號(hào)等結(jié)構(gòu)化信息,在暗光、傾斜、過(guò)曝光、防偽標(biāo)志干擾、陰影等異常條件下均可準(zhǔn)確識(shí)別行駛證信息。
4、護(hù)照識(shí)別:針對(duì)中國(guó)護(hù)照,可識(shí)別護(hù)照上的全部信息;針對(duì)其他國(guó)家護(hù)照,可根據(jù)兩行國(guó)際標(biāo)準(zhǔn)化的機(jī)讀碼識(shí)別出6-7個(gè)關(guān)鍵字段信息,包括姓名、性別、出生日期、護(hù)照號(hào)碼、簽發(fā)國(guó)國(guó)家碼、護(hù)照有效期等。在暗光、傾斜、過(guò)曝光、陰影等異常條件下均可準(zhǔn)確識(shí)別護(hù)照信息。
5、營(yíng)業(yè)執(zhí)照識(shí)別:識(shí)別營(yíng)業(yè)執(zhí)照中的公司名稱、注冊(cè)號(hào)、法人代表、地址、注冊(cè)資本、營(yíng)業(yè)期限、經(jīng)營(yíng)范圍等字段。 在暗光,傾斜、水印等異常條件下均可正常識(shí)別執(zhí)照信息。
6、銀行卡識(shí)別:自動(dòng)識(shí)別銀行卡正面的信息,識(shí)別信息包括卡片類型(借記卡或信用卡)、銀行卡卡號(hào)、有效日期、發(fā)卡行、持卡人姓名(限信用卡)。省去手動(dòng)錄入過(guò)程。
文字識(shí)別OCR票據(jù)類功能介紹:
1、增值稅發(fā)票識(shí)別:通過(guò)對(duì)增值稅發(fā)票圖片預(yù)處理、表格提取、文字提取、文字識(shí)別、結(jié)構(gòu)化信息輸出等一系列技術(shù)化手段,快速將增值稅發(fā)票上的文字信息識(shí)別出來(lái),用于后續(xù)的進(jìn)一步處理,節(jié)省大量的人工錄入成本。
2、機(jī)動(dòng)車銷售發(fā)票識(shí)別:自動(dòng)識(shí)別機(jī)動(dòng)車銷售發(fā)票圖片內(nèi)的文本內(nèi)容,并返回結(jié)構(gòu)化字段信息,用于后續(xù)的進(jìn)一步處理,節(jié)省大量的人工錄入成本。
3、飛機(jī)行程單識(shí)別:自動(dòng)識(shí)別飛機(jī)行程單的全部信息,一次掃描即可識(shí)別旅客姓名、有效身份證件號(hào)碼、訂單號(hào)、票價(jià)等全部信息。
4、定額發(fā)票識(shí)別:自動(dòng)識(shí)別定額發(fā)票的全部信息,一次掃描即可識(shí)別發(fā)票號(hào)碼、發(fā)票代碼、地址、發(fā)票金額等全部信息。
5、火車票識(shí)別:自動(dòng)識(shí)別火車票的全部信息,一次掃描即可識(shí)別一張車票的ID、檢票口信息、車次等全部信息。
6、出租車發(fā)票識(shí)別:自動(dòng)識(shí)別出租車發(fā)票的全部信息,一次掃描即可識(shí)別歸屬地區(qū)、發(fā)票代碼、發(fā)票號(hào)碼、電話(包括電話、監(jiān)督電話)等全部信息。
文字識(shí)別OCR在線體驗(yàn)的計(jì)費(fèi)項(xiàng)有哪些?
按API調(diào)用次數(shù)計(jì)費(fèi),計(jì)費(fèi)價(jià)格請(qǐng)參見(jiàn)價(jià)格計(jì)算器。
只有調(diào)用成功才會(huì)計(jì)算調(diào)用次數(shù),其中返回的2xx狀態(tài)碼表示調(diào)用成功,調(diào)用失敗不計(jì)費(fèi)。
文字識(shí)別OCR的計(jì)費(fèi)模式:
按需計(jì)費(fèi):默認(rèn)計(jì)費(fèi)方式,指按照API調(diào)用次數(shù)收費(fèi),按次進(jìn)行結(jié)算。
套餐包計(jì)費(fèi):
1、相比“按需計(jì)費(fèi)”具有更大折扣。
2、套餐包有效期為1年,到期不會(huì)自動(dòng)順延,請(qǐng)?jiān)谟行趦?nèi)使用完。
3、套餐包到期后或套餐包使用完后,如果沒(méi)有及時(shí)續(xù)費(fèi)或購(gòu)買新的套餐包,系統(tǒng)將自動(dòng)轉(zhuǎn)為按需計(jì)費(fèi)方式。
4、套餐包費(fèi)用為一次性支付,即刻生效,暫不支持指定日期生效。
5、套餐包可疊加使用,如果您購(gòu)買了多個(gè)套餐包,則套餐包的扣減規(guī)則如下:
按照套餐包來(lái)源類型扣費(fèi),扣減優(yōu)先級(jí)由高到低為:免費(fèi)額度->套餐包計(jì)費(fèi)->按需計(jì)費(fèi)。
按套餐包創(chuàng)建、生效、失效時(shí)間扣費(fèi)。
多個(gè)套餐包,創(chuàng)建時(shí)間相同時(shí),優(yōu)先抵扣先生效的。
多個(gè)套餐包,生效時(shí)間相同時(shí),優(yōu)先抵扣先失效的。
多個(gè)套餐包,失效時(shí)間相同時(shí),優(yōu)先抵扣先創(chuàng)建的。