檢測到您已登錄華為云國際站賬號,為了您更好的體驗(yàn),建議您訪問國際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
文字識別-發(fā)票識別與驗(yàn)真 文字識別-發(fā)票識別與驗(yàn)真 查看部署指南 方案咨詢 該解決方案有何用途? 該解決方案基于華為云文字識別 OCR增值稅發(fā)票識別與發(fā)票驗(yàn)真技術(shù)構(gòu)建,自動識別和錄入增值稅發(fā)票各字段信息,減少人工核算工作量,實(shí)現(xiàn)財(cái)稅報(bào)銷自動化。同時(shí),自動接入國家稅務(wù)機(jī)關(guān)發(fā)票查驗(yàn)平
使用OCR服務(wù)是否必須使用華為云存儲圖片 文字識別服務(wù)支持輸入圖片的base64編碼或圖片的url路徑。 如果您使用圖片的url路徑,可以將圖片上傳至華為云對象存儲服務(wù)(OBS)中,使用OBS提供的圖片url。 關(guān)于OBS的使用請參考配置OBS訪問權(quán)限。 OCR識別OBS私有桶中
上傳模板圖片 在使用單模板工作流開發(fā)應(yīng)用之前,必須確保需要識別的圖片都屬于同一類型的模板。同一類模板的圖片,它們有相同的版面排布,且要識別的文字類型和位置均要求固定。如果您的圖片具有多種模板,請考慮使用“多模板工作流”。 確認(rèn)模板類型后,要準(zhǔn)備一張文字清晰的圖作為模板圖片,模板圖中要
OCR服務(wù)支持上傳圖片后直接導(dǎo)出結(jié)果嗎 目前OCR服務(wù)不支持上傳圖片后直接導(dǎo)出結(jié)果,需要通過調(diào)用API的方式使用。具體操作請參考《文字識別服務(wù)快速入門》。 父主題: 產(chǎn)品咨詢類
識別機(jī)動車銷售發(fā)票圖片中的文字內(nèi)容,并將識別的結(jié)果返回給用戶。該增值稅發(fā)票僅限于中華人民共和國境內(nèi)使用的增值稅發(fā)票。 火車票識別 識別火車票中的文字信息,并返回識別的結(jié)構(gòu)化結(jié)果。 營業(yè)執(zhí)照識別 識別營業(yè)執(zhí)照首頁圖片中的文字信息,并返回識別的結(jié)構(gòu)化結(jié)果。 身份證識別 識別身份證圖片
是否支持從非華為云存儲中讀取圖片 OCR服務(wù)支持讀取公網(wǎng)http和https的圖片地址,如果使用非華為云存儲,請確保相應(yīng)的圖片可以通過公網(wǎng)進(jìn)行訪問。 父主題: API使用類
1對1咨詢 通用類文字識別 表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片識別 支持表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片文字識別 1對1咨詢 智能分類文字識別 檢測定位圖片上指定要識別的票證的文字信息 表格的文字與表格信息識別,可轉(zhuǎn)換成能編輯的Excel 1對1咨詢 證件類文字識別 身份證、駕駛證、行駛
【AI技術(shù)】通用文字識別 高精度 ,能夠快速準(zhǔn)確識別各種網(wǎng)絡(luò)圖片中的不規(guī)則文字,支持手寫文字識別,在復(fù)雜字體和復(fù)雜背景的情況下仍保持非常高的識別準(zhǔn)確率。通用文字識別,能夠快速準(zhǔn)確識別各種網(wǎng)絡(luò)圖片中的不規(guī)則文字,支持手寫文字識別,在復(fù)雜字體和復(fù)雜背景的情況下仍保持非常高的識別準(zhǔn)確率,對網(wǎng)
名片識別 功能介紹 識別名片圖片上的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。支持對多種不同版式名片進(jìn)行結(jié)構(gòu)化信息提取。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 名片示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
圖解文字識別
整的端到端OCR流程: (1)準(zhǔn)備一張含有文字的原圖; (2)對原圖進(jìn)行文字位置的檢測,檢測結(jié)果可能是水平矩形框,也可能是傾斜矩形框; (3)從原圖中把文字框?qū)?yīng)的圖片切下來,并旋轉(zhuǎn)正,得到水平的文字塊切片圖; (4)對每個(gè)文字塊切片圖依次進(jìn)行字符識別,每個(gè)切片圖
駕駛證識別 功能介紹 識別駕駛證圖片中主頁與副頁的文字內(nèi)容,并將識別的結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 駕駛證示例圖 圖2 電子駕駛證示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制
文字塊的區(qū)域位置 文字塊的區(qū)域位置。 文字塊識別結(jié)果 文字塊識別結(jié)果。 圖片朝向 圖片朝向。 檢測到的文字塊數(shù)目 檢測到的文字塊數(shù)目。 身份證識別 識別身份證圖片中的文字內(nèi)容,并將識別的結(jié)果返回給用戶。 輸入?yún)?shù) 用戶配置身份證識別執(zhí)行動作,相關(guān)參數(shù)說明如表5所示。 表5 身份證識別輸入?yún)?shù)說明
智能分類識別 功能介紹 自動分類識別17+種票證,支持指定票證的結(jié)構(gòu)化識別和印章檢測,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。 接口以列表形式返回圖片上要識別票證的位置坐標(biāo)、結(jié)構(gòu)化識別的內(nèi)容以及對應(yīng)的類別。該接口支持的票證類型請見表1,該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。
認(rèn)證”。 圖1 統(tǒng)一身份認(rèn)證 單擊“創(chuàng)建用戶”,并設(shè)置IAM賬戶的用戶名、密碼,創(chuàng)建IAM用戶。 圖2 創(chuàng)建用戶 圖3 設(shè)置用戶名、密碼 給子賬戶授予權(quán)限請參考權(quán)限管理。 圖4 設(shè)置用戶組 開通服務(wù): 單擊“控制臺”>“服務(wù)列表”,找到“文字識別OCR”,進(jìn)入文字識別控制臺。 圖5
票據(jù)類 功能介紹 增值稅發(fā)票識別 通過對增值稅發(fā)票圖片預(yù)處理、表格提取、文字提取、文字識別、結(jié)構(gòu)化信息輸出等一系列技術(shù)化手段,快速將增值稅發(fā)票上的文字信息識別出來,用于后續(xù)的進(jìn)一步處理,節(jié)省大量的人工錄入成本。 機(jī)動車銷售發(fā)票識別 自動識別機(jī)動車銷售發(fā)票圖片內(nèi)的文本內(nèi)容,并返回結(jié)構(gòu)化
在服務(wù)編排設(shè)計(jì)頁面,從左側(cè)“連接器 > AI”中,拖拽“OCR”圖元至畫布中。 OCR是系統(tǒng)預(yù)置的,與OCR對接的接口。 圖7 拖拽OCR圖元到畫布中 選中組件,單擊,設(shè)置OCR對接信息。 圖8 設(shè)置基本信息 標(biāo)簽:圖元在頁面展示的名稱。 名稱:圖元在系統(tǒng)中的唯一標(biāo)識,不能和其他圖元相同。 連接器:服務(wù)編排使用的連接器的名稱。
行駛證識別 功能介紹 識別行駛證圖片中主頁和副頁的文字內(nèi)容,并將識別的結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 行駛證示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 只支持中國大陸行駛證的識別。
現(xiàn)了多種字體和手寫體文字識別機(jī),其識別精度和機(jī)器性能都基本上能滿足要求。如用于信函分揀的手寫體數(shù)字識別機(jī)和印刷體英文數(shù)字識別機(jī)。70年代主要研究文字識別的基本理論和研制高性能的文字識別機(jī),并著重于漢字識別的研究。
了。使用服務(wù): OCR通用文字識別服務(wù)如何解決: 軟件運(yùn)行于后臺,創(chuàng)建鉤子實(shí)時(shí)監(jiān)聽鼠標(biāo)右鍵動作,若判斷到出現(xiàn)圈題動作,程序?qū)⒆詣釉诤笈_定位到鼠標(biāo)圈住的坐標(biāo)區(qū)域,并且轉(zhuǎn)換為base64圖片編碼,接著調(diào)用華為云OCR通用文字識別服務(wù),實(shí)現(xiàn)圖片轉(zhuǎn)文字功能,接下來只需再次