檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
使用OCR服務(wù)是否必須使用華為云存儲圖片 文字識別服務(wù)支持輸入圖片的base64編碼或圖片的url路徑。 如果您使用圖片的url路徑,可以將圖片上傳至華為云對象存儲服務(wù)(OBS)中,使用OBS提供的圖片url。 關(guān)于OBS的使用請參考配置OBS訪問權(quán)限。 OCR識別OBS私有桶中
OCR服務(wù)支持上傳圖片后直接導(dǎo)出結(jié)果嗎 目前OCR服務(wù)不支持上傳圖片后直接導(dǎo)出結(jié)果,需要通過調(diào)用API的方式使用。具體操作請參考《文字識別服務(wù)快速入門》。 父主題: 產(chǎn)品咨詢類
文字識別-發(fā)票識別與驗真 文字識別-發(fā)票識別與驗真 查看部署指南 方案咨詢 該解決方案有何用途? 該解決方案基于華為云文字識別 OCR增值稅發(fā)票識別與發(fā)票驗真技術(shù)構(gòu)建,自動識別和錄入增值稅發(fā)票各字段信息,減少人工核算工作量,實現(xiàn)財稅報銷自動化。同時,自動接入國家稅務(wù)機(jī)關(guān)發(fā)票查驗平
是否支持從非華為云存儲中讀取圖片 OCR服務(wù)支持讀取公網(wǎng)http和https的圖片地址,如果使用非華為云存儲,請確保相應(yīng)的圖片可以通過公網(wǎng)進(jìn)行訪問。 父主題: API使用類
【AI技術(shù)】通用文字識別 高精度 ,能夠快速準(zhǔn)確識別各種網(wǎng)絡(luò)圖片中的不規(guī)則文字,支持手寫文字識別,在復(fù)雜字體和復(fù)雜背景的情況下仍保持非常高的識別準(zhǔn)確率。通用文字識別,能夠快速準(zhǔn)確識別各種網(wǎng)絡(luò)圖片中的不規(guī)則文字,支持手寫文字識別,在復(fù)雜字體和復(fù)雜背景的情況下仍保持非常高的識別準(zhǔn)確率,對網(wǎng)
文字識別的監(jiān)控指標(biāo) 功能說明 本節(jié)定義了文字識別服務(wù)上報云監(jiān)控服務(wù)的監(jiān)控指標(biāo)的命名空間,監(jiān)控指標(biāo)列表和維度定義,用戶可以通過云監(jiān)控服務(wù)提供管理控制臺或API接口來檢索文字識別服務(wù)產(chǎn)生的監(jiān)控指標(biāo)和告警信息。 命名空間 SYS.OCR 監(jiān)控指標(biāo)詳情 表1 OCR支持的監(jiān)控指標(biāo) 指標(biāo)ID
名片識別 功能介紹 識別名片圖片上的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。支持對多種不同版式名片進(jìn)行結(jié)構(gòu)化信息提取。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 名片示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
駕駛證識別 功能介紹 識別駕駛證圖片中主頁與副頁的文字內(nèi)容,并將識別的結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 駕駛證示例圖 圖2 電子駕駛證示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制
填寫連接器的描述信息,用于識別不同的連接器。 支持的操作 通用表格識別 通用文字識別 網(wǎng)絡(luò)圖片識別 智能分類識別 手寫文字識別 身份證識別 行駛證識別 駕駛證識別 護(hù)照識別 銀行卡識別 營業(yè)執(zhí)照識別 道路運輸證識別 車牌識別 名片識別 VIN碼識別 增值稅發(fā)票識別 發(fā)票驗真 機(jī)動車銷售發(fā)票識別 出租車發(fā)票識別
1對1咨詢 通用類文字識別 表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片識別 支持表格、文檔、網(wǎng)絡(luò)圖片等任意格式圖片文字識別 1對1咨詢 智能分類文字識別 檢測定位圖片上指定要識別的票證的文字信息 表格的文字與表格信息識別,可轉(zhuǎn)換成能編輯的Excel 1對1咨詢 證件類文字識別 身份證、駕駛證、行駛
智能分類識別 功能介紹 自動分類識別17+種票證,支持指定票證的結(jié)構(gòu)化識別和印章檢測,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。 接口以列表形式返回圖片上要識別票證的位置坐標(biāo)、結(jié)構(gòu)化識別的內(nèi)容以及對應(yīng)的類別。該接口支持的票證類型請見表1,該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。
在服務(wù)編排設(shè)計頁面,從左側(cè)“連接器 > AI”中,拖拽“OCR”圖元至畫布中。 OCR是系統(tǒng)預(yù)置的,與OCR對接的接口。 圖7 拖拽OCR圖元到畫布中 選中組件,單擊,設(shè)置OCR對接信息。 圖8 設(shè)置基本信息 標(biāo)簽:圖元在頁面展示的名稱。 名稱:圖元在系統(tǒng)中的唯一標(biāo)識,不能和其他圖元相同。 連接器:服務(wù)編排使用的連接器的名稱。
行駛證識別 功能介紹 識別行駛證圖片中主頁和副頁的文字內(nèi)容,并將識別的結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 行駛證示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 只支持中國大陸行駛證的識別。
當(dāng)然啦,從一張給定的圖片中識別文字肯定比從一份掃描文檔中識別文字要復(fù)雜的多。操作流程按照我們正常的理解,圖片文字識別的話通常會先將圖像掃描一遍,然后找出圖片中的文字信息,并重點關(guān)注這些文字區(qū)域,同時對區(qū)域中的文字進(jìn)行識別,當(dāng)正確讀出這些文字以后,將這些文字內(nèi)容顯示并記錄下來。聽
在線調(diào)試 API Explorer在線調(diào)試工具提供API的檢索、調(diào)試、代碼示例生成功能。同時,集成開發(fā)環(huán)境CloudIDE,可完成代碼的構(gòu)建、調(diào)試、運行。 本章節(jié)以通用文字識別為例,介紹如何使用API Explorer調(diào)試API。 前提條件 注冊華為賬號并開通華為云,并完成實名認(rèn)
識別機(jī)動車銷售發(fā)票圖片中的文字內(nèi)容,并將識別的結(jié)果返回給用戶。該增值稅發(fā)票僅限于中華人民共和國境內(nèi)使用的增值稅發(fā)票。 火車票識別 識別火車票中的文字信息,并返回識別的結(jié)構(gòu)化結(jié)果。 營業(yè)執(zhí)照識別 識別營業(yè)執(zhí)照首頁圖片中的文字信息,并返回識別的結(jié)構(gòu)化結(jié)果。 身份證識別 識別身份證圖片
提取圖片中的文字暗水印 功能介紹 對已嵌入文字暗水印的圖片進(jìn)行水印提取,用戶以formData的格式傳入待提取水印的圖片,DSC服務(wù)以JSON的格式返回從圖片里提取的出的文字暗水印。目前支持的圖片格式為:*.jpg, *.bmp, *.png, *.jpeg, *.tiff, *
如何選購合適的API 文字識別服務(wù)(OCR)提供四種類型的API:通用類、證件類、票據(jù)類、智能分類。 通用類 通用表格識別:提取表格內(nèi)的文字和所在行列位置信息。 通用文字識別:提取圖片內(nèi)的文字及其對應(yīng)位置信息。 手寫文字識別:識別手寫文字、印刷文字信息。 網(wǎng)絡(luò)圖片識別:識別網(wǎng)絡(luò)圖片內(nèi)的所有文字及其對應(yīng)位置信息。
認(rèn)證”。 圖1 統(tǒng)一身份認(rèn)證 單擊“創(chuàng)建用戶”,并設(shè)置IAM賬戶的用戶名、密碼,創(chuàng)建IAM用戶。 圖2 創(chuàng)建用戶 圖3 設(shè)置用戶名、密碼 給子賬戶授予權(quán)限請參考權(quán)限管理。 圖4 設(shè)置用戶組 開通服務(wù): 單擊“控制臺”>“服務(wù)列表”,找到“文字識別OCR”,進(jìn)入文字識別控制臺。 圖5
票據(jù)類 功能介紹 增值稅發(fā)票識別 通過對增值稅發(fā)票圖片預(yù)處理、表格提取、文字提取、文字識別、結(jié)構(gòu)化信息輸出等一系列技術(shù)化手段,快速將增值稅發(fā)票上的文字信息識別出來,用于后續(xù)的進(jìn)一步處理,節(jié)省大量的人工錄入成本。 機(jī)動車銷售發(fā)票識別 自動識別機(jī)動車銷售發(fā)票圖片內(nèi)的文本內(nèi)容,并返回結(jié)構(gòu)化