檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
在服務(wù)編排設(shè)計頁面,從左側(cè)“連接器 > AI”中,拖拽“OCR”圖元至畫布中。 OCR是系統(tǒng)預(yù)置的,與OCR對接的接口。 圖7 拖拽OCR圖元到畫布中 選中組件,單擊,設(shè)置OCR對接信息。 圖8 設(shè)置基本信息 標(biāo)簽:圖元在頁面展示的名稱。 名稱:圖元在系統(tǒng)中的唯一標(biāo)識,不能和其他圖元相同。 連接器:服務(wù)編排使用的連接器的名稱。
基本概念、云服務(wù)簡介、專有名詞解釋: 文字識別服務(wù) OCR:文字識別(Optical Character Recognition,簡稱OCR)是指將圖片、掃描件或PDF、OFD文檔中的打印字符進(jìn)行檢測識別成可編輯的文本格式,以JSON格式返回識別結(jié)果。 對象存儲服務(wù) OBS:對象存儲服務(wù)(Object
當(dāng)然啦,從一張給定的圖片中識別文字肯定比從一份掃描文檔中識別文字要復(fù)雜的多。操作流程按照我們正常的理解,圖片文字識別的話通常會先將圖像掃描一遍,然后找出圖片中的文字信息,并重點關(guān)注這些文字區(qū)域,同時對區(qū)域中的文字進(jìn)行識別,當(dāng)正確讀出這些文字以后,將這些文字內(nèi)容顯示并記錄下來。聽
行駛證識別 功能介紹 識別行駛證圖片中主頁和副頁的文字內(nèi)容,并將識別的結(jié)果以JSON格式返回給用戶。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 行駛證示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 只支持中國大陸行駛證的識別。
使用流程簡介 文字識別是指對圖像中的打印字符進(jìn)行檢測識別,通過調(diào)用API,識別圖片中的文字,并返回JSON格式的識別結(jié)果。 使用流程 圖1 使用流程 使用前必讀 用戶需要具備編程能力,熟悉Java、Python、iOS、Android、Node.js編程語言。 OCR服務(wù)需要用戶通
現(xiàn)了多種字體和手寫體文字識別機(jī),其識別精度和機(jī)器性能都基本上能滿足要求。如用于信函分揀的手寫體數(shù)字識別機(jī)和印刷體英文數(shù)字識別機(jī)。70年代主要研究文字識別的基本理論和研制高性能的文字識別機(jī),并著重于漢字識別的研究。
Sliding Line Point Regression for Shape Robust Scene Text Detection扭曲形狀文字檢測:傳統(tǒng)文本檢測方法主要關(guān)注四邊形文本,為了檢測自然場景中任意形狀的文本,論文提出了新的方法——滑線點回歸SLPR。SLPR將文本行邊緣
一、通用文字識別技術(shù) 通用文字識別的核心技術(shù)是 OCR(Optical Character Recognition,光學(xué)字符識別)。OCR 是一種通過拍照、掃描等光學(xué)輸入方式,把各種票據(jù)、卡證、表格、報刊、書籍等印刷品文字轉(zhuǎn)化為圖像信息,再利用文字識別技術(shù)將圖像信息轉(zhuǎn)化為計算機(jī)等設(shè)備可以使用的字符信息的技術(shù)。
問:OCR服務(wù)識別結(jié)果可以轉(zhuǎn)化為Word或者TXT嗎?答:OCR提取之后返回的結(jié)果是JSON格式,需要用戶通過編程,將結(jié)果保存為Word或者TXT格式。
導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 護(hù)照示例圖 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 支持中國大陸護(hù)照的全字段識別。 支持含有完整機(jī)讀碼的中國-港澳臺地區(qū)及外國護(hù)照識別。 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像
靠的方式運(yùn)行。此外,按函數(shù)實際執(zhí)行資源計費(fèi),不執(zhí)行不產(chǎn)生費(fèi)用。 文字識別 OCR:提供在線文字識別服務(wù),將圖片或掃描件中的文字識別成可編輯的文本。OCR文字識別支持證件識別、票據(jù)識別、定制模板識別、通用表格文字識別等。
ON格式返回識別的結(jié)構(gòu)化結(jié)果。 手寫文字識別 識別手寫文字圖片中的文字內(nèi)容。 證件類 身份證識別 識別身份證圖片中正面與反面的文字內(nèi)容,并返回識別的文字和坐標(biāo)。 戶口本識別 識別戶口本中的文字信息,并返回識別的結(jié)構(gòu)化結(jié)果。 行駛證識別 識別行駛證圖片中主頁與副頁的文字內(nèi)容,并返回識別的文字和坐標(biāo)。
圖片區(qū)域,上傳本地的圖片作為測試圖片。 上傳圖片后,右側(cè)會顯示文字識別結(jié)果,包括“識別區(qū)”和對應(yīng)的“識別結(jié)果”。 上傳在線圖片 單擊“在線URL”,切換至“在線URL”頁簽。在“開始識別”左側(cè)輸出框中輸入待測試的圖片URL地址,或者拖拽測試圖片至虛線框內(nèi)上傳圖片區(qū)域,上傳在線圖片作為測試圖片。
方式: OCR體驗館:直接在網(wǎng)頁上傳圖片,系統(tǒng)自動返回識別后的文本。 如果您沒有開發(fā)基礎(chǔ),想快速體驗OCR服務(wù),OCR體驗館提供了在線網(wǎng)頁調(diào)用方式,該方式無需編碼,直接在網(wǎng)頁上傳圖片,即可返回識別結(jié)果。 華為云API Explorer:使用華為云API調(diào)試工具調(diào)用OCR服務(wù)。 如
1.2.8 文字識別計算機(jī)文字識別,俗稱光學(xué)字符識別(Optical Character Recognition),是利用光學(xué)掃描技術(shù)將票據(jù)、報刊、書籍、文稿及其他印刷品的文字轉(zhuǎn)化為圖像信息,再利用文字識別技術(shù)將圖像信息轉(zhuǎn)化為可以使用的計算機(jī)輸入技術(shù)。該技術(shù)可應(yīng)用于如表1-4所示
如何選購合適的API 文字識別服務(wù)(OCR)提供四種類型的API:通用類、證件類、票據(jù)類、智能分類。 通用類 通用表格識別:提取表格內(nèi)的文字和所在行列位置信息。 通用文字識別:提取圖片內(nèi)的文字及其對應(yīng)位置信息。 手寫文字識別:識別手寫文字、印刷文字信息。 網(wǎng)絡(luò)圖片識別:識別網(wǎng)絡(luò)圖片內(nèi)的所有文字及其對應(yīng)位置信息。
文字識別:一般包括文字信息的采集、信息的分析與處理、信息的分類判別等幾個部分。信息采集 將紙面上的文字灰度變換成電信號,輸入到計算機(jī)中去。信息采集由文字識別機(jī)中的送紙機(jī)構(gòu)和光電變換裝置來實現(xiàn),有飛點掃描、攝像機(jī)、光敏元件和激光掃描等光電變換裝置。信息分析和處理 對變換后的電信號消
增值稅發(fā)票識別 功能介紹 識別增值稅發(fā)票的類別,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果,支持識別圖片、PDF、OFD文件。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 發(fā)票驗真API請參見發(fā)票驗真。 圖1 增值稅發(fā)票示例圖 圖2 區(qū)塊鏈發(fā)票示例圖 圖3 全電發(fā)票示例圖(專用發(fā)票)
了圖片中的文字塊數(shù)目、文字塊排列順序、具體文本內(nèi)容、所在位置、置信度等信息。 result字段僅在API調(diào)用成功后返回。 words_block_count表示文字塊識別結(jié)果,本示例中,識別出2個文字塊,分別代表圖片中的2行文字。 words_block_list表示文字塊列表,按照圖片文字從上到下、從左到右排列。
size的大小workers8int是是workers的數(shù)量height64int是是網(wǎng)絡(luò)輸入圖片的高度width256int是是網(wǎng)絡(luò)輸入圖片的寬度voc_typeALLCASES_SYMBOLSString是否表示識別的類別包括大小寫字母數(shù)字以及標(biāo)點符號archResNet_ASTERStrin