檢測到您已登錄華為云國際站賬號,為了您更好的體驗(yàn),建議您訪問國際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
如何選購合適的API 文字識別服務(wù)(OCR)提供四種類型的API:通用類、證件類、票據(jù)類、智能分類。 通用類 通用表格識別:提取表格內(nèi)的文字和所在行列位置信息。 通用文字識別:提取圖片內(nèi)的文字及其對應(yīng)位置信息。 手寫文字識別:識別手寫文字、印刷文字信息。 網(wǎng)絡(luò)圖片識別:識別網(wǎng)絡(luò)圖片內(nèi)的所有文字及其對應(yīng)位置信息。
圖片中的文字塊數(shù)目、文字塊排列順序、具體文本內(nèi)容、所在位置、置信度等信息。 result字段僅在API調(diào)用成功后返回。 words_block_count表示文字塊識別結(jié)果,本示例中,識別出2個(gè)文字塊,分別代表圖片中的2行文字。 words_block_list表示文字塊列表,按照圖片文字從上到下、從左到右排列。
對于營業(yè)廳標(biāo)準(zhǔn)格式模板的合同,ModelArts有套件支持自定義模板嗎?
護(hù)照識別 - RecognizePassport 功能介紹 識別護(hù)照首頁圖片中的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。 當(dāng)前版本支持2012年及以后發(fā)行的中國普通電子護(hù)照的全字段識別。中國-港澳臺地區(qū)、外國護(hù)照支持護(hù)照下方兩行國際標(biāo)準(zhǔn)化的機(jī)讀碼識別,并可從中提取7個(gè)關(guān)鍵
就決定了在手寫字符的識別中單一方案不會(huì)得到很好的識別效果。試卷客觀題的評閱中,大多只包含A、B、C、D四個(gè)字符,字符個(gè)數(shù)少,僅對A~D四個(gè)字符進(jìn)行識別能夠得到較好的閱卷效率及較高的正確識別率。針對手寫英文字母的特點(diǎn)及應(yīng)用場景,本文提出一種基于組合特征的手寫英文字母識別方法。該方法
參考表16。 表16 文字識別輸出參數(shù)說明 參數(shù) 說明 識別文字塊列表 識別文字塊列表,輸出順序從左到右,先上后下。 文字塊識別結(jié)果 文字塊識別結(jié)果。 手寫文字識別 識別文檔中的手寫文字信息,并將識別的結(jié)構(gòu)化結(jié)果返回給用戶。 輸入?yún)?shù) 用戶配置手寫文字識別執(zhí)行動(dòng)作,相關(guān)參數(shù)說明如表17所示。
需要的識別功能,支持印刷體識別,手寫體識別,族譜識別。 通過云脈文檔云識別軟件您可以體驗(yàn)族譜識別技術(shù),同時(shí)云脈提供族譜識別SDK的定制開發(fā),適用于各類族譜、古文、生僻文字識別,以及手寫體圖像識別。有了它,即使是潦草的手寫族譜信息也能夠識別,并接近人工識別水平,通過族譜識別和智能排版,可以大大提高效率了修譜效率。
錯(cuò)誤。 return_text_location 否 Boolean 識別到的文字塊的區(qū)域位置信息。可選值包括: true:返回各個(gè)文字塊區(qū)域 false:不返回各個(gè)文字塊區(qū)域 如果無該參數(shù),系統(tǒng)默認(rèn)不返回文字塊區(qū)域。如果輸入?yún)?shù)不是Boolean類型,則會(huì)報(bào)非法參數(shù)錯(cuò)誤。 re
發(fā)票識別與驗(yàn)真 方案概述 資源和成本規(guī)劃 實(shí)施步驟
就決定了在手寫字符的識別中單一方案不會(huì)得到很好的識別效果。試卷客觀題的評閱中,大多只包含A、B、C、D四個(gè)字符,字符個(gè)數(shù)少,僅對A~D四個(gè)字符進(jìn)行識別能夠得到較好的閱卷效率及較高的正確識別率。針對手寫英文字母的特點(diǎn)及應(yīng)用場景,本文提出一種基于組合特征的手寫英文字母識別方法。該方法
type 請求類型區(qū)分:1. 手寫軌跡識別2. 獲取聯(lián)想字 lang 中文簡體:chns;中文繁體:chnt;英文:en;法語:fr; 德語:de;意大利語:it;日語:ja;韓語:kr;西班牙語:es;葡萄牙語 data 當(dāng)type=1時(shí),請傳入手寫軌跡串:x1,y1,x2,y2
智能分類識別 - RecognizeAutoClassification 功能介紹 自動(dòng)分類識別17+種票證,支持指定票證的結(jié)構(gòu)化識別和印章檢測,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。 接口以列表形式返回圖片上要識別票證的位置坐標(biāo)、結(jié)構(gòu)化識別的內(nèi)容以及對應(yīng)的類別。該接口支持的票證
道路運(yùn)輸從業(yè)資格證識別 - RecognizeTransportationLicense 功能介紹 識別道路運(yùn)輸從業(yè)資格證上的關(guān)鍵文字信息,并返回識別的結(jié)構(gòu)化結(jié)果。 圖1 道路運(yùn)輸從業(yè)資格證示例圖 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各
名片識別 - RecognizeBusinessCard 功能介紹 識別名片圖片上的文字信息,并以JSON格式返回識別的結(jié)構(gòu)化結(jié)果。支持對多種不同版式名片進(jìn)行結(jié)構(gòu)化信息提取。該接口的使用限制請參見約束與限制,詳細(xì)使用指導(dǎo)請參見OCR服務(wù)使用簡介章節(jié)。 圖1 名片示例圖 約束與限制
擊操作列“部署>在線服務(wù)”,將模型部署為在線服務(wù)。 在 “部署”頁面,參考 圖4填寫參數(shù),然后根據(jù)界面提示完成在線服務(wù)創(chuàng)建。 圖4 部署模型 預(yù)測結(jié)果 完成模型部署后,等待服務(wù)部署完成,當(dāng)服務(wù)狀態(tài)顯示為“運(yùn)行中”,表示服務(wù)已部署成功。 在“在線服務(wù)”頁面,單擊在線服務(wù)名稱,進(jìn)入服務(wù)詳情頁面。
可見 ch_ppocr_server_v2.0_rec_infer_bs1.om 離線模型已生成。 下載手寫漢字?jǐn)?shù)據(jù)集 mkdir dataset 瀏覽器 下載 https://mindx.sdk.obs.cn-north-4.myhuaweicloud
其實(shí)現(xiàn)的功能是首先能夠識別用戶輸入的手寫數(shù)字,并提取輸入數(shù)字的特征;然后將得到的手寫數(shù)字特征加上對應(yīng)數(shù)字的標(biāo)簽,將其存入樣本庫中,用于后面手寫數(shù)字的對比識別;最后根據(jù)用戶輸入的手寫數(shù)字,提取特征并在樣本庫中根據(jù)貝葉斯決策來判斷手寫數(shù)字的類型,最后顯示識別結(jié)果。主要分為以下四個(gè)步驟:
保險(xiǎn)單識別 - RecognizeInsurancePolicy 功能介紹 識別保險(xiǎn)單圖片上的文字信息,并將識別的結(jié)構(gòu)化結(jié)果返回給用戶。支持對多板式保險(xiǎn)單的掃描圖片及手機(jī)照片進(jìn)行結(jié)構(gòu)化信息提取。 約束與限制 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊
設(shè)置用戶名、密碼 給子賬戶授予權(quán)限請參考權(quán)限管理。 圖4 設(shè)置用戶組 開通服務(wù): 單擊“控制臺”>“服務(wù)列表”,找到“文字識別OCR”,進(jìn)入文字識別控制臺。 圖5 文字識別控制臺 在文字識別控制臺“總覽”頁面,選擇對應(yīng)產(chǎn)品的“終端節(jié)點(diǎn)”。不同區(qū)域OCR產(chǎn)品部署情況請參考終端節(jié)點(diǎn)。 圖6 終端節(jié)點(diǎn)
支持整頁,中文、英文、數(shù)字混合書寫,即寫即現(xiàn)。采用自主研發(fā)的識別算法,對手寫設(shè)備上書寫時(shí)產(chǎn)生的整篇有序軌跡信息化轉(zhuǎn)化為整篇文字的過程,支持混合文字輸入,為用戶提供更加高效、自然的錄入方式。多場景,高精度,即寫即現(xiàn)。