檢測(cè)到您已登錄華為云國(guó)際站賬號(hào),為了您更好的體驗(yàn),建議您訪(fǎng)問(wèn)國(guó)際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
OCR的發(fā)票識(shí)別以及發(fā)票驗(yàn)真技術(shù)構(gòu)建,可幫助企業(yè)快速使用AI技術(shù)實(shí)現(xiàn)發(fā)票報(bào)銷(xiāo)的自動(dòng)化處理流程。該解決方案部署架構(gòu)如下圖所示: 圖1 方案架構(gòu)圖 該解決方案會(huì)部署如下資源: 創(chuàng)建用于上傳發(fā)票的對(duì)象存儲(chǔ)服務(wù) OBS桶,企業(yè)業(yè)務(wù)系統(tǒng)將員工報(bào)銷(xiāo)的發(fā)票圖片或者電子發(fā)票P(pán)DF文件上傳到該桶。 創(chuàng)
§01 掃描圖片 在 對(duì)于七段數(shù)碼數(shù)字模型進(jìn)行改進(jìn):一個(gè)關(guān)鍵的數(shù)字1的問(wèn)題 中訓(xùn)練了一款具有更好泛化特性的網(wǎng)絡(luò)模型,下面測(cè)試一下它對(duì)于圖片的一維,二維掃描的情況。為: 找到更好的圖片分割的方法;實(shí)現(xiàn)圖片中特定對(duì)象定位; 給出實(shí)驗(yàn)基礎(chǔ)。 ▲ 圖 掃描識(shí)別對(duì)象
章節(jié)。 圖1 通用文字示例圖 約束與限制 只支持識(shí)別PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD、PDF格式圖片。 圖像各邊的像素大小在15px到30000px之間,圖像高*寬的總像素?cái)?shù)不能大于1.6億。單個(gè)圖片、PDF文件其對(duì)應(yīng)的Base64編碼不超過(guò)10MB。
約束與限制 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。 圖像中火車(chē)票區(qū)域有效占比超過(guò)25%。 支持圖像中火車(chē)票任意角度的水平旋轉(zhuǎn)。 支持少量扭曲,扭曲后圖像中的火車(chē)票長(zhǎng)寬比與實(shí)際火車(chē)票相差不超過(guò)10%。
礎(chǔ)設(shè)施,函數(shù)以彈性、免運(yùn)維、高可靠的方式運(yùn)行。此外,按函數(shù)實(shí)際執(zhí)行資源計(jì)費(fèi),不執(zhí)行不產(chǎn)生費(fèi)用。 文字識(shí)別 OCR:提供在線(xiàn)文字識(shí)別服務(wù),將圖片或掃描件中的文字識(shí)別成可編輯的文本。OCR文字識(shí)別支持證件識(shí)別、票據(jù)識(shí)別、定制模板識(shí)別、通用表格文字識(shí)別等。
保障用戶(hù)訓(xùn)練作業(yè)的長(zhǎng)穩(wěn)運(yùn)行 提供訓(xùn)練作業(yè)斷點(diǎn)續(xù)訓(xùn)與增量訓(xùn)練能力,即使訓(xùn)練因某些原因中斷,也可以基于checkpoint接續(xù)訓(xùn)練,保障需要長(zhǎng)時(shí)間訓(xùn)練的模型的穩(wěn)定性和可靠性,避免重新開(kāi)始訓(xùn)練耗費(fèi)的時(shí)間與計(jì)算成本 支持訓(xùn)練數(shù)據(jù)使用SFS Turbo文件系統(tǒng)進(jìn)行數(shù)據(jù)掛載,訓(xùn)練作業(yè)產(chǎn)生的中間和結(jié)果等數(shù)據(jù)可以直接高速寫(xiě)入到SFS
Boolean 是否校正圖片的傾斜角度,可選值如下。 true:校正圖片的傾斜角度 false:不校正圖片的傾斜角度 支持任意角度的校正,未傳入該參數(shù)時(shí)默認(rèn)為“false”。 待識(shí)別圖片如果存在傾斜,建議將此參數(shù)設(shè)置為“true”。 響應(yīng)參數(shù) 根據(jù)識(shí)別的結(jié)果,可能有不同的HTTP響應(yīng)狀態(tài)碼(status
解讀識(shí)別結(jié)果 本章節(jié)通過(guò)網(wǎng)絡(luò)圖片識(shí)別API介紹如何解讀調(diào)API返回的JSON格式識(shí)別結(jié)果。請(qǐng)參照API參考“響應(yīng)參數(shù)”章節(jié)比對(duì)查看。 以下圖識(shí)別結(jié)果為例,講解圖片內(nèi)容如何與API的返回字段對(duì)應(yīng)。 調(diào)用網(wǎng)絡(luò)圖片API成功后,在“JSON返回結(jié)果”中,可見(jiàn)result字段,該字段包含
圖片質(zhì)量類(lèi)報(bào)錯(cuò)處理辦法 問(wèn)題現(xiàn)象 調(diào)用文字識(shí)別API時(shí),產(chǎn)生以下圖片質(zhì)量類(lèi)報(bào)錯(cuò)。 錯(cuò)誤碼AIS.0102:圖片格式不支持。 錯(cuò)誤碼AIS.0103:圖片尺寸不滿(mǎn)足要求。 錯(cuò)誤碼AIS.0104:非支持的圖片類(lèi)型或圖片質(zhì)量差。 解決方法 請(qǐng)參考產(chǎn)品介紹 > 約束與限制章節(jié)檢查圖片的格式、像素是否符合規(guī)范。
登錄華為云對(duì)象存儲(chǔ)服務(wù)控制臺(tái),查看自動(dòng)創(chuàng)建的OBS桶列表: 圖1 對(duì)象存儲(chǔ)服務(wù)控制臺(tái) 選擇用于上傳和存儲(chǔ)發(fā)票圖片或者PDF文件的桶“ocr-invoice-recognition-and-verification-image”,上傳示例發(fā)票圖片或者電子發(fā)票pdf文件: 圖2 上傳待識(shí)別發(fā)票 選擇用于存放結(jié)果的“oc
0元/GB-秒 400,000 GB/秒以上 :0.00011108元/GB-秒 0元 文字識(shí)別 OCR 區(qū)域:華東-上海一 計(jì)費(fèi)模式:按需計(jì)費(fèi) 服務(wù)類(lèi)型: 網(wǎng)絡(luò)圖片識(shí)別 0.05元/次 電子面單識(shí)別 0.08元/次 50+80 = 130元 總計(jì): - 130.1490元
基于收集到的業(yè)務(wù)圖片進(jìn)行標(biāo)注并上傳到對(duì)象存儲(chǔ)服務(wù) 階段二 使用工作流訓(xùn)練模型:使用零售陳列工作流,基于上階段標(biāo)注好的SKU數(shù)據(jù)進(jìn)行工作流參數(shù)配置,一鍵訓(xùn)練具體業(yè)務(wù)場(chǎng)景下的模型。 階段三 部署模型生成調(diào)用接口:將訓(xùn)練好后的模型部署在云側(cè),并調(diào)用部署好的推理服務(wù)API接口 交付與使用
約束與限制 只支持識(shí)別PNG、JPG、JPEG、BMP、TIFF格式圖片。 圖像各邊的像素大小在15px到8192px之間。單個(gè)圖片對(duì)應(yīng)的Base64編碼不超過(guò)10MB。 圖像中名片的有效占比超過(guò)60%,保證整張名片內(nèi)容包含在圖像內(nèi)。 支持圖像中名片的任意角度的水平旋轉(zhuǎn)(需開(kāi)啟方向檢測(cè))。
如何獲取圖片的base64編碼 本節(jié)以Python為例,介紹如何將本地圖片,轉(zhuǎn)換為base64編碼。您也可以使用在線(xiàn)的圖片轉(zhuǎn)base64工具。 使用時(shí),需要將代碼的d:\demo.jpg替換為實(shí)際圖片路徑。 import base64 with open("d:\demo.jpg"
證件類(lèi) 證件類(lèi) 證件類(lèi)OCR(Card OCR),支持身份證識(shí)別、行駛證識(shí)別、駕駛證識(shí)別、護(hù)照識(shí)別、銀行卡識(shí)別、營(yíng)業(yè)執(zhí)照識(shí)別、名片識(shí)別、車(chē)牌識(shí)別、VIN碼識(shí)別、道路運(yùn)輸證識(shí)別、道路運(yùn)輸從業(yè)資格證識(shí)別等卡證圖片上有效信息的自動(dòng)識(shí)別和關(guān)鍵字段結(jié)構(gòu)化提取。 證件類(lèi)OCR(Card OCR)
可完成。 當(dāng)訓(xùn)練作業(yè)的狀態(tài)變更為“已完成”時(shí),表示已運(yùn)行結(jié)束。 您可以單擊訓(xùn)練作業(yè)名稱(chēng),進(jìn)入詳情頁(yè)面,了解訓(xùn)練作業(yè)的“配置信息”、“日志”、“資源占用情況”和“評(píng)估結(jié)果”等信息。您也可以在配置的“訓(xùn)練輸出位置”對(duì)應(yīng)的OBS目錄下獲得訓(xùn)練生成的模型。 步驟4:創(chuàng)建AI應(yīng)用 在訓(xùn)練作
架陳列圖片和地堆商品陳列圖片的翻拍情況,可有效降低人工審核人力,提降低市場(chǎng)費(fèi)用利用,促進(jìn)“人貨場(chǎng)”的結(jié)構(gòu)優(yōu)化,助力企業(yè)降低成本、提升效率 方案咨詢(xún) 方案介紹 讓企業(yè)更放心 使用場(chǎng)景 商品翻拍圖片識(shí)別 支持識(shí)別商品貨架陳列圖片和地堆商品陳列圖片的翻拍圖片 線(xiàn)下門(mén)店簽到作弊識(shí)別 精準(zhǔn)
單擊“下一步”。 圖4 資源棧設(shè)置 在配置確認(rèn)界面中,單擊“創(chuàng)建執(zhí)行計(jì)劃”。 圖5 配置確認(rèn) 在彈出的創(chuàng)建執(zhí)行計(jì)劃框中,自定義填寫(xiě)執(zhí)行計(jì)劃名稱(chēng),單擊“確定”。 圖6 創(chuàng)建執(zhí)行計(jì)劃 單擊“部署”,并且在彈出的執(zhí)行計(jì)劃確認(rèn)框中單擊“執(zhí)行”。 圖7 執(zhí)行計(jì)劃 圖8 執(zhí)行計(jì)劃確認(rèn) 待“事件”中出現(xiàn)“Apply
容及其邊緣包含在圖像內(nèi)。 支持圖像中行駛證任意角度的水平旋轉(zhuǎn)。 支持少量扭曲,扭曲后圖像中的行駛證長(zhǎng)寬比與實(shí)際行駛證相差不超過(guò)10%。 能處理反光、暗光、防偽標(biāo)識(shí)等干擾的圖片但影響識(shí)別精度。 目前只支持識(shí)別2008年版的行駛證和電子行駛證。 僅支持紙質(zhì)行駛證的框內(nèi)遮擋、邊框完整性告警檢測(cè)。
OBS的語(yǔ)音文件識(shí)別成可編輯的文本,支持中文普通話(huà)的識(shí)別和合成,其中語(yǔ)音識(shí)別還支持帶方言口音的普通話(huà)識(shí)別以及方言(四川話(huà)、粵語(yǔ)和上海話(huà))的識(shí)別。適用于如下場(chǎng)景:識(shí)別客服、客戶(hù)的語(yǔ)音,進(jìn)一步通過(guò)文本檢索,檢查有沒(méi)有違規(guī)、敏感詞、電話(huà)號(hào)碼等信息。對(duì)會(huì)議記錄的音頻文件,進(jìn)行快速的識(shí)別,轉(zhuǎn)化成文字,方便進(jìn)行會(huì)議記錄等場(chǎng)景。