一、獲取網(wǎng)頁
構(gòu)造一個(gè)請(qǐng)求并發(fā)送給服務(wù)器;接收到響應(yīng)(頁面源代碼)并將其解析出來。
二、提取信息
網(wǎng)頁的結(jié)構(gòu)有一定的規(guī)則,采用正則表達(dá)式提?。皇褂肦equests庫,我們可以高效快速地從中提取網(wǎng)頁信息。
三、保存數(shù)據(jù)
將提取到的數(shù)據(jù)保存到某處以便后續(xù)使用;保存形式有多種多樣,可以保存到文本或者 數(shù)據(jù)庫 。
最新文章
- 工作負(fù)載_云容器引擎_什么是工作負(fù)載
- 如何使用模板創(chuàng)建函數(shù)_模板創(chuàng)建函數(shù)_函數(shù)工作流 FunctionGraph-華為云
- 什么是函數(shù)工作流_functiongraph是什么_函數(shù)工作流服務(wù)
- 函數(shù)工作流可以做什么_函數(shù)工作流有什么優(yōu)勢(shì)_函數(shù)工作流 FunctionGraph-華為云
- 彈性負(fù)載均衡ELB入門_彈性負(fù)載均衡作用_彈性負(fù)載均衡如何工作
- 什么是函數(shù)工作流_函數(shù)托管計(jì)算服務(wù)_函數(shù)工作流 FunctionGraph-華為云