文章 > Python爬虫 > python爬数据教程

python爬数据教程

头像

小妮浅浅

2021-03-20 09:35:47854浏览 · 0收藏 · 0评论

1、爬取过程

(1)用python实现请求一个网页的功能。

(2)用python实现解析请求到的网页的功能。

(3)用python实现保存数据的功能。

2、爬数据实例

在提取数据的过程中,会用到熟悉的BeautifulSoup库。其中find()方法比较常用。

# 使用find()方法提取数据例子:
 
import requests
# 引入requests库
from bs4 import BeautifulSoup
# 引入bs库
 
res = requests.get('https:www.example.com')
# 获取https:www.example.com网页信息
print(res.status_code)
# 检查请求是否成功
string = res.text
# 将数据转换为字符串格式
soup = BeautifulSoup(string,'html.parser')
# 解析数据至可读懂格式
data = soup.find('div')
# 提取首个<div>元素,并命名变量为data
print(data)

以上就是python爬数据教程,可以说获取数据的方法有很多,本篇挑选了简单的find方法,帮助大家解决数据的提取。更多Python学习指路:python爬虫

(推荐操作系统:windows7系统、Python 3.9.1,DELL G3电脑。)

关注公众号

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

底部广告图 底部广告图按钮