品易云推流 关闭
文章详情页
文章 > 爬虫入门 > Python中urllib.parse模块的urljoin()如何使用?

Python中urllib.parse模块的urljoin()如何使用?

Python爬虫 模块

头像

宋雪维

2021-04-28 10:31:471251浏览 · 0收藏 · 0评论

小编介绍过Python中urllib.parse模块的的urlparse可以将 URL 解析成 ParseResult 对象,实现url的识别和分段。作为urllib.parse模块的urljoin()方法也应用于url,作用与urlparse相反,是用于拼接url。除了可以组接url,还可以对网址进行拼接,本文介绍它的使用方法。

1、urllib.parse模块的urljoin()方法

urljoin()方法将两个链接参数拼接为完整URL,用于拼接url。

2、使用格式

urljoin(base, url, allow_fragments=True)

连接两个参数的url, 将第二个参数中缺的部分用第一个参数的补齐,如果第二个有完整的路径,则以第二个为主。

3、urljoin()组接url使用实例

# 连接两个参数的url, 将第二个参数中缺的部分用第一个参数的补齐,如果第二个有完整的路径,则以第二个为主
from urllib.parse import urljoin
 
print(urljoin('www.baidu.com', '?category=2#comment'))
print(urljoin('www.baidu.com', 'https://blog.csdn.net/nav/python'))
输出
www.baidu.com?category=2#comment
https://blog.csdn.net/nav/python

4、urljoin()对网址进行拼接使用实例

from urllib.parse import urljoin
print(urljoin('http://www.baidu.com','FAQ.html'))  #http://www.baidu.com/FAQ.html
print(urljoin('www.baidu.com','?category=2#comment')) #www.baidu.com?category=2#comment
print(urljoin('www.baidu.com','http://qq.com'))    #http://qq.com

以上就是Python中urllib.parse模块的urljoin()使用方法,希望能对你有所帮助哟~更多python爬虫推荐:python爬虫教程

(推荐操作系统:windows7系统、Python 3.9.1,DELL G3电脑。)

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

底部广告图