技术文章 > Python爬虫 >  爬虫入门 > 正文

Python中urllib.parse模块的urljoin()如何使用?

宋雪维

小编介绍过Python中urllib.parse模块的的urlparse可以将 URL 解析成 ParseResult 对象,实现url的识别和分段。作为urllib.parse模块的urljoin()方法也应用于url,作用与urlparse相反,是用于拼接url。除了可以组接url,还可以对网址进行拼接,本文介绍它的使用方法。

1、urllib.parse模块的urljoin()方法

urljoin()方法将两个链接参数拼接为完整URL,用于拼接url。

2、使用格式

urljoin(base, url, allow_fragments=True)

连接两个参数的url, 将第二个参数中缺的部分用第一个参数的补齐,如果第二个有完整的路径,则以第二个为主。

3、urljoin()组接url使用实例

# 连接两个参数的url, 将第二个参数中缺的部分用第一个参数的补齐,如果第二个有完整的路径,则以第二个为主
from urllib.parse import urljoin
 
print(urljoin('www.baidu.com', '?category=2#comment'))
print(urljoin('www.baidu.com', 'https://blog.csdn.net/nav/python'))
输出
www.baidu.com?category=2#comment
https://blog.csdn.net/nav/python

4、urljoin()对网址进行拼接使用实例

from urllib.parse import urljoin
print(urljoin('http://www.baidu.com','FAQ.html'))  #http://www.baidu.com/FAQ.html
print(urljoin('www.baidu.com','?category=2#comment')) #www.baidu.com?category=2#comment
print(urljoin('www.baidu.com','http://qq.com'))    #http://qq.com

以上就是Python中urllib.parse模块的urljoin()使用方法,希望能对你有所帮助哟~更多python爬虫推荐:python爬虫教程

免费视频教程
本教程部分素材来源于网络,版权问题联系站长!
相关文章
  python中series排序的两种方法
  python中DataFrame如何按列排序
  Python3爬虫利器:BeautifulSoup4的安装
  python中time tzset()的使用
  python time.asctime()的字符串返回
  Python中time.clock和 time.time的对比探究
相关视频章节
  解决提示“‘python’不是内部或外外部命令
  python注释
  python编码规范
  《Python程序设计》课程导论
视频教程分类