python中的urlparse()方法使用
python urlparse()方法
该方法实现url的识别和分段,这里先用一个实例来看一下
from urllib.parse import urlparse
result=urlparse('http://www.baidu.com/index.html;user?id=5#comment')
print(type(result),result)这里我们用urlparse()方法进行了URL的解析,首先,输出解析结果类型,再将结果也输出
如下:
<class 'urllib.parse.ParseResult'> ParseResult(scheme='http', netloc='www.baidu.com', path='/index.html', params='user', query='id=5', fragment='comment')
观察实例,'http://www.baidu.com/index.html;user?id=5#comment'
可以发现,urlparse()方法将其拆分为6个部分,分别是
scheme='http',代表协议 netloc='www.baidu.com',代表域名 path='/index.html', 代表path,即访问路径 params='user', 代表参数 query='id=5', 代表查询条件,一般用作get类型的URL fragment='comment'代表锚点,用于直接定位页面内部的下拉位置,
所以一个标准的链接应该是
scheme://netloc/path;params?query#fragment
接下来讲述其API用法
urllib.parse.urlparse(urlstring,scheme='',allow_fragments=True)
urlstring:必填项,即待解析的urlscheme:它的默认协议(比如http,https等)allow_fragments:即是否忽略fragment,如果它被设为False,fragment部分会被忽略,它会被解析为path、params、query的一部分,而fragment为空
python urlsplit, urlparse简单区别
顾名思义,urlsplit是拆分,而urlparse是解析,所以urlparse粒度更为细致
区别
split函数在分割的时候,path和params属性是在一起的
代码示例
# -*- coding: utf-8 -*-
from urllib.parse import urlsplit, urlparse
url = "https://username:password@www.baidu.com:80/index.html;parameters?name=tom#example"
print(urlsplit(url))
"""
SplitResult(
scheme='https',
netloc='username:password@www.baidu.com:80',
path='/index.html;parameters',
query='name=tom',
fragment='example')
"""
print(urlparse(url))
"""
ParseResult(
scheme='https',
netloc='username:password@www.baidu.com:80',
path='/index.html',
params='parameters',
query='name=tom',
fragment='example'
)
"""
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。
相关文章
用Python的pandas框架操作Excel文件中的数据教程
这篇文章主要介绍了用Python的pandas框架操作Excel文件中的数据教程,包括单位格式转换、分类汇总等基本操作,需要的朋友可以参考下2015-03-03
python通过colorama模块在控制台输出彩色文字的方法
这篇文章主要介绍了python通过colorama模块在控制台输出彩色文字的方法,实例分析了colorama模块的功能及相关使用技巧,具有一定参考借鉴价值,需要的朋友可以参考下2015-03-03
python+ollama自己写代码调用本地deepseek模型
本文主要介绍了python+ollama自己写代码调用本地deepseek模型,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧2025-03-03
python中三种输出格式总结(%,format,f-string)
在Python语言编程中,我们会与字符串打交道,那务必会输出字符串来查看字符串的内容,下面这篇文章主要给大家介绍了关于python中三种输出格式的相关资料,三种格式分别是%,format,f-string,需要的朋友可以参考下2022-03-03
Python MongoDB 插入数据时已存在则不执行,不存在则插入的解决方法
这篇文章主要介绍了Python MongoDB 插入数据时已存在则不执行,不存在则插入的解决方法,结合实例形式分析了Python基于日志判断数据是否已经插入的相关操作技巧,需要的朋友可以参考下2019-09-09


最新评论