python中的urlparse()方法使用

 更新时间:2023年10月27日 10:14:16   作者:码奋  
这篇文章主要介绍了python中的urlparse()方法使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

python urlparse()方法

该方法实现url的识别和分段,这里先用一个实例来看一下

from urllib.parse import urlparse
 
result=urlparse('http://www.baidu.com/index.html;user?id=5#comment')
print(type(result),result)

这里我们用urlparse()方法进行了URL的解析,首先,输出解析结果类型,再将结果也输出

如下:

<class 'urllib.parse.ParseResult'> 
ParseResult(scheme='http', netloc='www.baidu.com', path='/index.html', params='user', query='id=5', fragment='comment')

观察实例,'http://www.baidu.com/index.html;user?id=5#comment'

可以发现,urlparse()方法将其拆分为6个部分,分别是

scheme='http',代表协议

netloc='www.baidu.com',代表域名

path='/index.html', 代表path,即访问路径

params='user', 代表参数

query='id=5', 代表查询条件,一般用作get类型的URL

fragment='comment'代表锚点,用于直接定位页面内部的下拉位置,

所以一个标准的链接应该是

scheme://netloc/path;params?query#fragment

接下来讲述其API用法

 urllib.parse.urlparse(urlstring,scheme='',allow_fragments=True)
  • urlstring:必填项,即待解析的url
  • scheme:它的默认协议(比如http,https等)
  • allow_fragments:即是否忽略fragment,如果它被设为False,fragment部分会被忽略,它会被解析为path、params、query的一部分,而fragment为空

python urlsplit, urlparse简单区别

顾名思义,urlsplit是拆分,而urlparse是解析,所以urlparse粒度更为细致

区别

split函数在分割的时候,path和params属性是在一起的

代码示例

# -*- coding: utf-8 -*-

from urllib.parse import urlsplit, urlparse

url = "https://username:password@www.baidu.com:80/index.html;parameters?name=tom#example"

print(urlsplit(url))
"""
SplitResult(
    scheme='https', 
    netloc='username:password@www.baidu.com:80', 
    path='/index.html;parameters', 
    query='name=tom', 
    fragment='example')
"""

print(urlparse(url))
"""
ParseResult(
    scheme='https', 
    netloc='username:password@www.baidu.com:80', 
    path='/index.html', 
    params='parameters', 
    query='name=tom', 
    fragment='example'
)
"""

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • TensorFlow 滑动平均的示例代码

    TensorFlow 滑动平均的示例代码

    这篇文章主要介绍了TensorFlow 滑动平均的示例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-06-06
  • 用Python的pandas框架操作Excel文件中的数据教程

    用Python的pandas框架操作Excel文件中的数据教程

    这篇文章主要介绍了用Python的pandas框架操作Excel文件中的数据教程,包括单位格式转换、分类汇总等基本操作,需要的朋友可以参考下
    2015-03-03
  • python通过colorama模块在控制台输出彩色文字的方法

    python通过colorama模块在控制台输出彩色文字的方法

    这篇文章主要介绍了python通过colorama模块在控制台输出彩色文字的方法,实例分析了colorama模块的功能及相关使用技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-03-03
  • Python条件语句与循环语句

    Python条件语句与循环语句

    这篇文章主要介绍了Python条件语句与循环语句,条件语句就是通过指定的表达式的运行结果来判断当前是执行还是跳过某些指定的语句块,循环语句就是对某些语句的重复执行,这个重复执行是通过指定表达式来控制的,下面来看具体内容及续航管案例吧,需要的朋友可以参考一下
    2021-11-11
  • Django 如何获取前端发送的头文件详解(推荐)

    Django 如何获取前端发送的头文件详解(推荐)

    这篇文章主要介绍了Django 如何获取前端发送的头文件,先需要导入一个类再通过request.environ来获取,具体操作可查看下文,需要的朋友可以参考下
    2017-08-08
  • python+ollama自己写代码调用本地deepseek模型

    python+ollama自己写代码调用本地deepseek模型

    本文主要介绍了python+ollama自己写代码调用本地deepseek模型,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2025-03-03
  • python中三种输出格式总结(%,format,f-string)

    python中三种输出格式总结(%,format,f-string)

    在Python语言编程中,我们会与字符串打交道,那务必会输出字符串来查看字符串的内容,下面这篇文章主要给大家介绍了关于python中三种输出格式的相关资料,三种格式分别是%,format,f-string,需要的朋友可以参考下
    2022-03-03
  • Python 统计字数的思路详解

    Python 统计字数的思路详解

    这篇文章主要介绍了Python 统计字数的思路详解,文中还给大家提供了不借助第三方模块的解决方法,感兴趣的朋友一起看看吧
    2018-05-05
  • python web框架 django wsgi原理解析

    python web框架 django wsgi原理解析

    这篇文章主要介绍了python web框架 django wsgi原理解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值
    2019-08-08
  • Python MongoDB 插入数据时已存在则不执行,不存在则插入的解决方法

    Python MongoDB 插入数据时已存在则不执行,不存在则插入的解决方法

    这篇文章主要介绍了Python MongoDB 插入数据时已存在则不执行,不存在则插入的解决方法,结合实例形式分析了Python基于日志判断数据是否已经插入的相关操作技巧,需要的朋友可以参考下
    2019-09-09

最新评论