Python Requests爬虫之求取关键词页面详解

 更新时间:2022年02月16日 10:10:18   作者:那人独钓寒江雪.  
这篇文章主要为大家详细介绍了Python Requests爬虫之求取关键词页面,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助

需求:爬取搜狗首页的页面数据

import requestsif __name__=='__main__':    #step 1:搜索Url    url='https://123.sogou.com/'    #step 2:发起请求    #get方法会返回一个响应对象    response=requests.get(url=url)    #step 3:获取响应数据,text返回的是字符串形式的响应数据    page_text=response.text    print(page_text)    #step 4:持久化存储    with open('./sogou.html','w',encoding='utf-8') as fp:        fp.write(page_text)    print("爬取数据结束")import requests
if __name__=='__main__':
    #step 1:搜索Url
    url='https://123.sogou.com/'
    #step 2:发起请求
    #get方法会返回一个响应对象
    response=requests.get(url=url)
    #step 3:获取响应数据,text返回的是字符串形式的响应数据
    page_text=response.text
    print(page_text)
    #step 4:持久化存储
    with open('./sogou.html','w',encoding='utf-8') as fp:
        fp.write(page_text)
    print("爬取数据结束")

请添加图片描述

使用UA伪装 求取关键词页面

import requests
if __name__=='__main__':
    #UA伪装:将对应的User-Agent封装到一个字典中
    headers={
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.9 Safari/537.36'
    }
    url='https://www.sogou.com/sie?'
    #处理url携带的参数:封装到字典中
    kw=input('enter a word:')
    param={
        'query':kw
    }
    #对指定的url发起的请求对应的url是携带参数的,并且请求过程中处理了参数
    response=requests.get(url=url,params=param,headers=headers)#headers是伪装 params输入关键词

    page_text=response.text#以文本的形式输出
    fileName=kw+'.html'#存储为网页形式
    with open(fileName,'w+',encoding='utf-8') as fp:
        fp.write(page_text)#写入fp
    print(fileName,"保存成功!!")

请添加图片描述

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注脚本之家的更多内容!         

相关文章

  • python字符串驻留机制的使用范围知识点详解

    python字符串驻留机制的使用范围知识点详解

    在本篇文章里小编给大家整理的是一篇关于python字符串驻留机制的使用范围相关知识点内容,有兴趣的朋友们可以学习下。
    2021-09-09
  • python银行卡号码校验Luhn模10算法

    python银行卡号码校验Luhn模10算法

    这篇文章主要为大家介绍了python银行卡号码校验Luhn模10算法,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • 解读什么是npy文件,为什么要用npy格式保存文件

    解读什么是npy文件,为什么要用npy格式保存文件

    这篇文章主要介绍了什么是npy文件,为什么要用npy格式保存文件这个问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-02-02
  • python基础梳理(一)(推荐)

    python基础梳理(一)(推荐)

    这篇文章主要介绍了python基础梳理,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-04-04
  • python web.py开发httpserver解决跨域问题实例解析

    python web.py开发httpserver解决跨域问题实例解析

    这篇文章主要介绍了python web.py开发httpserver解决跨域问题实例解析,分享了相关代码示例,小编觉得还是挺不错的,具有一定借鉴价值,需要的朋友可以参考下
    2018-02-02
  • mac 安装python网络请求包requests方法

    mac 安装python网络请求包requests方法

    今天小编就为大家分享一篇mac 安装python网络请求包requests方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • python3使用diagrams绘制架构图的步骤

    python3使用diagrams绘制架构图的步骤

    这篇文章主要介绍了python3使用diagrams生成架构图的步骤,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下
    2021-04-04
  • 举例讲解Python面相对象编程中对象的属性与类的方法

    举例讲解Python面相对象编程中对象的属性与类的方法

    这篇文章主要介绍了Python面相对象编程中对象的属性与类的方法,类和对象以及方法这些都是面相对象的编程语言所具有的基础内容,需要的朋友可以参考下
    2016-01-01
  • Python中的配对函数zip()解读

    Python中的配对函数zip()解读

    这篇文章主要介绍了Python中的配对函数zip()解读,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-11-11
  • Pygame游戏开发之太空射击实战盾牌篇

    Pygame游戏开发之太空射击实战盾牌篇

    相信大多数8090后都玩过太空射击游戏,在过去游戏不多的年代太空射击自然属于经典好玩的一款了,今天我们来自己动手实现它,在编写学习中回顾过往展望未来,在本课中,我们将为玩家添加一个盾牌以及一个用于显示盾牌等级的栏
    2022-08-08

最新评论