用python爬取租房网站信息的代码

 更新时间:2018年12月14日 10:48:04   作者:Struggler09  
今天小编就为大家分享一篇关于用python爬取租房网站信息的代码,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧

自己在刚学习python时写的,中途遇到很多问题,查了很多资料,下面就是我爬取租房信息的代码:

链家的房租网站
两个导入的包
1.requests 用来过去网页内容 
2.BeautifulSoup
import time
import pymssql
import requests
from bs4 import BeautifulSoup
#  https://wh.lianjia.com/zufang/
#获取url中下面的内容
def get_page(url):
  responce = requests.get(url)
  soup = BeautifulSoup(responce.text,'lxml')
  return soup
#封装成函数,作用是获取列表下的所有租房页面的链接,返回一个链接列表
def get_links(url):
  responce = requests.get(url)
  soup = BeautifulSoup(responce.text,'lxml')
  link_div = soup.find_all('div',class_ = 'pic-panel')
  links = [div.a.get('href') for div in link_div]
  return links
#收集一个房子的信息
def get_house_info(house_url):
  soup = get_page(house_url)
  price = soup.find('span',class_='total').text
  unit = soup.find('span',class_= 'unit').text[1:-1]
  area = soup.find('p', class_ = 'lf').text
  house_info= soup.find_all('p',class_ = 'lf')
  area = house_info[0].text[3:] #字符串切片工具
  layout = house_info[1].text[5:]
  info={
    '价格':price,
    '单位':unit,
    '面积':area,
    '户型':layout
    }
  return info
#链接数据库
server="192.168.xx.xx"  #换成自己的服务器信息
user="liujiepeng"
password="xxxxx"    #自己的数据库用户名和密码
conn=pymssql.connect(server,user,password,database="house")
def insert(conn,house):
  #sql_values = values.format(house['价格'],house['单位'],house['面积'],
                #house['户型'])
  sql = "insert into [house].dbo.lianjia(price,unit,area,layout)values('%s','%s','%s','%s')"%(house["价格"],house["单位"],house["面积"],house["户型"])
  print(sql)
  cursor = conn.cursor() #游标,开拓新的窗口
  #cursor1 = conn.cursor()
  cursor.execute(sql) #执行sql语句
  conn.commit() #提交 ,更新sql 语句
links = get_links('https://wh.lianjia.com/zufang/')
count = 1
for link in links:
  #time.sleep(2)
  print('获取一个数据成功')
  house = get_house_info(link)
  insert(conn,house)
  print("第%s个数据,存入数据库成功!"%(count))
  count = count+1
  #print(house["价格"],end='\r')

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对脚本之家的支持。如果你想了解更多相关内容请查看下面相关链接

相关文章

  • Python使用Pandas对csv文件进行数据处理的方法

    Python使用Pandas对csv文件进行数据处理的方法

    这篇文章主要介绍了Python使用Pandas对csv文件进行数据处理的方法,本文通过实例代码相结合给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-08-08
  • pytorch 模型可视化的例子

    pytorch 模型可视化的例子

    今天小编就为大家分享一篇pytorch 模型可视化的例子,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • Python分支语句与循环语句应用实例分析

    Python分支语句与循环语句应用实例分析

    这篇文章主要介绍了Python分支语句与循环语句应用,结合具体实例形式详细分析了Python分支语句与循环语句各种常见应用操作技巧与相关注意事项,需要的朋友可以参考下
    2019-05-05
  • Python MySQLdb 执行sql语句时的参数传递方式

    Python MySQLdb 执行sql语句时的参数传递方式

    这篇文章主要介绍了Python MySQLdb 执行sql语句时的参数传递方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • pycharm打开chrome自动退出错误的解决方法

    pycharm打开chrome自动退出错误的解决方法

    这篇文章主要给大家介绍了关于pycharm打开chrome自动退出错误的解决方法,文中通过实例代码以及图文将解决的办法介绍的非常详细,需要的朋友可以参考下
    2023-07-07
  • Python中使用item()方法遍历字典的例子

    Python中使用item()方法遍历字典的例子

    这篇文章主要介绍了Python中使用item()方法遍历字典的例子,for...in这种是Python中最常用的遍历字典的方法了,需要的朋友可以参考下
    2014-08-08
  • 利用pyecharts绘制地理散点图

    利用pyecharts绘制地理散点图

    这篇文章主要介绍了利用pyecharts绘制地理散点图,文章利用上海市7000+办公楼项目,包括项目名称,地理位置,每天的租金,建筑面积和项目所在的商圈,现在要让这些项目按经纬度落位到地图上去,需要的朋友可以参考一下
    2022-03-03
  • 最基础的Python的socket编程入门教程

    最基础的Python的socket编程入门教程

    这篇文章主要介绍了最基础的Python的socket编程入门教程,包括最基本的发送和接受信息等内容,需要的朋友可以参考下
    2015-04-04
  • Python脚本实现Zabbix多行日志监控过程解析

    Python脚本实现Zabbix多行日志监控过程解析

    这篇文章主要介绍了Python脚本实现Zabbix多行日志监控过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-08-08
  • Pytorch搭建SRGAN平台提升图片超分辨率

    Pytorch搭建SRGAN平台提升图片超分辨率

    这篇文章主要为大家介绍了Pytorch搭建SRGAN平台提升图片超分辨率,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-04-04

最新评论