Python Selenium防检测策略汇总

 更新时间:2025年04月27日 08:40:34   作者:翠花上酸菜  
这篇文章主要为大家详细介绍了Python Selenium防检测的一些策略汇总,文中的示例代码简洁易懂,有需要的小伙伴可以根据自己的需要进行选择

selenium 防检测策略的方法汇总

合理设置延迟:请求间添加随机延迟 (2-10秒)

限制爬取频率:控制每小时/每天的请求量

轮换用户代理:准备至少10个不同的User-Agent

使用住宅代理:优先选择高质量的住宅代理IP

处理验证码:集成2Captcha或Anti-Captcha服务

定期更新工具:保持selenium和浏览器驱动最新版本

1. 基础防检测配置

from selenium import webdriver
from selenium.webdriver.chrome.options import Options

def get_stealth_driver():
    options = Options()
    
    # 基本防检测设置
    options.add_argument("--disable-blink-features=AutomationControlled")
    options.add_experimental_option("excludeSwitches", ["enable-automation"])
    options.add_experimental_option("useAutomationExtension", False)
    
    # 禁用自动化控制标志
    options.add_argument("--disable-infobars")
    options.add_argument("--disable-dev-shm-usage")
    options.add_argument("--no-sandbox")
    
    # 随机用户代理
    user_agents = [
        "Mozilla/5.0 (Windows NT 10.0; Win64; x64)...",
        "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7)..."
    ]
    import random
    options.add_argument(f"user-agent={random.choice(user_agents)}")
    
    driver = webdriver.Chrome(options=options)
    
    # 修改navigator.webdriver属性
    driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
        "source": """
        Object.defineProperty(navigator, 'webdriver', {
            get: () => undefined
        })
        """
    })
    
    return driver

2. 高级防检测技术

2.1 使用 undetected-chromedriver

import undetected_chromedriver as uc

​​​​​​​def get_undetected_driver():
    options = uc.ChromeOptions()
    
    # 配置选项
    options.add_argument("--disable-popup-blocking")
    options.add_argument("--disable-notifications")
    
    # 随机窗口大小
    import random
    width = random.randint(1000, 1400)
    height = random.randint(700, 900)
    options.add_argument(f"--window-size={width},{height}")
    
    driver = uc.Chrome(
        options=options,
        version_main=114,  # 匹配你的Chrome版本
        headless=False,
        use_subprocess=True
    )
    
    return driver

2.2 模拟人类行为模式

from selenium.webdriver.common.action_chains import ActionChains
import time
import random

​​​​​​​def human_like_behavior(driver, element=None):
    """模拟人类操作行为"""
    actions = ActionChains(driver)
    
    # 随机鼠标移动
    if element:
        actions.move_to_element(element)
    else:
        x = random.randint(0, 500)
        y = random.randint(0, 500)
        actions.move_by_offset(x, y)
    
    # 随机延迟
    time.sleep(random.uniform(0.5, 2.5))
    
    # 随机滚动
    scroll_amount = random.randint(200, 800)
    driver.execute_script(f"window.scrollBy(0, {scroll_amount})")
    time.sleep(random.uniform(0.3, 1.8))
    
    actions.perform()

3. 完整防检测爬取流程

def stealth_scrape(url):
    try:
        # 使用undetected-chromedriver
        driver = get_undetected_driver()
        
        # 访问目标URL
        driver.get(url)
        
        # 随机等待
        time.sleep(random.uniform(2, 5))
        
        # 模拟人类浏览行为
        human_like_behavior(driver)
        
        # 执行实际爬取操作
        # 示例:获取页面标题
        title = driver.title
        print(f"成功获取页面标题: {title}")
        
        # 更多爬取逻辑...
        
    except Exception as e:
        print(f"爬取过程中发生错误: {str(e)}")
    finally:
        driver.quit()
# 使用示例
stealth_scrape("https://example.com")

4. 额外防护措施

4.1 代理IP轮换

proxies = [
    "123.45.67.89:8080",
    "98.76.54.32:3128"
] #换成自己的

def get_proxy_driver():
    options = uc.ChromeOptions()
    proxy = random.choice(proxies)
    options.add_argument(f"--proxy-server=http://{proxy}")
    return uc.Chrome(options=options)

4.2 指纹混淆

def modify_fingerprint(driver):
    # 修改屏幕分辨率
    driver.execute_script(
        "Object.defineProperty(screen, 'width', {get: () => 1920});"
        "Object.defineProperty(screen, 'height', {get: () => 1080});"
    )
    
    # 修改时区
    driver.execute_cdp_cmd(
        "Emulation.setTimezoneOverride",
        {"timezoneId": "America/New_York"}
    )
    
    # 修改WebGL指纹
    driver.execute_script(
        "const getParameter = WebGLRenderingContext.prototype.getParameter;"
        "WebGLRenderingContext.prototype.getParameter = function(parameter) {"
        "  if (parameter === 37445) { return 'NVIDIA Corporation'; }"
        "  return getParameter.call(this, parameter);"
        "};"
    )

5. 检测与验证

def test_stealth(driver):
    test_urls = [
        "https://bot.sannysoft.com",
        "https://arh.antoinevastel.com/bots/areyouheadless"
    ]
    
    for url in test_urls:
        driver.get(url)
        time.sleep(3)
        driver.save_screenshot(f"stealth_test_{url.split('/')[-1]}.png")
        print(f"测试结果已保存: stealth_test_{url.split('/')[-1]}.png")

到此这篇关于Python Selenium防检测策略汇总的文章就介绍到这了,更多相关Python Selenium防检测内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Django框架中的对象列表视图使用示例

    Django框架中的对象列表视图使用示例

    这篇文章主要介绍了Django框架中的对象列表视图使用示例,Django是重多Python人气web框架中最为著名的一个,需要的朋友可以参考下
    2015-07-07
  • Python enumerate函数遍历数据对象组合过程解析

    Python enumerate函数遍历数据对象组合过程解析

    这篇文章主要介绍了Python enumerate函数遍历数据对象组合过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-12-12
  • 详解python分布式进程

    详解python分布式进程

    在本专题里,小编给大家讲述了关于python分布式进程的相关知识点内容,需要的朋友们参考下。
    2018-10-10
  • Python接口自动化之request请求封装源码分析

    Python接口自动化之request请求封装源码分析

    这篇文章主要介绍了Python接口自动化之request请求封装源码分析,文章围绕主题的相关资料展开详细的内容介绍,具有一定的参考价值,感兴趣的小伙伴可以参考一下
    2022-06-06
  • Python转换itertools.chain对象为数组的方法

    Python转换itertools.chain对象为数组的方法

    这篇文章主要介绍了Python转换itertools.chain对象为数组的方法,通过代码给大家介绍了itertools 的 chain() 方法,需要的朋友可以参考下
    2020-02-02
  • pandas数据处理之 标签列字符转数字的实现

    pandas数据处理之 标签列字符转数字的实现

    这篇文章主要介绍了pandas数据处理之 标签列字符转数字的实现方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • Python功能键的读取方法

    Python功能键的读取方法

    这篇文章主要介绍了Python功能键的读取方法,涉及Python键盘事件的相关操作技巧,需要的朋友可以参考下
    2015-05-05
  • 基于Python __dict__与dir()的区别详解

    基于Python __dict__与dir()的区别详解

    下面小编就为大家带来一篇基于Python __dict__与dir()的区别详解。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-10-10
  • Python argv用法详解

    Python argv用法详解

    这篇文章主要介绍了Python argv用法详解的相关资料,涉及到python argv相关知识,需要的朋友可以参考下
    2016-01-01
  • Django中间件基础用法详解

    Django中间件基础用法详解

    这篇文章主要介绍了Django中间件基础用法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07

最新评论