【基础】【Python网络爬虫】【10.验证码处理】OCR识别,Tesseract ,ddddocn识别,打码平台,滑块验证码(附大量案例代码)(建议收藏)

Python网络爬虫基础

  • 验证码处理
  • 一. OCR识别
    • 1. Tesseract 引擎的安装
      • windows引擎环境安装
      • Mac系统引擎环境安装
        • 安装 tesseract
        • 查看 tesseract 版本
        • 安装过程遇到的报错解决方法
        • 下载中文包
        • 中文包存放目录
        • 查看全部语言库
        • python 安装 pytesseract 和 pillow
        • 识别图片中文字体
      • Linux系统引擎环境安装
    • 2. Tesseract 中文语言模型配置
      • Windows配置中文模型
      • linux配置中文模型
    • 3. Tesserract识别
      • 识别英文
      • 识别中文
      • 识别验证码
  • 二. ddddocn 识别
    • 1. 图片的形式和转化
      • 图片在网页页面中的形式
      • 如何进行图片形式的转化
    • 2. 字符串图片转化
    • 3. ddddcon识别
    • 4. 青灯论坛模拟登录对接
    • 5. ddddcon中文识别
  • 三、打码平台识别
        • 案例 - (古诗文)验证码图片识别
    • 1. 快识别打码平台测试
    • 2. 凤凰网登录
    • 3. B站点选验证码
  • 四、滑块验证码
    • 1. 简单滑块
    • 2. 极验验证
      • 分段类型
        • 获取验证码图片
          • 修改网页前端属性显示全部图片
          • 下载验证码
          • 还原验证码图片
        • 获取验证码缺口距离
        • 动验证码模拟滑动
        • 练习案例
      • canvas类型处理
        • 获取验证码图片
        • 获取验证码缺口距离
        • 滑动验证码模拟滑动
        • 练习案例

验证码处理

一. OCR识别

OCR(Optical Character Recognition)是指使用扫描仪或数码相机对文本资料进行扫描成图像文件,然后对图像文件进行分析处理,自动识别获取文字信息及版面信息的软件

在读取和处理图像、图像相关的机器学习以及创建图像等任务中,Python 一直都是非常出色的语言。虽然有很多库可以进行图像处理,但在这里只重点介绍:Tesseract

1. Tesseract 引擎的安装

windows引擎环境安装

安装包下载链接:
https://wwae.lanzoub.com/b04k0prcj
密码:26yo

  • 下载引擎安装包,直接安装。安装方式:–>直接双击安装包 --> 选择安装路径 --> 后续所有选项点 “下一步” 安装。
  • 配置环境变量,安装完后如果要在计算机正常使用需要在计算机中配置环境变量,步骤如下所示:
    • 右键点击此电脑, 选择属性
      在这里插入图片描述
    • 选择点击**高级系统设置
      在这里插入图片描述
    • 选择点击**环境变量
      在这里插入图片描述
    • 系统变量中双击Path
      在这里插入图片描述
    • Tesseract引擎安装的根路径添加到环境变量中去
      在这里插入图片描述
    • 依次点击确定使环境变量生效
      在这里插入图片描述
    • 打开cmd验证,输入**tesseract -v **验证,出现如下说明你配置好了
      在这里插入图片描述

Mac系统引擎环境安装

安装 tesseract
brew install tesseract

==> Installing dependencies for tesseract: libarchive
==> Installing tesseract dependency: libarchive
==> Pouring libarchive-3.6.1.catalina.bottle.tar.gz
🍺  /usr/local/Cellar/libarchive/3.6.1: 62 files, 3.6MB
==> Installing tesseract
==> Pouring tesseract--5.1.0.catalina.bottle.tar.gz
==> Caveats
This formula contains only the "eng", "osd", and "snum" language data files.
If you need any other supported languages, run `brew install tesseract-lang`.
==> Summary
🍺  /usr/local/Cellar/tesseract/5.1.0: 58 files, 30.0MB
==> Caveats
==> tesseract
This formula contains only the "eng", "osd", and "snum" language data files.
If you need any other supported languages, run `brew install tesseract-lang`.
查看 tesseract 版本

成功安装后查看 tesseract 版本

tesseract --version
tesseract 5.1.0
 leptonica-1.82.0
  libgif 5.2.1 : libjpeg 9e : libpng 1.6.37 : libtiff 4.3.0 : zlib 1.2.11 : libwebp 1.2.2 : libopenjp2 2.4.0
 Found AVX2
 Found AVX
 Found FMA
 Found SSE4.1
 Found libarchive 3.6.1 zlib/1.2.11 liblzma/5.2.5 bz2lib/1.0.6 liblz4/1.9.3 libzstd/1.5.2
 Found libcurl/7.64.1 SecureTransport (LibreSSL/2.8.3) zlib/1.2.11 nghttp2/1.39.2
安装过程遇到的报错解决方法

错误一:

  • 安装tesseract的过程中报缺少依赖的错误
  • Error: No such file or directory @ rb_sysopen - /Users/f/Library/Caches/Homebrew/downloads/266702d9bc59c9dfde27ce555b4a3f9ed9d0de770ba697e62a111d74ee0a4231–openjpeg-2.4.0.catalina.bottle.tar.gz
  • 针对这类错误单独安装缺少的包即可
  • brew install openjpeg

错误二:

  • 单独安装依赖出现如下提示:
  • Disable this behaviour by setting HOMEBREW_NO_INSTALL_CLEANUP. Hide these hints with HOMEBREW_NO_ENV_HINTS (see man brew).
  • 执行如下命令即可: export HOMEBREW_NO_INSTALL_CLEANUP=TRUE
下载中文包
  • tesseract默认不支持中文,需要单独下载中文包
  • 中文包下载地址: https://tesseract-ocr.github.io/tessdoc/Data-Files

在这里插入图片描述

中文包存放目录

/usr/local/Cellar/tesseract/{tesseract版本}/share/tessdata

cd /usr/local/Cellar/tesseract/5.1.0/share/tessdata

在这里插入图片描述

查看全部语言库
tesseract --list-langs
List of available languages in "/usr/local/share/tessdata/" (4):
chi_sim
eng
osd
snum
python 安装 pytesseract 和 pillow
pip install pytesseract
pip install pillow
识别图片中文字体
import pytesseract
from PIL import Image
# 读取图片  # 打开对应图片的文件路径
im = Image.open('/Users/f/PycharmProjects/firstProject/a/a.png')
# 识别文字,并指定语言
string = pytesseract.image_to_string(im, lang='chi_sim')
print(string)

Linux系统引擎环境安装

可以通过指令在线安装

sudo apt-get update
sudo apt-get install tesseract-ocr

2. Tesseract 中文语言模型配置

Tesseract各个国家语言地区文字模型在GitHub可以自行下载, 以下是下载链接:

  • 中文语言模型下载网址:https://github.com/tesseract-ocr/tessdata

在这里插入图片描述

Windows配置中文模型

中文语言模型配置主要是要将模型文件放到引擎的安装目录下

将中文模型放到引擎的 安装目录/tessdata 的目录下
在这里插入图片描述

linux配置中文模型

Linux 系统下通过apt get指令安装的工具默认是在~/etc下,进入到tesseract安装路径下share下面的tessdata文件夹下,将中文语言包拷贝进去即可

3. Tesserract识别

识别英文

from PIL import Image  # pillow模块  安装名和导入名不一样
import pytesseract

# 当找不到识别引擎的情况下, 加一下代码
# pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

# 打开加载英文内容图片
image = Image.open('test_english.png')

# 识别图片中的文字, 默认语言模型是英文模型
result = pytesseract.image_to_string(image)

# 打印识别结果
print(result)

"""
默认情况下只要是计算机敲出来的文字, 用这个方法识别率是 100%
"""

识别中文

''' 首先要中文语言模型配置 '''
from PIL import Image  # pillow模块  安装名和导入名不一样
import pytesseract

# 打开加载图片
image = Image.open('test_chinese.png')

# 识别图片中的文字
#  lang="chi_sim" 指定中文语言模型进行识别
result = pytesseract.image_to_string(image, lang='chi_sim')

# 打印识别结果
print(result)

识别验证码

from PIL import Image  # pillow模块  安装名和导入名不一样
import pytesseract

# 打开加载图片
image = Image.open('yzm1.png')

# 识别图片中的文字
#  lang="chi_sim" 指定中文语言模型进行识别
result = pytesseract.image_to_string(image)

# 打印识别结果
print(result)

"""
因为我们没有验证码模型, 所以识别验证码图片会识别率会非常低
"""

二. ddddocn 识别

1. 图片的形式和转化

图片在网页页面中的形式

图片在网页页面中的形式一般就两种:一种是以一个链接形式存在html中,另外一种是以字符串的形式存在于html中。

以链接形式存在于html中的图片,意味着每次浏览器执行渲染的时候会发送图片链接地址请求,请求到了之后再渲染到页面。目前大部分网站都是以这种形式去加载图片的。之前我们也学习过通过获取图片的链接地址就可以请求图片数据。
在这里插入图片描述
这样的形式存在于页面当中的图片,如果一旦页面图片很多的话,就意味着需要发送很多次网络请求,去请求图片数据。

以字符串形式存在于html中的图片,和上述形式有明显的区别。这样形式的图片在html页面中是以字符串的形式去展示图片,而不是一个链接。
在这里插入图片描述

  • 这样的好处是加载页面的时候,不用发送网络请求去请求图片数据。因为我们在请求html页面的时候就已经拿到图片的字符串数据,浏览器只需要转换图片为二进制形式展示就可以了。
  • 有利也有弊,这样做虽然网络请求的次数少了,但是我们需要把图片转换成字符串形式才可以放到标签里面。如果图片数据过大,那么转换之后的字符长度就会很长。所以一般网页中字符串形式的图片都是数据量比较小的图片,比如验证码。

如何进行图片形式的转化

前面我们讲了图片有两种形式,链接形式的图片我们通过requests发送请求就可以拿到图片的二进制数据,保存下来就可以用看图软件查看。这种形式的图片处理就不做赘述了。

  • 那么字符串的形式的图片我们应该如何处理呢?
  • 字符串形式的图片我们可以借助 base64 模块进行处理。
# base64.b64decode()

  把字符串形式的图片转化为二进制的数据, 传入图片的字符串数据

# base64.b64encode()

  把二进制形式的图片转化为字符串数据, 传入图片的二进制数据

2. 字符串图片转化

import base64  # 内置模块

"""把字符串形式的图片转化成二进制"""
img_str = ''

# b64decode() 把字符串形式的图片转化成二进制
bytes_img = base64.b64decode(img_str)
print(bytes_img)

with open('yzm.png', mode='wb') as f:
    f.write(bytes_img)

""" 把二进制形式的图片转换成字符串 """
with open('yzm.png', mode='rb') as f:
    img_bytes_data = f.read()
    print('读取出的二进制形式的图片: ', img_bytes_data)

# b64encode() 把二进制形式的图片成字符串
str_img = base64.b64encode(img_bytes_data).decode()
print('转换之后的字符串图片: ', str_img)

3. ddddcon识别

import ddddocr

"""创建识别对象"""
ocr = ddddocr.DdddOcr(beta=True)  # beta=True 自动识别模型

"""打开图片数据"""
with open('yzm.png', mode='rb') as f:
    image = f.read()

"""识别验证码"""
result = ocr.classification(image)
print(result)

"""
只要验证码没有覆盖, 识别率还行
"""
# 数字验证码
ocr = ddddocr.DdddOcr(beta=True)
with open('test.png', mode='rb') as f:
    image = f.read()
result2 = ocr.classification(image)
print(result2)

# 英文验证码
ocr = ddddocr.DdddOcr(beta=True)
with open('test2.png', mode='rb') as f:
    image = f.read()
result2 = ocr.classification(image)
print(result2)

# 英数混合验证码
ocr = ddddocr.DdddOcr(beta=True)
with open('test3.png', mode='rb') as f:
    image = f.read()
result3 = ocr.classification(image)
print(result3)

# 验证码覆盖识别测试
ocr = ddddocr.DdddOcr(beta=True)
with open('验证码4.png', mode='rb') as f:
    image = f.read()
result4 = ocr.classification(image)
print(result4)

4. 青灯论坛模拟登录对接

"""
时间戳: 格林威治时间1970年1月1日0时0分0秒开始 到 目前 位置所消耗的时间数
    秒级时间戳: 10为数字
    毫秒级时间戳: 13为数字
    微秒级时间戳: 16为数字
"""
import time

import ddddocr
import requests


def get_time():
    """获取时间戳的函数"""
    now_time = str(int(time.time() * 1000))
    print('当前时间戳为:', now_time)
    return now_time


cookies = {'seesion': 'vnrasebgvi'}

# 创建一个会话位置对象
session = requests.Session()

"""请求验证码, 保存"""
img_time = get_time()
img_url = 'http://118.126.88.143:5000/login/captcha?image_code=' + img_time
print('图片地址:', img_url)

# 使用回话维持对象发送请求
img_response = session.get(url=img_url, cookies=cookies).content
with open('yzm.png', mode='wb') as f:
    f.write(img_response)

# # 手动识别验证码
# img_code = input('请输入验证码:')
# print('您输入的验证码为:', img_code)
"""ddddocr识别"""
ocr = ddddocr.DdddOcr(beta=True)
with open('yzm.png', mode='rb') as f:
    image = f.read()
img_code = ocr.classification(image)
print(img_code)

"""构建登录请求"""
login_url = 'http://118.126.88.143:5000/api/private/v1/login'
json_data = {
    "image_code": img_time,
    "username": "admin",
    "password": "123456",
    "captcha_code": img_code  # 手动验证码
}

# 使用回话维持对象维持用户的登录状态
login_response = session.post(url=login_url, json=json_data)
print(login_response.cookies.get_dict())
print(login_response.json())

# 其他网站构建请求联系, 一般是通过cookies字段

5. ddddcon中文识别

import time

import ddddocr
import requests

"""ddddocr识别"""
ocr = ddddocr.DdddOcr(beta=True)
with open('test_chinese.png', mode='rb') as f:
    image = f.read()
img_code = ocr.classification(image)
print(img_code)

# 后续可以识别字体图片

三、打码平台识别

  • 图鉴平台:http://www.ttshitu.com/ (推荐)
  • 使用图鉴识别古诗文网登录中的验证码
'''
使用流程:
- 注册登录图鉴平台
- 登录后,点击开发文档,提取识别的源代码
- 模块(tujian.py)的封装:
'''
import base64
import json
import requests
# 一、图片文字类型(默认 3 数英混合):
# 1 : 纯数字
# 1001:纯数字2
# 2 : 纯英文
# 1002:纯英文2
# 3 : 数英混合
# 1003:数英混合2
#  4 : 闪动GIF
# 7 : 无感学习(独家)
# 11 : 计算题
# 1005:  快速计算题
# 16 : 汉字
# 32 : 通用文字识别(证件、单据)
# 66:  问答题
# 49 :recaptcha图片识别
# 二、图片旋转角度类型:
# 29 :  旋转类型
#
# 三、图片坐标点选类型:
# 19 :  1个坐标
# 20 :  3个坐标
# 21 :  3 ~ 5个坐标
# 22 :  5 ~ 8个坐标
# 27 :  1 ~ 4个坐标
# 48 : 轨迹类型
#
# 四、缺口识别
# 18 : 缺口识别(需要2张图 一张目标图一张缺口图)
# 33 : 单缺口识别(返回X轴坐标 只需要1张图)
# 五、拼图识别
# 53:拼图识别
# 函数实现忽略
def base64_api(uname, pwd, img, typeid):
    with open(img, 'rb') as f:
        base64_data = base64.b64encode(f.read())
        b64 = base64_data.decode()
    data = {"username": uname, "password": pwd, "typeid": typeid, "image": b64}
    result = json.loads(requests.post("http://api.ttshitu.com/predict", json=data).text)
    if result['success']:
        return result["data"]["result"]
    else:
        return result["message"]
    return ""


def getImgCodeText(imgPath, imgType):  # 直接返回验证码内容
    # imgPath:验证码图片地址
    # imgType:验证码图片类型
    result = base64_api(uname='bb328410948', pwd='bb328410948', img=imgPath, typeid=imgType)
    return result
案例 - (古诗文)验证码图片识别
from lxml import etree
import requests
import tujian

headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'
}
# 将验证码图片请求后保存到本地
login_url = 'https://so.gushiwen.cn/user/login.aspx?from=http://so.gushiwen.cn/user/collect.aspx'
page_text = requests.get(url=login_url, headers=headers).text
tree = etree.HTML(page_text)
img_src = 'https://so.gushiwen.cn' + tree.xpath('//*[@id="imgCode"]/@src')[0]
code_data = requests.get(url=img_src, headers=headers).content
with open('./code.jpg', 'wb') as fp:
    fp.write(code_data)

# 识别验证码图片内容
result = tujian.getImgCodeText('./code.jpg', 3)

print(result)

在抓包工具里定位点击登录按钮后对应的数据包:

  • 只要数据包的请求参数中包含用户名,密码和验证码则该数据包就是我们要定位的
  • 首次模拟登录操作:
from lxml import etree
import requests
import tujian

headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'
}
# 将验证码图片请求后保存到本地
login_url = 'https://so.gushiwen.cn/user/login.aspx?from=http://so.gushiwen.cn/user/collect.aspx'
page_text = requests.get(url=login_url, headers=headers).text
tree = etree.HTML(page_text)
img_src = 'https://so.gushiwen.cn' + tree.xpath('//*[@id="imgCode"]/@src')[0]
code_data = requests.get(url=img_src, headers=headers).content
with open('./code.jpg', 'wb') as fp:
    fp.write(code_data)

# 识别验证码图片内容
result = tujian.getImgCodeText('./code.jpg', 3)
print(result)
# 模拟登录
url = 'https://so.gushiwen.cn/user/login.aspx?from=http%3a%2f%2fso.gushiwen.cn%2fuser%2fcollect.aspx'
data = {
    "__VIEWSTATE": "opfVI7oolwkr7MLRVzsNSMASqLRUuO1dg5ZP5EIRa4FyM+mOYKEs6KWEKQKaba2ulLoZQIaLFiKK4mr5K3ci1v8ua28wtcRtabKWjOtJtU/i2etH+zSduegTMcg=",
    "__VIEWSTATEGENERATOR": "C93BE1AE",
    "from": "http://so.gushiwen.cn/user/collect.aspx",
    "email": "15027900535",
    "pwd": "bobo@15027900535",
    "code": result,
    "denglu": "登录"
}
# 获取了登录成功后的页面源码数据
login_page_text = requests.post(url=url, headers=headers, data=data).text
with open('wushiwen.html', 'w') as fp:
    fp.write(login_page_text)

1. 快识别打码平台测试

import base64
import json
import requests
from constants import KUAI_USERNAME, KUAI_PASSWORD

def base64_api(uname, pwd, img, typeid):
    """
    识别验证码的函数
    :param uname: 用户名
    :param pwd: 密码
    :param img: 图片路径
    :param typeid: 识别类型
    :return:
    """
    with open(img, 'rb') as f:
        # 打开图片图片, 把图片转换成字符串形式
        base64_data = base64.b64encode(f.read())
        b64 = base64_data.decode()

    data = {"username": uname, "password": pwd, "typeid": typeid, "image": b64}

    result = requests.post("http://api.ttshitu.com/predict", json=data).json()
    print('识别返回结果:', result)

    if result['success']:
        return result["data"]["result"]
    else:
        # !!!!!!!注意:返回 人工不足等 错误情况 请加逻辑处理防止脚本卡死 继续重新 识别
        return result["message"]


if __name__ == "__main__":
    img_path = "验证码4.png"
    result = base64_api(uname=KUAI_USERNAME, pwd=KUAI_PASSWORD, img=img_path, typeid=7)
    print(result)

    # 当我们识别错误可以, 可以换识别类型

2. 凤凰网登录

import base64
import time

from selenium import webdriver
from selenium.webdriver.common.by import By
from constants import FENG_USERNAME, FENG_PASSWORD

driver = webdriver.Chrome()
driver.get('https://www.ifeng.com/')
driver.implicitly_wait(10)
driver.maximize_window()

"""找到账号登录点击"""
driver.find_element(By.CSS_SELECTOR, '.login_in_2x-3NxtSKIw').click()
time.sleep(2)

"""注意一定要进入嵌套网页"""
iframe_label = driver.find_element(By.CSS_SELECTOR, '.box-1pZSPyeN>div:nth-child(2)>iframe')
driver.switch_to.frame(iframe_label)

"""点击账号登录"""
driver.find_element(By.CSS_SELECTOR, '.index_tab_FDzng>span:nth-child(1)').click()
time.sleep(1)

"""找用户名和密码框, 输入数据"""
driver.find_element(By.NAME, 'text').send_keys(FENG_USERNAME)
time.sleep(0.5)

driver.find_element(By.NAME, 'password').send_keys(FENG_PASSWORD)
time.sleep(0.5)

"""获取验证码"""
img_label = driver.find_element(By.CSS_SELECTOR, '.index_codeImg_6TcnD>img')
img_str = img_label.get_attribute('src')
print('全部的图片标签数据:', img_str)
base64_str = img_str.split(',')[-1]
print('base64字符串形式的图片:', base64_str)

# 把字符串形式的图片转换成二进制
bytes_img = base64.b64decode(base64_str)
print(bytes_img)

with open('yzm.png', mode='wb') as f:
    f.write(bytes_img)
    print('验证码保存完毕')

"""调用打码平台识别验证码"""
from img_api import base64_api

code_result = base64_api('yzm.png', 7)
print('验证码识别结果:', code_result)

"""输入验证码"""
driver.find_element(By.CSS_SELECTOR, '.index_input_Lm1EX input').send_keys(code_result)
time.sleep(2)

# 点击登录
driver.find_element(By.CSS_SELECTOR, '.index_submmitBtn_Xd39V').click()
time.sleep(2)

input()
driver.quit()

3. B站点选验证码

import base64
import time

from selenium import webdriver
from selenium.webdriver.common.by import By
from constants import BILIBILI_USERNAME, BILIBILI_PASSWORD
from selenium.webdriver import ActionChains

driver = webdriver.Chrome()
driver.get('https://passport.bilibili.com/login')
driver.implicitly_wait(10)
driver.maximize_window()

"""找用户名和密码框, 输入数据"""
driver.find_element(By.XPATH, '//input[@placeholder="请输入账号"]').send_keys(BILIBILI_USERNAME)
time.sleep(2)
driver.find_element(By.XPATH, '//input[@placeholder="请输入密码"]').send_keys(BILIBILI_PASSWORD)
time.sleep(2)

"""点击登录按钮"""
driver.find_element(By.CSS_SELECTOR, '.btn_wp>div:nth-child(2)').click()
time.sleep(2)

"""使用selenium标签对象保存图片"""
img_label = driver.find_element(By.CSS_SELECTOR, 'body>div:last-of-type .geetest_holder.geetest_silver')
img_label.screenshot('yzm2.png')
print('正在保存验证码...')

"""识别图验证码"""
from img_api import base64_api

code_result_list = base64_api('yzm2.png', 21)
print('验证码识别结果为:', code_result_list)  # 173,262|112,139|254,224

result_list = code_result_list.split('|')  # ['173,262', '112,139', '254,224']

"""
4.0+版本的move_to_element_with_offset方法会以元素中心为基准进行偏移,而4.0版本会以左上角顶点为基准进行偏移
既然是基于中心的偏移,我们只需要获取页面点选图片元素后,获取其长度和宽度,
再在move_to_element_with_offset的后两个参数中,减去一半的长度、宽度再进行偏移就好了。
"""
code_label_half_width = img_label.rect['width'] / 2  # 验证码标签对象一半的宽度
code_label_half_height = img_label.rect['height'] / 2  # 验证码标签对象一半的宽度

for result in result_list:
    x = int(result.split(',')[0])  # x轴  str 转 int
    y = int(result.split(',')[1])  # y轴  str 转 int

    # # move_to_element_with_offset  根据元素执行点击操作
    # move_to_element_with_offset 会以元素中心为基准进行偏移
    ActionChains(driver).move_to_element_with_offset(
        img_label,  # 验证码标签对象
        x - code_label_half_width,  # 计算 x 轴点的位置
        y - code_label_half_height  # 计算 y 轴点的位置
    ).click().perform()

# 点击确认
driver.find_element(By.CSS_SELECTOR, '.geetest_commit_tip').click()

input()
driver.quit()

四、滑块验证码

1. 简单滑块

import time
from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By

driver = webdriver.Chrome()
# 绕过检测的代码要放到实例化浏览器对象下面
# 修改selenium打开浏览器的属性特征
driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
    "source": """
    Object.defineProperty(navigator, 'webdriver', {
      get: () => false
    })
  """
})
driver.get('https://kyfw.12306.cn/otn/resources/login.html')
driver.implicitly_wait(10)
driver.maximize_window()

"""模拟用户名和密码输入"""
driver.find_element(By.CSS_SELECTOR, '#J-userName').send_keys('19999999999')
driver.find_element(By.CSS_SELECTOR, '#J-password').send_keys('1234567890')
driver.find_element(By.CSS_SELECTOR, '#J-login').click()
time.sleep(1)

# 定位滑块元素
h = driver.find_element(By.CSS_SELECTOR, '#nc_1_n1z')

"""使用鼠标动作链滑动"""
action = ActionChains(driver)
action.click_and_hold(h)  # click_and_hold 点击按住元素并且保持
action.move_by_offset(340, 0)
# action.move_by_offset(85, 0)
# action.move_by_offset(85, 0)
# action.move_by_offset(85, 0)
# release() 松开鼠标
action.release().perform()

input('阻塞, 回车继续:')
driver.quit()

"""
如果加常规的染过检测的代码还是过不了滑块
那么可以使用本地浏览器 或者 用绕过流行特征的方式, 染过服务器检测
参考: https://blog.csdn.net/weixin_45081575/article/details/126585575


绕过检测方式:
    1. driver.execute_cdp_cmd("
    2. 刷js文件, 将浏览器的其他特征刷掉
    3. 操作本地浏览器
"""

2. 极验验证

分段类型

获取验证码图片
修改网页前端属性显示全部图片

因为在此案例网站中, 滑动验证码的图片默认是隐藏的,所以不方便我们查看分析。可以去进行验证码的滑动,查看在滑动的过程中前端的标签属性哪里会发生变化,然后手动修改变化后的属性值,让验证码显示在页面上来。

  • 没滑动前标签样式是这样的:注意查看 div标签的 gt_widget gt_hide 这个类属性

在这里插入图片描述

  • 滑动后div标签属性发生了变化,其中gt_hide属性变成了gt_show

在这里插入图片描述

基于上述情况, 可以在Elements元素面板中将gt_hide修改成gt_show即可查看到显示出来的滑动验证码,鼠标双击此属性即可键入修改。
但是修改后有时效性,后续有需要的话需要重复多次修改

下载验证码

这种类型的滑块验证码有一个特点,在前端中整个滑动验证码将图片分割成了若干份,并且在前端中将图片顺序打乱了。那么问题来了,为什么在前端网页中我们看到的图片是一个正常的图片呢?原因在于前端中将乱序的图片通过css偏移,让每个分割的图片显示到了特定的位置,从而用户看到的是一个正常的图片。

  • 当使用元素选择工具选取验证码部分标签对象的时候,看到的就是一个一个分块的图片

在这里插入图片描述

  • 在每个分块图片的div标签中,包含了整张图片的链接地址、分块图片的偏移数据,因此我们需要提取这些数据。整张图片的链接地址用于请求下载图片,下载的图片是乱序的,因此要根据分块图片的偏移量数据还原。

在这里插入图片描述

  • 以下代码是下载验证码,并且提取分块图片偏移量的代码
def get_image(div_path, file_name):
    """
    下载错乱的图片  获得所有图片的偏移值
    :param div_path: 根据xpath提取图片,传入xpath规则
    :param file_name: 保存的图片的文件名
    :return: 返回图片的偏移值
    """
    background_images = driver.find_elements(By.CSS_SELECTOR, div_path)  # 根据css语法提取图片所在的标签

    location_list = []  # 定义一个空列表, 后期存放所有图片偏移值的信息
    for background_image in background_images:
        location = {}  # 定义一个空字典, 后以键值对的形式记录每一张图片的偏移量
        result = re.findall('background-image: url\("(.*?)"\); background-position: (.*?)px (.*?)px;',
                            background_image.get_attribute('style'))  # 根据每一个片段的图片对应得标签

        location['x'] = int(result[0][1])  # 第一个偏移量用 x 做字典的第一个键
        location['y'] = int(result[0][2])  # 第二个偏移量用 y 做字典的第二个键

        image_url = result[0][0]  # 取出匹配结果中图片的url地址, 后期需要下载图片

        location_list.append(location)

    # 替换图片 url 后缀, 避免在pycharm显示不了
    image_url = image_url.replace('webp', 'jpg')

    image_result = requests.get(image_url).content  # 请求图片数据
    with open(file_name, 'wb') as f:
        f.write(image_result)

    return location_list
  • 要下载两张验证码图片, 一张是完整的验证码图片,一张是带缺口的验证码图片

    • 以下标签是完整验证码图片对应的标签
      在这里插入图片描述
    • 以下标签是带缺口的验证码图片对应的标签
      在这里插入图片描述
  • 下载好的图片是乱序的图片

    • 完整验证码如下所示:
      在这里插入图片描述
    • 带缺口的验证码如下所示:
      在这里插入图片描述
    • 验证码会实时刷新,所以课件中所示验证码不一样
还原验证码图片
  • 使用pillow模块对乱序图片进行分割,按照偏移量规则进行还原

根据上述操作咱们已经获取到两张验证码图片,但是图片显示出来是错乱乱序的。我们可以根据提取到的css偏移量对图片进行裁剪,然后贴到一张空白图像上对图片进行还原。具体代码如下:

def merge_image(image_file, location_list, restore_name):
    """
    还原图片数据 还原图片
    :param image_file: 传递一个图片文件路径
    :param location_list: 传递图片的偏移量数据
    :param restore_name: 还原图片后保存的文件名
    :return: None
    """
    im = Image.open(image_file)  # 打开传入的文件对象
    new_im = Image.new('RGB', (260, 116))  # 创建一个空白的图片

    im_list_upper = []  # 存放上半部分的图片
    im_list_down = []  # 存放下半部分的图片

    for location in location_list:  # 遍历 location_list 列表中的所有字典
        # print('乱序图片的偏移量', location)
        print(location)
        if location['y'] == -58:  # 上半边
            # crop() 方法返一个图像的矩形区域,需要指定 "左上顶点" 和 "右下点" 的坐标,返回一个指定区域的图片对象
            # abs()  方法是取数字的绝对值
            im_list_upper.append(im.crop((abs(location['x']), 58, abs(location['x']) + 10, 116)))
        if location['y'] == 0:  # 下半边
            im_list_down.append(im.crop((abs(location['x']), 0, abs(location['x']) + 10, 58)))

    x_offset = 0
    for im in im_list_upper:
        new_im.paste(im, (x_offset, 0))  # 把小图片放到 新的空白图片上 放上半部分
        x_offset += im.size[0]

    x_offset = 0
    for im in im_list_down:
        new_im.paste(im, (x_offset, 58))  # 把小图片放到 新的空白图片上 放下半部分
        x_offset += im.size[0]

    new_im.save(restore_name)
    return None
  • 完整滑动验证码图片和带缺口的验证码图片都需要还原
    • 还原后的完整验证码图片如下:
      在这里插入图片描述
    • 还原后的带缺口的验证码图片如下:
      在这里插入图片描述
获取验证码缺口距离

对比两张验证码图片,使用ddddocr调用接口识别出缺口距离,代码如下所示:

def get_gap(notch_img, all_img):
    """
    验证码缺口距离识别, 获取缺口偏移量
    :param notch_img: 带缺口的验证码文件路径
    :param all_img: 完整的验证码文件路径
    :return: 验证码缺口横向距离
    """
    slide = ddddocr.DdddOcr(beta=True)  # beta=True 通用识别

    # 打开带缺口的图片
    with open(notch_img, 'rb') as f:
        target_bytes = f.read()
    # 打开完整图片
    with open(all_img, 'rb') as f:
        background_bytes = f.read()
    # slide_comparison(二进制带缺口图片, 二进制完整图片)  --> 识别方法
    res = slide.slide_comparison(target_bytes, background_bytes)

    if res:
        # 识别结果样式: {'target': [117, 72]} --> 其中列表中第一个数字就是缺口的横向距离
        print("识别结果: ", res)
        print("缺口的横向距离: ", res['target'][0])
    else:
        raise Exception('验证码识别失败')

    return res['target'][0]
动验证码模拟滑动

使用pyautogui自动化工具做模拟滑动

PyAutoGUI 是一个面向人类的跨平台 GUI 自动化 Python 模块。用于以编程方式控制鼠标和键盘。

  • 安装:pip install pyautogui
  • 英文文档:https://pyautogui.readthedocs.org
  • 中文示例:https://github.com/asweigart/pyautogui/blob/master/docs/simplified-chinese.ipynb
  • 依赖关系
macOS 需要安装 pyobjc-core 和 pyobjc 模块(按顺序)。

Linux 需要安装 python3-xlib(或 Python 2 的 python-xlib)模块。

需要安装 Pillow,在 Linux 上您可能需要安装额外的库以确保 Pillow 的 PNG/JPEG 正常工作
  • 为什么使用pyautogui

    极验的滑动验证码并不是简单的将滑块滑动到缺口位置就能成功的,滑动到缺口位置只是其中一个必要条件,除此以外极验滑动验证码还会校验用户的滑动轨迹,如果滑动的轨迹校验不是一个正常的人为滑动轨迹,即使滑动到了缺口位置也不会成功通过。

    鼠标动作链(ActionChains)是一个不错的选择,但是操作的是浏览器对象,即使轨迹构建好滑到缺口位置也会经常性的不能通过极验滑动验证码。

    因此使用pyautogui操作系统的鼠标,构建好滑动轨迹,那么一般情况下极验验证码就很难做识别了。

  • 具体具体代码实现如下:

def move_slide(offset_x, offset_y, left):
    """
    执行滑块的移动
    :param offset_x: 滑块的x轴坐标
    :param offset_y: 滑块的y轴坐标
    :param left: 需要移动的距离
    :return:
    """

    # 移动到滑块的位置
    # duration为持续时间
    # random.uniform(参数1,参数2) 返回参数1和参数2之间的任意值
    pyautogui.moveTo(
        offset_x,
        offset_y,
        duration=0.1 + random.uniform(0, 0.1 + random.randint(1, 100) / 100))

    # 按下鼠标 准备开始滑动
    pyautogui.mouseDown()
    # random.randint(参数1, 参数2) 函数返回参数1和参数2之间的任意整数
    offset_y += random.randint(9, 19)
    pyautogui.moveTo(
        offset_x + int(left * random.randint(15, 25) / 20),
        offset_y,
        duration=0.28)

    offset_y += random.randint(-9, 0)
    pyautogui.moveTo(
        offset_x + int(left * random.randint(18, 22) / 20),
        offset_y,
        duration=random.randint(19, 31) / 100)

    offset_y += random.randint(0, 8)
    pyautogui.moveTo(
        offset_x + int(left * random.randint(19, 21) / 20),
        offset_y,
        duration=random.randint(20, 40) / 100)

    offset_y += random.randint(-3, 3)
    pyautogui.moveTo(
        left + offset_x + random.randint(-3, 3),
        offset_y,
        duration=0.5 + random.randint(-10, 10) / 100)

    offset_y += random.randint(-2, 2)
    pyautogui.moveTo(
        left + offset_x + random.randint(-2, 2),
        offset_y,
        duration=0.5 + random.randint(-3, 3) / 100)

    # 释放鼠标
    pyautogui.mouseUp()
    time.sleep(3)
练习案例
import random
import re
import time

import ddddocr
import requests
from PIL import Image
from selenium import webdriver
from selenium.webdriver.common.by import By
import pyautogui


def get_image(div_path, file_name):
    """
    下载乱序图片, 获取每张小图的偏移量
    :param div_path: 解析语法定位到图片的标签对象
    :param file_name: 保存的文件名字
    :return: 返回每一个小图的偏移量数据
    """
    # 根据解析语法定位标签
    background_images = driver.find_elements(By.CSS_SELECTOR, div_path)

    location_list = []  # 定义空列表, 存放所有图片偏移量信息
    for background_image in background_images:
        location = {}  # 定义一个空字典, 后续以键值对的形式记录每一个小图的哦爱你一辆

        # 提取图片地址, 每一个小图的偏移量数据
        result = re.findall('background-image: url\("(.*?)"\); background-position: (.*?)px (.*?)px;',
                            background_image.get_attribute('style'))

        location['x'] = int(result[0][1])  # 第一个偏移量用 x 做字典的第一个键
        location['y'] = int(result[0][2])  # 第二个偏移量用 y 做字典的第二个键

        image_url = result[0][0]  # 取出匹配到的图片链接, 后续请求保存图片

        location_list.append(location)

    # 替换图片 url 后缀, 避免在pycharm显示不了
    image_url = image_url.replace('webp', 'jpg')

    image_result = requests.get(image_url).content  # 请求图片数据
    with open(file_name, 'wb') as f:
        f.write(image_result)

    return location_list  # 返回当前图片的偏移量信息


def merge_image(image_file, location_list, restore_name):
    """
    还原乱序的图片
    :param image_file: 文件名路径
    :param location_list: 偏移量规则
    :param restore_name: 还原后保存的图片名字
    :return: None
    """

    im = Image.open(image_file)  # 打开传入的文件对象
    new_im = Image.new('RGB', (260, 116))  # 创建一个空白的图片

    im_list_upper = []  # 存放上半部分的图片
    im_list_down = []  # 存放下半部分的图片

    for location in location_list:

        print(location)
        if location['y'] == -58:  # 上半边
            # crop() 方法返一个图像的矩形区域,需要指定 "左上顶点" 和 "右下点" 的坐标,返回一个指定区域的图片对象
            # abs()  方法是取数字的绝对值
            im_list_upper.append(im.crop((abs(location['x']), 58, abs(location['x']) + 10, 116)))
        if location['y'] == 0:  # 下半边
            im_list_down.append(im.crop((abs(location['x']), 0, abs(location['x']) + 10, 58)))

    x_offset = 0  # 初始值
    for im in im_list_upper:
        #
        new_im.paste(im, (x_offset, 0))  # 把小图片放到 新的空白图片上 放上半部分
        x_offset += im.size[0]

    x_offset = 0
    for im in im_list_down:
        new_im.paste(im, (x_offset, 58))  # 把小图片放到 新的空白图片上 放下半部分
        x_offset += im.size[0]

    new_im.save(restore_name)  # 保存还原图片
    return None


def get_gap(notch_img, all_img):
    """
    验证码缺口距离识别, 获取缺口偏移量
    :param notch_img: 带缺口的验证码文件路径
    :param all_img: 完整的验证码文件路径
    :return: 验证码缺口横向距离
    """

    slide = ddddocr.DdddOcr(beta=True)  # beta=True 通用识别

    # 打开带缺口的图片
    with open(notch_img, 'rb') as f:
        target_bytes = f.read()
    # 打开完整图片
    with open(all_img, 'rb') as f:
        background_bytes = f.read()

    # slide_comparison(二进制带缺口图片, 二进制完整图片)  --> 识别方法
    res = slide.slide_comparison(target_bytes, background_bytes)

    if res:
        # 识别结果样式: {'target': [117, 72]} --> 其中列表中第一个数字就是缺口的横向距离
        print("识别结果: ", res)
        print("缺口的横向距离: ", res['target'][0])
    else:
        raise Exception('验证码识别失败')

    return res['target'][0]


def move_slide(offset_x, offset_y, left):
    """
    执行滑块的移动
    :param offset_x: 滑块的x轴坐标
    :param offset_y: 滑块的y轴坐标
    :param left: 需要移动的距离
    :return:
    """
    # 鼠标移动到显示器窗口指定的坐标位置, 后续自己电脑的位置, 需要重新定位
    pyautogui.moveTo(
        offset_x,
        offset_y,
        # 设置移动时间
        duration=0.1 + random.uniform(0, 0.1 + random.randint(1, 100) / 100))

    pyautogui.mouseDown()  # 按下鼠标

    offset_y += random.randint(9, 19)  # 随机偏移Y轴位置
    pyautogui.moveTo(
        offset_x + int(left * random.randint(15, 25) / 20),
        offset_y,
        duration=0.28)

    offset_y += random.randint(-9, 0)
    pyautogui.moveTo(
        offset_x + int(left * random.randint(18, 22) / 20),
        offset_y,
        duration=random.randint(19, 31) / 100)

    offset_y += random.randint(0, 8)
    pyautogui.moveTo(
        offset_x + int(left * random.randint(19, 21) / 20),
        offset_y,
        duration=random.randint(20, 40) / 100)

    offset_y += random.randint(-3, 3)
    pyautogui.moveTo(
        left + offset_x + random.randint(-3, 3),
        offset_y,
        duration=0.5 + random.randint(-10, 10) / 100)

    offset_y += random.randint(-2, 2)
    pyautogui.moveTo(
        left + offset_x + random.randint(-2, 2),
        offset_y,
        duration=0.5 + random.randint(-3, 3) / 100)

    pyautogui.mouseUp()  # 松开鼠标
    time.sleep(3)


if __name__ == '__main__':
    # 实例化一个浏览器对象
    driver = webdriver.Chrome()
    # 打开浏览器页面, 请求url地址
    driver.get('http://www.cnbaowen.net/api/geetest/')
    driver.maximize_window()
    driver.implicitly_wait(10)

    time.sleep(2)
    """获取到两张图片(一个是有缺口的图片, 一个是完整的图片)"""
    image1_location = get_image('.gt_cut_fullbg.gt_show>div', 'split-1.png')  # 获取完整的图片
    print('正在保存完整图片......')

    image2_location = get_image('.gt_cut_bg.gt_show>div', 'split-2.png')  # 获取带缺口的图片
    print('正在保存带有缺口的图片......\n')
    print('偏移量规则:', image2_location)

    """还原图片"""
    merge_image('split-1.png', image1_location, 'output-all.png')
    print('正在还原完整的验证码图片......')
    merge_image('split-2.png', image2_location, 'output-notch.png')
    print('正在还原带缺口的验证码图片......\n')

    """调用ddddocr识别滑块距离"""
    # 滑块距离不一定对, 可能会存在偏差
    distance = get_gap('output-notch.png', 'output-all.png')

    # 鼠标动作链滑动极验验证码经常会被检测到

    # 实际滑动距离需要做细微的调整
    # distance += 2

    """调用移动滑块的函数"""
    # 当调用滑动的时候, 不要动你的鼠标
    move_slide(665, 390, distance)

    input('阻塞, 回车继续:')
    driver.quit()

canvas类型处理

获取验证码图片

目标网址中,滑动验证码图片有三张图片,每张图片对应的标签分别是三个 <canvas> ,并且在前端样式经过处理后,不管选中哪个 <canvas> 标签,选择的都是滑动验证码图片同一块标签区域。

在这里插入图片描述
根据分析三张图依次对应的验证码图像如下所示:
在这里插入图片描述
基于这样的情况,那么我们怎样去截取验证码图片呢?咱们在前端可以修改 <canvas> 标签的样式,让想要保存的验证码图片显示出来,不想要的验证码图片通过样式修改可以将其隐藏。我们只需要获取带缺口的验证码图片和完整验证码图片就可以了,可以通过执行js代码修改标签样式,如下所示:

通过在Console控制台调试js代码

  • document.querySelectorAll("canvas")
    • 上述js代码可以获取到三个 标签,对应的索引分别是 0 - 1 - 2,其中0代表缺口图,1代表滑块图,2代表完整图
      在这里插入图片描述
  • document.querySelectorAll("canvas")[1].style="display: none;"
    • 上述js代码是将索引为 [1] 的**<canvas>**标签通过.style修改其属性display为隐藏,执行后可以看到滑动验证码的滑块图片就被隐藏了
      在这里插入图片描述
    • 当滑块隐藏后那么我们可以将带缺口的验证码截图并保存下来。按照上述相同的逻辑,我们可以把完整的滑动验证码通过修改标签属性显示在前端后,截图保存下来。
      js代码:document.querySelectorAll("canvas")[2].style="",此js逻辑是移除了索引为 [2] 的**<canvas>**标签的style属性。执行js后如下所示:
      在这里插入图片描述

获取验证码图片的代码逻辑如下:

def get_captcha():
    """保存验证码的缺口图片和完整的图片"""
    wait.until(
        EC.text_to_be_present_in_element((By.CSS_SELECTOR, ".geetest_radar_tip_content"), "点击按钮进行验证")
    )

    driver.find_element(By.CSS_SELECTOR, ".geetest_radar_tip_content").click()

    # 确定滑块加载出来之后 再进行后续的操作
    wait.until(
        EC.text_to_be_present_in_element((By.CSS_SELECTOR, ".geetest_slider_tip.geetest_fade"), "拖动滑块完成拼图")
    )
    time.sleep(1)
    print("滑块加载完成")

    # 执行以下是隐藏滑块图片 [0]是缺口图片; [1]是滑块图片; [2]是完整图片
    driver.execute_script('document.querySelectorAll("canvas")[1].style="display: none;"')

    """标签元素截图保存验证码"""
    captcha_tag = driver.find_element(By.CSS_SELECTOR, ".geetest_window")
    # 获取有缺口的验证码
    captcha_tag.screenshot('output-notch.png')
    print('正在保存带缺口的验证码......')

    time.sleep(1)
    # 先修改CSS样式 得到完整验证码图片, 不带缺口的; 修改后不需要恢复, 因为当后续滑动的时候,验证码前端样式会自动修改
    driver.execute_script('document.querySelectorAll("canvas")[2].style=""')
    captcha_tag.screenshot('output-all.png')
    print('正在保存不带缺口的完整的验证码......')

    time.sleep(1)
    # 为了更加清楚的看到滑动的效果 恢复一下之前修改的css样式
    driver.execute_script('document.querySelectorAll("canvas")[1].style="opacity: 1; display: block;"')
获取验证码缺口距离

对比两张验证码图片,使用ddddocr调用接口识别出缺口距离,代码如下所示:

def get_gap(notch_img, all_img):
    """
    验证码缺口距离识别, 获取缺口偏移量
    :param notch_img: 带缺口的验证码文件路径
    :param all_img: 完整的验证码文件路径
    :return: 验证码缺口横向距离
    """
    slide = ddddocr.DdddOcr(beta=True)  # beta=True 通用识别

    # 打开带缺口的图片
    with open(notch_img, 'rb') as f:
        target_bytes = f.read()
    # 打开完整图片
    with open(all_img, 'rb') as f:
        background_bytes = f.read()
    # slide_comparison(二进制带缺口图片, 二进制完整图片)  --> 识别方法
    res = slide.slide_comparison(target_bytes, background_bytes)

    if res:
        # 识别结果样式: {'target': [117, 72]} --> 其中列表中第一个数字就是缺口的横向距离
        print("识别结果: ", res)
        print("缺口的横向距离: ", res['target'][0])
    else:
        raise Exception('验证码识别失败')

    return res['target'][0]
滑动验证码模拟滑动

同样使用pyautogui模拟鼠标对验证码进行滑动, 代码如下所示:

def move_slide(offset_x, offset_y, left):
    """
    执行滑块的移动
    :param offset_x: 滑块的x轴坐标
    :param offset_y: 滑块的y轴坐标
    :param left: 需要移动的距离
    :return:
    """

    # duration为持续时间
    # random.uniform(参数1,参数2) 返回参数1和参数2之间的任意值
    pyautogui.moveTo(
        offset_x,
        offset_y,
        duration=0.1 + random.uniform(0, 0.1 + random.randint(1, 100) / 100))

    # 按下鼠标 准备开始滑动
    pyautogui.mouseDown()
    # random.randint(参数1, 参数2) 函数返回参数1和参数2之间的任意整数
    offset_y += random.randint(9, 19)
    pyautogui.moveTo(
        offset_x + int(left * random.randint(15, 25) / 20),
        offset_y,
        duration=0.28)

    offset_y += random.randint(-9, 0)
    pyautogui.moveTo(
        offset_x + int(left * random.randint(18, 22) / 20),
        offset_y,
        duration=random.randint(19, 31) / 100)

    offset_y += random.randint(0, 8)
    pyautogui.moveTo(
        offset_x + int(left * random.randint(19, 21) / 20),
        offset_y,
        duration=random.randint(20, 40) / 100)

    offset_y += random.randint(-3, 3)
    pyautogui.moveTo(
        left + offset_x + random.randint(-3, 3),
        offset_y,
        duration=0.5 + random.randint(-10, 10) / 100)

    offset_y += random.randint(-2, 2)
    pyautogui.moveTo(
        left + offset_x + random.randint(-2, 2),
        offset_y,
        duration=0.5 + random.randint(-3, 3) / 100)

    # 释放鼠标
    pyautogui.mouseUp()
    time.sleep(3)
练习案例
import random
import time
import ddddocr
import pyautogui
from selenium import webdriver
from selenium.webdriver.common.by import By

def get_captcha():
    time.sleep(1)
    # 点击人机校验
    driver.find_element(By.CSS_SELECTOR, ".geetest_radar_tip_content").click()
    time.sleep(2)

    print("滑块加载完成")

    # 如果不确定下表索引是从零开始的 还是1开始的 可以简单测试一下:从0开始的
    # 执行以下是隐藏滑块图片 [0]是缺口图片; [1]是滑块图片; [2]是完整图片
    driver.execute_script('document.querySelectorAll("canvas")[1].style="display: none;"')

    """标签元素截图保存验证码"""
    captcha_tag = driver.find_element(By.CSS_SELECTOR, ".geetest_window")

    captcha_tag.screenshot('output-notch.png')
    print('正在保存带缺口的验证码......')

    time.sleep(1)

    # 执行一下js代码, 可以显示完整图片
    driver.execute_script('document.querySelectorAll("canvas")[2].style=""')
    captcha_tag.screenshot('output-all.png')
    print('正在保存不带缺口的完整的验证码......')

    time.sleep(1)

    # 为了更加清楚的看到滑动的效果 恢复一下之前修改的css样式; opacity: 1 --> 不透明; display: block --> 显示块级元素
    driver.execute_script('document.querySelectorAll("canvas")[1].style="opacity: 1; display: block;"')


def get_gap(notch_img, all_img):
    """
    验证码缺口距离识别, 获取缺口偏移量
    :param notch_img: 带缺口的验证码文件路径
    :param all_img: 完整的验证码文件路径
    :return: 验证码缺口横向距离
    """

    slide = ddddocr.DdddOcr(beta=True)  # beta=True 通用识别

    # 打开带缺口的图片
    with open(notch_img, 'rb') as f:
        target_bytes = f.read()
    # 打开完整图片
    with open(all_img, 'rb') as f:
        background_bytes = f.read()

    # slide_comparison(二进制带缺口图片, 二进制完整图片)  --> 识别方法
    res = slide.slide_comparison(target_bytes, background_bytes)

    if res:
        # 识别结果样式: {'target': [117, 72]} --> 其中列表中第一个数字就是缺口的横向距离
        print("识别结果: ", res)
        print("缺口的横向距离: ", res['target'][0])
    else:
        raise Exception('验证码识别失败')

    return res['target'][0]


def move_slide(offset_x, offset_y, left):
    """
    执行滑块的移动
    :param offset_x: 滑块的x轴坐标
    :param offset_y: 滑块的y轴坐标
    :param left: 需要移动的距离
    :return:
    """
    # 鼠标移动到显示器窗口指定的坐标位置, 后续自己电脑的位置, 需要重新定位
    pyautogui.moveTo(
        offset_x,
        offset_y,
        # 设置移动时间
        duration=0.1 + random.uniform(0, 0.1 + random.randint(1, 100) / 100))

    pyautogui.mouseDown()  # 按下鼠标

    offset_y += random.randint(9, 19)  # 随机偏移Y轴位置
    pyautogui.moveTo(
        offset_x + int(left * random.randint(15, 25) / 20),
        offset_y,
        duration=0.28)

    offset_y += random.randint(-9, 0)
    pyautogui.moveTo(
        offset_x + int(left * random.randint(18, 22) / 20),
        offset_y,
        duration=random.randint(19, 31) / 100)

    offset_y += random.randint(0, 8)
    pyautogui.moveTo(
        offset_x + int(left * random.randint(19, 21) / 20),
        offset_y,
        duration=random.randint(20, 40) / 100)

    offset_y += random.randint(-3, 3)
    pyautogui.moveTo(
        left + offset_x + random.randint(-3, 3),
        offset_y,
        duration=0.5 + random.randint(-10, 10) / 100)

    offset_y += random.randint(-2, 2)
    pyautogui.moveTo(
        left + offset_x + random.randint(-2, 2),
        offset_y,
        duration=0.5 + random.randint(-3, 3) / 100)

    pyautogui.mouseUp()  # 松开鼠标
    time.sleep(3)


if __name__ == '__main__':
    driver = webdriver.Chrome()
    driver.get("https://www.geetest.com/demo/slide-float.html")
    driver.maximize_window()  # 最大化
    driver.implicitly_wait(10)

    # 调用保存验证码的函数
    get_captcha()

    """调用ddddocr识别滑块距离"""
    distance = get_gap('output-notch.png', 'output-all.png')
    # 实际滑动距离需要做细微的调整
    distance -= 5

    """调用移动滑块的函数"""
    move_slide(937, 475, distance)

    input("阻塞:")
    driver.quit()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/283124.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Baumer工业相机堡盟工业相机如何通过NEOAPI SDK设置相机本身的数据保存(CustomData)功能(C#)

Baumer工业相机堡盟工业相机如何通过NEOAPI SDK设置相机本身的数据保存&#xff08;CustomData&#xff09;功能&#xff08;C#&#xff09; Baumer工业相机Baumer工业相机的数据保存&#xff08;CustomData&#xff09;功能的技术背景CameraExplorer如何使用图像剪切&#xff…

【42页动态规划学习笔记分享】动态规划核心原理详解及27道LeetCode相关经典题目汇总

《博主简介》 小伙伴们好&#xff0c;我是阿旭。专注于人工智能AI、python、计算机视觉相关分享研究。 ✌更多学习资源&#xff0c;可关注公-仲-hao:【阿旭算法与机器学习】&#xff0c;共同学习交流~ &#x1f44d;感谢小伙伴们点赞、关注&#xff01; 《------往期经典推荐--…

MIT线性代数笔记-第35讲-期末复习

目录 35.期末复习打赏 35.期末复习 已知一个矩阵 A A A满足 A x ⃗ [ 1 0 0 ] A \vec{x} \begin{bmatrix} 1 \\ 0 \\ 0 \end{bmatrix} Ax ​100​ ​无解且 A x ⃗ [ 0 1 0 ] A \vec{x} \begin{bmatrix} 0 \\ 1 \\ 0 \end{bmatrix} Ax ​010​ ​仅有一个解 (1)求 A A A的…

Linux驱动学习—pinctl和gpio子系统

1、pinctl和gpio子系统&#xff08;一&#xff09; 1.1pinctrl 子系统主要工作内容 <1>获取设备树中 pin 信息&#xff0c;管理系统中所有的可以控制的 pin&#xff0c; 在系统初始化的时候&#xff0c; 枚举所有可以控制的 pin&#xff0c; 并标识这些 pin。 <2>…

burpsuite模块介绍之compare

导语 Burp Comparer是Burp Suite中的一个工具&#xff0c;主要提供一个可视化的差异比对功能&#xff0c;可以用于分析比较两次数据之间的区别。它的应用场景包括但不限于&#xff1a; 枚举用户名过程中&#xff0c;对比分析登陆成功和失败时&#xff0c;服务器端反馈结果的区…

python脚本实现一次提取多个文件下的图片

problem formulation 有时候下载的数据集如下&#xff0c;就很烦&#xff0c;一个里面就一张图片 code import os import shutil# 定义源目录和目标目录 source_dir ./dataset/data/Detection destination_dir ./dataset/data/img# 确保目标目录存在&#xff0c;如果不存…

初识大数据,一文掌握大数据必备知识文集(7)

&#x1f3c6;作者简介&#xff0c;普修罗双战士&#xff0c;一直追求不断学习和成长&#xff0c;在技术的道路上持续探索和实践。 &#x1f3c6;多年互联网行业从业经验&#xff0c;历任核心研发工程师&#xff0c;项目技术负责人。 &#x1f389;欢迎 &#x1f44d;点赞✍评论…

pycharm python环境安装

目录 1.Python安装 2.PyQt5介绍 3.安装pyuic 4.启动designer.exe 5.pyinstaller(打包发布程序) 6.指定源安装 7.PyQt5-tools安装失败处理 8.控件介绍 9.错误记录 1.NameError: name reload is not defined 10.开发记录 重写报文输出和文件 ​编辑 1.Python安装 点…

BFS

目录 BFS 走迷宫 BFS 算法特点 优先考虑宽度&#xff0c;换句话说就是按层推进&#xff0c;直到最后一层。 空间复杂度&#xff1a;O&#xff08;2^h&#xff09; BFS是按宽度搜索&#xff0c;所以可以找到最短路&#xff0c;适用于解决像最短路&#xff0c;最少之类的问题…

Python装饰器的专业解释

装饰器&#xff0c;其实是用到了闭包的原理来进行操作的。 单个装饰器&#xff1a; 以下是一个简单的例子&#xff1a; def outer(func):print("OUTER enter ...")def wrapper(*args, **kwargs):print("调用之前......")result func(*args, **kwargs)p…

【YOLO系列】yolo V1 ,V3,V5,V8 解释

文章目录 yolo V1 模型结构图通道数 的 物理意义是什么&#xff1f;输出 7730 怎么理解&#xff1f;YOLO v1 损失函数LOSS yolo V3yolo V5yolo V8 视频来源&#xff1a;https://www.bilibili.com/video/BV13K411t7Zs/ AI视频小助理 一、YOLO系列的目标检测算法&#xff0c;其中…

【操作系统】存储器管理

目录 4.1 存储器的层次结构 4.1.1 多级存储结构 4.1. 2 可执行存储器 4.1.3 高速缓存和磁盘缓存 4.2 程序的装入和链接 4.2.1 程序的装入 4.2.2 程序的链接 1.静态链接(Static Linking)方式 (1) 对相对地址进行修改。 (2) 变换外部调用符号。 2. 装入时动态链接(Load-t…

CodeWave赋能创新的全功能技术平台

目录 前言1 应用中心2 资产中心&#xff1a;汇聚创新能量&#xff0c;提供开发加速3 集成中心3.1 API管理3.2 报表管理 4 运维中心4.1 资源监控4.2 用户管理4.3 权限管理4.4 日志与监控 5 配置中心5.1 源码配置5.2 镜像仓库配置5.3 数据库配置5.4 报表配置5.5 资产配置5.6 品牌…

JavaFX:MVC模式学习01-使用PropertyValueFactory将模型与视图绑定

PropertyValueFactory类是“TableColumn cell value factory”,绑定创建列表中的项。示例如下&#xff1a; TableColumn<Person,String> firstNameCol new TableColumn<Person,String>("First Name");firstNameCol.setCellValueFactory(new PropertyVal…

安装torch(GPU版本)并在Pycharm中配置

零.前置环境 1.NVIDIA GPU Computing Toolkit已安装 版本为&#xff1a;11.6 已添加到环境变量 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.6\bin C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.6\libnvvp 在cmd中查看cuda版本 方法1&#xff1a…

详解Vue3中的鼠标事件mousemove、mouseover和mouseout

本文主要介绍Vue3中的常见鼠标事件mousemove、mouseover和mouseout。 目录 一、mousemove——鼠标移动事件二、mouseover——鼠标移入事件三、mouseout——鼠标移出事件 下面是Vue 3中常用的鼠标事件mousemove、mouseover和mouseout的详解。 一、mousemove——鼠标移动事件 鼠…

图神经网络--GNN从入门到精通

图神经网络--GNN从入门到精通 一、图的基本表示和特征工程1.1 什么是图1.2 图的基本表示1.3 图的性质--度&#xff08;degree)1.4 连通图&#xff0c;连通分量1.5有向图连通性1.6图直径1.7度中心性1.7特征中心性&#xff08; Eigenvector Centrality&#xff09;1.8中介中心性 …

年度总结 | 回味2023不平凡的一年

目录 前言1. 平台成就2. 自我提升3. Bug连连4. 个人展望 前言 每年CSDN的总结都不能落下&#xff0c;回顾去年&#xff1a;年度总结 | 回味2022不平凡的一年&#xff0c;在回忆今年&#xff0c;展望下年 1. 平台成就 平台造就我&#xff08;我也造就平台哈哈&#xff09; 每…

汇川PLC(H5U):定时器指令

一、H5U系列的定时器种类 H5U系列PLC的定时器指令都封装成指令块了&#xff0c;共4种类型&#xff1a;脉冲定时器、接通延时定时器、关断延时定时器、时间累加定时器。 H5U系列PLC的定时器时间基准是1ms&#xff0c;在IN引脚的执行指令有效的时候开始跟新计数器的值。 我们知…

门控循环单元(GRU)-多输入时序预测

目录 一、程序及算法内容介绍&#xff1a; 基本内容&#xff1a; 亮点与优势&#xff1a; 二、实际运行效果&#xff1a; 三、部分代码&#xff1a; 四、完整代码数据下载&#xff1a; 一、程序及算法内容介绍&#xff1a; 基本内容&#xff1a; 本代码基于Matlab平台编译…