selenium 4.x 之验证码处理(python)

 验证码处理

一般情况公司如果涉及web自动化测试需要对验证码进行处理的方式一般有一下几种:

  • 关闭验证码功能(开发处理)
  • 设置万能验证码(开发处理)
  • 使用智能识别库进行验证
  • 通过第三方打码平台识别验证码

1. 跳过验证功能

需要开发配合,关闭验证码功能或者设置万能验证码

 2. 使用智能识别库进行验证(不推荐)

使用ddddocr库

基于深度学习的工具

主要用于识别图片中的文字以及数字内容

主要 特点:易用,正确率以及高效的优势

from ddddocr import DdddOcr
# 截取验证码图片
img = driver.find_element(By.XPATH, '//*[@id="verify"]').screenshot_as_png
# 使用识别库
verify = DdddOcr(show_ad=False).classification(img)

注意点:识别成功率会根据图片的复杂程度决定,所以使用程度并不高,但是可以进行对应的

优化,比如识别之后的验证码准确的判断

3. 通过第三方打码平台识别验证码

#截取验证码图片

driver.find_element(By.ID, 'slideBg').screenshot("vertify.png")

通过第三方接口发送请求识别验证码内容

超级鹰官方平台:https://www.chaojiying.com/price.html

识别验证码的接口地址:https://upload.chaojiying.net/Upload/Processing.php

登录平台,注册并生成软件ID

3.1 封装识别验证码函数

新建一个utils模块定义一个函数来识别验证

需要识别验证码,只需要调用对应的函数即可

函数中需要处理的逻辑就是识别返回结果

utils.py

#!/usr/local/bin/python3
# @IDE: PyCharm
# @.py: get_code
#-*- coding : utf-8
# @Author:may
# @Time: 2024/4/27
import requests


# 打码平台识别验证码
def img_code():

    url = 'https://upload.chaojiying.net/Upload/Processing.php'
    # 传递实参数据
    data = {
        # 用户名
        "user": "young",
        # 密码
        "pass": "3db3a2****80c675da4",
        # 用户id
        "sofid": "95**27",
        # 验证码类型编号
        "codetype": 1004}
    # 提取验证码图片
    files = {"userfile": open("verify.png", "rb")}
    # 发送接口请求识别验证码
    resp = requests.post(url, data=data, files=files)
    # 查看响应信息
    # print(resp.json())
    res = resp.json()
    print(res)
    if res["err_no"] == 0:
        code = res["pic_str"]
        print(f"验证码识别成功:{code}")
        return code
    else:
        print("验证码识别失败")
        return False

"codetype": 1004 是1~4 位英文数字

使用

from common.utils import img_code
# 获取验证码图片,保存至本地
driver.find_element(By.ID, '***').screenshot("verify.png")
# 调用验证码图片识别
code = img_code()

调用成功结果:

3.2 滑块验证

验证码类型 9103 的返回结果如下:

验证码 9101 的返回结果:

以豆瓣登录为例:

切换焦点并下载验证图片,将焦点切换至滑块验证区域,并下载加载好的滑块验证背景图片。

点击登录按钮后,就会出现滑块验证区域,这是一个新增的frame区域,此时我们需要将切换的焦点从主页面转换到这个frame区域上

driver.switch_to.frame('tcaptcha_iframe_dy')

 获取验证码图片

# 获取验证码图片,保存至本地
driver.find_element(By.ID, 'slideBg').screenshot("verify.png")

 左边匹配的滑块的位置

有很多方法,但是好像都不是很适用这个,不知道是不是 mac上画布不大一样。。。要么就是很麻烦。。。 

selenium 与 超级鹰结合完成自动登录验证-CSDN博客

超级鹰,字符,点触,滑块验证码识别-CSDN博客

关于滑块验证码的问题_滑块验证码上机报告-CSDN博客

【Python从入门到进阶】39、使用Selenium自动验证滑块登录_selenium滑块验证码实现-CSDN博客

 *4. 通过cookie保持登录

需要保持登录状态方式:

通过cookie信息的唯一标识符id进行验证

让标识符id一直保持登录的状态,那么再次访问页面的时候就是已登录的状态

通过cookie的机制原理先获取已登录的id然后再未登录的页面中进行使用即可

需要退出登录状态方式:

关闭整个浏览器

自动清除cookie信息

删除已登录的表示id

刷新页面,自动退出登录的状态

注意点:对页面的cookie值进行修改完成之后,一定要刷新页面才生效,需要清楚缓存

使用selenium提供的方法,get_cookies提取当前页面中所有的cookie信息

4.1 封装自动化获取cookie

第一次登录完成之后,把页面的已登录的cookie信息进行保存(唯一标识符的id)

在第二次及所有需要登录的页面中直接使用已登录的cookie信息,直接绕过登录

定义2个函数来获取cookie和使用cookie

utils.py

import json

def save_cookies(drier):
    # 将已登录页面中的cookie进行保存
    cookies = drier.get_cookies()
    with open("cookies.json", "w") as f:
        f.write(json.dumps(cookies))
def load_cookies(driver):
    try:
        with open("cookies.json") as f:
            cookies = json.loads(f.read())
        # 遍历字典获取cookie信息进行添加
        for cookie in cookies:
            driver.add_cookie(cookie)
        else:
            # 刷新页面,清除缓存
            driver.refresh()
    except:
        print("目前没有可以使用的已登录cookie信息")

4.2 使用cookie绕过登录

使用cookie信息进行绕过登录,保持登录状态:

import time
from webdriver_helper import get_webdriver
# import requests as requests
# from selenium.webdriver.common.by import By
from common.utils import img_code, load_cookies, save_cookies

driver = get_webdriver()  # 启动浏览器
driver.get("https://accounts.douban.com/passport/login")  # 控制浏览器

driver.maximize_window()
time.sleep(3)
# 使用cookie信息
load_cookies(driver)
# 完成登录用例脚本,解决验证码的处理
# driver.find_element(By.XPATH, '//*[@id="verify"]').screenshot("verify.png")
# code = img_code()
# driver.find_element(By.XPATH, '/html/body/form/table/tbody/tr/td[3]/table/tbody/tr[2]/td[2]/input').send_keys("admin")
# driver.find_element(By.XPATH, '/html/body/form/table/tbody/tr/td[3]/table/tbody/tr[3]/td[2]/input').send_keys("msjy123")
# driver.find_element(By.XPATH, '/html/body/form/table/tbody/tr/td[3]/table/tbody/tr[5]/td[2]/input').send_keys(code)
# driver.find_element(By.XPATH, '//*[@id="login_btn"]').click()
# 保存cookie信息
# save_cookies(driver)
time.sleep(5)
driver.quit()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/594501.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Activity工作流基本知识点

1.概念 工作流(Workflow),就是“业务过程的部分或整体在计算机应用环境下的自动化”,它主要解决的是“使在多个参与者之间按照某种预定义的规则传递文档、信息或任务的过程自动进行,从而实现某个预期的业务目标,或者促使此目标的…

MySql#MySql数据库基础

目录 一、什么是数据库 二、主流数据库 三、基本使用 1.连接服务器 2.使用 1.查看你数据库 2.创建数据库 ​编辑 ​编辑 ​编辑​编辑 3.使用数据库 ​编辑 4.创建数据库表 5.表中插入数据 6.服务器,数据库,表之间的关系 四、MySQL架构…

AI图书推荐:AI在语言学习教育领域的应用和挑战

这本书《AI在语言学习教育领域的应用和挑战》(AI in Language Teaching, Learning, and Assessment)由Fang Pan编辑,出版于IGI Global,主要探讨了人工智能(AI)在语言教育领域的应用、挑战以及潜在的益处。 …

Vue踩坑,less与less-loader安装,版本不一致

无脑通过npm i less -D安装less之后,继续无脑通过npm i less-loader -D安装less-loader出现如下错误: 解决方法: 1) npm uninstall less与 npm uninstall less-loader 2) 直接对其版本: npm i less3.0.4 -D npm i less-loader…

Jackson 中使用 Optional

介绍 在本文中,我们会对 Optional 类进行一些说明,并且会解释下如果在使用 Optional 类的时候可能在 Jackson 中进行序列化和反序列化的过程中出现的问题。 针对上面的问题,本文会将会介绍在 Jackson 中如何处理 Optional 对象,…

vue2项目升级到vue3经历分享3

当初花了1个半月将十几个微服务从mybatis升级为mybatis-plus,就很自信的认为前端vue2升级到vue3也不过so so,世界过程中却是折腾,写法乱七八糟,不兼容的问题一大堆。 1 操作dom元素 this.$refs.subject[index].$children[0].$chil…

「 网络安全常用术语解读 」通用配置枚举CCE详解

1. 背景介绍 NIST提供了安全内容自动化协议(Security Content Automation Protocol,SCAP)为漏洞描述和评估提供一种通用语言。SCAP组件包括: 通用漏洞披露(Common Vulnerabilities and Exposures, CVE):提供一个描述…

wordpress子比主题给文章内容加上密码查看

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、pandas是什么?二、使用步骤1.引入库2.读入数据第三步:文章内添加代码前言 提示:这里可以添加本文要记录的大概内容: 例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,…

乳制品粘性测试:操作流程详解

乳制品粘性测试:操作流程详解 在乳制品生产中,粘性测试是确保产品质量和口感的重要步骤。通过详细的操作流程,我们可以准确评估乳制品的粘性,为产品优化和品质控制提供有力支持。本文将详细介绍乳制品粘性测试的操作流程。 一、准…

应用层协议——http协议和https协议

目录 一、HTTP协议 1、概念 2、URL 二、HTTP协议格式 1、请求协议格式 2、响应协议格式 三、HTTP的请求方法 四、HTTP的状态码 五、HTTP常见的报头 六、HTTP和HTTPS 1、HTTPS协议 2、HTTPS的加密原理 1、基本概念 2、加密原理 通常我们程序员在网络编程的时候&am…

CSDN如何转载他人文章(超简单)

经常遇到一篇很好的文章&#xff0c;但是CSDN没有转载功能&#xff0c;所以需要我们自己处理一下。以谷歌浏览器打开某篇文章为例 一、按F12打开开发者工具 二、复制转载文章内容 按Ctrlf查找content_views&#xff0c;找到这一行<div id"content_views" class&…

2024项目拆解日均引流100+精准创业粉,全程干货

详情介绍 2024年项目拆解引流高质量创业粉&#xff0c;全程干货单日轻松引流100&#xff0c;项目拆解类视频本身引流效果就非常不错&#xff0c;视频内容针对性强直击创业粉内心&#xff0c;获客非常有效。做好视频钩子&#xff0c;和后端承接&#xff0c;赚钱没那么难。 课程…

没有精益管理内容的数字化,会是成功的数字化吗?

精益管理与数字化的结合被认为是制造业和企业管理中的一种重要转型策略。精益管理注重消除浪费、提升效率和质量&#xff0c;而数字化则通过技术手段来实现这一目标&#xff0c;两者的结合能够带来更高效、更智能的生产和管理方式。 首先&#xff0c;精益管理的核心理念是价值…

什么是HTTPS证书?怎么免费申请?——值得收藏

SSL证书的核心功能在于保障互联网数据传输的安全性和网站身份的可靠性。它通过加密通信防止信息被窃取或篡改&#xff0c;同时验证网站的真实身份&#xff0c;有效抵御钓鱼攻击&#xff0c;增强用户信任。此外&#xff0c;使用SSL证书还有助于提升网站在搜索引擎中的排名&#…

Docker 入门篇(六)-- idea 打包 docker 镜像流程

环境准备&#xff1a; idea 环境&#xff1a;IntelliJ IDEA 2021.3.1 (Ultimate Edition)docker 版本&#xff1a;v. 26.1.0准备 springboot jar 文件 &#xff1a;target/DockerDemo-0.0.1-SNAPSHOT.jardocker 可视化管理工具 portainer &#xff1a;v2.6.0 一. 配置docker远…

前端面试题大合集3----网络篇

一、Http协议详解&#xff0c;http请求方式&#xff0c;http状态码 Http协议详解&#xff1a; 全称Hyper Text Transfer Protocol&#xff0c;即超文本传输协议&#xff0c;是互联网上应用最为广泛的一种网络传输协议。 是一个无状态的应用层协议&#xff0c;即不会保存客户…

【管理咨询宝藏92】国际咨询公司为大型药企数字化转型项目规划方案

本报告首发于公号“管理咨询宝藏”&#xff0c;如需阅读完整版报告内容&#xff0c;请查阅公号“管理咨询宝藏”。 【管理咨询宝藏92】国际咨询公司为大型药企数字化转型项目规划方案 【格式】PDF版本 【关键词】国际咨询公司、药企转型、数字化转型 【核心观点】 - 企业业务…

51-48 CVPR 2024 | Vlogger: make your dream a vlog 自编剧制作视频博客

24年1月&#xff0c;上海交大、上海人工智能实验室、中科院联合发布Vlogger&#xff1a;make your dream a vlog。该论文主要工作是生成超过5分钟的视频博客vlog。鉴于现有文本到视频T2V生成方法很难处理复杂的故事情节和多样化的场景&#xff0c;本文提出了一个名为Vlogger的通…

百度文库最新AI旋转验证码

上个月发现百度文库最新出了一个验证码&#xff0c;是AI生成的。内容每次可能都不一样&#xff0c;所以给识别造成 了很大困难。传统的比对放松完全失效。 一、介绍 这个是最近才出的最新验证码&#xff0c;内容主要以工厂、建筑、山峰、机器人、汽车、盆栽植物等为主。如下图…
最新文章