截图识别对比:CnOCR与PaddleOCR

1、需求

  想使用PyAutoGUI做界面自动化,需要一个ocr库识别压测软件的文字,然后获取定位。现在找到了CnOCR与PaddleOCR,都安装来试试看,哪一个更适合我的需求,这里对这俩库进行对比。
本机环境:

win11+python3.9

请添加图片描述

2、安装

两个库都有详细的安装步骤,有报错就去百度,安装对应的库就好了。
  特别提醒安装Polygon3报错:Microsoft Visual C++ 14.0 or greater is required. Get it with “Microsoft C++ Build Tools”: Microsoft C++ Build Tools - Visual Studio。
  不要去安Visual Studio,去https://www.lfd.uci.edu/~gohlke/pythonlibs/下载一个Polygon3-3.0.9.1-cp39-cp39-win_amd64.whl包,手动安就好了。

CnOCR:

  CnOCR 是 Python 3 下的文字识别(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别,支持竖排文字的识别。自带了20+个训练好的识别模型,适用于不同应用场景,安装后即可直接使用。同时,CnOCR也提供简单的训练命令供使用者训练自己的模型。
开源地址:https://gitee.com/cyahua/cnocr/
安装使用国内源快一点

pip install cnocr[ort-cpu] -i https://mirrors.aliyun.com/pypi/simple

PaddleOCR(飞桨)

  PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。支持多种OCR相关前沿算法,在此基础上打造产业级特色模型PP-OCR和PP-Structure,并打通数据生产、模型训练、压缩、预测部署全流程。
开源地址:https://gitee.com/paddlepaddle/PaddleOCR
安装命令:

python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

3、使用对比

待识别原图:
在这里插入图片描述

CnOCR:

使用还是挺方便,有几个模型选用,我主要是识别软件截图,就使用了doc-densenet_lite_136-gru的文档图片模型,试了几个图片,比通用模型要好一点点。

import time
from cnocr import CnOcr
time1=time.time()

img_fp = 'Temporary picture/jm.png'
#ocr = CnOcr()  # 所有参数都使用默认值
ocr = CnOcr(rec_model_name='doc-densenet_lite_136-gru') # 文档图片模型
result = ocr.ocr(img_fp)

time2=time.time()
print('本次图片识别总共耗时%s s' % (time2 - time1))
for line in result:
    print('text:'+line['text']+'\t\t\t\tscore:'+str(line['score']))

识别出的文字:
  其中score是:识别结果的得分(置信度),取值范围为 [0, 1];得分越高表示越可信
  从结果对比原图,有较多的图标被识别成文字,我需要点击的【jp@gc - Transactions per Second】等标题,置信度不高。

本次图片识别总共耗时0.36582493782043457 s
文件 编辑 查找 运行 选项 工具 帮助				score:0.5050349831581116
T				score:0.16470065712928772
昌日4自自				score:0.1683034747838974
45				score:0.22396154701709747
a				score:0.17519843578338623:?				score:0.3250223994255066
-”A				score:0.2549944818019867
测试计划				score:0.9605422019958496
NHTTP请求默认值				score:0.26849085092544556
jp@gc - Transactions per Second				score:0.6434031128883362
3				score:0.1756362020969391
火HTTP信息头管理器				score:0.237385094165802
名称:				score:0.8146508932113647
jp@gc - Transactions per Second				score:0.6060640811920166
XHTTP Cookie管理器				score:0.5214072465896606
中安个人				score:0.3283456563949585
注释:				score:0.8776631951332092
电豪单位				score:0.3201594650745392
所有数据写入一个文件				score:0.8833575248718262
中换疲劳				score:0.36431533098220825
文件名				score:0.6730592250823975
laC				score:0.27173328399658203
察看结果树				score:0.9904499650001526
jp@gc - Transactiorns per Second				score:0.5057143568992615
OHelp on this plugin				score:0.5024359822273254
 jp@gc - Response Times Over Time				score:0.5534773468971252
Cha				score:0.33296921849250793
RoFS				score:0.1565089076757431
Settings				score:0.9603992104530334
d jp@gc - Hits per Second				score:0.5598205327987671
聚合报告				score:0.2708910405635834

PaddleOCR(飞桨)

就是默认设置,示例代码

import time
from paddleocr import PaddleOCR, draw_ocr
time1=time.time()

img_fp = 'Temporary picture/jm.png'
ocr = PaddleOCR(use_angle_cls=True, use_gpu=False)
result = ocr.ocr(img_fp, cls=True)
time2=time.time()
print('本次图片识别总共耗时%s s' % (time2 - time1))
for idx in range(len(result)):
    res = result[idx]
    for line in res:
        print(line[1])

# 显示结果图片
from PIL import Image
result = result[0]
image = Image.open(img_fp).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='doc/fonts/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')

识别出的文字:
  速度慢点,但是内容明细精准许多。

[2024/03/28 16:17:26] ppocr DEBUG: dt_boxes num : 30, elapsed : 0.47530055046081543
[2024/03/28 16:17:26] ppocr DEBUG: cls num  : 30, elapsed : 0.25675177574157715
[2024/03/28 16:17:31] ppocr DEBUG: rec_res num  : 30, elapsed : 5.016136646270752
本次图片识别总共耗时9.896943092346191 s
('文件编辑查找运行选项工具帮助', 0.9968308210372925)
('测试计划', 0.9999251365661621)
('jp@gc -Transactions per Second', 0.973632276058197)
('HTTP请求默认值', 0.9975183010101318)
('HTTP信息头管理器', 0.9982931017875671)
('名称:', 0.9997771382331848)
('jp@gc - Transactions per Second', 0.9546123743057251)
('HTTPCookie管理器', 0.9962799549102783)
('个人', 0.9977327585220337)
('注释:', 0.9986750483512878)
('单位', 0.999846339225769)
('所有数据写入一个文件', 0.999435544013977)
('疲劳', 0.930761456489563)
('文件名|', 0.8699598908424377)
('C', 0.5080356001853943)
('察看结果树', 0.9994238615036011)
('jp@gc-', 0.9731400609016418)
('Transactions per Second', 0.9741607904434204)
('Help on this plugin', 0.9478721618652344)
('jp@gc - Response Times Over Time', 0.9619945883750916)
('Chart', 0.9883855581283569)
('Rows', 0.9848779439926147)
('Settings', 0.916187584400177)
('jp@gc- Hits per Second', 0.9670764803886414)
('聚合报告', 0.9991028308868408)

有个飞桨的可视化图
在这里插入图片描述

4、总结

我需要对jmeter与loadrunner软件截图进行识别,获取定位,再使用PyAutoGUI做自动化操作。从上面的识别结果来看,PaddleOCR(飞桨)的识别率符合要求,就是慢一点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/499501.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

说说HTTP 常见的状态码有哪些,适用场景?

一、是什么 HTTP状态码(英语:HTTP Status Code),用以表示网页服务器超文本传输协议响应状态的3位数字代码 它由 RFC 2616规范定义的,并得到 RFC 2518、RFC 2817、RFC 2295、RFC 2774与 RFC 4918等规范扩展 简单来讲…

【C++】 vector 数组/向量

文章目录 【 1. vector 的声明与初始化 】1.1 vector 的声明1.2 vector 的初始化1.2.1 构造一个空的 vector1.2.2 指定数量初值的方式初始化 vector1.2.3 迭代器的方式初始化1.2.4 构造一个相同的 vector 【 2. vector 的相关操作 】2.1 插入元素2.1.1 在vector的末尾插入新元素…

Docker搭建FastDFS + Ngnix图片文件服务器

安装教程 一、环境与备件安装(安装Docker) 更新系统:首先,确保系统已更新到最新版本。 a. 更新Ubuntu系统命令: sudo apt update sudo apt upgradeb. 更新CentOS系统命令: sudo yum update安装依赖项&…

GESP Python编程二级认证真题 2024年3月

Python 二级 2024 年 03 月 1 单选题(每题 2 分,共 30 分) 第 1 题 小杨的父母最近刚刚给他买了一块华为手表,他说手表上跑的是鸿蒙,这个鸿蒙是?( ) A. 小程序 B. 计时器 C. 操作系统…

重磅:2024中国国际信息通信展览|通信展览会

2024中国国际信息通信展览|通信展览会 让我们一起怀揣激情与期待,相聚2024中国信息通信展!这场盛大的展览将于9月25日-27日在北京.国家会议中心隆重举行,展会向世界展示中国信息通信行业在工信部“十四五”规划中迎来的新时代。 2024年中国…

数据结构刷题篇 之 【力扣二叉树基础OJ】详细讲解(含每道题链接及递归图解)

有没有一起拼用银行卡的,取钱的时候我用,存钱的时候你用 1、相同的树 难度等级:⭐ 直达链接:相同的树 2、单值二叉树 难度等级:⭐ 直达链接:单值二叉树 3、对称二叉树 难度等级:⭐⭐ 直达…

NFT Insider #125:Astar将与索尼开发的新公链将关注游戏或 NFT 等众多领域

引言:NFT Insider由NFT收藏组织WHALE Members (https://twitter.com/WHALEMembers)、BeepCrypto (https://twitter.com/beep_crypto)联合出品,浓缩每周NFT新闻,为大家带来关于NFT最全面、最新鲜…

【C语言】——指针六:冒泡排序与qsort函数的实现

【C语言】——指针六:冒泡排序与qsort函数 一、冒泡排序1.1、冒泡排序的原理1.2、用代码实现冒泡排序 二、qsort函数2.1、qsort函数的定义2.2、 qosrt函数的使用(1)比较函数的写法(2)使用 q s o r t qsort qsort 函数…

Linux 常用命令(1)

😇作者介绍:一个有梦想、有理想、有目标的,且渴望能够学有所成的追梦人。 🎆学习格言:不读书的人,思想就会停止。——狄德罗 ⛪️个人主页:进入博主主页 🗼专栏系列:Linux 随笔集合 …

NetCore3.1 Controller中直接返回JObject对象抛出异常解决方案

问题描述 在NetCore 3.1的Web项目中,Controller有一个方法直接返回JObject对象时,抛出了异常 S y s t e m . N o t S u p p o r t e d E x c e p t i o n : T h e c o l l e c t i o n t y p e ′ N e w t o n s o f t . J s o n . L i n q . J O b j …

2024/3/29 IOday2

所有人&#xff0c;今日作业&#xff1a;用fwrite 和 fseek功能&#xff0c;将一张bmp格式的图片更改成 德国国旗 #include <stdio.h> #include <string.h> #include <stdlib.h> int main(int argc, const char *argv[]) {FILE* fpfopen("./rising_free…

<QT基础(4)>QLabel使用笔记

Label 前面的文章里面把QLabel批量引入ScrollArea作为预览窗口&#xff0c;这篇把图像填充到QLable的PixelMap展示指定图像。 参数设置 设置QLabel的大小格式 QWidget* widget new QWidget; widget->setSizePolicy(QSizePolicy::Fixed, QSizePolicy::Fixed); widget->…

千川素材投放效果如何追踪:精准识别爆款、潜力、首发、优质素材

在数字营销和广告领域&#xff0c;素材投放的效果直接关乎广告的成功与否。为了在竞争激烈的市场中脱颖而出&#xff0c;广告主和广告从业者需要密切关注素材投放效果&#xff0c;并及时识别出不同类型的素材&#xff0c;如爆款、潜力、首发和优质素材。本文将详细探讨如何进行…

慧天【HTWATER】:水文水动力模型的革命性工具,城市内涝的精准解决方案

城市内涝水文水动力模型介绍 在城市排水防涝规划过程中&#xff0c;水文水动力耦合模型已经成为一种不可或缺的分析工具。在模型建立、城市内涝风险评估、排水系统性能诊断以及海绵城市规划等方面&#xff0c;内涝耦合模型提供了相应的模拟及分析工具&#xff1a; 1.1丰富的数…

Docker安装xxl-job并整合到SpringBoot项目

1. 创建数据库 执行如下SQL语句创建相关表 CREATE database if NOT EXISTS xxl_job default character set utf8mb4 collate utf8mb4_general_ci; use xxl_job;SET NAMES utf8mb4; CREATE TABLE xxl_job_info (id int(11) NOT NULL AUTO_INCREMENT,job_group int(11) NOT NUL…

分享几个以前画过的pcb,确实能看到进步

本文来自看海原创视频教程&#xff1a;《运放秘籍》运算放大器基础精讲及应用第一部*开天 微信公众号&#xff1a;工程师看海 【淘宝】https://m.tb.cn/h.5PAjLi7?tkvmMLW43KO7q CZ3457 「运放秘籍_运算放大器Multisim仿真视频教程第一部开天_工程师看海」 点击链接直接打开 …

【多线程系列】你先说说synchronized的实现原理

面试官&#xff1a;听说你精通多线程&#xff0c;那我就考考你吧 面试官&#xff1a;不用慌尽管说&#xff0c;错了也没关系&#x1f60a;。。。 以贴近现实的【面试官面试】形式来分享技术&#xff0c;本期是《多线程系列》&#xff0c;感兴趣就关注我吧❤️ 面试官&#xff1…

SpringBoot Redis的使用

官方文档&#xff1a; 官方文档&#xff1a;Spring Data Redis :: Spring Data Redis 和jedis一样&#xff0c;SpringBoot Redis 也可以让我在Java代码中使用redis&#xff0c;同样也是通过引入maven依赖的形式。 加速访问github: 使用steam可以免费加速访问github Spring…

第十四届蓝桥杯JavaA组省赛真题 - 特殊日期

解题思路&#xff1a; 暴力秒了 public class Main {public static void main(String[] args) {int cnt 0;for (int i 1900; i < 9999; i) {for (int j 1; j < 12; j) {for (int k 1; k < days(i, j); k) {if (sum(i) sum(j) sum(k)) cnt;}}}System.out.print…

【Flink】Flink 处理函数之基本处理函数(一)

1. 处理函数介绍 流处理API&#xff0c;无论是基本的转换、聚合、还是复杂的窗口操作&#xff0c;都是基于DataStream进行转换的&#xff0c;所以统称为DataStreamAPI&#xff0c;这是Flink编程的核心。 但其实Flink为了更强大的表现力和易用性&#xff0c;Flink本身提供了多…
最新文章