目标检测数据预处理——部件截图,按一定比例进行外扩

本片是截图的篇的升级版本,简单版本的截图请参考根据目标框外扩一定比例进行截图(连带标签)。

对目标框(类别名称)进行分类,将同一类的目标框进行截图并分类保存在不同的文件夹中。

  1. 在本篇当中,我关注的是对人的不同部位的检测,所以我分为4类部件:头部区域(头、帽子、眼睛、眼睛……)、身体区域(各种工服)、手部区域(手、手套)、脚部区域(靴子、雨鞋、没穿鞋)。
  2. 而截图方式也是跟简单篇一样,保留截图区域内的目标框。
    特别说明,每类部件只会截部件范围的大图,例如头部区域内的眼睛、眼镜之类的不会单独截那么小的图,没有太多的意义,只会对头部帽子等的目标框进行截图,保留其内的眼睛、眼镜等。
  3. 这里相对于简单篇升级的不仅是从一类的截图升级到部件的截图,还有外扩范围也从上下左右外扩固定范围到根据图片大小按比例外扩。本篇的升级版是按随机比例外扩。
'''
cut 4 part in [head, body, hand, foot]
generate small pic of some rate extend
and generate corresponding json
'''
from copy import deepcopy
import cv2
import json
import os

img_path = "/data/weardata/images"
json_path = "/data/weardata/json"
save_path = "/data/weardata/save"
head_save = os.path.join(save_path, "head")
body_save = os.path.join(save_path, "body")
hand_save = os.path.join(save_path, "hand")
foot_save = os.path.join(save_path, "foot")

# 4部件分类
head_label = ["head", "hat", "workhat", "helmet"]
body_label = ["blueworkclothes", "cloth", "refvest", "apron", "whiteworkclothes"]
hand_label = ["glove", "inglove", "hand"]
foot_label = ["shoes", "inshoes", "noshoes"]

# 只需要创建好存放图片、json、截图后文件的三个路径即可,其余部件路径自己创建
save_path = [head_save, body_save, hand_save, foot_save]
for s_p in save_path:
    if not os.path.exists(s_p):
        os.mkdir(s_p)

def cut_part(json_data, part_label, save_path, img_file, img_h, img_w, x_e, y_e):
    i = 0
    for shape in json_data["shapes"]:
        [x_extend, y_extend] = [x_e, y_e]
        json_data_1 = deepcopy(json_data)
        if shape["label"] in part_label:
            img_save = os.path.join(save_path, os.path.splitext(os.path.split(img_file)[-1])[0] + ".jpg")
            json_save = save_path + "/" + file
            if os.path.exists(json_save):
                json_save = save_path + "/" + str(i) + file
                img_save = save_path + "/" + str(i) + os.path.splitext(os.path.split(img_file)[-1])[0] + ".jpg"
                json_data_1["imagePath"] = str(i) + os.path.splitext(os.path.split(img_file)[-1])[0] + ".jpg"
                i += 1
            print("-----------------------------")
            p = shape["points"]
            print(p)
            print(x_extend, y_extend)
            x_extend = int(abs(p[1][0] - p[0][0]) * x_e)
            y_extend = int(abs(p[1][1] - p[0][1]) * y_e)
            print(x_extend, y_extend)
            x1 = int(min(p[0][0], p[1][0])) - x_extend
            y1 = int(min(p[0][1], p[1][1])) - y_extend
            x2 = int(max(p[0][0], p[1][0])) + x_extend
            y2 = int(max(p[0][1], p[1][1])) + y_extend
            # 判断截图是否超过范围
            if x1 < 0:
                x1 = 0
            if y1 < 0:
                y1 = 0
            if x2 > img_w:
                x2 = img_w
            if y2 > img_h:
                y2 = img_h
            print(x1, y1, x2, y2, p[0][0], p[0][1], p[1][0], p[1][1])
            print("-----------------------------")
            inpart_label = []
            for shape1 in json_data_1["shapes"]:
                m_p = shape1["points"]
                m_x1 = int(min(m_p[0][0], m_p[1][0]))
                m_y1 = int(min(m_p[0][1], m_p[1][1]))
                m_x2 = int(max(m_p[0][0], m_p[1][0]))
                m_y2 = int(max(m_p[0][1], m_p[1][1]))
                m_p[0][0] = m_x1
                m_p[0][1] = m_y1
                m_p[1][0] = m_x2
                m_p[1][1] = m_y2

                # 过滤哪些目标框留住
                if shape1["label"] == "other" and ((x1 < m_x1 < x2 or x1 < m_x2 < x2)\
                    and (y1 < m_y1 < y2 or y1 < m_y2 < y2)):
                    inpart_label.append(shape1)
                if x1 < (m_x1 + m_x2)/2 < x2 and y1 < (m_y1 + m_y2)/2 <y2:
                    if part_label == hand_label:
                        if shape1["label"] in hand_label:
                            inpart_label.append(shape1)
                    else:
                        inpart_label.append(shape1)
                else:
                    continue
                # print(m_x1, m_y1, m_x2, m_y2)
            img = cv2.imread(img_file)
            try:
                img = img[y1:y2, x1:x2, :]
            except TypeError:
                print(img_file, shape["label"])
                input()
            json_data_1["shapes"] = []
            for p_label in inpart_label:
                m_p = p_label["points"]
                m_p[0][0] = m_p[0][0] - x1
                m_p[0][1] = m_p[0][1] - y1
                m_p[1][0] = m_p[1][0] - x1
                m_p[1][1] = m_p[1][1] - y1
                # 判断目标框是否超出范围
                if m_p[0][0] < 0:
                    m_p[0][0] = 0
                if m_p[0][1] < 0:
                    m_p[0][1] = 0
                if m_p[1][0] > x2 - x1:
                    m_p[1][0] = x2 - x1
                if m_p[1][1] > y2 - y1:
                    m_p[1][1] = y2 - y1
                json_data_1["shapes"].append(p_label)
            json_data_1["imageHeight"] = y2 - y1
            json_data_1["imageWidth"] = x2 -x1
            json.dump(json_data_1, open(json_save, "w"), ensure_ascii=False, indent=2)
            cv2.imwrite(img_save, img)

files = os.listdir(json_path)
for file in files:
    if os.path.splitext(file)[-1] != ".json":
        continue
    
    # 指定各种图片格式,若还有别的格式的图片可以自己添加
    img_file = os.path.join(img_path, file.split(".json")[0] + ".jpg")
    if not os.path.exists(img_file):
        img_file = os.path.join(img_path, file.split(".json")[0] + ".png")
        if not os.path.exists(img_file):
            img_file = os.path.join(img_path, file.split(".json")[0] + ".jpeg")
    json_file = os.path.join(json_path, file)
    json_data = json.load(open(json_file))
    img_h = json_data["imageHeight"]
    img_w = json_data["imageWidth"]

    # 根据一定的比例进行外扩
    cut_part(json_data, head_label, head_save, img_file, img_h, img_w, 0.3, 0.2) # head
    cut_part(json_data, body_label, body_save, img_file, img_h, img_w, 0.25, 0.05) # body
    cut_part(json_data, hand_label, hand_save, img_file, img_h, img_w, 0.3, 0.2) # hand
    cut_part(json_data, foot_label, foot_save, img_file, img_h, img_w, 0.2, 0.2) # foot
  1. 这里的外扩比例是左右一个比例,上下一个比例,可以自己调。比如我的body部件的区域比较长,所以上下的比例会比较小。
  2. 截图后保留的目标框有以下两个过滤条件:
    a.中心点没有落入截图区域内不留(没有超过一般),除了“other”标签(特征有歧义的涂黑标签);
    b.手部区域的非本类部件的类别不留。因为手部区域很大概率在body区域之内,中心点很可能落入其中,若是把body的框保留再根据目标框不超过截图范围,则整个截图的范围都是body框,但手部区域相对body区域小很多所以保留的body框的特征基本上全被破坏。
  3. 这里有两处范围判断:一处是截图时截图范围不能超过原图范围;二是目标框范围不能超过截图范围。都是超过最大按最大、低于最小按最小的方式处理。

截图前:

第1张图片有head、hand、foot这三个部件的目标框。
在这里插入图片描述
第2张图片有head、hand、body这三个部件的目标框。
在这里插入图片描述

截图后:

自己生成4个部件的保存路径。在这里插入图片描述

1.搜索第1张图的截图效果

1)搜索第1张图内的head区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述

2)搜索第1张图内的hand区域

a.截取的图片:
在这里插入图片描述

b.选取其中一张labelme打开:
在这里插入图片描述

3)搜索第1张图内的foot区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述

2.搜索第2张图的截图效果

1)搜索第2张图内的head区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述

2)搜索第2张图内的body区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述

3)搜索第2张图内的hand区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/21890.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Flink有状态计算的状态容错

状态容错 State Fault Tolerance 首先来说一说状态容错。Flink 支持有状态的计算&#xff0c;可以把数据流的结果一直维持在内存&#xff08;或 disk&#xff09;中&#xff0c;比如累加一个点击数&#xff0c;如果某一时刻计算程序挂掉了&#xff0c;如何保证下次重启的时候&…

一文了解customRef 自定义ref使用

概念 按照文档中的说明&#xff1a;customRef 可以用来创建一个自定义的 ref&#xff0c;并对其依赖项跟踪和更新触发进行显式控制。它需要一个工厂函数&#xff0c;该函数接收 track 和trigger函数作为参数&#xff0c;并且应该返回一个带有 get 和 set 的对象。 其实大致意思…

5.2 标准IO:文件的打开、关闭及代码实现

目录 标准IO 文件的打开 标准I/O-fopen-mode参数 ​编辑 标准I/O-fopen-示例 标准I/O-fopen-新建文件权限 标准I/O-处理错误信息 标准I/O-错误信息处理-示例1 标准I/O-错误信息处理-示例2 文件的关闭 标准IO 文件的打开 打开就是占用资源 下列函数可用于打开一个…

历经70+场面试,我发现了大厂面试的套路都是···

今年的金三银四刚刚过去&#xff0c;我又想起了我在去年春招时面试了50余家&#xff0c;加上暑期实习面试了20余家&#xff0c;加起来也面试了70余场的面试场景了。 基本把国内有名的互联网公司都面了一遍&#xff0c;不敢说自己的面试经验很丰富&#xff0c;但也是不差的。 …

Kali-linux使用社会工程学工具包(SET)

社会工程学工具包&#xff08;SET&#xff09;是一个开源的、Python驱动的社会工程学渗透测试工具。这套工具包由David Kenned设计&#xff0c;而且已经成为业界部署实施社会工程学攻击的标准。SET利用人们的好奇心、信任、贪婪及一些愚蠢的错误&#xff0c;攻击人们自身存在的…

HNU-计算机系统-Challenge

Challenge 计科210X wolf 202108010XXX 本题是从属于第七次讨论课的个人题,听说做了有加分?我来试试。 下面是相关报告。 题目: C 语言的初学者第一个编写的 C 代码一般是如下所示的“ #include <stdio.h> int main() {printf("Hello, World!");

项目管理:有效的沟通对项目的成功至关重要

为实施有效的沟通&#xff0c;需要建立沟通管理计划同时理解什么是沟通&#xff0c;沟通的对象是谁&#xff0c;沟通的目标是什么&#xff0c;难度在哪里&#xff0c;并选择合适的沟通方式。 项目沟通是确保项目团队的相关信息能及时、正确地产生、收集、发布、储存和最终处理…

Java多线程异常处理

文章目录 一. 线程中出现异常的处理1. 线程出现异常的默认行为2. setUncaoughtExceptionHandler()方法处理异常3. setDefaultUncaoughtExceptionHandler()方法进行异常处理 二. 线程组内出现异常 一. 线程中出现异常的处理 1. 线程出现异常的默认行为 当单线程中初出现异常时…

LOTO示波器如何测试阻抗的频响曲线

LOTO示波器如何测试阻抗的频响曲线 模块的输入输出端口&#xff0c;在电路分析上&#xff0c;一般简单表征为电阻来进行计算和分析。但多数情况下&#xff0c;这些端口并不是纯电阻的特性&#xff0c;更精确一些&#xff0c;它可能是电阻电容以及电感的组合&#xff0c;表现为非…

ChatGPT 聊天接口API 使用

一、准备工作 1.准备 OPENAI_ACCESS_TOKEN 2.准备好PostMan 软件 二、测试交流Demo 本次使用POSTMAN工具进行快速测试&#xff0c;旨在通过ChatGPT API实现有效的上下文流。在测试过程中&#xff0c;我们发现了三个问题&#xff1a;    1.如果您想要进行具有上下文的交流&…

从供应链协同角度挖掘数字化应用场景

企业在数字化转型的过程中&#xff0c;供应链的数字化转型是绕不开的话题。供应链的数字化转型&#xff0c;是借助数字化技术赋能企业和供应链从业人员&#xff0c;驱动业务向更加高效智能的方向发展。越来越多的企业意识到需要依靠新技术&#xff0c;也往往非常强调新技术的应…

为什么我们应该选择Renderbus瑞云渲染进行 EEVEE 渲染?

在某些情况下&#xff0c;用户需要高精度、快速的渲染&#xff0c;而 EEVEE的诞生就是为了满足这种需求。Eevee&#xff08;Extra Easy Virtual Environment Engine&#xff09;是 Blender 最新的内部渲染引擎&#xff0c;由用于 Epic Games 开发的虚幻引擎的相同代码提供支持…

openldap介绍以及使用

参考文献&#xff1a;openldap介绍和使用 基本概念 官网&#xff1a;https://www.openldap.org 官方文档&#xff1a;https://www.openldap.org/doc LDAP是一个开放的&#xff0c;中立的&#xff0c;工业标准的应用协议&#xff0c;通过IP协议提供访问控制和维护分布式信息的…

【Linux】进程信号“疑问?坤叫算信号吗?“

鸡叫当然也算信号啦~ 文章目录 前言一、认识信号量二、信号的产生 1.调用系统函数向进程发信号2.由软件条件产生信号3.硬件异常产生信号总结 前言 信号在我们生活中很常见&#xff0c;下面我们举一举生活中信号的例子&#xff1a; 你在网上买了很多件商品&#xff0c;再等待不…

统计一个数的二进制中1的个数(三种方法)

那么好了好了&#xff0c;宝子们&#xff0c;今天给大家分享一篇经典例题的三种实现方法&#xff0c;来吧&#xff0c;开始整活&#xff01;⛳️ 一、基础法 #define _CRT_SECURE_NO_WARNINGS 1 #include <stdio.h> int number_of_one(int n) {int count 0;while(n){if…

VTKmimics Calculate Parts

前言&#xff1a;本博文主要研究mimics中Calculate Parts所采用的方法以及VTK中三维重建的方法&#xff0c;希望对各位小伙伴有所帮助&#xff0c;谢谢&#xff01; mimics-Calculate parts - Interpolation Gray Interpolation 灰度值插值是一种真正的3D插值&#xff0c;它考…

宝塔面板快速搭建贪吃蛇小游戏web网站 - 无需云服务器,网站发布上线

文章目录 前言视频教程1. 环境安装2. 安装cpolar内网穿透3. 内网穿透4. 固定http地址5. 配置二级子域名6. 创建一个测试页面&#x1f34e;总结 转载自远程内网穿透的文章&#xff1a;Linux使用宝塔面板搭建网站&#xff0c;并内网穿透实现公网访问 前言 宝塔面板作为简单好用的…

RoyalScope-总线工作状况和信号质量“体检”

海量存储、洞悉细微 无间断连续采样、波形和报文记录 内置100MHz示波器&#xff0c;采样率高达100MS/s&#xff0c;精确查看、分析和统计信号波形细节。 无间断连续采样总线上信号&#xff0c;全部无遗漏的解析成报文(包括数据帧、遥控帧、过载帧、错误帧、帧间隔和错误报文)和…

Vue3-黑马(十四)

目录&#xff1a; &#xff08;1&#xff09;vue3-进阶-router-令牌-前端路由 &#xff08;2&#xff09;vue3-进阶-router-令牌-前端路由 &#xff08;3&#xff09;vue3-进阶-pinia1 &#xff08;4&#xff09;vue3-进阶-pinia2 &#xff08;1&#xff09;vue3-进阶-rout…

ARM学习笔记_2 模式,寄存器,流水线

ARM arm体积小功耗低性能高&#xff0c;支持thumb ARM双指令集&#xff0c;兼容8/16位器件&#xff1b;大量使用寄存器&#xff0c;指令定长&#xff0c;寻址简单。 ARM是32位架构&#xff0c;Word 32bit&#xff0c; half Word 16bit. 模式 用户模式是用户程序的模式&#…
最新文章