OpenCV 笔记(22):图像的缩放——最近邻插值、双线性插值算法

1. 图像缩放

1.1 简介

图像缩放是指通过增加或减少像素来改变图像尺寸的过程,是图像处理中常见的操作。图像缩放会涉及效率和图像质量之间的权衡。

图像放大(也称为上采样插值)的主要目的是放大原图像,以便在更高分辨率的显示设备上显示。但是,放大图像并不能带来更多信息,因此图像质量会不可避免地受到影响。

图像缩小(也称为下采样)的主要目的是减小图像尺寸,以便更有效地存储或传输。缩小图像可以保留更多信息,但图像细节会丢失。

1.2 图像缩放方法分类

  • 空间域方法:直接在图像像素空间进行操作。常见的空间域缩放方法包括:

    • 最近邻插值:简单快速,但图像质量较差。

    • 双线性插值:图像质量比最近邻插值好,但计算量更大。

    • 立方插值:图像质量比双线性插值好,但计算量更大。

常见空间域缩放方法的比较:

方法优点缺点
最近邻插值简单快速容易产生锯齿
双线性插值平滑图像可能导致细节模糊
立方插值效果更好计算量较大
  • 频域方法:将图像转换为频域,然后在频域进行操作。常见的频域缩放方法包括:

    • 傅里叶插值:将图像转换为傅里叶频谱,然后根据缩放比例调整频谱大小,再将逆傅里叶变换回图像空间。傅里叶插值可以保持图像边缘锐度。图像质量较高,但计算量较大。

    • Lanczos 插值:一种改进的傅里叶插值算法,通过使用低通滤波器来消除频谱中的混叠现象,平衡了速度和质量,是常用频域算法之一。

2.  插值算法

图像插值算法是指在已知像素值的基础上,估计未知像素值的数学方法。OpenCV 提供了多种插值算法,用于图像缩放、旋转、仿射变换等操作。

在数学的数值分析领域中,内插,或称插值(英语:Interpolation),是一种通过已知的、离散的数据点,在范围内推求新数据点的过程或方法。

2.1 最近邻插值(Nearest Neighbor Interpolation)

最近邻插值通过找到目标像素在原图像中最近的像素值来赋值给目标像素。具体来说,根据原图像和目标图像的尺寸,计算缩放的比例,然后根据缩放比例计算目标像素所依据的原像素,并将该值赋给目标像素。

其中, 、 表示原图像中的坐标, 、 表示目标图像中的坐标,scale 表示放缩倍数。

最近邻插值的优点:

  • 算法简单,计算量小,速度快。

  • 不会产生新的像素值,保持原始图像的灰度值。

最近邻插值的缺点:

  • 容易产生锯齿现象,图像质量较低。

1a3a02e3e496e496f585dfb43c1cf0e0.jpeg
最近邻插值.png

下面的代码,展示了如何实现最近邻插值算法

#include "opencv2/highgui/highgui.hpp"
#include "opencv2/imgproc/imgproc.hpp"

using namespace std;
using namespace cv;

//最近邻插值算法
void nearestNeighbor(cv::Mat& src, cv::Mat& dst, float sx, float sy)
{
    // 由 scale 计算输出图像的尺寸(四舍五入)
    int dst_cols = round(src.cols * sx);
    int dst_rows = round(src.rows * sy);

    dst = cv::Mat(dst_rows,dst_cols,src.type());

    for (int i = 0; i < dst.rows; i++){
        for (int j = 0; j < dst.cols; j++){
            if (src.channels() == 1) {
                // 插值计算,输出图像的像素点由原图像对应的最近的像素点得到(四舍五入)
                int i_index = round(i / sy);
                int j_index = round(j / sx);
                if (i_index > src.rows - 1) i_index = src.rows - 1;//防止越界
                if (j_index > src.cols - 1) j_index = src.cols - 1;//防止越界

                dst.at<uchar>(i, j) = src.at<uchar>(i_index, j_index);
            } else {
                // 插值计算,输出图像的像素点由原图像对应的最近的像素点得到(四舍五入)
                int i_index = round(i / sy);
                int j_index = round(j / sx);
                if (i_index > src.rows - 1) i_index = src.rows - 1;//防止越界
                if (j_index > src.cols - 1) j_index = src.cols - 1;//防止越界

                dst.at<cv::Vec3b>(i, j)[0] = src.at<cv::Vec3b>(i_index, j_index)[0];
                dst.at<cv::Vec3b>(i, j)[1] = src.at<cv::Vec3b>(i_index, j_index)[1];
                dst.at<cv::Vec3b>(i, j)[2] = src.at<cv::Vec3b>(i_index, j_index)[2];
            }
        }
    }
}

int main()
{
    Mat src = imread(".../grass.jpg");
    imshow("src", src);

    Mat dst;
    nearestNeighbor(src, dst,1.5, 1.5);

    imshow("dst", dst);
    waitKey(0);

    return 0;
}
2f3f3820f526f629b5b60c2ce57317fd.jpeg
原图和最近邻插值实现的缩放.png

下面的代码,通过 Mat 的 forEach() 结合 C++11 lambda 表达式,实现对 Mat 对象快速像素遍历,进而重构了最近邻插值算法。

typedef cv::Point3_<uint8_t> Pixel;

//最近邻插值算法
void nearestNeighbor(cv::Mat& src, cv::Mat& dst, float sx, float sy)
{
    // 由 scale 计算输出图像的尺寸(四舍五入)
    int dst_cols = round(src.cols * sx);
    int dst_rows = round(src.rows * sy);

    dst = cv::Mat(dst_rows,dst_cols,src.type());
    dst.forEach<Pixel>([&](Pixel &p, const int * position) -> void {
        int row = position[0];
        int col = position[1];

        if (src.channels() == 1) {
            int i_index = round(row / sy);
            int j_index = round(col / sx);

            dst.at<uchar>(row, col) = src.at<uchar>(i_index, j_index);
        } else {
            int i_index = round(row/ sy);
            int j_index = round(col / sx);

            dst.at<cv::Vec3b>(row, col)[0] = src.at<cv::Vec3b>(i_index, j_index)[0];
            dst.at<cv::Vec3b>(row, col)[1] = src.at<cv::Vec3b>(i_index, j_index)[1];
            dst.at<cv::Vec3b>(row, col)[2] = src.at<cv::Vec3b>(i_index, j_index)[2];
        }
    });
}

2.2 双线性插值(Bilinear Interpolation)

先介绍一下线性插值,线性插值是一种估计两个已知数据点之间的值的方法。

5373ee69bdfa3e4ee9675df57b9c4113.jpeg
线性插值.png

假设我们已知坐标 (,) 与 (,),要得到 [,] 区间内某一位置 x 在直线上的值。由上图可得:

由于 x 已知,则 y:

所以,这是在 x 方向上进行了一次线性插值。

双线性插值是对 x 方向和 y 方向分别进行插值,它根据原始图像中四个相邻像素的值来估计新位置处像素的值。它是一维线性插值的扩展。

e9fd8707f2dd9a3279ba366882e6f0ff.jpeg
双线性插值.png

在上图中,假设已知、、、四个点,我们要估计由这四个点组成的矩形内的任意点(x,y)处像素值 f(x,y) 。

  • 对沿 y 轴的两对点 、在 x 方向进行线性插值:

  • 对沿 y 轴的两对点 、在 x 方向进行线性插值:

  • 对沿 x 轴的两对点 、在 y 方向进行线性插值:

此时,一共执行了三次线性插值,双线性插值只是对 x、y 方向进行插值,而不是进行两次插值。

双线性插值用于根据原始图像中的已知值来估计调整大小的图像中像素的强度或颜色值。与最近邻插值相比,这种方法可以产生更平滑的结果,后者可能会导致可见的伪影或锯齿状边缘。

下面的代码,展示了如何实现双线性插值算法。

#include <opencv2/opencv.hpp>

using namespace cv;
using namespace std;

typedef cv::Point3_<uint8_t> Pixel;

// 双线性插值算法
void bilinearInterpolation(Mat& src, Mat& dst, double sx, double sy) {
    int dst_rows = static_cast<int>(src.rows * sy);
    int dst_cols = static_cast<int>(src.cols * sx);
    dst = Mat::zeros(cv::Size(dst_cols, dst_rows), src.type());

    dst.forEach<Pixel>([&](Pixel &p, const int * position) -> void {

        int row = position[0];
        int col = position[1];

        // (col,row)为目标图像坐标
        // (before_x,before_y)原图坐标
        double before_x = double(col + 0.5) / sx - 0.5f;
        double before_y = double(row + 0.5) / sy - 0.5;
        // 原图像坐标四个相邻点
        // 获得变换前最近的四个顶点,取整
        int top_y = static_cast<int>(before_y);
        int bottom_y = top_y + 1;
        int left_x = static_cast<int>(before_x);
        int right_x = left_x + 1;

        //计算变换前坐标的小数部分
        double u = before_x - left_x;
        double v = before_y - top_y;

        // 如果计算的原始图像的像素大于真实原始图像尺寸
        if ((top_y >= src.rows - 1) && (left_x >= src.cols - 1)) {//右下角
            for (size_t k = 0; k < src.channels(); k++) {
                dst.at<Vec3b>(row, col)[k] = (1\. - u) * (1\. - v) * src.at<Vec3b>(top_y, left_x)[k];
            }
        } else if (top_y >= src.rows - 1) { //最后一行
            for (size_t k = 0; k < src.channels(); k++) {
                dst.at<Vec3b>(row, col)[k]
                        = (1\. - u) * (1\. - v) * src.at<Vec3b>(top_y, left_x)[k]
                          + (1\. - v) * u * src.at<Vec3b>(top_y, right_x)[k];
            }
        } else if (left_x >= src.cols - 1) {//最后一列
            for (size_t k = 0; k < src.channels(); k++) {
                dst.at<Vec3b>(row, col)[k]
                        = (1\. - u) * (1\. - v) * src.at<Vec3b>(top_y, left_x)[k]
                          + (v) * (1\. - u) * src.at<Vec3b>(bottom_y, left_x)[k];
            }
        } else {
            for (size_t k = 0; k < src.channels(); k++) {
                dst.at<Vec3b>(row, col)[k]
                        = (1\. - u) * (1\. - v) * src.at<Vec3b>(top_y, left_x)[k]
                          + (1\. - v) * (u) * src.at<Vec3b>(top_y, right_x)[k]
                          + (v) * (1\. - u) * src.at<Vec3b>(bottom_y, left_x)[k]
                          + (u) * (v) * src.at<Vec3b>(bottom_y, right_x)[k];
            }
        }
    });
}

int main() {
    Mat src = imread(".../grass.jpg");
    imshow("src", src);

    double sx = 1.5;
    double sy = 1.5;

    Mat dst;
    bilinearInterpolation(src,dst, sx, sy);

    imshow("dst", dst);

    waitKey(0);
    return 0;
}
cf8fa61c541bb9d2a7acfe0d30c7375b.jpeg
原图和双线性插值实现的缩放.png

3.  总结

图像缩放是图像处理中一项重要的技术,具有广泛的应用场景。

本文介绍了两种比较简单的插值算法:最近邻插值、双线性插值。最近邻插值适合于需要保持图像原始灰度值或边缘清晰度的场景。双线性插值适合于需要平滑图像的场景。如果需要更高的图像质量,可以考虑使用其他插值算法,例如立方插值或 Lanczos 插值,后续的文章也会介绍它们。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/390150.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

JavaWeb

一、技术栈 【1】 前端部分 HTML CSS JavaScript ES6 Nodejs npm vite vue3 router pinia axios element-plus … 【2】 后端部分 HTTP xml Tomcat Servlet Request Response Cookie Sesssion Filter Listener MySQL JDBC Druid Jackson lombok jwt … 二、JAVAWEB交互模…

QtApplets-线程池

QtApplets-线程池 ​ 今天咱们稍微看下Qt的线程池。QThreadPool&#xff0c;浅浅搞一下。 文章目录 QtApplets-线程池QThreadPoolQThreadPool 与 QThread 区别替代方案Qt Concurrent QThreadPool 与 Qt Concurrent 区别Demo运行效果 ☞ 源码 关键字&#xff1a; Qt、QRunnable…

爬虫之牛刀小试(十):爬取某宝手机商品的销量,价格和店铺

首先淘宝需要登录&#xff0c;这一点如果用selenium如何解决&#xff0c;只能手动登录&#xff1f;如果不用selenium&#xff0c;用cookies登录也可。但是验证码又是一个问题&#xff0c;现在的验证码五花八门&#xff0c;难以处理。 我们回到正题&#xff0c;假设你已经登录上…

【图论经典题目讲解】CF786B - Legacy 一道线段树优化建图的经典题目

C F 786 B − L e g a c y \mathrm{CF786B - Legacy} CF786B−Legacy D e s c r i p t i o n \mathrm{Description} Description 给定 1 1 1 张 n n n 个点的有向图&#xff0c;初始没有边&#xff0c;接下来有 q q q 次操作&#xff0c;形式如下&#xff1a; 1 u v w 表示…

P1219 八皇后 (dfs 表格坐标关系)

一个正常的dfs&#xff08;数据范围1-13&#xff09;&#xff0c;发现一条对角线上&#xff0c;分别符合和与差相等。因为有负数&#xff0c;这里我最开始开的是map&#xff0c;发现卡了最后一个点TLE&#xff0c;记录一下时间复杂度&#xff08; map&#xff0c;set的时间复杂…

算法--数论二

这里写目录标题 高斯消元高斯消元求线性方程组用途高斯消元的数学思想例题代码 二级目录 一级目录二级目录二级目录二级目录 一级目录二级目录二级目录二级目录 一级目录二级目录二级目录二级目录 一级目录二级目录二级目录二级目录 高斯消元 高斯消元求线性方程组 用途 这个…

《Linux 简易速速上手小册》第1章: Linux 系统基础(2024 最新版)

文章目录 1.1 Linux 操作系统概述1.1.1 重点基础知识1.1.2 重点案例&#xff1a;配置 Apache Web 服务器1.1.3 拓展案例 1&#xff1a;配置 SSH 服务以进行远程管理1.1.4 拓展案例 2&#xff1a;使用 Cron 定时任务 1.2 选择合适的 Linux 发行版1.2.1 重点基础知识1.2.2 重点案…

淘宝项目实战相关知识点

淘宝各个方面的布局大部分都是常规操作&#xff0c;在这里我就简单记录一下练习过程中的相关知识点&#xff0c;比较简短。相关知识点如下&#xff1a; 行高的取值 假设font-size为16px line-height:normal; line-height:1.5;24px&#xff0c;先继承后计算 line-height:200%;3…

win7自带截图工具保存失效解决办法

今日发现一台远航技术的win7中自带的截图工具使用时正常&#xff0c;保存图片时没有弹出保存位置的对话窗口&#xff0c;无法正常保存图片。解决方案如下&#xff1a; 1、进入注册表编辑器。开始-搜索程序和文件-输入 regedit 按下回车键&#xff0c;打开注册表&#xff1b; 2、…

MySQL篇----第十三篇

系列文章目录 文章目录 系列文章目录前言一、MySQL 支持事务吗?二、MySQL 里记录货币用什么字段类型好三、MySQL 有关权限的表都有哪几个?四、列的字符串类型可以是什么?前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转…

C语言指针

小伙伴们应该都知道在C语言中指针是非常难学的&#xff0c;指针它经常与内存联系&#xff0c;指向存放数据的地址&#xff0c;这样据很容易使小伙伴们绕晕&#xff0c;下面我就来简单解析一下指针&#xff01; 一、内存和地址 像我们学生一样&#xff0c;每个学生都拥有自己的…

C语言希尔排序详解!!!速过

目录 希尔排序是什么&#xff1f; 关于时间复杂度 希尔排序的源代码 希尔排序源代码的详解 希尔排序是什么&#xff1f; 之前我们说了三个排序&#xff08;插入排序&#xff0c;选择排序&#xff0c;冒泡排序&#xff09;有需要的铁铁可以去看看之前的讲解。 但因为之前的…

老和尚背女人过河,小和尚不理解,返程路上睡大觉——早读

回程路上&#xff01; 引言代码第一篇 人民日报 夜读 新的一年成为最好的自己&#xff0c;遇见更好的生活第二篇(跳) 人民日报 来了 新闻早班车要闻社会政策 结尾 引言 今天应该算是回归正常的节奏了 这个点在高铁上爬了一下 没想到新闻早班车的排名终于回归正常 也就意味着大家…

SSM整合进阶操作

SSM整合&#xff1a; http://t.csdnimg.cn/0lgfl 响应格式统一 我们要保证一个项目中所有接口返回的数据格式的统一。这样无论是前端还是移动端开发获取到我们的数据后都能更方便的进行统一处理。 所以我们定义以下结果封装类 /*** 在将Java对象转换为JSON格式时&#xff0c;…

理解并实现OpenCV中的图像平滑技术

导读 图像模糊&#xff08;也称为图像平滑&#xff09;是计算机视觉和图像处理中的基本操作之一。模糊图像通常是噪声减少、边缘检测和特征提取等应用的第一步。在本博客中&#xff0c;我们将重点介绍如何使用Python中的OpenCV库应用多种模糊技术。 理论概述&#xff1a; 基本…

杨中科 ASP.NET DI综合案例

综合案例1 需求说明 1、目的:演示DI的能力; 2、有配置服务、日志服务&#xff0c;然后再开发一个邮件发送器服务。可以通过配置服务来从文件、环境变量、数据库等地方读取配置&#xff0c;可以通过日志服务来将程序运行过程中的日志信息写入文件、控制台、数据库等。 3、说明…

【Linux】 Linux 小项目—— 进度条

进度条 基础知识1 \r && \n2 行缓冲区3 函数介绍 进度条实现版本 1代码实现运行效果 版本2 Thanks♪(&#xff65;ω&#xff65;)&#xff89;谢谢阅读&#xff01;&#xff01;&#xff01;下一篇文章见&#xff01;&#xff01;&#xff01; 基础知识 1 \r &&a…

一文读懂深度学习中的各种卷积 !!

文章目录 前言 1、卷积与互相关 2、3D 卷积 3、转置卷积&#xff08;去卷积&#xff09; 4、扩张卷积 5、可分卷积 6、分组卷积 前言 我们都知道卷积的重要性&#xff0c;但你知道深度学习领域的卷积究竟是什么&#xff0c;又有多少种类吗&#xff1f;研究学者Kunlun Bai发布了…

2月12号

第一种判断方式 if (n 10) 更好&#xff0c;因为它具有更好的可读性、可以避免误操作&#xff0c;并符合常见的编程习惯和约定

DSA 经典数据结构与算法 学习心得和知识总结(三) |有向无环图及其应用

目录结构 注&#xff1a;提前言明 本文借鉴了以下博主、书籍或网站的内容&#xff0c;其列表如下&#xff1a; 1、参考书籍&#xff1a;《算法导论》第三版 就是这本被封神的杰作&#xff0c;就是它&#x1f926; 2、参考书籍&#xff1a;《数据结构》严奶奶版 3、参考书…
最新文章