SLAM PnP问题以及相关基础知识

目标泛函

目标泛函是在优化问题中使用的一种数学工具,目标泛函是一个函数,它将一个或多个函数映射到一个实数。它常用于描述需要最小化或最大化的函数。在优化问题中,我们通常希望找到使得某个特定函数取得最大值或最小值的变量值。目标泛函可以帮助我们形式化地表达这些优化目标,并通过数学方法来寻找最优解。

例如,在最小二乘法中,目标泛函是一个关于模型参数的函数,我们希望通过调整参数来最小化目标泛函。在变分问题中,目标泛函是一个关于函数的函数,我们希望找到一个函数,使得目标泛函取得最小值。

图像的向下采样

 图像的向下采样是指将图像在水平和垂直方向上按照一定的比例进行缩小。这可以通过减少图像中的像素来实现。

特征点提取与检测步骤

SLAM(Simultaneous Localization and Mapping)的特征点提取与检测步骤通常包括以下几个关键步骤:

  1. 图像获取:首先,需要从传感器(如摄像头、激光雷达)中获取图像数据。这些图像将用于后续的特征点提取和SLAM过程。
  2. 预处理:对图像进行必要的预处理,如去畸变、降噪等,以便更好地提取特征点。
  3. 特征点提取:利用特定的算法(如Harris角点检测、SIFT、SURF、ORB等)从图像中提取出具有显著特征的点。这些特征点通常具有旋转不变性和尺度不变性。
  4. 特征点描述:对提取出的特征点进行描述,通常使用特征描述子(如SIFT描述子、SURF描述子、ORB描述子等)来描述特征点的局部外观特征。
  5. 特征点匹配:在不同帧之间或者在同一帧的不同时间点之间,进行特征点匹配,以确定它们的对应关系。常用的匹配算法有基于光流的方法、基于特征描述子的方法等

SLAM中的求解PnP问题的特殊情况(P3P)

PnP问题:求解3D点到2D点对运动的情况,他描述了知道n个3D空间点及其投影位置如何估计相机的位姿。

P3P(高翔SLAM183页)最终目的:估计出相机的运动姿态(R,t)

大致流程图如下:

57cff3ab3bb14dcf86ce382da3d6fa40.png

 

 

问题:SLAM中李群与李代数的具体用途?

答:将相机的位姿表示成变换矩阵T,那么在假设的世界坐标系中的一个空间点P,通过相机产生对应于该空间点的一个观测数据Z,Z=T*P+noise,e = Z-T*P,其中e是T的函数,即e=f(T),通过建立整体误差最小化 

ca6425f529ef484fb07398a753d1cbf0.png

求解此问题,就是求目标函数J对于变换矩阵T的导数。但是旋转矩阵加法不封闭使得变换矩阵T对于加法不封闭,所以需要将变换矩阵T在SE(3)空间中的映射转换成李代数se(3),转换后的李代数是一个向量对加法封闭,最终通过对李代数求导间接得到对于变换矩阵T的求导结果。

问题:李群如何理解?


答:群就是一种几何加上一种算法的代数结构。群的性质包括:封闭性、结合律、幺元、逆。
群的举例:旋转矩阵与乘法就构成了一种旋转矩阵群(满足封闭性)。但是旋转矩阵和加法就不能构成群。
因为旋转矩阵满足约束:

5c8d295184fe4a6f9b7a0a469b8e2535.png

但是如果两个旋转矩阵R1+R2的结果就不能满足上述约束,但是R1*R2满足,因此(R1*R2,*)满足群。幺元是单位矩阵I,也有逆矩阵满足R乘以R的逆等于幺元(单位阵)。
特殊正交群SO(3)是旋转矩阵群,特殊欧式群SE(3)是变换矩阵群。
李群的定义是连续光滑的群,如SO(3),其可以绕着空间某个点连续旋转,所以SO(3)是李群。
同样,对于某个点,可以一边连续旋转一边移动,同样也是连续光滑的运动,因此变换矩阵SE(3)也是李群

 问题:李代数和李群的关系?

答:相机在三维空间中做连续旋转变换,SLAM使我们优化求解相机的最佳位姿(变换矩阵T),优化的方法一般采用迭代优化的方法,每次迭代更新一个位姿的增量,使得目标函数最小化,这个增量就是通过对e=J(T)的误差函数对T(变换矩阵)求微分得到的。
最重要的一点:李代数对应于李群的正切空间,描述了李群局部的导数。(因此可以用李代数代表李群的局部导数)

 

e5e6d99fb341413bb551bc3012a8c737.png

 将φ在原点t=0附近一阶泰勒展开,我们看到这个向量φ=(φ1,φ2,φ3)反应了R的导数性质,故称它在SO(3)上的原点 φ0 附近的正切空间上。李代数so(3)是三维向量φ的集合,每个向量φi的反对称矩阵都可以表达李群(大SO(3))上旋转矩阵R的导数,R和φ是一个指数映射关系。
因此可以有这层关系:在李群空间的任意一个旋转矩阵R都可以利用李代数空间的一个向量φ的反对称矩阵的指数来近似。

小so(3)的李代数空间就是由旋转向量组成的的空间,其物体意义就是旋转向量。而前面结论二中的指数映射关系就是罗德里格斯公式,他们在数学上本质是一样的。

罗德里格斯公式是表示从旋转向量到旋转矩阵的转换过程的。bc8406ecda0144dfa7c8387e5ef85a50.png

我们可以说旋转矩阵的导数可以由其对应的旋转向量指定,指导如何在旋转矩阵中进行微积分运算。

 

 

https://zhuanlan.zhihu.com/p/47330137 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/278053.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

合并区间(LeetCode 56)

文章目录 1.问题描述2.难度等级3.热门指数4.解题思路参考文献 1.问题描述 以数组 intervals 表示若干个区间的集合,其中单个区间为 intervals[i] [starti, endi] 。请你合并所有重叠的区间,并返回 一个不重叠的区间数组,该数组需恰好覆盖输…

Google Play上架:2023年度总结报告

今天是2023年的最后一个工作日,今天用来总结一下2023年关于谷歌商店上架的相关政策改动和对应的拒审解决方法。 目录 政策更新与改动2023 年 2 月 22 日2023 年 4 月5 日2023 年 7 月 12 日2023 年 10 月 25 日 开发者计划政策拒审邮件内容和解决办法 政策更新与改…

【js自定义鼠标样式】【js自定义鼠标动画】

文章目录 前言一、效果图二、实现步骤1. 去除原有鼠标样式2. 自定义鼠标样式3. 使用 总结 前言 自定义鼠标形状,自定义鼠标的动画,可以让我们的页面更加有设计感。 当前需求:吧鼠标自定义成一个正方形,鼠标的效果有:和…

AI数字人克隆系统源代码克隆系统开发--本地源码部署

随着人工智能技术的不断发展,AI数字人克隆系统逐渐成为现实。这一系统通过克隆人的外貌和行为模式,可以创建具有自我认知、学习和情感的数字化人类。而为了更好地开发AI数字人克隆系统,本地源码部署是一项关键步骤。 在开始介绍本地源码部署…

Web自动化测试:selenium使用总结

前言 说到自动化测试,就不得不提大名鼎鼎的Selenium。Selenium 是如今最常用的自动化测试工具之一,支持快速开发自动化测试框架,且支持在多种浏览器上执行测试。 Selenium学习难度小,开发周期短。对测试人员来说,如果…

APE+SELF=自动化指令集构建代码实现

Automatic Prompt Engineer(APE) paper: 2023.3, LARGE LANGUAGE MODELS ARE HUMAN-LEVEL PROMPT ENGINEERS github: GitHub - keirp/automatic_prompt_engineer 一语道破天机: prompt逆向工程,根据输入和输出让模型生成并寻找更优的prompt 指令生成 这里作者基…

一篇文章带你入门PHP魔术方法

PHP魔术方法 PHP 中的"魔术方法"是一组特殊的方法,它们在特定情况下自动被调用。这些方法的名称都是以两个下划线(__)开头。魔术方法提供了一种方式来执行各种高级编程技巧,使得对象的行为可以更加灵活和强大。以下是一…

SpringBoot+modbus4j实现ModebusTCP通讯读取数据

场景 Windows上ModbusTCP模拟Master与Slave工具的使用: Windows上ModbusTCP模拟Master与Slave工具的使用-CSDN博客 Modebus TCP Modbus由MODICON公司于1979年开发,是一种工业现场总线协议标准。 1996年施耐德公司推出基于以太网TCP/IP的Modbus协议&…

这本书没有一个公式,却讲透了数学的本质!

这本书没有一个公式,却讲透了数学的本质! 《数学的雨伞下:理解世界的乐趣》。一本足以刷新观念的好书,从超市到对数再到相对论,娓娓道来。对于思维空间也给出了一个更容易理解的角度。 作者:米卡埃尔•洛奈…

毫米波雷达:从 3D 走向 4D

1 毫米波雷达已广泛应用于汽车 ADAS 系统 汽车智能驾驶需要感知层、决策层、执行层三大核心系统的高效配合,其中感知层通过传感器探知周围的环境。汽车智能驾驶感知层将真实世界的视觉、物理、事件等信息转变成数字信号,为车辆了解周边环境、制定驾驶操…

Element UI之el-tabs的样式修改字体颜色、下划线、选中/未选中

目录 默认样式 修改默认字体颜色&#xff1a; 修改鼠标悬浮/选中字体颜色&#xff1a; 去掉长分割线并修改下划线颜色 完整代码 默认样式 注意事项&#xff1a;一定要在 <style scoped>不然修改的样式不会覆盖生效 修改默认字体颜色&#xff1a; ::v-deep .el-tabs__…

Java虚拟机中的垃圾回收

2 垃圾回收 2.1 判断一个对象是否可回收 2.1.1 引用计数法 如果一个对象被另一个对象引用&#xff0c;那么它的引用计数加一&#xff0c;如果那个对象不再引用它了&#xff0c;那么引用计数减一。当引用计数为 0 时&#xff0c;该对象就应该被垃圾回收了。 但是下面这种互相…

2023,平安!2024,最诚挚的祝福送给诸君!

☞ ░ 前往老猿Python博客 ░ https://blog.csdn.net/LaoYuanPython 时光荏苒&#xff0c;流年如水&#xff0c;一载忙碌&#xff0c;收获寥寥&#xff0c;然家人安康&#xff0c;生活安稳&#xff0c;尚有几分欣慰。 值此岁末之时&#xff0c;CSDN举行年度征文&#xff0c;适逢…

独立站如何优化网页加载速度

对于跨境电商独立站而言&#xff0c;流量是跨境电商业务的重中之重&#xff0c;由于独立站并不自带流量&#xff0c;非常依赖于谷歌搜索引擎自然流量&#xff0c;以及付费广告流量。 但随着付费流量价格日益水涨船高&#xff0c;为了摆脱对付费流量的依赖&#xff0c;相信广大…

很实用的ChatGPT网站——httpchat-zh.com

很实用的ChatGPT网站——http://chat-zh.com/ 今天介绍一个好兄弟开发的ChatGPT网站&#xff0c;网址[http://chat-zh.com/]。这个网站功能模块很多&#xff0c;包含生活、美食、学习、医疗、法律、经济等很多方面。下面简单介绍一些部分功能与大家一起分享。 登录和注册页面…

免费在线客服软件推荐:经济实用的客户沟通解决方案

好用的在线客服软件是企业是必不可少的工具&#xff0c;他让企业流程更流畅高效&#xff0c;让客户服务更完善优质。市场上的在线客服软件有很多&#xff0c;说着免费使用的软件也不在少数。今天小编就来推荐一款免费在线客服软件。 不过&#xff0c;我们选择免费在线客服软件…

口罩佩戴监测识别摄像机

口罩佩戴监测识别摄像机是一种应用于公共场所的智能监控设备&#xff0c;旨在监测人们是否正确佩戴口罩。这种摄像机使用先进的图像识别技术&#xff0c;能够准确辨识出人们的面部&#xff0c;并判断是否佩戴口罩。该技术可以用于各种场所&#xff0c;如火车站、机场、商场、学…

大模型中的LM-BFF

LM-BFF paper: 2020.12 Making Pre-trained Language Models Better Few-shot Learners Prompt: 完形填空自动搜索prompt Task: Text Classification Model: Bert or Roberta Take Away: 把人工构建prompt模板和标签词优化为自动搜索 LM-BFF是陈丹琦团队在20年底提出的针对…

Android笔记(二十二):Paging3分页加载库结合Compose的实现网络单一数据源访问

Paging3 组件是谷歌公司推出的分页加载库。个人认为Paging3库是非常强大&#xff0c;但是学习难点比较大的一个库。Paging3组件可用于加载和显示来自本地存储或网络中更大的数据集中的数据页面。此方法可让移动应用更高效地利用网络带宽和系统资源。在具体实现上&#xff0c;Pa…

YBM41567/4A 20V1.0A线性锂电池充电管理芯片

YBM41567/4A 20V1.0A线性锂电池充电管理芯片 概述&#xff1a; YB4156/7/4A是一款狸电池充电管理芯片&#xff0c;集成涓流、恒流、恒压三段式线性充电管理&#xff0c;符合锂电池安全充电规范。充电输入耐压高达24V,充电电流高至1.0A,可通过片外电阻配置。YB4156/7/4A集成防…
最新文章