在计算机视觉中的李群、李代数
2016-02-24 20:34
316 查看
在多视角几何中,特别是在一些恢复相机运动轨迹的模型中,我们需要将相机的旋转和平移表示出来。通常情况下,我们都是在欧几里得空间中用R和t来进行相应的运算得到相机轨迹。然而,在很多论文中,作者们却喜欢用Lie algebrase(3)、so(3) 以及 Lie group
SE(3)、SO(3) 之类的表示。紧接着,出现了很多术语,比如twist, tangent space,也出现了一些运算,比如exp(),log()之类的,看得我是云里雾里。
比如下面这个公式,
是由三个角速度组成的向量,
表示对应的旋转矩阵,
表示由三个角速度组成的反对称矩阵(skew-symmetric matrix)。
自然要问为啥通过指数运算能够把角速度映射到旋转矩阵,它的背后又有什么样的物理意义,这中间是否有一些尽量直观的解释。
本篇博客将从最基础的内容出发,用直观的容易理解的方式对旋转矩阵和李代数之间的关系进行推导,如有错误,请指出,希望共同进步。
对给定的两个三维实数向量
,它们的叉积可以通过下面的公式计算出来:
叉积有如下性质:
这说明通过叉积运算得到的结果实际上是一个垂直于u,v 平面的向量。
这种两个向量的运算可以通过一个矩阵来表示,即
其中
是一个3*3的实数矩阵:
注意向量u上带一个帽子表示的是由它构成的反对称矩阵。同时由这个矩阵也很容易看出有
至于什么是刚体变换,什么是旋转矩阵,旋转矩阵有哪些性质这些更基础的知识在这里不再一一补充。
下面的内容中,都是基于3维空间,所以没有特别说明时,所说的旋转矩阵都是3*3的,平移向量也是3维的。并且所有向量上带一个帽子的表示的是它的反对称矩阵形式。
旋转矩阵与
我们知道对于旋转矩阵,旋转矩阵本身乘以它的转置等于单位矩阵:
对上式求导可以得到:
(1)
这个1式推得的结果不正好满足反对称矩阵的性质吗?因此肯定存在一个三维向量,使得该向量组成的反对称矩阵满足:
(2)
对2式中两边各右乘一个旋转R(t),得到:
(3)
这个等式是不是很熟悉?一个变量的导数等于它本身再乘以一个系数。Bingo,是他是他就是他,我们高斯微积分中熟悉的指数!
在介绍我们期待已久的指数映射前,先挖掘挖掘(3)式的一些含义。如果初始时刻
,那么有
。那么在单位矩阵附近的一个旋转矩阵,我们能用一阶导来近似得到:
这是不是有点类似于速度位移之类的。我们把所有的这些反对称矩阵集合起来就组成了一个所谓的李代数Lie algebraso(3) :
而把所有的旋转矩阵集合起来呢,就有了一个所谓的李群Lie group SO(3)
上式中的约束表示R是旋转矩阵。由前面的推导公式三知道如果R是单位矩阵,那它的导数就是一个反对称矩阵,所以只有反对称矩阵组成的空间,即so(3),我们称之为在在单位矩阵处的正切空间tangent space.为什么称为正切呢?回忆二维曲线在某处的导数是一条切线。对于这个三维球面,那么它的导数应该是个切面。如下图所示,图片来源于tangent
space 的 wiki:
可是对于那些不是单位矩阵的旋转矩阵R该怎么找在他们位置处的正切空间呢?由公式3我们知道,在反对称矩阵的右边乘以R就能够得到R的导数,所以在非单位矩阵的R处的正切空间就是反对称矩阵乘以R就行了。
求微分方程得到:
其中
是矩阵的指数映射:
) (4)
好了,此时我们假设R(0)=I,即单位矩阵,就可以得到:
(5)
当然可以验证验证这个指数是不是旋转矩阵:
所以,我们能够说指数映射将so(3)映射到了SO(3):
也就是说找了一个通道,它将切平面上的一点可以映射到球面体上去。但是,指数还带一个矩阵这不好算吧,没关系,马上带来Rodrigues formula for rotation matrix。首先反对称矩阵有如下性质:
此时指数映射的泰勒展开式(4)式能够整理成如下形式:
注意公式中两个括号里面的内容,他们就是sin(t)和(1-cost(t)),其实这种形式的推导在欧拉方程那里也见到过。最后得到:
当然,对于任意的旋转矩阵,我们也能够找到一组对应的w,t:
和之前的推导一样,我们可以对如下的刚体变换矩阵求导:
对这个矩阵的每部分进行分析可知,存在一个反对称矩阵和三维向量
使得下面两式成立:
即可以得到:
所以,我们可以和反对称矩阵一样,定一个矩阵
,注意这里这个帽子不代表反对称矩阵了:
接着我们就能得到:
这和之前的推导太像了。由于有了前面的铺垫,我们可以直接给出g(t)附近的近似,而不必像之前那样从R(t)=I开始:
可以称之为在曲线g(t)处的”正切向量”,而在机器人领域,我们称它为twist。这个twist呢,就像我们开葡萄酒塞时螺旋的角速度和前进的线速度。于是把这些twist集合起来就有了刚体变换的李代数se(3):
当然这个twist矩阵也可以表示成一个六维的向量
:
同理,由
可以得到:
如果假设g(0)=I,有
又到了指数映射,这个矩阵的指数映射可以写成如下形式:
于是我们知道了如何将se(3) 映射到SE(3)。
到这里基本理清了SE,SO之类的与刚体变换之间的关系,看视觉SLAM类的论文以及相应代码中有关lie部分应该没啥压力了。
各种论文里涉及到的求解位姿矩阵时的非线性最小二乘优化(牛顿法,LM法),其中增量都是在单位矩阵处的tangent space se(3)上计算,获得的增量(即相邻位姿变换关系)通过指数映射映射回多面体SE(3)上。
通过这种方式,能够避免奇异点,保证很小的变换矩阵也能够表示出来。这一段引用自论文《Scale Drift-Aware Large Scale Monocular SLAM》。
这篇博文可以说是我看慕尼黑工大(TUM)多视角几何教学视频的笔记,YouTube链接点击这里,这位牛的飞老师的英语吐字清晰,大家应该能够听懂。当然,老师也是参看的别人的文档,这里我也把讲lie 和计算机视觉的两个文档传到了csdn上,供大家下载。
转自:http://blog.csdn.net/heyijia0327/article/details/50446140
SE(3)、SO(3) 之类的表示。紧接着,出现了很多术语,比如twist, tangent space,也出现了一些运算,比如exp(),log()之类的,看得我是云里雾里。
比如下面这个公式,
是由三个角速度组成的向量,
表示对应的旋转矩阵,
表示由三个角速度组成的反对称矩阵(skew-symmetric matrix)。
自然要问为啥通过指数运算能够把角速度映射到旋转矩阵,它的背后又有什么样的物理意义,这中间是否有一些尽量直观的解释。
本篇博客将从最基础的内容出发,用直观的容易理解的方式对旋转矩阵和李代数之间的关系进行推导,如有错误,请指出,希望共同进步。
预备知识:
在进入正题之前,我们先需要复习下向量叉积(cross product),以及反对称矩阵(skew symmetric matrix),在计算机视觉中最初遇到这些概念应该是在求解本征矩阵时,然而,他们在沟通刚体变换矩阵和李代数之间扮演着十分重要的作用。对给定的两个三维实数向量
,它们的叉积可以通过下面的公式计算出来:
叉积有如下性质:
这说明通过叉积运算得到的结果实际上是一个垂直于u,v 平面的向量。
这种两个向量的运算可以通过一个矩阵来表示,即
其中
是一个3*3的实数矩阵:
注意向量u上带一个帽子表示的是由它构成的反对称矩阵。同时由这个矩阵也很容易看出有
请记住这个性质。并且任意一个3*3的反对称矩阵,我们能够找到一个三维向量和它对应。
至于什么是刚体变换,什么是旋转矩阵,旋转矩阵有哪些性质这些更基础的知识在这里不再一一补充。
下面的内容中,都是基于3维空间,所以没有特别说明时,所说的旋转矩阵都是3*3的,平移向量也是3维的。并且所有向量上带一个帽子的表示的是它的反对称矩阵形式。
旋转矩阵与
so(3):
我们知道对于旋转矩阵,旋转矩阵本身乘以它的转置等于单位矩阵:对上式求导可以得到:
(1)
这个1式推得的结果不正好满足反对称矩阵的性质吗?因此肯定存在一个三维向量,使得该向量组成的反对称矩阵满足:
(2)
对2式中两边各右乘一个旋转R(t),得到:
(3)
这个等式是不是很熟悉?一个变量的导数等于它本身再乘以一个系数。Bingo,是他是他就是他,我们高斯微积分中熟悉的指数!
在介绍我们期待已久的指数映射前,先挖掘挖掘(3)式的一些含义。如果初始时刻
,那么有
。那么在单位矩阵附近的一个旋转矩阵,我们能用一阶导来近似得到:
这是不是有点类似于速度位移之类的。我们把所有的这些反对称矩阵集合起来就组成了一个所谓的李代数Lie algebraso(3) :
而把所有的旋转矩阵集合起来呢,就有了一个所谓的李群Lie group SO(3)
注意是大写:
上式中的约束表示R是旋转矩阵。由前面的推导公式三知道如果R是单位矩阵,那它的导数就是一个反对称矩阵,所以只有反对称矩阵组成的空间,即so(3),我们称之为在在单位矩阵处的正切空间tangent space.为什么称为正切呢?回忆二维曲线在某处的导数是一条切线。对于这个三维球面,那么它的导数应该是个切面。如下图所示,图片来源于tangent
space 的 wiki:
可是对于那些不是单位矩阵的旋转矩阵R该怎么找在他们位置处的正切空间呢?由公式3我们知道,在反对称矩阵的右边乘以R就能够得到R的导数,所以在非单位矩阵的R处的正切空间就是反对称矩阵乘以R就行了。
指数映射:
回到公式(3),把旋转矩阵R用x替换掉,如下:求微分方程得到:
其中
是矩阵的指数映射:
) (4)
好了,此时我们假设R(0)=I,即单位矩阵,就可以得到:
(5)
当然可以验证验证这个指数是不是旋转矩阵:
所以,我们能够说指数映射将so(3)映射到了SO(3):
也就是说找了一个通道,它将切平面上的一点可以映射到球面体上去。但是,指数还带一个矩阵这不好算吧,没关系,马上带来Rodrigues formula for rotation matrix。首先反对称矩阵有如下性质:
此时指数映射的泰勒展开式(4)式能够整理成如下形式:
注意公式中两个括号里面的内容,他们就是sin(t)和(1-cost(t)),其实这种形式的推导在欧拉方程那里也见到过。最后得到:
当然,对于任意的旋转矩阵,我们也能够找到一组对应的w,t:
刚体变换和SE(3):
前面还只说了旋转,实际上刚体变换还有平移。所以,和只有旋转矩阵构成的李群SO(3) 一样,我们也可以有由刚体变换得到的李群SE(3) :和之前的推导一样,我们可以对如下的刚体变换矩阵求导:
对这个矩阵的每部分进行分析可知,存在一个反对称矩阵和三维向量
使得下面两式成立:
即可以得到:
所以,我们可以和反对称矩阵一样,定一个矩阵
,注意这里这个帽子不代表反对称矩阵了:
接着我们就能得到:
这和之前的推导太像了。由于有了前面的铺垫,我们可以直接给出g(t)附近的近似,而不必像之前那样从R(t)=I开始:
可以称之为在曲线g(t)处的”正切向量”,而在机器人领域,我们称它为twist。这个twist呢,就像我们开葡萄酒塞时螺旋的角速度和前进的线速度。于是把这些twist集合起来就有了刚体变换的李代数se(3):
当然这个twist矩阵也可以表示成一个六维的向量
:
同理,由
可以得到:
如果假设g(0)=I,有
又到了指数映射,这个矩阵的指数映射可以写成如下形式:
于是我们知道了如何将se(3) 映射到SE(3)。
到这里基本理清了SE,SO之类的与刚体变换之间的关系,看视觉SLAM类的论文以及相应代码中有关lie部分应该没啥压力了。
各种论文里涉及到的求解位姿矩阵时的非线性最小二乘优化(牛顿法,LM法),其中增量都是在单位矩阵处的tangent space se(3)上计算,获得的增量(即相邻位姿变换关系)通过指数映射映射回多面体SE(3)上。
通过这种方式,能够避免奇异点,保证很小的变换矩阵也能够表示出来。这一段引用自论文《Scale Drift-Aware Large Scale Monocular SLAM》。
这篇博文可以说是我看慕尼黑工大(TUM)多视角几何教学视频的笔记,YouTube链接点击这里,这位牛的飞老师的英语吐字清晰,大家应该能够听懂。当然,老师也是参看的别人的文档,这里我也把讲lie 和计算机视觉的两个文档传到了csdn上,供大家下载。
转自:http://blog.csdn.net/heyijia0327/article/details/50446140
相关文章推荐
- https://projecteuler.net/problem=7
- 网络原理学习1
- 网络交换卡
- linux内核分析作业:以一简单C程序为例,分析汇编代码理解计算机如何工作
- 上机题目(初级)- Java网络操作-打印网页(Java)
- 原生Ajax的XMLHttpRequest对象使用指南
- 使用线程进行网络图片下载(一)
- 网络的最大流最小割定理
- viewpageindicator +fragment 在网络访问中与volley框架 null问题
- 网络的理解2
- ios: 使用http进行通信(Transport Security has Blocked a cleartext HTTP)
- 网络的理解
- 《数据结构与算法分析(c描述)》—— 插入排序&希尔排序
- 网络的理解
- [Computer Security : Art and Science] Chapter_1 1.1 基础部分
- PXE网络引导自动化安装系统详解
- HTTPS原理
- Android编程获取网络连接状态(3G/Wifi)及调用网络配置界面
- volley Request添加Header的HTTP请求
- linux网络编程相关函数(一)