-
python爬虫之旋转傻乌龟——几何变换实践
试听地址 https://www.xin3721.com/eschool/pythonxin3721/
这两天新型肺炎病例是指数上升啊!呆在家里没事干,正好想起之前FPGA大赛上有个老哥做了一个图像旋转作品,还在群里发了技术报告。无聊之下就打算学习一下,然后就顺便把平移、旋转、缩放这些几何变换都看了,最后决定把这三个综合起来写个“旋转傻乌龟”的动画。先是用OpenCV内置函数实现了下,感觉不过瘾,又自己写了一遍。老规矩,还是把学过的、做过的东西记录下来!
旋转傻乌龟,效果就是将一只乌龟在窗口中同时进行平移、缩放和旋转,由于最后看起来样子比较傻,因此得名“旋转傻乌龟”。
效果视频:
|一、几何变换的矩阵表示
|1.1 平移的表示
上图中的三种表示方法第二种是OpenCV要求的方式,但第一种形式表示起来更具统一性,因此我更倾向于第一种。但无论哪一种,都能展开成第三种的形式。第三种非常直观的反映了平移,只是需要注意正负号的选取——在编程中,图像一般以左上角为(0,0)点。这也就是说,建立坐标系的时候,X轴以右正方向,Y轴以下为正方向。以上矩阵表示将图像向右平移x0,向下平移y0,也可以认为是将坐标系向左平移x0,向上平移y0。平移可以形象地表示如下:
|1.2 以左上角为定点缩放的表示
缩放最容易理解,就是将横纵坐标乘以缩放比例。由于我们以左上角为坐标系原点,所以左上角点的位置并不会变化。
|1.3 以左上角点为中心旋转的表示
在本文中,规定顺时针方向旋转,θ为正;逆时针旋转,θ为负。旋转前后的坐标关系推导也不难,如下图所示,旋转前先求出旋转半径L,旋转后根据L求出坐标。
为了之后表述的简洁,我们将这三节中的矩阵分别用特定符号简记:
|1.4 以任一点为中心旋转的表示
有了以上的基础,我们就可以研究更加复杂的变换。例如我们想以任一点(x0,y0)为中心旋转,而我们推导的R(θ)只适用于以坐标系原点为中心旋转。因此,我们可以将图像向上平移x0,向左平移y0,使(x0,y0)点平移到坐标系原点;然后再旋转,旋转完后再向下平移x0,向右平移y0回到原来位置,这一过程可用三个基础基础矩阵表示成如下形式,注意三个矩阵顺序不能调换。
|1.5 以任一点为定点缩放的表示
方法同1.4节的旋转,可以表示为下面形式。除此之外,还可以在此基础上进行旋转平移,只要在左边依次乘上相应矩阵即可。
|二、旋转傻乌龟OpenCV函数实现
OpenCV提供了仿射变换函数warpAffine。在输入参数中,M表示变换矩阵,可以是平移、旋转和缩放矩阵等;dsize是输入图像的大小;flags是插值方式,一般采用默认的双线性插值。
至于M的获取,平移矩阵只能自己构造;二旋转矩阵可以由函数getRotationMatrix2D得到。输入参数中,center表示旋转中心的坐标;angle为旋转角度,逆时针为正;scale是缩放比例。可见这个函数同时包揽了旋转和缩放的功能。
我的思路是,用正弦函数生成一系列轨迹点,乌龟每到达一个轨迹点,就旋转一定角度,缩放一定比例,而轨迹点的跟踪就是乌龟中心的平移。根据之前的说的原理,我们先让整个图像绕自身中心旋转和缩放,缩放后的乌龟应该是在整个图像的中间,为了让它中心和轨迹重合,就使用平移变换,此时平移的距离应该是path-center。整个过程的代码如下:
|三、旋转傻乌龟自实现
这个自己用Python实现的话,性能就相当重要了,尤其是双线性插值,如果不优化的话,慢得简直可以让你怀疑人生。比如,一般的是用两个for循环迭代,代码如下。在这个项目里,这个函数执行一次需要花费1.4s的时间。所以不优化的话,这只乌龟真的是名副其实了!
那怎么办?网上有一些优化的方法,主要是将浮点运算转成整数运算,这个方法对于FPGA这样的逻辑器件最适合不过了——但别忘了,我现在用的是Python,整数运算实际上也会被转成浮点运算,所以这个方法显然不适用。我采用的优化是进行矩阵化,据我所知,很多编程语言只要是支持矩阵运算的,其运算都是优化过的。对于双线性插值和仿射变换,运用矩阵也是很合适,只是写起来会有点抽象。。。
首先,先把生成变换矩阵的函数写出来,代码如下。要注意numpy的三角函数接受的参数是弧度制。
接下来写仿射变换函数,输入参数为图片数据、变换矩阵和输入图片的大小。这里应该要有逆向思维——现在我要得到变换后的图片,就是要求各坐标位置上的色彩,而色彩取样自变换前图像上的一点(这点的坐标可能不是整数),也就是说我们要将变换后的坐标映射到变换前的坐标。再来看之前的公式(下图左,为了方便,将变换矩阵合成为一个矩阵A),现在我们已知的是左边部分,而要求的映射是等式右边的XY,因此我们将A拿到左边,得到另一个公式(下图右),并依据这个公式,写出仿射变换函数。