conv2卷积计算整理
2016-02-29 15:21
393 查看
关于conv2函数的计算过程
假设有两个矩阵a,b,a的大小是ma行na列,b的大小是mb行nb列。
c=conv2(a,b)计算这两个矩阵的卷积,c的大小是ma+mb-1行,na+nb-1列。
计算过程如下:
1.对矩阵a进行边界填补0,填充规则是:在a的第一行之前和最后一行之后分别填充mb-1行0,并在a的第一列之前和最后一列之后分别填充nb-1列0;
2.对矩阵b进行翻转,上下换位左右换位。%rot90(b,2)或者fliplr(flipud(b))或者flipud(fliplr(b))
3.从左上角开始,按照先列后行的顺序在矩阵a上滑动矩阵b,对应的元素相乘然后求和所得的数值为相应的c中的值。
例子如下:
NOTE:关于shape选项的说明;
当shape=full时, 返回全部二维卷积结果,即返回c的大小为(ma+mb-1)x(na+nb-1)
shape=same时,返回与a同样大小的卷积中心部分,若涉及奇偶区分时,像高位取,如行数为3,中心在第二行,取两行则取第二第三行,列数为6,中心在第三列,要取四列,则取二三四五列。
shape=valid时, 不考虑边界补零,即只要有边界补出的零参与运算的都舍去,返回c的大小为(ma-mb+1)x(na-nb+1)
这里给出一种最原始的实现方案。这种实现对于数据矩阵大小为1000x1000,卷积核矩阵大小为20x20,在我的机器上需要大约1秒钟的时间,而matlab采用的MKL库最快只需要将近0.1s的时间。下面的代码用到了自己目前开发的FastIV中的一些函数接口。具体代码如下:
[cpp] view
plain copy
![](https://oscdn.geek-share.com/Uploads/Images/Content/201611/a7c8e286f463007e2a900848b93dd72c.png)
![](https://oscdn.geek-share.com/Uploads/Images/Content/201611/9e12f1d3e499fc949c886e7c9e0484f9)
#include "fiv_core.h"
typedef enum{
FIV_CONV2_SHAPE_FULL,
FIV_CONV2_SHAPE_SAME,
FIV_CONV2_SHAPE_VALID
}FIV_CONV_SHAPE;
void fIv_conv2(fIvMat** dst_mat, fIvMat* src_mat, fIvMat* kernel_mat, FIV_CONV_SHAPE shape)
{
int src_row = src_mat->rows;
int src_cols = src_mat->cols;
int kernel_row = kernel_mat->rows;
int kernel_cols = kernel_mat->cols;
int dst_row = 0, dst_cols = 0, edge_row = 0, edge_cols = 0;
int i,j, kernel_i,kernel_j,src_i,src_j;
fIvMat* ptr_dst_mat = NULL;
switch(shape){
case FIV_CONV2_SHAPE_FULL:
dst_row = src_row + kernel_row - 1;
dst_cols = src_cols + kernel_cols - 1;
edge_row = kernel_row - 1;
edge_cols = kernel_cols - 1;
break;
case FIV_CONV2_SHAPE_SAME:
dst_row = src_row;
dst_cols = src_cols;
edge_row = (kernel_row - 1) / 2;
edge_cols = (kernel_cols - 1) / 2;
break;
case FIV_CONV2_SHAPE_VALID:
dst_row = src_row - kernel_row + 1;
dst_cols = src_cols - kernel_cols + 1;
edge_row = edge_cols = 0;
break;
}
ptr_dst_mat = fIv_create_mat(dst_row, dst_cols, FIV_64FC1);
*dst_mat = ptr_dst_mat;
for (i = 0; i < dst_row; i++) {
ivf64* ptr_dst_line_i = (ivf64* )fIv_get_mat_data_at_row(ptr_dst_mat, i);
for (j = 0; j < dst_cols; j++) {
ivf64 sum = 0;
kernel_i = kernel_row - 1 - FIV_MAX(0, edge_row - i);
src_i = FIV_MAX(0, i - edge_row);
for (; kernel_i >= 0 && src_i < src_row; kernel_i--, src_i++) {
ivf64* ptr_src_line_i,*ptr_kernel_line_i;
kernel_j = kernel_cols - 1 - FIV_MAX(0, edge_cols - j);
src_j = FIV_MAX(0, j - edge_cols);
ptr_src_line_i = (ivf64*)fIv_get_mat_data_at_row(src_mat, src_i);
ptr_kernel_line_i = (ivf64*)fIv_get_mat_data_at_row(kernel_mat, kernel_i);
ptr_src_line_i += src_j;
ptr_kernel_line_i += kernel_j;
for (; kernel_j >= 0 && src_j < src_cols; kernel_j--, src_j++){
sum += *ptr_src_line_i++ * *ptr_kernel_line_i--;
}
}
ptr_dst_line_i[j] = sum;
}
}
}
FIV_ALIGNED(16) ivf64 ker_data[4*4] = {0.1,0.2,0.3,0.4,
0.5,0.6,0.7,0.8,
0.9,1.0,1.1,1.2,
1.3,1.4,1.5,1.6};
void test_conv2()
{
fIvMat* src_mat = fIv_create_mat_magic(8, FIV_64FC1); // 8x8 magic matrix
fIvMat* kernel_mat = fIv_create_mat_header(4, 4, FIV_64FC1);
fIvMat* dst_mat = NULL;
fIv_set_mat_data(kernel_mat, ker_data, (sizeof(ivf64)) * 4 * 4);
fIv_conv2(&dst_mat, src_mat, kernel_mat, FIV_CONV2_SHAPE_FULL);
fIv_export_matrix_data_file(dst_mat,"dst_mat_4x4-full.txt", 1);
fIv_release_mat(&src_mat);
fIv_release_mat(&kernel_mat);
fIv_release_mat(&dst_mat);
}
int main()
{
test_conv2();
return 0;
}
目前FastIV中的实现已经经过优化,最快速度在我的机器上已经超越MATLAB。
Reference:
1.matlab conv2卷积的实现
2.conv2,filter2,imfilter的区别
假设有两个矩阵a,b,a的大小是ma行na列,b的大小是mb行nb列。
c=conv2(a,b)计算这两个矩阵的卷积,c的大小是ma+mb-1行,na+nb-1列。
计算过程如下:
1.对矩阵a进行边界填补0,填充规则是:在a的第一行之前和最后一行之后分别填充mb-1行0,并在a的第一列之前和最后一列之后分别填充nb-1列0;
2.对矩阵b进行翻转,上下换位左右换位。%rot90(b,2)或者fliplr(flipud(b))或者flipud(fliplr(b))
3.从左上角开始,按照先列后行的顺序在矩阵a上滑动矩阵b,对应的元素相乘然后求和所得的数值为相应的c中的值。
例子如下:
NOTE:关于shape选项的说明;
当shape=full时, 返回全部二维卷积结果,即返回c的大小为(ma+mb-1)x(na+nb-1)
shape=same时,返回与a同样大小的卷积中心部分,若涉及奇偶区分时,像高位取,如行数为3,中心在第二行,取两行则取第二第三行,列数为6,中心在第三列,要取四列,则取二三四五列。
shape=valid时, 不考虑边界补零,即只要有边界补出的零参与运算的都舍去,返回c的大小为(ma-mb+1)x(na-nb+1)
这里给出一种最原始的实现方案。这种实现对于数据矩阵大小为1000x1000,卷积核矩阵大小为20x20,在我的机器上需要大约1秒钟的时间,而matlab采用的MKL库最快只需要将近0.1s的时间。下面的代码用到了自己目前开发的FastIV中的一些函数接口。具体代码如下:
[cpp] view
plain copy
![](https://oscdn.geek-share.com/Uploads/Images/Content/201611/a7c8e286f463007e2a900848b93dd72c.png)
#include "fiv_core.h"
typedef enum{
FIV_CONV2_SHAPE_FULL,
FIV_CONV2_SHAPE_SAME,
FIV_CONV2_SHAPE_VALID
}FIV_CONV_SHAPE;
void fIv_conv2(fIvMat** dst_mat, fIvMat* src_mat, fIvMat* kernel_mat, FIV_CONV_SHAPE shape)
{
int src_row = src_mat->rows;
int src_cols = src_mat->cols;
int kernel_row = kernel_mat->rows;
int kernel_cols = kernel_mat->cols;
int dst_row = 0, dst_cols = 0, edge_row = 0, edge_cols = 0;
int i,j, kernel_i,kernel_j,src_i,src_j;
fIvMat* ptr_dst_mat = NULL;
switch(shape){
case FIV_CONV2_SHAPE_FULL:
dst_row = src_row + kernel_row - 1;
dst_cols = src_cols + kernel_cols - 1;
edge_row = kernel_row - 1;
edge_cols = kernel_cols - 1;
break;
case FIV_CONV2_SHAPE_SAME:
dst_row = src_row;
dst_cols = src_cols;
edge_row = (kernel_row - 1) / 2;
edge_cols = (kernel_cols - 1) / 2;
break;
case FIV_CONV2_SHAPE_VALID:
dst_row = src_row - kernel_row + 1;
dst_cols = src_cols - kernel_cols + 1;
edge_row = edge_cols = 0;
break;
}
ptr_dst_mat = fIv_create_mat(dst_row, dst_cols, FIV_64FC1);
*dst_mat = ptr_dst_mat;
for (i = 0; i < dst_row; i++) {
ivf64* ptr_dst_line_i = (ivf64* )fIv_get_mat_data_at_row(ptr_dst_mat, i);
for (j = 0; j < dst_cols; j++) {
ivf64 sum = 0;
kernel_i = kernel_row - 1 - FIV_MAX(0, edge_row - i);
src_i = FIV_MAX(0, i - edge_row);
for (; kernel_i >= 0 && src_i < src_row; kernel_i--, src_i++) {
ivf64* ptr_src_line_i,*ptr_kernel_line_i;
kernel_j = kernel_cols - 1 - FIV_MAX(0, edge_cols - j);
src_j = FIV_MAX(0, j - edge_cols);
ptr_src_line_i = (ivf64*)fIv_get_mat_data_at_row(src_mat, src_i);
ptr_kernel_line_i = (ivf64*)fIv_get_mat_data_at_row(kernel_mat, kernel_i);
ptr_src_line_i += src_j;
ptr_kernel_line_i += kernel_j;
for (; kernel_j >= 0 && src_j < src_cols; kernel_j--, src_j++){
sum += *ptr_src_line_i++ * *ptr_kernel_line_i--;
}
}
ptr_dst_line_i[j] = sum;
}
}
}
FIV_ALIGNED(16) ivf64 ker_data[4*4] = {0.1,0.2,0.3,0.4,
0.5,0.6,0.7,0.8,
0.9,1.0,1.1,1.2,
1.3,1.4,1.5,1.6};
void test_conv2()
{
fIvMat* src_mat = fIv_create_mat_magic(8, FIV_64FC1); // 8x8 magic matrix
fIvMat* kernel_mat = fIv_create_mat_header(4, 4, FIV_64FC1);
fIvMat* dst_mat = NULL;
fIv_set_mat_data(kernel_mat, ker_data, (sizeof(ivf64)) * 4 * 4);
fIv_conv2(&dst_mat, src_mat, kernel_mat, FIV_CONV2_SHAPE_FULL);
fIv_export_matrix_data_file(dst_mat,"dst_mat_4x4-full.txt", 1);
fIv_release_mat(&src_mat);
fIv_release_mat(&kernel_mat);
fIv_release_mat(&dst_mat);
}
int main()
{
test_conv2();
return 0;
}
目前FastIV中的实现已经经过优化,最快速度在我的机器上已经超越MATLAB。
Reference:
1.matlab conv2卷积的实现
2.conv2,filter2,imfilter的区别
相关文章推荐
- 模仿淘宝客户端倒计时控件
- 并发编程之二:wait、notify、notifyAll的使用方法
- 使用 jsoup 对 HTML 文档进行解析和操作
- 纯静态和伪静态的比较
- 批量安装文件夹下的所有apk应用
- 【写给自己】项目组件化,gradle项目如何修改远程依赖库的源码?
- python群发QQ邮件研究
- linux下远程服务器批量执行命令及SFTP上传文件 -- python实现
- 【数据结构与算法】希尔排序
- MySQL分库分表分库准备(6th)
- [已解决]TypeError: 'module' object is not callable
- linux下查找文件中空行的行号
- spring-jms的pom.xml
- 数据挖掘、自然语言处理
- 2、发现群组 Python代码
- 51.Which statement is true regarding synonyms?
- 又一编辑神器-百度编辑器-Ueditor
- LeetCode Best Time to Buy and Sell Stock I II III
- android 一键锁屏实现
- Number of Islands