算法导论学习笔记—Strassen算法的Java实现
2017-11-29 16:27
731 查看
Strassen算法
Strassen算法的核心思想是令递归树稍微不那么茂盛,相比于简单的“分而治之”的矩阵递归计算,其递归的分支由8条减少到7条。其时间复杂度为O(n的lg7次方)。虽然,它的算法中需要新增10个(n/2 * n/2)的中间矩阵S1-S10。每次子矩阵的加减运算会增加O(n平方/4)的时间消耗,所以代码在执行S1-S10时,这部分的时间复杂度为10*O(n平方/4),但是相比之下,Strassen算法减少了一次递归,所以时间复杂度上会减少。
下面来看简单“分而治之”矩阵乘法和Strassen算法的对比:
(1) 简单“分而治之”矩阵乘法
package com.oracle.ThirdCharpter;
/**
* 写一个简单的“分而治之的矩阵乘法”,即A = [A11 A12 B=[B11 B12 C=[A11*B11+A12*B21 A11*B12+A12*B22
* A21 A22] B21 B22] A21*B11+A22*B21 A21*B12+A22*B22]
* 经过算法分析发现,其时间复杂度依然还是O(n的3次方)
* @author zhegao
*
*/
public class Practice1_4 {
public int[][] matrix_multiply(int[][] a,int[][] b) {
if(a.length==1) {
return new int[][] {{a[0][0]*b[0][0]}};
}else {
int[][] A11 = partition(a,1);
int[][] B11 = partition(b,1);
int[][] A12 = partition(a,2);
int[][] B12 = partition(b,2);
int[][] A21 = partition(a,3);
int[][] B21 = partition(b,3);
int[][] A22 = partition(a,4);
int[][] B22 = partition(b,4);
//进行加法运算
int[][] C11 = matrixAdd(matrix_multiply(A11,B11),matrix_multiply(A12,B21));
int[][] C12 = matrixAdd(matrix_multiply(A11,B12),matrix_multiply(A12,B22));
int[][] C21 = matrixAdd(matrix_multiply(A21,B11),matrix_multiply(A22,B21));
int[][] C22 = matrixAdd(matrix_multiply(A21,B12),matrix_multiply(A22,B22));
int[][] C = merge(C11,C12,C21,C22);
return C;
}
}
//拆分矩阵,得到四个子矩阵,把不同位置的子矩阵标记成1,2,3,4。1——左上;2——右上;3——左下;4——右下
public int[][] partition(int[][] arr,int index) {
int len = arr.length;
int[][] result = new int[len/2][len/2];
switch(index) {
case 1:
for(int i=0;i<len/2;i++) {
for(int j=0;j<len/2;j++) {
result[i][j]=arr[i][j];
//System.out.println(result[i][j]);
}
};
break;
case 2:
for(int i=0;i<len/2;i++) {
for(int j=len/2;j<len;j++) {
result[i][j-len/2]=arr[i][j];
}
};
break;
case 3:
for(int i=len/2;i<len;i++) {
for(int j=0;j<len/2;j++) {
result[i-len/2][j] = arr[i][j];
}
};
break;
case 4:
for(int i=len/2;i<len;i++) {
for(int j=len/2;j<len;j++) {
result[i-len/2][j-len/2]=arr[i][j];
}
};
}
return result;
}
//矩阵的加运算
public int[][] matrixAdd(int[][] a,int[][] b){
int[][] result = new int[a.length][a.length];
for(int i=0;i<a.length;i++) {
for(int j=0;j<a.length;j++) {
result[i][j]=a[i][j]+b[i][j];
}
}
return result;
}
public void display(int[][] arr) {
System.out.print("[");
for(int i=0;i<arr.length;i++) {
for(int j=0;j<arr.length;j++) {
if(j==arr.length-1) {
System.out.print(arr[i][j]);
}else {
System.out.print(arr[i][j]+ " ");
}
}
System.out.print("]");
System.out.print("\n");
}
}
//将四个子矩阵合并成一个整体的大矩阵
public int[][] merge(int[][] a1,int[][] a2,int[][] a3,int[][] a4){
int len = a1.length;
int[][] result = new int[len*2][len*2];
for(int i=0;i<result.length;i++) {
if(i<len) {
for(int j=0;j<result.length;j++) {
if(j<len) {
result[i][j]=a1[i][j];
}else {
result[i][j] = a2[i][j-len];
}
}
}else {
for(int j=0;j<result.length;j++) {
if(j<len) {
result[i][j]=a3[i-len][j];
}else {
result[i][j] = a4[i-len][j-len];
}
}
}
}
return result;
}
public static void main(String[] args) {
int[][] arr = new int[][] {{1,2,3,4},{5,6,7,8},{9,10,11,12},{13,14,15,16}};
Practice1_4 prac = new Practice1_4();
int[][] result1 = prac.partition(arr, 1);
int[][] result2 = prac.partition(arr, 2);
int[][] result3 = prac.partition(arr, 3);
int[][] result4 = prac.partition(arr, 4);
//测试矩阵分离方法
prac.display(result1);
prac.display(result2);
prac.display(result3);
prac.display(result4);
//测试矩阵的合并方法
int[][] merge = prac.merge(result1, result2, result3, result4);
prac.display(merge);
//测试分而治之的矩阵乘法
int[][] a1 = new int[][] {{1,2,3,4},{4,3,2,1},{0,1,2,3},{3,2,1,0}};
int[][] a2 = new int[][] {{1,2,3,4},{4,3,2,1},{0,1,2,3},{3,2,1,0}};
prac.display(prac.matrix_multiply(a1, a2));
}
}
(2)Strassen算法
package com.oracle.ThirdCharpter;
/**
* 使用Strassen算法进行矩阵乘法
* 相比于“分而治之”的矩阵乘法,Stassen算法的递归分支只有7条,所以其时间复杂度为O(log2 7)
*
* 分析:Strassen算法相比传统”分而治之“的算法,它的递归分支只有7条,P1-P7
4000
。
* @author zhegao
*
*/
public class Practice1_5 {
public int[][] matrix_multiply(int[][] a,int[][] b) {
if(a.length==1) {
return new int[][] {{a[0][0]*b[0][0]}};
}else {
int[][] A11 = partition(a,1);
int[][] B11 = partition(b,1);
int[][] A12 = partition(a,2);
int[][] B12 = partition(b,2);
int[][] A21 = partition(a,3);
int[][] B21 = partition(b,3);
int[][] A22 = partition(a,4);
int[][] B22 = partition(b,4);
//计算S1-S10的中间矩阵
int[][] S1 = matrixSubstract(B12,B22);
int[][] S2 = matrixAdd(A11,A12);
int[][] S3 = matrixAdd(A21,A22);
int[][] S4 = matrixSubstract(B21,B11);
int[][] S5 = matrixAdd(A11,A22);
int[][] S6 = matrixAdd(B11,B22);
int[][] S7 = matrixSubstract(A12,A22);
int[][] S8 = matrixAdd(B21,B22);
int[][] S9 = matrixSubstract(A11,A21);
int[][] S10 = matrixAdd(B11,B12);
//计算P1-P7的几个递归矩阵
int[][] P1 = matrix_multiply(A11,S1);
int[][] P2 = matrix_multiply(S2,B22);
int[][] P3 = matrix_multiply(S3,B11);
int[][] P4 = matrix_multiply(A22,S4);
int[][] P5 = matrix_multiply(S5,S6);
int[][] P6 = matrix_multiply(S7,S8);
int[][] P7 = matrix_multiply(S9,S10);
//进行加减运算
int[][] C11 = matrixAdd(matrixSubstract(matrixAdd(P5,P4),P2),P6);
int[][] C12 = matrixAdd(P1,P2);
int[][] C21 = matrixAdd(P3,P4);
int[][] C22 = matrixSubstract(matrixSubstract(matrixAdd(P5,P1),P3),P7);
//合并各个子矩阵
int[][] C = merge(C11,C12,C21,C22);
return C;
}
}
//拆分矩阵,得到四个子矩阵,把不同位置的子矩阵标记成1,2,3,4。1——左上;2——右上;3——左下;4——右下
public int[][] partition(int[][] arr,int index) {
int len = arr.length;
int[][] result = new int[len/2][len/2];
switch(index) {
case 1:
for(int i=0;i<len/2;i++) {
for(int j=0;j<len/2;j++) {
result[i][j]=arr[i][j];
//System.out.println(result[i][j]);
}
};
break;
case 2:
for(int i=0;i<len/2;i++) {
for(int j=len/2;j<len;j++) {
result[i][j-len/2]=arr[i][j];
}
};
break;
case 3:
for(int i=len/2;i<len;i++) {
for(int j=0;j<len/2;j++) {
result[i-len/2][j] = arr[i][j];
}
};
break;
case 4:
for(int i=len/2;i<len;i++) {
for(int j=len/2;j<len;j++) {
result[i-len/2][j-len/2]=arr[i][j];
}
};
}
return result;
}
//矩阵的加运算
public int[][] matrixAdd(int[][] a,int[][] b){
int[][] result = new int[a.length][a.length];
for(int i=0;i<a.length;i++) {
for(int j=0;j<a.length;j++) {
result[i][j]=a[i][j]+b[i][j];
}
}
return result;
}
//矩阵的减运算
public int[][] matrixSubstract(int[][] a,int[][] b){
int[][] result = new int[a.length][a.length];
for(int i=0;i<a.length;i++) {
for(int j=0;j<a.length;j++) {
result[i][j]=a[i][j]-b[i][j];
}
}
return result;
}
public void display(int[][] arr) {
System.out.print("[");
for(int i=0;i<arr.length;i++) {
for(int j=0;j<arr.length;j++) {
if(j==arr.length-1) {
System.out.print(arr[i][j]);
}else {
System.out.print(arr[i][j]+ " ");
}
}
System.out.print("]");
System.out.print("\n");
}
}
//将四个子矩阵合并成一个整体的大矩阵
public int[][] merge(int[][] a1,int[][] a2,int[][] a3,int[][] a4){
int len = a1.length;
int[][] result = new int[len*2][len*2];
for(int i=0;i<result.length;i++) {
if(i<len) {
for(int j=0;j<result.length;j++) {
if(j<len) {
result[i][j]=a1[i][j];
}else {
result[i][j] = a2[i][j-len];
}
}
}else {
for(int j=0;j<result.length;j++) {
if(j<len) {
result[i][j]=a3[i-len][j];
}else {
result[i][j] = a4[i-len][j-len];
}
}
}
}
return result;
}
public static void main(String[] args) {
//测试分而治之的矩阵乘法
Practice1_5 prac = new Practice1_5();
int[][] a1 = new int[][] {{1,2,3,4},{4,3,2,1},{0,1,2,3},{3,2,1,0}};
int[][] a2 = new int[][] {{1,2,3,4},{4,3,2,1},{0,1,2,3},{3,2,1,0}};
prac.display(prac.matrix_multiply(a1, a2));
}
}
Strassen算法的核心思想是令递归树稍微不那么茂盛,相比于简单的“分而治之”的矩阵递归计算,其递归的分支由8条减少到7条。其时间复杂度为O(n的lg7次方)。虽然,它的算法中需要新增10个(n/2 * n/2)的中间矩阵S1-S10。每次子矩阵的加减运算会增加O(n平方/4)的时间消耗,所以代码在执行S1-S10时,这部分的时间复杂度为10*O(n平方/4),但是相比之下,Strassen算法减少了一次递归,所以时间复杂度上会减少。
下面来看简单“分而治之”矩阵乘法和Strassen算法的对比:
(1) 简单“分而治之”矩阵乘法
package com.oracle.ThirdCharpter;
/**
* 写一个简单的“分而治之的矩阵乘法”,即A = [A11 A12 B=[B11 B12 C=[A11*B11+A12*B21 A11*B12+A12*B22
* A21 A22] B21 B22] A21*B11+A22*B21 A21*B12+A22*B22]
* 经过算法分析发现,其时间复杂度依然还是O(n的3次方)
* @author zhegao
*
*/
public class Practice1_4 {
public int[][] matrix_multiply(int[][] a,int[][] b) {
if(a.length==1) {
return new int[][] {{a[0][0]*b[0][0]}};
}else {
int[][] A11 = partition(a,1);
int[][] B11 = partition(b,1);
int[][] A12 = partition(a,2);
int[][] B12 = partition(b,2);
int[][] A21 = partition(a,3);
int[][] B21 = partition(b,3);
int[][] A22 = partition(a,4);
int[][] B22 = partition(b,4);
//进行加法运算
int[][] C11 = matrixAdd(matrix_multiply(A11,B11),matrix_multiply(A12,B21));
int[][] C12 = matrixAdd(matrix_multiply(A11,B12),matrix_multiply(A12,B22));
int[][] C21 = matrixAdd(matrix_multiply(A21,B11),matrix_multiply(A22,B21));
int[][] C22 = matrixAdd(matrix_multiply(A21,B12),matrix_multiply(A22,B22));
int[][] C = merge(C11,C12,C21,C22);
return C;
}
}
//拆分矩阵,得到四个子矩阵,把不同位置的子矩阵标记成1,2,3,4。1——左上;2——右上;3——左下;4——右下
public int[][] partition(int[][] arr,int index) {
int len = arr.length;
int[][] result = new int[len/2][len/2];
switch(index) {
case 1:
for(int i=0;i<len/2;i++) {
for(int j=0;j<len/2;j++) {
result[i][j]=arr[i][j];
//System.out.println(result[i][j]);
}
};
break;
case 2:
for(int i=0;i<len/2;i++) {
for(int j=len/2;j<len;j++) {
result[i][j-len/2]=arr[i][j];
}
};
break;
case 3:
for(int i=len/2;i<len;i++) {
for(int j=0;j<len/2;j++) {
result[i-len/2][j] = arr[i][j];
}
};
break;
case 4:
for(int i=len/2;i<len;i++) {
for(int j=len/2;j<len;j++) {
result[i-len/2][j-len/2]=arr[i][j];
}
};
}
return result;
}
//矩阵的加运算
public int[][] matrixAdd(int[][] a,int[][] b){
int[][] result = new int[a.length][a.length];
for(int i=0;i<a.length;i++) {
for(int j=0;j<a.length;j++) {
result[i][j]=a[i][j]+b[i][j];
}
}
return result;
}
public void display(int[][] arr) {
System.out.print("[");
for(int i=0;i<arr.length;i++) {
for(int j=0;j<arr.length;j++) {
if(j==arr.length-1) {
System.out.print(arr[i][j]);
}else {
System.out.print(arr[i][j]+ " ");
}
}
System.out.print("]");
System.out.print("\n");
}
}
//将四个子矩阵合并成一个整体的大矩阵
public int[][] merge(int[][] a1,int[][] a2,int[][] a3,int[][] a4){
int len = a1.length;
int[][] result = new int[len*2][len*2];
for(int i=0;i<result.length;i++) {
if(i<len) {
for(int j=0;j<result.length;j++) {
if(j<len) {
result[i][j]=a1[i][j];
}else {
result[i][j] = a2[i][j-len];
}
}
}else {
for(int j=0;j<result.length;j++) {
if(j<len) {
result[i][j]=a3[i-len][j];
}else {
result[i][j] = a4[i-len][j-len];
}
}
}
}
return result;
}
public static void main(String[] args) {
int[][] arr = new int[][] {{1,2,3,4},{5,6,7,8},{9,10,11,12},{13,14,15,16}};
Practice1_4 prac = new Practice1_4();
int[][] result1 = prac.partition(arr, 1);
int[][] result2 = prac.partition(arr, 2);
int[][] result3 = prac.partition(arr, 3);
int[][] result4 = prac.partition(arr, 4);
//测试矩阵分离方法
prac.display(result1);
prac.display(result2);
prac.display(result3);
prac.display(result4);
//测试矩阵的合并方法
int[][] merge = prac.merge(result1, result2, result3, result4);
prac.display(merge);
//测试分而治之的矩阵乘法
int[][] a1 = new int[][] {{1,2,3,4},{4,3,2,1},{0,1,2,3},{3,2,1,0}};
int[][] a2 = new int[][] {{1,2,3,4},{4,3,2,1},{0,1,2,3},{3,2,1,0}};
prac.display(prac.matrix_multiply(a1, a2));
}
}
(2)Strassen算法
package com.oracle.ThirdCharpter;
/**
* 使用Strassen算法进行矩阵乘法
* 相比于“分而治之”的矩阵乘法,Stassen算法的递归分支只有7条,所以其时间复杂度为O(log2 7)
*
* 分析:Strassen算法相比传统”分而治之“的算法,它的递归分支只有7条,P1-P7
4000
。
* @author zhegao
*
*/
public class Practice1_5 {
public int[][] matrix_multiply(int[][] a,int[][] b) {
if(a.length==1) {
return new int[][] {{a[0][0]*b[0][0]}};
}else {
int[][] A11 = partition(a,1);
int[][] B11 = partition(b,1);
int[][] A12 = partition(a,2);
int[][] B12 = partition(b,2);
int[][] A21 = partition(a,3);
int[][] B21 = partition(b,3);
int[][] A22 = partition(a,4);
int[][] B22 = partition(b,4);
//计算S1-S10的中间矩阵
int[][] S1 = matrixSubstract(B12,B22);
int[][] S2 = matrixAdd(A11,A12);
int[][] S3 = matrixAdd(A21,A22);
int[][] S4 = matrixSubstract(B21,B11);
int[][] S5 = matrixAdd(A11,A22);
int[][] S6 = matrixAdd(B11,B22);
int[][] S7 = matrixSubstract(A12,A22);
int[][] S8 = matrixAdd(B21,B22);
int[][] S9 = matrixSubstract(A11,A21);
int[][] S10 = matrixAdd(B11,B12);
//计算P1-P7的几个递归矩阵
int[][] P1 = matrix_multiply(A11,S1);
int[][] P2 = matrix_multiply(S2,B22);
int[][] P3 = matrix_multiply(S3,B11);
int[][] P4 = matrix_multiply(A22,S4);
int[][] P5 = matrix_multiply(S5,S6);
int[][] P6 = matrix_multiply(S7,S8);
int[][] P7 = matrix_multiply(S9,S10);
//进行加减运算
int[][] C11 = matrixAdd(matrixSubstract(matrixAdd(P5,P4),P2),P6);
int[][] C12 = matrixAdd(P1,P2);
int[][] C21 = matrixAdd(P3,P4);
int[][] C22 = matrixSubstract(matrixSubstract(matrixAdd(P5,P1),P3),P7);
//合并各个子矩阵
int[][] C = merge(C11,C12,C21,C22);
return C;
}
}
//拆分矩阵,得到四个子矩阵,把不同位置的子矩阵标记成1,2,3,4。1——左上;2——右上;3——左下;4——右下
public int[][] partition(int[][] arr,int index) {
int len = arr.length;
int[][] result = new int[len/2][len/2];
switch(index) {
case 1:
for(int i=0;i<len/2;i++) {
for(int j=0;j<len/2;j++) {
result[i][j]=arr[i][j];
//System.out.println(result[i][j]);
}
};
break;
case 2:
for(int i=0;i<len/2;i++) {
for(int j=len/2;j<len;j++) {
result[i][j-len/2]=arr[i][j];
}
};
break;
case 3:
for(int i=len/2;i<len;i++) {
for(int j=0;j<len/2;j++) {
result[i-len/2][j] = arr[i][j];
}
};
break;
case 4:
for(int i=len/2;i<len;i++) {
for(int j=len/2;j<len;j++) {
result[i-len/2][j-len/2]=arr[i][j];
}
};
}
return result;
}
//矩阵的加运算
public int[][] matrixAdd(int[][] a,int[][] b){
int[][] result = new int[a.length][a.length];
for(int i=0;i<a.length;i++) {
for(int j=0;j<a.length;j++) {
result[i][j]=a[i][j]+b[i][j];
}
}
return result;
}
//矩阵的减运算
public int[][] matrixSubstract(int[][] a,int[][] b){
int[][] result = new int[a.length][a.length];
for(int i=0;i<a.length;i++) {
for(int j=0;j<a.length;j++) {
result[i][j]=a[i][j]-b[i][j];
}
}
return result;
}
public void display(int[][] arr) {
System.out.print("[");
for(int i=0;i<arr.length;i++) {
for(int j=0;j<arr.length;j++) {
if(j==arr.length-1) {
System.out.print(arr[i][j]);
}else {
System.out.print(arr[i][j]+ " ");
}
}
System.out.print("]");
System.out.print("\n");
}
}
//将四个子矩阵合并成一个整体的大矩阵
public int[][] merge(int[][] a1,int[][] a2,int[][] a3,int[][] a4){
int len = a1.length;
int[][] result = new int[len*2][len*2];
for(int i=0;i<result.length;i++) {
if(i<len) {
for(int j=0;j<result.length;j++) {
if(j<len) {
result[i][j]=a1[i][j];
}else {
result[i][j] = a2[i][j-len];
}
}
}else {
for(int j=0;j<result.length;j++) {
if(j<len) {
result[i][j]=a3[i-len][j];
}else {
result[i][j] = a4[i-len][j-len];
}
}
}
}
return result;
}
public static void main(String[] args) {
//测试分而治之的矩阵乘法
Practice1_5 prac = new Practice1_5();
int[][] a1 = new int[][] {{1,2,3,4},{4,3,2,1},{0,1,2,3},{3,2,1,0}};
int[][] a2 = new int[][] {{1,2,3,4},{4,3,2,1},{0,1,2,3},{3,2,1,0}};
prac.display(prac.matrix_multiply(a1, a2));
}
}
相关文章推荐
- Java 线程同步问题 生产者-消费者 算法实现 -Java学习笔记(29)
- 算法(第四版)学习笔记之二分查找的递归与非递归java实现
- 算法(第四版)学习笔记之java实现栈和队列(链表实现)
- 8大内部排序算法学习笔记--(1)插入排序java实现
- 算法(第四版)学习笔记之java实现快速排序
- 8大内部排序算法学习笔记--(3)选择排序java实现
- 算法(第四版)学习笔记之java实现基于堆的优先队列
- 链栈实现算法 - Java 学习笔记(26)
- 【Java数据结构学习笔记之三】Java数据结构与算法之队列(Queue)实现
- 算法导论学习笔记(1)——快排中hoarePartition的实现(问题已解决)
- 算法(第四版)学习笔记之java实现选择排序
- 8大内部排序算法学习笔记--(4)归并、基数排序 Java实现
- 8大内部排序算法学习笔记--(2)快速排序 Java实现
- 算法(第四版)学习笔记之java实现归并排序
- 算法(第四版)学习笔记之java实现堆排序
- 算法(第四版)学习笔记之java实现可以动态调整数组大小的栈
- 算法(第四版)学习笔记之java实现希尔排序
- Java学习笔记---实现两个ArrayList合并,并去掉重复数据的算法
- 算法(第四版)学习笔记之java实现希尔排序
- 算法(第四版)学习笔记之java实现插入排序