DTW距离,时间序列之间的距离
2017-02-01 17:02
232 查看
在日常的生活中我们最经常使用的距离毫无疑问应该是欧式距离,但是对于一些特殊情况,欧氏距离存在着其很明显的缺陷,比如说时间序列,举个比较简单的例子,序列A:1,1,1,10,2,3,序列B:1,1,1,2,10,3,如果用欧氏距离,也就是distance[i][j]=(b[j]-a[i])*(b[j]-a[i])来计算的话,总的距离和应该是128,应该说这个距离是非常大的,而实际上这个序列的图像是十分相似的,这种情况下就有人开始考虑寻找新的时间序列距离的计算方法,然后提出了DTW算法,这种方法在语音识别,机器学习方便有着很重要的作用。
这个算法是基于动态规划(DP)的思想,解决了发音长短不一的模板匹配问题,简单来说,就是通过构建一个邻接矩阵,寻找最短路径和。
还以上面的2个序列作为例子,A中的10和B中的2对应以及A中的2和B中的10对应的时候,distance[3]以及distance[4]肯定是非常大的,这就直接导致了最后距离和的膨胀,这种时候,我们需要来调整下时间序列,如果我们让A中的10和B中的10
对应
,A中的1和B中的2对应,那么最后的距离和就将大大缩短,这种方式可以看做是一种时间扭曲,看到这里的时候,我相信应该会有人提出来,为什么不能使用A中的2与B中的2对应的问题,那样的话距离和肯定是0了啊,距离应该是最小的吧,但这种情况是不允许的,因为A中的10是发生在2的前面,而B中的2则发生在10的前面,如果对应方式交叉的话会导致时间上的混乱,不符合因果关系。
接下来,以output[6][6](所有的记录下标从1开始,开始的时候全部置0)记录A,B之间的DTW距离,简单的介绍一下具体的算法,这个算法其实就是一个简单的DP,状态转移公式是output[i][j]=Min(Min(output[i-1][j],output[i][j-1]),output[i-1][j-1])+distance[i][j];最后得到的output[5][5]就是我们所需要的DTW距离.
DTW的C语言实现
[cpp] view plain copy print?#include<iostream>
#include<string.h>
using namespace std;
#define NUM 5 //序列中样本点的个数简单起见,假设2个序列的样本点一样多
#define Min(a,b) (a<b?a:b)
int main()
{
int i,j,k;
int a[NUM],b[NUM];
int distance[NUM+1][NUM+1];
int output[NUM+1][NUM+1];
memset(distance,0,sizeof(distance));
memset(output,0,sizeof(output));
for(i=0;i<NUM;i++) cin>>a[i];
for(i=0;i<NUM;i++) cin>>b[i];
for(i=1;i<=NUM;i++)
for(j=1;j<=NUM;j++)
distance[i][j]=(b[j-1]-a[i-1])*(b[j-1]-a[i-1]); //计算点与点之间的欧式距离
for(i=1;i<=NUM;i++)
{
for(j=1;j<NUM;j++)
cout<<distance[i][j]<<’/t’;
cout<<endl;
} //输出整个欧式距离的矩阵
cout<<endl;
for(i=1;i<=NUM;i++)
for(j=1;j<NUM;j++)
output[i][j]=Min(Min(output[i-1][j-1],output[i][j-1]),output[i-1][j])+distance[i][j];
//DP过程,计算DTW距离
for(i=0;i<=NUM;i++)
{
for(j=0;j<NUM;j++)
cout<<distance[i][j]<<’/t’;
cout<<endl;
} //输出最后的DTW距离矩阵,其中output[NUM][NUM]为最终的DTW距离和
return 0;
}
这个算法是基于动态规划(DP)的思想,解决了发音长短不一的模板匹配问题,简单来说,就是通过构建一个邻接矩阵,寻找最短路径和。
还以上面的2个序列作为例子,A中的10和B中的2对应以及A中的2和B中的10对应的时候,distance[3]以及distance[4]肯定是非常大的,这就直接导致了最后距离和的膨胀,这种时候,我们需要来调整下时间序列,如果我们让A中的10和B中的10
对应
,A中的1和B中的2对应,那么最后的距离和就将大大缩短,这种方式可以看做是一种时间扭曲,看到这里的时候,我相信应该会有人提出来,为什么不能使用A中的2与B中的2对应的问题,那样的话距离和肯定是0了啊,距离应该是最小的吧,但这种情况是不允许的,因为A中的10是发生在2的前面,而B中的2则发生在10的前面,如果对应方式交叉的话会导致时间上的混乱,不符合因果关系。
接下来,以output[6][6](所有的记录下标从1开始,开始的时候全部置0)记录A,B之间的DTW距离,简单的介绍一下具体的算法,这个算法其实就是一个简单的DP,状态转移公式是output[i][j]=Min(Min(output[i-1][j],output[i][j-1]),output[i-1][j-1])+distance[i][j];最后得到的output[5][5]就是我们所需要的DTW距离.
DTW的C语言实现
[cpp] view plain copy print?#include<iostream>
#include<string.h>
using namespace std;
#define NUM 5 //序列中样本点的个数简单起见,假设2个序列的样本点一样多
#define Min(a,b) (a<b?a:b)
int main()
{
int i,j,k;
int a[NUM],b[NUM];
int distance[NUM+1][NUM+1];
int output[NUM+1][NUM+1];
memset(distance,0,sizeof(distance));
memset(output,0,sizeof(output));
for(i=0;i<NUM;i++) cin>>a[i];
for(i=0;i<NUM;i++) cin>>b[i];
for(i=1;i<=NUM;i++)
for(j=1;j<=NUM;j++)
distance[i][j]=(b[j-1]-a[i-1])*(b[j-1]-a[i-1]); //计算点与点之间的欧式距离
for(i=1;i<=NUM;i++)
{
for(j=1;j<NUM;j++)
cout<<distance[i][j]<<’/t’;
cout<<endl;
} //输出整个欧式距离的矩阵
cout<<endl;
for(i=1;i<=NUM;i++)
for(j=1;j<NUM;j++)
output[i][j]=Min(Min(output[i-1][j-1],output[i][j-1]),output[i-1][j])+distance[i][j];
//DP过程,计算DTW距离
for(i=0;i<=NUM;i++)
{
for(j=0;j<NUM;j++)
cout<<distance[i][j]<<’/t’;
cout<<endl;
} //输出最后的DTW距离矩阵,其中output[NUM][NUM]为最终的DTW距离和
return 0;
}
相关文章推荐
- 时间序列挖掘-DTW加速算法FastDTW简介
- 时间序列挖掘-动态时间归整原理及实现(Dynamic Time Warping, DTW)
- 调用百度地图实现查询两地之间驾车所需时间、距离
- 时间序列的模式距离
- 人和人之间的距离有多远
- oracle得到任意2个经纬度之间的距离
- 计算一个时间距离今天还有多少天
- PHP计算两个经纬点之间的距离
- 分治算法题:nlgn时间复杂度计算原序列的重要逆序个数
- 找了好久的HEVC视频序列才找到了啊,还是转一下吧!!能帮助需要的人节约点时间
- Linux下shell计算两个日期之间的时间天数差,并获取出中间的日期
- 计算两经纬度之间的距离
- 两点之间的最短距离是?
- MySQL和Java时间毫秒之间的转换问题的总结
- 最小生成树(城市之间的最短距离)
- 复习计划(距离找工作还有一年的时间)
- oracle毫秒数和日期时间之间的转换
- [置顶] Python时间序列案例分析实战--奶牛产奶量预测
- ZT: 办公室同事之间的最佳距离
- python科学计算笔记(十)pandas中时间、日期以及时间序列处理