动态规划 两序列最近距离(字符串比对)
2016-02-15 20:24
246 查看
【编程题】(满分27分)
脱氧核糖核酸即常说的DNA,是一类带有遗传信息的生物大分子。它由4种主要的脱氧核苷酸(dAMP、dGMP、dCMT和dTMP)通过磷酸二酯键连接而成。这4种核苷酸可以分别记为:A、G、C、T。
DNA携带的遗传信息可以用形如:AGGTCGACTCCA.... 的串来表示。DNA在转录复制的过程中可能会发生随机的偏差,这才最终造就了生物的多样性。
为了简化问题,我们假设,DNA在复制的时候可能出现的偏差是(理论上,对每个碱基被复制时,都可能出现偏差):
1. 漏掉某个脱氧核苷酸。例如把 AGGT 复制成为:AGT
2. 错码,例如把 AGGT 复制成了:AGCT
3. 重码,例如把 AGGT 复制成了:AAGGT
如果某DNA串a,最少要经过 n 次出错,才能变为DNA串b,则称这两个DNA串的距离为 n。
例如:AGGTCATATTCC 与 CGGTCATATTC 的距离为 2
你的任务是:编写程序,找到两个DNA串的距离。
【输入、输出格式要求】
用户先输入整数n(n<100),表示接下来有2n行数据。
接下来输入的2n行每2行表示一组要比对的DNA。(每行数据长度<10000)
程序则输出n行,表示这n组DNA的距离。
例如:用户输入:
3
AGCTAAGGCCTT
AGCTAAGGCCT
AGCTAAGGCCTT
AGGCTAAGGCCTT
AGCTAAGGCCTT
AGCTTAAGGCTT
则程序应输出:
1
1
2
开始的时候居然当做最长公共子序列来做的,后来试了一组发现不对。
!= A[i] 的话,那修改相当于用了1步。所以dp[i][j] = dp[i - 1][j - 1] + (A[i] == B[j] ? 0, 1)。
脱氧核糖核酸即常说的DNA,是一类带有遗传信息的生物大分子。它由4种主要的脱氧核苷酸(dAMP、dGMP、dCMT和dTMP)通过磷酸二酯键连接而成。这4种核苷酸可以分别记为:A、G、C、T。
DNA携带的遗传信息可以用形如:AGGTCGACTCCA.... 的串来表示。DNA在转录复制的过程中可能会发生随机的偏差,这才最终造就了生物的多样性。
为了简化问题,我们假设,DNA在复制的时候可能出现的偏差是(理论上,对每个碱基被复制时,都可能出现偏差):
1. 漏掉某个脱氧核苷酸。例如把 AGGT 复制成为:AGT
2. 错码,例如把 AGGT 复制成了:AGCT
3. 重码,例如把 AGGT 复制成了:AAGGT
如果某DNA串a,最少要经过 n 次出错,才能变为DNA串b,则称这两个DNA串的距离为 n。
例如:AGGTCATATTCC 与 CGGTCATATTC 的距离为 2
你的任务是:编写程序,找到两个DNA串的距离。
【输入、输出格式要求】
用户先输入整数n(n<100),表示接下来有2n行数据。
接下来输入的2n行每2行表示一组要比对的DNA。(每行数据长度<10000)
程序则输出n行,表示这n组DNA的距离。
例如:用户输入:
3
AGCTAAGGCCTT
AGCTAAGGCCT
AGCTAAGGCCTT
AGGCTAAGGCCTT
AGCTAAGGCCTT
AGCTTAAGGCTT
则程序应输出:
1
1
2
开始的时候居然当做最长公共子序列来做的,后来试了一组发现不对。
状态转移方程:
有三种情况可以导致我们上面设计的状态会发生转移。我们现在来看A[i] 和 B[j] ,①、我们可以在B[j]后面插入一个核苷酸(即一个字符)ch,ch==A[i],这样做的话,至少需要dp[i - 1][j] + 1步操作,即dp[i][j] = dp[i - 1][j] + 1。②、我们可以删除B[j],这样的话,B[1...j] 变为A[1...i] 需要dp[i][j - 1]步,即dp[i][j] = dp[i][j - 1] + 1。③、我们也可以考虑修改B[j],使它变为A[j],但是如果B[j]本来就等于A[i]的话,那修改其实相当于用了0步,如果B[j]!= A[i] 的话,那修改相当于用了1步。所以dp[i][j] = dp[i - 1][j - 1] + (A[i] == B[j] ? 0, 1)。
#include <stdio.h> #include <string.h> char a[10003], b[10003]; int dp[10003][10003]; int min(int a, int b, int c) { int x = a < b ? a : b; int y = x < c ? x : c; return y; } int main() { int n, la, lb, ans, i, j; scanf("%d", &n); while(n--) { scanf("%s", a); scanf("%s", b); la = strlen(a); lb = strlen(b); for(i = 1; i <= lb ; i++)//注意边界的处理,i为0就是第一个串为空,所以要修改b的位数位 dp[0][i] = i; for(i = 1; i <= la ; i++) dp[i][0] = i; for(i = 1 ; i <= la ; i++) for(j = 1 ; j <= lb ; j++) { if(a[i] == b[j]) dp[i][j] = dp[i - 1][j - 1]; else dp[i][j] = min(dp[i - 1][j] + 1, dp[i][j - 1] + 1, dp[i - 1][j - 1] + 1); } printf("%d\n", dp[la][lb]); } return 0; }
相关文章推荐
- AndroidStudio查看对象引用,是否内存泄露
- java项目与javaweb项目导入jar包的区别
- x265-1.8版本-encoder/ratecontrol.cpp注释
- 自编题——找数列
- hdoj 2022 海选女主角
- AFNetworking2.0源码解析<四>
- AFNetworking2.0源码解析<三>
- 模仿新浪微博“@”好友搜索功能(支持IE和火狐浏览器)-(咋个办呢 zgbn)
- 日常整理(监控CACTI)
- 异常解决Unknown system variable 'lower_case_table_names'
- x265-1.8版本-encoder/motion.h注释
- AFNetworking2.0源码解析<二>
- Kotlin Android开发学习记录
- 文字的发音
- 重学C++ (十一) OOP面向对象编程(2)
- uploadify的用法与动态传参 提供demo下载
- 实现从一个界面返回有导航条的界面然后再跳转到下一个界面
- AFNetworking2.0源码解析<一>
- 低版本VC2010打开高版本VC2012的方法
- C++继承与派生