您的位置:首页 > 其它

POJ1007 DNA Sorting

2013-09-03 15:06 246 查看
POJ上的一道题目:

题目大意:

序列“未排序程度”的一个计算方式是元素乱序的元素对个数。例如:在单词序列“DAABEC'”中,因为D大于右边四个单词,E大于C,所以计算结果为5。这种计算方法称为序列的逆序数。序列“AACEDGG”逆序数为1(E与D)——近似排序,而序列``ZWQM'' 逆序数为6(它是已排序序列的反序)。

你的任务是分类DNA字符串(只有ACGT四个字符)。但是你分类它们的方法不是字典序,而是逆序数,排序程度从好到差。所有字符串长度相同。

输入:

第一行包含两个数:一个正整数n(0<n<=50)表示字符串长度,一个正整数m(0<m<=100)表示字符串个数。接下来m行,每行一个长度为n的字符串。
输出:
输出输入字符串列表,按排序程度从好到差。如果逆序数相同,就原来顺序输出。

样例输入:

10 6

AACATGAAGG

TTTTGGCCAA

TTTGGCCAAA
GATCAGATTT
CCCGGGGGGA
ATCGATGCAT

样例输出:

CCCGGGGGGA
AACATGAAGG
GATCAGATTT
ATCGATGCAT
TTTTGGCCAA
TTTGGCCAAA

  今天被这道题目坑了一天,唉,说多了全是泪,但还是要说的,免得广大程序猿同志跟我一样,其实这道题目不是很难,我设计的程序也没有错误,只是POJ网站不支持某些库函数而已,所以,在做这些题目的时候,不要轻易使用类似 fflush() 之类的函数,今天我一整天检查不出bug就是因为这个fflush()

  虽然简单,还是大概说一下思路吧:

  1、纯粹使用数组来实现比较麻烦,当然也是可以实现的,我的第一个程序就是用数组实现的,选取的数据结构为:

typedef struct
{
int DNAnum;
char str[52];
}NodeDNA;
2、计算每个字符串的逆序数,根据题意来计算即可;

int DNAcount(char* destination, int len)
{
/*
统计每个字符串的DNA值
*/
int iterX = 0;
int iterY = 0;
int cnt = 0;
for(iterX = 0; iterX < len - 1; iterX++)
{
if(destination[iterX] == 'A')
{
continue;
}
for(iterY = iterX + 1; iterY < len; iterY++)
{
if(destination[iterX] > destination[iterY])
{
cnt++;
}
}
}
return cnt;
}
字符串里面假设有字母 'A' ,是可以直接跳过的,因为字母 'A' 不影响逆序数,所以,程序才加入了if语言来判断;

  3、接下来就是对逆序数排序了,可以采用直接货冒泡排序,快速排序,这两种排序我都试过,没有超出时间要求,不过快速排序不用自己写,直接调用qsort()函数即可;下面贴出完整代码

#include <stdio.h>
#include <stdlib.h>
typedef struct { int DNAnum; char str[52]; }NodeDNA;

int DNAcount(char* destination, int len) { /* 统计每个字符串的DNA值 */ int iterX = 0; int iterY = 0; int cnt = 0; for(iterX = 0; iterX < len - 1; iterX++) { if(destination[iterX] == 'A') { continue; } for(iterY = iterX + 1; iterY < len; iterY++) { if(destination[iterX] > destination[iterY]) { cnt++; } } } return cnt; }

int cmp(const void* a,const void* b)
{
NodeDNA* x=(NodeDNA*)a;
NodeDNA* y=(NodeDNA*)b;
return (x -> DNAnum) - (y -> DNAnum);
}

int main(void)
{
NodeDNA NoDNA[101];
int col = 0;
int row = 0;
int iter = 0;
//scanf("%d%d", &col, &row);
//fflush(stdin);
while( scanf("%d%d", &col, &row) != EOF )
{
getchar();
for(iter = 0; iter < row; iter++)
{
gets(NoDNA[iter].str);
NoDNA[iter].DNAnum = DNAcount(NoDNA[iter].str, col);
}
qsort(NoDNA, row, sizeof(NodeDNA),cmp);
for(iter = 0; iter < row; iter++)
{
puts(NoDNA[iter].str);
}
}

return 0;
}
另外,需要说明的一点是,计算逆序数的还有一个复杂度为O(n)的算法;

int InversionNumber(char* s,int len)
{
int ans=0;  //s逆序数
int A, C, G , i;  //各个字母出现次数
A = C = G = 0;
for( i = len-1;i >= 0;i--)
{
switch(s[i])
{
case 'A':A++;break;  //A是最小的,无逆序数
case 'C':
{
C++;
ans+=A;  //当前C后面出现A的次数就是这个C的逆序数
break;
}
case 'G':
{
G++;
ans+=A;
ans+=C;
break;
}
case 'T':
{
ans+=A;
ans+=C;
ans+=G;
break;
}
}
}
return ans;
}

注:本博客与博客园上的博客为同一博客主:http://www.cnblogs.com/bestDavid/
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息