UCSD计算生物学——1.Introduction
2016-04-11 18:37
162 查看
坚持好好写博客,做社会主义好少年。
课程名称:Bioinformatics Algorithm: An active learning approach
Instructor: Dr. PABLO & Dr. Phillips Campos
UCSD的课程,对入门计算生物学有特别大的帮助。 教学视频来自于Youtube。 在Coursera上也有该课程,但是有规定的时间安排,来不及看。
该博客将关注该课程的知识要点,配套Biopython的代码实现,参考经典书籍(列举如下),给自己以督促,以飨有需之人。
参考书籍:
1. Bioinformatics Sequence and Genomic Analysis
2. An Introduction of Bioinformatic Algorithm
(经师兄推荐目前在参考这两本书。据说前者更加偏向生物科学方面,后者更加注重算法的研究)
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Introduction:
计算生物学:多用字符串查找,图论和机器学习的知识解决基因序列等生物学上的问题。问题包括:
1.生物序列的片段拼接。
2.序列对接。
3.基因识别:人类长达30个亿DNA序列中只有3%-5%是基因。阐明人体中全部基因的位置,结构,功能,表达等。
4.蛋白质结构预测:通过蛋白质序列推测其结构,但这不但成本高而且费时,计算生物学的蛋白质结构预测工具通过序列分析可以直接得出其结构
生物学上基本概念的解释:
基因组学:研究基因组的学科。
基因组: 单倍体细胞核、细胞器或病毒粒子所含的所有DNA分子或RNA分子。
转录组学: 对基因表达的研究
<
4000
p>蛋白质组学: 对基因表达的蛋白质水平进行定量的测定,鉴定疾病、药物对生命过程的影响,以及解释基因表达调控的机制
代谢组学: 对生物体内所有代谢物进行定量分析,并寻找代谢物与生理病理变化的相对关系的研究方式
DNA的复制过程: 解旋->复制->终止
从DNA到蛋白质: DNA->转录->RNA->翻译(信使RNA)->protein(需要密码子的对应)
起始密码子: AUG
终止密码子: UAA, UAG, UGA
一些性质:
DNA:由脱氧核糖核苷酸组成(AGCT),双螺旋,储存信息(像硬盘),容易复制。
RNA:由核糖核苷酸组成(AGCU),单螺旋,传递信息(像缓存)。
Protein:由氨基酸组合而成,共20种氨基酸。具有功能性3D结构
some bacteria uses more complex known ribosomal rather than RNA or DNA
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
一些可以用Bioinformatics解释的例子 :
Find Hidden Messages in DNA
Find some molecular basis macroscopically circadian often have
Find which of the bacteria really causes cholera
Bioinformatics 常用数据集:ICGC
课程名称:Bioinformatics Algorithm: An active learning approach
Instructor: Dr. PABLO & Dr. Phillips Campos
UCSD的课程,对入门计算生物学有特别大的帮助。 教学视频来自于Youtube。 在Coursera上也有该课程,但是有规定的时间安排,来不及看。
该博客将关注该课程的知识要点,配套Biopython的代码实现,参考经典书籍(列举如下),给自己以督促,以飨有需之人。
参考书籍:
1. Bioinformatics Sequence and Genomic Analysis
2. An Introduction of Bioinformatic Algorithm
(经师兄推荐目前在参考这两本书。据说前者更加偏向生物科学方面,后者更加注重算法的研究)
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Introduction:
计算生物学:多用字符串查找,图论和机器学习的知识解决基因序列等生物学上的问题。问题包括:
1.生物序列的片段拼接。
2.序列对接。
3.基因识别:人类长达30个亿DNA序列中只有3%-5%是基因。阐明人体中全部基因的位置,结构,功能,表达等。
4.蛋白质结构预测:通过蛋白质序列推测其结构,但这不但成本高而且费时,计算生物学的蛋白质结构预测工具通过序列分析可以直接得出其结构
生物学上基本概念的解释:
基因组学:研究基因组的学科。
基因组: 单倍体细胞核、细胞器或病毒粒子所含的所有DNA分子或RNA分子。
转录组学: 对基因表达的研究
<
4000
p>蛋白质组学: 对基因表达的蛋白质水平进行定量的测定,鉴定疾病、药物对生命过程的影响,以及解释基因表达调控的机制
代谢组学: 对生物体内所有代谢物进行定量分析,并寻找代谢物与生理病理变化的相对关系的研究方式
DNA的复制过程: 解旋->复制->终止
从DNA到蛋白质: DNA->转录->RNA->翻译(信使RNA)->protein(需要密码子的对应)
起始密码子: AUG
终止密码子: UAA, UAG, UGA
一些性质:
DNA:由脱氧核糖核苷酸组成(AGCT),双螺旋,储存信息(像硬盘),容易复制。
RNA:由核糖核苷酸组成(AGCU),单螺旋,传递信息(像缓存)。
Protein:由氨基酸组合而成,共20种氨基酸。具有功能性3D结构
some bacteria uses more complex known ribosomal rather than RNA or DNA
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
一些可以用Bioinformatics解释的例子 :
Find Hidden Messages in DNA
Find some molecular basis macroscopically circadian often have
Find which of the bacteria really causes cholera
Bioinformatics 常用数据集:ICGC
相关文章推荐
- 书评:《算法之美( Algorithms to Live By )》
- 动易2006序列号破解算法公布
- Ruby实现的矩阵连乘算法
- C#插入法排序算法实例分析
- 超大数据量存储常用数据库分表分库算法总结
- C#数据结构与算法揭秘二
- C#冒泡法排序算法实例分析
- 算法练习之从String.indexOf的模拟实现开始
- C#算法之关于大牛生小牛的问题
- C#实现的算24点游戏算法实例分析
- c语言实现的带通配符匹配算法
- 浅析STL中的常用算法
- 算法之排列算法与组合算法详解
- C++实现一维向量旋转算法
- Ruby实现的合并排序算法
- C#折半插入排序算法实现方法
- 基于C++实现的各种内部排序算法汇总
- C++线性时间的排序算法分析
- C++实现汉诺塔算法经典实例
- PHP实现克鲁斯卡尔算法实例解析