您的位置:首页 > 其它

UCSD计算生物学——1.Introduction

2016-04-11 18:37 162 查看
坚持好好写博客,做社会主义好少年。

课程名称:Bioinformatics Algorithm: An active learning approach

Instructor: Dr. PABLO & Dr. Phillips Campos

UCSD的课程,对入门计算生物学有特别大的帮助。 教学视频来自于Youtube。 在Coursera上也有该课程,但是有规定的时间安排,来不及看。

该博客将关注该课程的知识要点,配套Biopython的代码实现,参考经典书籍(列举如下),给自己以督促,以飨有需之人。

参考书籍:

1. Bioinformatics Sequence and Genomic Analysis

2. An Introduction of Bioinformatic Algorithm

(经师兄推荐目前在参考这两本书。据说前者更加偏向生物科学方面,后者更加注重算法的研究)

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Introduction:

计算生物学:多用字符串查找,图论和机器学习的知识解决基因序列等生物学上的问题。问题包括:

1.生物序列的片段拼接。

2.序列对接。

3.基因识别:人类长达30个亿DNA序列中只有3%-5%是基因。阐明人体中全部基因的位置,结构,功能,表达等。

4.蛋白质结构预测:通过蛋白质序列推测其结构,但这不但成本高而且费时,计算生物学的蛋白质结构预测工具通过序列分析可以直接得出其结构

生物学上基本概念的解释:

基因组学:研究基因组的学科。

基因组: 单倍体细胞核、细胞器或病毒粒子所含的所有DNA分子或RNA分子。

转录组学: 对基因表达的研究

<
4000
p>蛋白质组学: 对基因表达的蛋白质水平进行定量的测定,鉴定疾病、药物对生命过程的影响,以及解释基因表达调控的机制
代谢组学: 对生物体内所有代谢物进行定量分析,并寻找代谢物与生理病理变化的相对关系的研究方式

DNA的复制过程: 解旋->复制->终止

从DNA到蛋白质: DNA->转录->RNA->翻译(信使RNA)->protein(需要密码子的对应)

起始密码子: AUG

终止密码子: UAA, UAG, UGA

一些性质:

DNA:由脱氧核糖核苷酸组成(AGCT),双螺旋,储存信息(像硬盘),容易复制。

RNA:由核糖核苷酸组成(AGCU),单螺旋,传递信息(像缓存)。

Protein:由氨基酸组合而成,共20种氨基酸。具有功能性3D结构

some bacteria uses more complex known ribosomal rather than RNA or DNA

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

一些可以用Bioinformatics解释的例子 :

Find Hidden Messages in DNA

Find some molecular basis macroscopically circadian often have

Find which of the bacteria really causes cholera

Bioinformatics 常用数据集:ICGC
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息