您的位置:首页 > 其它

第十篇论文读后总结-GiniClust(基尼聚类)

2017-11-21 17:03 281 查看

GiniClust: detecting rare cell types from single-cell geneexpression data with Gini index

基尼聚类:用基尼指数侦测单细胞基因表达数据中的罕见细胞类型

Lan Jiang1,2,3, Huidong Chen1,2,4, LucaPinello1,2 and Guo-Cheng Yuan1,2,5

Jiang et al. Genome Biology (2016) 17:144 DOI10.1186/s13059-016-1010-4

本文讲了什么问题?

当今的高通量测序技术对于找到新细胞类型有很大潜能,但是从大量细胞样本中找到罕见细胞类型对于高通量测序技术来说却是一个不小的挑战!可是现实中在生物学发展中或疾病进程中占据重要角色的细胞类型,它们的量都是很小的。

因此,本文通过引入“基尼指数”(Gini index)的概念,得出一个从大量细胞样本中找罕见细胞类型的方法——“基尼聚类”(GiniClust)。

方法

基尼指数是比例数值,在0和1之间,是国际上用来综合考察居民内部收入分配差异状况的一个重要分析指标。本文通过对基尼指数进行一些修改,延伸出了基尼聚类的方法,并通过基尼聚类在一些数据集上的实际应用证明了基尼聚类比现存的侦测罕见细胞类型的其他方法更有效。

基尼聚类过程如下:

1. Calculate Gini index(计算基尼指数)

2. Normalize Gini index. Selecthigh Gini genes.(正则化基尼指数,选择高基尼基因)

3. Identify rare cell clusters byDBSCAN(DBSCAN聚类方法确定罕见细胞簇)

4. Visualize results by usingt-SNE(使用t-SNE可视化结果)

5. Identify rarecell-type-specific gene signature.(识别罕见的细胞类型特异性基因签名。)


a0bf
的收获

本文能将社会学中存在很久的基尼指数炼化为己用并生出新的聚类方法很让人敬佩!这让我联想到社会中数以万计的人类中主导历史进程的也就只有那一小部分人;但肿瘤中数以万计的肿瘤细胞是不是就像人类一样,起关键作用的只有极少数?我们能不能找到那极少数肿瘤细胞进行针对分析?找到那极少数肿瘤细胞的方法(例如和其他细胞联系最多的细胞;或这极少数肿瘤细胞中有和其他肿瘤细胞不同的基因表达;或只有这极少数肿瘤细胞中某些基因不表达)。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息