第十篇论文读后总结-GiniClust(基尼聚类)
2017-11-21 17:03
281 查看
GiniClust: detecting rare cell types from single-cell geneexpression data with Gini index
基尼聚类:用基尼指数侦测单细胞基因表达数据中的罕见细胞类型
Lan Jiang1,2,3, Huidong Chen1,2,4, LucaPinello1,2 and Guo-Cheng Yuan1,2,5Jiang et al. Genome Biology (2016) 17:144 DOI10.1186/s13059-016-1010-4
本文讲了什么问题?
当今的高通量测序技术对于找到新细胞类型有很大潜能,但是从大量细胞样本中找到罕见细胞类型对于高通量测序技术来说却是一个不小的挑战!可是现实中在生物学发展中或疾病进程中占据重要角色的细胞类型,它们的量都是很小的。因此,本文通过引入“基尼指数”(Gini index)的概念,得出一个从大量细胞样本中找罕见细胞类型的方法——“基尼聚类”(GiniClust)。
方法
基尼指数是比例数值,在0和1之间,是国际上用来综合考察居民内部收入分配差异状况的一个重要分析指标。本文通过对基尼指数进行一些修改,延伸出了基尼聚类的方法,并通过基尼聚类在一些数据集上的实际应用证明了基尼聚类比现存的侦测罕见细胞类型的其他方法更有效。基尼聚类过程如下:
1. Calculate Gini index(计算基尼指数)
2. Normalize Gini index. Selecthigh Gini genes.(正则化基尼指数,选择高基尼基因)
3. Identify rare cell clusters byDBSCAN(DBSCAN聚类方法确定罕见细胞簇)
4. Visualize results by usingt-SNE(使用t-SNE可视化结果)
5. Identify rarecell-type-specific gene signature.(识别罕见的细胞类型特异性基因签名。)
我
a0bf
的收获
本文能将社会学中存在很久的基尼指数炼化为己用并生出新的聚类方法很让人敬佩!这让我联想到社会中数以万计的人类中主导历史进程的也就只有那一小部分人;但肿瘤中数以万计的肿瘤细胞是不是就像人类一样,起关键作用的只有极少数?我们能不能找到那极少数肿瘤细胞进行针对分析?找到那极少数肿瘤细胞的方法(例如和其他细胞联系最多的细胞;或这极少数肿瘤细胞中有和其他肿瘤细胞不同的基因表达;或只有这极少数肿瘤细胞中某些基因不表达)。
相关文章推荐
- 论文读后总结1:一种对多元数据非监督异常点检测算法的对比评估
- 第九篇论文读后总结-相似森林
- 论文总结
- 看懂信息检索和网络数据挖掘领域论文的必备知识总结
- 找一篇论文的源代码的方法总结
- 项目管理师论文考试准备总结 - 经典草根Blog - 博客频道 - CSDN.NET
- 行人检测(Pedestrian Detection)小结-Part III(相关论文总结报告)
- 《这样装修最省钱》—— 读后总结
- 权力是靠不住的 - 美国政治文化探析 读后总结
- 聚类总结
- 显著性论文学习阶段总结(一)
- kmeans聚类算法与二分聚类的总结
- linux系统编译链接总结--高级c/c++编译技术读后总结(下)
- 原来论文摘要并不是摘录原文,而是原文的总结和提炼
- 读论文总结一
- GraphMat论文总结
- 《深入探索C++对象模型》读后总结
- 《穆斯林的葬礼》—— 读后总结
- 看懂信息检索和网络数据挖掘领域论文的必备知识总结
- 《拆掉思维里的墙》—— 读后总结