English
联系我们
网站地图
邮箱
旧版回顾



uu快3分析:中国留美博士首创CLIME统计算法 为全

文章来源:网络    发布时间:2018-11-12  【字号:      】

中国留美博士李扬。(受访者供图)重构人类基因进化历史,对于研究并预防遗传疾病具有重要意义。哈佛大学来自中国的留学生李扬首创CLIME统计算法,依托大数据时代巨大的公共基因组数据,通过分析不同物种的DNA序列之间的关系,快速准确重构了2万人的基因进化历史,为推动生物医学研究发展做出巨大贡献。据悉,李扬的CLIME统计算法目前不仅已在世界顶级期刊Cell发表,同时还为全球714个实验室提供了6,000余次在线分析。其中,10余家实验室通过使用CLIME算法应用得到了新的科学成果。快速高效完成DNA测序据了解,人类基因组中大概有2万个基因,然而目前科学界只对其中不到50%的基因有所了解,另外50%的基因并不清楚他们在人体中起到什么作用。但就是这些未知基因的功能,却左右着人类的遗传疾病。李扬告诉记者,根据达尔文的进化论,不同的高级物大发pk10计划网种可能是从少数的几个低级物种进化而来,通过分析不同物种的DNA序列之间的关系,就可以重构每个人类基因的进化历史。在大数据时代,巨大的公共基因组数据量给研究者提供了一个良好的契机,CLIME算法正是基于这种思想,并基于严格的数学统计模型而发明的。据悉,CLIME的统计模型是根据统计学中著名的隐马尔科夫模型(Hidden Markov Model)对人类基因在进化过程中的产生和消失进行数学建模。通过这个模型,CLIME分析出每个人类基因的进化历史,同时进一步使用贝叶斯混合模型 (Bayesian mixture uu快3model), 并使用马尔科夫链采样算法(Markov chain Monte Carlo)把进化模型相似的基因进行聚类。因为DNA测序数据量巨大,统计分析算法往往需要很长的计算时间。李扬博大发快3单双士在CLIME在中提出了一个动态规划(Dynamic Programming)算法,使CLIME可以在短时间内高效完成计算。10余实验室通过CLIME算法得出新成果而在实际应用中,CLIME算法使用了138个物种(包含动物、植物、单核生物等)的基因序列数据,重构了2万个人类基因的进化历史,通过把进化历史相似的基因进行聚类。目前,哈佛大学已经建立了CLIME 算法分析网站 www.gene-clime.org,该网站在全球范围内被研究者广泛使用,已经为全球714个实验室,提供了6,000余次在线分析,在线提供的人类基因组进化模型的分析结果已经被下载超过51万余次。此外,还有全球有10余家实验室通过使用CLIME算法,并应用于他们的数据上得到了新的科学成果。芬兰科学院院士、赫尔辛基大学Anu Wartiovaara教授近期在Cell Metabolism上发表论文,详细研究了细胞代谢中几个重要基因的作用。在此文中,Wartiovaara教授实验室的研究人员使用了CLIME算法,对几个重要的细胞代谢基因进行分析,并得出了几个基因之间相关性的分析。Wartiovaara教授提到:“CLIME算法是李扬对学术界的一个重要贡献,CLIME算法的在线分析网站不仅仅是我的研究小组的研究人员经常使用,同时也是被国际上很多研究人员经常使用的工具”。对于未来的研究方向,李扬表示,随着科技发展,各个领域各个行业的数据量都在迅猛增长,每天会出现不同来源、不同形式、包含不同信息的数据。而通过数据来发掘有用的信息,帮助人类社会发展当今社会的一个重要问题。因此,自己下一步将重点研究在高纬度下,如何从众多的变量中选择出最有预测能力的变量。



(责任编辑:admin)

专题推荐


© 1996 - 2017 中国科学院 版权所有 京ICP备05002857号  京公网安备110402500047号   联系我们

地址:北京市三里河路52号 邮编:100864