科普 | 上个世纪的辉煌——人类基因组计划竞赛的故事
这也是人类基因组计划中一段有意思的故事。
视频很形象,图文也精彩——我依据视频内容作了一些修改。
https://www.zhihu.com/video/931269776643248128以下正文。
这是一个发生于二十年前的故事。那时人类基因组计划正在如火如荼地进行着。。。
我们知道,人类身体里的每一个细胞中都有着一组由长达32亿个字符的碱基对组成的遗传密码。它们蕴含着人类遗传的密码,虽然要把这些信息解读出来是一项无比艰巨的任务,但对我们了解自身却有着深远的意义。
于是,在1990年,一个由20个国际研究中心组成的团队开始着手完成这项全世界最浩大的生物工程——人类基因组计划——20世纪人类三大自然科学研究计划之一。一开始这个计划由美国NIH主导,预计需要耗资30亿美元和长达15年的时间才能完成!
然而,在1998年,该项目在如火如荼地进行了8年之后,一个叫Celera(塞拉维)的私人企业竟然宣称说,他们可以用更少的资金,并且可以在三年内完成这一项目!
大家如果不熟悉这一段故事的话,可能不知道,当时在Celera幕后推动这一个计划的人正是科学狂人——JC.Venter,就是在2011年全球第一个人工合成生命的家伙!他是个大科学家也是一位大商人,近两年他又发起一项研究人类寿命的基因组计划。
那个时候,这两个团队曾试图展开合作,但是却因为彼此在研究结果分享机制、法律和伦理上的分歧而失败。(据说,JC.Venter老爷子,希望商业化,而不是无偿分享)
既然,谈判崩了,那么他们之间的竞赛就开始了!
尽管这两个团队在基因测序方面采用相同的技术手段——Sanger测序法,但它们的测序策略却完全不同。
总的来说,区别主要体现在以下几个关键步骤:
首先,国家队——NIH牵头(6个国家参与)的“正规”人类基因组计划的方案是要把整个基因图谱分为更小、更易操作的子片段。每个片段都由大约15万个碱基对组成,并且相邻片段首尾均存在小部分重叠,这都是一片片统一好的。
然后,将每个DNA片段都注入到人工培育的细菌染色体中,在那里面繁殖复制,从而获得指纹图谱。指纹图谱可以向科学家们展现那些序列中的重叠部分,将这些重叠的小片段作为线索,研究者们会对各个片段做记号,从而获得一副延续性的图谱,仅仅这个养细菌和做标记的过程就持续了整整六年的时间。
接着,这些片段会被运往全世界所有参与该项目的实验室进行测序,这是一项大型的国家合作项目,所有参与的实验室也都遵循以下两项准则:1. 研究成果属于全人类,并且对世界各国公开;2. 要将研究中所收集的资料在24小时内公布于众。
在各个实验室中,这些基因片段都会被分割为更小的、同样有重叠片段,长度大约是1000个碱基对。随后他们运用“Sanger测序法”(注:双脱氧链终止法),将每个片段内的碱基进行逐一测序。
国家队这一严格的图谱测序法被称作“分级散弹枪测序法”,它可以将测序错误的组合风险降至最低,从而保证能够产出最高质量的人类基因组序列结果。
与国家队这种“宁稳妥,勿遗憾”的原则不同,JC.Venter所在的Celera公司提出的是“全基因组散弹枪测序法”。JC.Venter完全跳过图谱阶段,这在当时的有些人看来,这是一个有勇无谋的策略。他们将整个基因组直接切成许多小而重叠的片段,然后再统一将这些小片段直接进行“Sanger测序”。事实上,在当时JC.Venter采取的这一套策略风险极高,它需要通过算法检测小片段之间的重叠部分来直接重构人类基因组,能否成功在一开始的时候谁都说不准。
但是就最终结果来看呢,或许他们的策略并非是一场豪赌,猜猜看这两个队伍最后谁率先完成了这个图谱?
事实上,国家队在1998年,感受到来自于JC.Venter的压力之后,全世界各国参与项目的科学家都开始了“疯狂”的测序行动。
最终,经过3年艰苦漫长的测序和重组,这个比赛有结果了。2001年二月的时候,双方都在克林顿面前同时发布了完成度超过90%的人类基因组草图!国家队比原先预测的进度早了好几年,从结果上看比赛似乎打平了!
双方的成果获得的两个人类基因组序列也都分别发表在了Nature和Science上。
但是我觉得,从某种程度上其实是JC.Venter赢了,他所能使用的资源其实是更少的,而且完成的时间也更短。JC.Venter的这种“全基因组散弹枪测序法”的测序策略也正是我们后来在NGS中所使用的方法。
人类基因组计划除了其本身成果的意义之外,其实还带来了大科学研究的新模式。在那个时候这种多实验室共同协作,并及时分享数据的做法并不常见。因为,科学家们往往会更倾向于在他们自己分析并且认为结果完整了的时候再公布研究数据和成果。然而,人类基因组计划的这种做法加速了研究过程,并且促成了研究领域一项空前的国际合作。自此之后,随着在公共卫生和私人领域的研究的不断深入,使很多与基因相关的疾病被检测出来,测序方法随着时间的推移不断完善。
如今,一个人的全基因测序只需要40个小时就能完成。但是我们也必须清晰地认识到,能够解读基因只是第一步而已。要了解大多数基因的功能以及他们是如何调控生命体的,我们还有很长的路要走。
如果喜欢更多的生物信息和组学文章,欢迎搜索并关注我的微信公众号“碱基矿工”(ID: helixminer)