我们经常会听到,不管是肿瘤也好,糖尿病也好,心脑血管疾病也好,经常都可以找到基因突变跟某一个疾病有关联的。但是请大家一定注意,很多情况只是一种关联,关联不是因果。因果是说,我和我老婆的存在,导致了我女儿的出生;而关联不是因果关系,只是一个随带的关系。比如我女儿碰巧上了这家幼儿园,她上这个幼儿园是一个关联,而不是因果。就像前面提到的一样,基因突变很多时候是一个关联;它并不可怕。而且我刚刚说了,哪怕我们99.99%相似,只有万分之一的不同,但是基数足够大。每个人,比如我们从爸爸妈妈继承的基因突变,每一代大概是72个,这是有据可循的,而且这72个里面大部分来自于父亲的贡献,有的遗传学家就此认为,其实进化的动力来自于父亲,因为它显现了更多突变,更有可能给后代带来基因的多样性,更有可能使得后代与众不同。
正是因为基因组学的如此重要,在人类基因组计划之后,全世界范围的科学家并没有放弃追逐。当时的人类基因计划研究对象只有一个人,但是一个人太少了,每个人都不一样,因此便有了后来的千人基因组计划,我们检测一下黄钟人,再测一下黑色人种,白色人种,每一个人种,不管是中国人,还是日本人,虽然差别可以缩小到十万分之一,但是它的数目还是足够大的。
所以千人基因组计划出台后,我们今后在使用的时候,在序列比对的时候,可能不用再去比人类基因组计划中的HG38(人类基因组计划的第38版),而是比对我们自己的,比对我们中国人群的,比对我们中国南方人群里面某一个亚系的人群基因组,这样才更有可能找到:我突变了什么?我哪种疾病爆发的可能性更大?这就是千人基因组计划的初衷。
后来,为了把一直困扰人类的癌症解释清楚,世界范围内的两大组织,分别是加拿大领衔的国际癌症基因组联盟和美国人领衔的癌症基因组图谱,用基因组学方法去测序某一个类别的肿瘤。
比如说肾癌,他们选择了500多名肾癌患者来测序它的基因组,分析哪些肾癌产生了突变,哪些突变跟愈后相关联,哪些药物针对哪些突变,然后对患者后续治疗做指导。
美国人领衔的计划(TCGA)在去年结束,加拿大领衔计划(ICGC)现在还没有结束。但是毫无疑问,不管是白种人,黑种人,还是我们黄种人,我们人类最主要的肿瘤基本上都测序结束了,这就导致大量数据的产生。
我们知道一个U盘大概有十个G,乘以1024倍是10个T,再乘以1024倍是10个P。而我们研究所里面数据储存远远高于这个,因为数据无时无刻不在产生,这样的数据量意味着我们需要更大容量,需要更大的容器来把它装下来,不然我们没有办法去比对它,没有办法很好地使用它。而这也导致了所谓的生物大数据的出现,大到了T级,大到了P级。
在大数据的应用方面,精准医学的出现毫无疑问对大数据是最好的回馈。因为花了那么多的钱,十几个国家的科学家投入研究,十几年的时间,数百亿美金的投入,对我们人类产生了如此多的数据,我们不用它岂不变成了垃圾?其实精准医学并不仅仅是美国总统在2015年和2016年曾经提到,在这之前,在我们中国,在我们中国科学院,在美国以外的地方,很早就有人提出来精准医学,因为需要针对每个人的基因背景,针对每个人蛋白背景来做个性化的裁减,来做个性化的治疗,这就是所谓的精准医疗,形象点来说,就是哪里坏了修哪里,这是最好的想法。
这是精准医学在癌症领域的应用。我展示的这个流程图是以肝癌为例的整个精准医疗的流程。术前影像显示有个肿块,影像结果出来之后,大部分患者会选择做手术。手术之后我们会进行一个病理学的判断,诊断肝癌到哪一级,哪一期;并且对这样的手术样本进行基因组学建库,建库以后进行基因组学测序,测序之后进行分析,分析以后会由董事会(咨询委员会)坐下来讨论这个患者的基因背景是什么样的,哪些突变可能是致病的,哪些不是主要的突变,董事会(咨询委员会)里面会包含至少四类人员,包括生物信息学家、遗传学家、临床大夫、病理医生。讨论结束后,我们针对这些可用的突变频谱进行验证,验证结束之后我们会对患者进行报告。比如肝癌,已有的病理学分析到了哪个层面,现在基因组分析到了哪个状态,现在有哪些药可以用,哪些是针对患者的。这样的报告就是精准医学最直接的体现。
【免责声明】本文仅代表作者个人观点,与IT09数码网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。您若对该稿件内容有任何疑问或质疑,请联系本网将迅速给您回应并做处理。