认识你不了解的自己——WeGene基因检测体验
近年来基因组学技术飞速发展,主要得益于基因芯片技术的成熟,特别是高通量测序技术进步及成本降低。基于基因芯片的变异检测属于上一代的技术了,现在的基因组学科研中主要使用高通量测序鉴定基因组变异。虽然基于芯片的变异检测在科研中已经被淘汰了,但由于其成本比测序低很多,所以目前好多基因检测,尤其是涉及较多位点的基因检测,还是采用基于芯片的技术。著名的美国23andMe就是较早向公众提供这种基于芯片的大规模基因检测的公司。
最近两年国内的基因检测发展很火,有好多创业公司。WeGene就相当于是国内的23andMe,WeGene也是基于基因芯片对基因组中特定的位点进行基因型检测。基因组中位点的基因型就是DNA上某个位置的碱基构成,碱基只有A, T, C, G四种,每个人会从父亲和母亲各继承一套基因组,所以基因组一个位置来自父亲的碱基和来自母亲的碱基一起构成了这个位置的基因型,简单想就是两个字母,每个字母从A,T,C,G中选一种。与参考基因组不同的基因型就称为变异。这些检测的位点都是提前设计选取好的,选取的都是已经有文献报道能够导致疾病发生或表型改变、或者统计上同疾病关联的位点。WeGene在检测报告后提供原始数据,我数了下,我的检测结果共包括有596,744个位点,表头有说明质量低的位点已被过滤掉,所以估计WeGene的芯片总共包括了大约60万个位点,分布在人类1-22号常染色体、X和Y性染色体、还有线粒体里的基因。WeGene包含的位点已经非常多了,分布也非常广泛,但每个人的基因组都由30亿个碱基对构成,所以相当于测了整个基因组万分之二的位置。
因此,基于芯片的基因检测的局限性就是检测位点不能做到全面,这就使得检测结果的分析解读,尤其是涉及疾病的部分,参考价值较少。但60万个位点对于分析祖源、一些简单性状如血型等是足够做到基本准确了。但对于疾病,尤其是复杂疾病如癌症、心脑血管疾病、糖尿病、精神类疾病等,涉及多基因多位点,在科研中还没有鉴定到全部的致病基因,已经发现的位点也多是通过统计关联分析得到的,只是统计上的关联,并不是因果关系,而且也不是单个位点的变异就会导致疾病的发生。而对于单基因疾病,如果检测发现携带致病变异,那还是有很大的参考价值的,需要防止遗传给下一代而造成下一代患病的可能。但如果检测到没有携带,也并不意味着该基因没有问题,因为在该基因没有检测的其他位点上可能存在着有害的突变。也正是因为这样,FDA禁止了23andMe检测结果中疾病相关的解读,因为仅凭这些位点的基因型检测说明不了关于疾病的什么,还容易造成误导。实际上,对于一些单基因疾病的产前筛查、诊断目前一般都是把整个基因进行测序,这样检测的变异才会全面,对单个基因进行测序的成本还是比较低的,然后对该基因上所有发现的变异进行评估,比如苯丙酮尿症的产前筛查等,这个目前在国内外都已经很成熟而且临床上广泛使用了。
最全面的基因检测就是进行全基因组测序,正好发现最近WeGene推出了全基因组测序服务,要9999元,能够把个人基因组测到30倍的覆盖度,就是基因组每个位置平均测30次,以便准确地发现基因组中的变异。现在国际上测一个人的基因组到30X试剂耗材成本最低能到大约1000美元一个人,使用illumina公司的HiSeq X Ten设备,国内好多测序公司如华大等都买了好多台,所以在国内大概1万元的价格基本是成本价了。不过目前进行全基因组测序虽然能够较为准确的鉴定个体基因组中几乎全部的变异,但是如何解读这些变异成了一个急需解决的问题。一次全基因组测序就能够鉴定大约300万个单位点变异,还有好多插入缺失和结构变异。而目前科研中已经发现的致病的变异相对较少,即使加上疾病关联研究中鉴定的同疾病统计关联的位点,能够解释的变异还是少之又少。因此,利用全基因组测序进行基因检测,得到的变异虽然全面,但其中绝大多数变异的致病性都是未知的。如何判断这些变异的致病性,就是当前基因组学的主要研究问题之一,也是楼主主要的研究工作啦。
所以目前基因检测虽然很火,但关于疾病方面的提示十分有限,目前最实用的还是对单个基因测序进行单基因遗传疾病的产前筛查诊断,还有对于一些癌症可以根据相关基因的基因型进行最佳药物选择。这大概就是目前基因检测的现状。大规模基因检测的目标就是利用个体基因组信息准确判断各种疾病的患病风险,从而提早做出预防或治疗。虽然目前基因组学的研究成果离实现这个目标还很远,不过我相信未来会实现的,毕竟一个人的基因组蕴含了个体全部的遗传信息,当然对于复杂疾病还需要考虑环境因素的影响。目前好多生命科学研究都是在朝实现这个目标努力的。所以像23andMe和WeGene这样的基因检测虽然处于实现这个目标的初级阶段,但也离实现这个目标近了一点点,所以还是值得体验下的。
一、唾液样本采集
基因检测一般都是使用血液或唾液样本,自我采集样本的话唾液是最容易的了,主要是利用脱落的口腔上皮细胞,唾液采集有专门的收集管,里面的试剂可以防止DNA降解,WeGene会快递过来,就是下面的盒子。
盒子背面,可以看到采集管的编号,需要和WeGene注册的账号绑定。
侧面印了X染色体上的一段DNA序列,另一侧是Y染色体上的一段序列。
打开盒子,里面有说明书,样本收集说明,唾液采集管,还有邮寄回去的快递单:
全家福:
唾液收集管特写:
盖子上密封的是防止DNA降解的试剂,唾液收集完盖上后液体会流下,需要与唾液充分混合。
两个样本采集说明,内容基本一样:
唾液采集最好提前清洁口腔,然后30分钟内不要饮食。采集时可以用舌头刮口腔上皮。收集好足够的唾液后盖上漏斗盖子,让液体留下,然后扔掉漏斗,盖上密封盖,然后上下颠倒让试剂与唾液充分混合,密封在生物安全袋内快递寄出。
二、检测流程
6月19日 样本到达实验室 => 6月26日 DNA提取完成 => 6月28日 上机检测 => 7月4日 报告生成
从寄出样本到看到报告共耗时18天。
三、报告解读
官方报告共分为7个方面:祖源分析 运动基因 营养代谢 健康风险 遗传性疾病 药物指南 遗传特征
此外还有第三方解读。
3.1 祖源分析
60万个位点分析祖源还是比较靠谱的。我的籍贯在辽宁和内蒙古交界的地方,差不多一半汉族血统,一半蒙古族血统。父系祖源可以通过Y染色体推断得到,因为Y染色体是直接继承于父亲,在X染色体上几乎没有同源区域发生交叉互换,所以可以精确推断父系祖源。结果显示是从非洲起源,当然现在的研究结果认为现代人类都是从非洲起源的,然后到了中国南方,然后又到了北方。母系祖源的分析利用线粒体基因,因为线粒体基因都来源于母亲的卵细胞,父亲的生殖细胞中只有核基因组在受精时会进入卵细胞中。所以一个人的线粒体基因组和他母亲的、姥姥的、姥姥的妈妈的以及再往上的都是一样的,不考虑自发突变的话。结果显示从非洲经中东,然后到了中国北方,然后还有一些继续迁徙,经白令海峡到了北美洲以及南美洲。这个结果还是很有意思的,可以知道自己大概是从哪来的。
3.2 运动基因
运动以及代谢的情况应该都是多基因控制的,还有环境因素的影响,所以这里的结果只能简单参考。不过其中的咖啡因敏感性对我个人来说确实与实际符合,比较不敏感,喝了咖啡该困还是困。
这个体重管理,要是真的如检测的这样就好了,吃多了也不会变胖,然后运不运动也没关系。但事实是最近吃的多体重还是明显增加了。
3.3 营养代谢
乳糖代谢能力弱没有感觉,从小到大经常和牛奶都没有问题。咖啡因代谢能力强与上面的结果一致。其他营养需求包括维生素A等可以参考,可以根据提示适当多补充些。
3.4 健康风险
健康风险里列的都是复杂疾病,受较多基因和位点影响的。如前面讨论的,这里的风险参考意义不大,因为凭单个或几个位点计算的患病概率非常不准确,而且这些位点大多是统计关联,绝大多数都不是致病的位点。
3.5 遗传性疾病
在这一项里列的都是单基因疾病,所以检测结果有一定的参考价值。尤其是检测到携带致病变异的话,而本人未发病,说明疾病是阴性遗传,需要在生育前检测配偶的该基因上是否携带,如果都携带的话,生的小孩虽然不能说100%但非常非常高的可能会患病,而且很多单基因遗传病都是非常严重的。但是,即使检测未携带,但因为不是全面的基因测序,仅仅是检测了每个基因的几个位点,所以在其他芯片未检测的位置可能存在着有害变异。
WeGene这里检测的单基因疾病一共33种。但目前已发现致病的基因共有3777个 (http://www.omim.org/statistics/geneMap),目前没有时间仔细研究WeGene的60万个位点中是否含有这些基因中被报道的致病位点,但感觉WeGene的这个列表可以继续扩充。现在有好多公共的数据库如OMIM以及收费的数据库如HGMD等都有这些致病的位点信息。
3.6 药物指南
药物指南具有一定的参考性,可以指导合理用药。
3.7 遗传特征
遗传特征中的性状既有单基因性状也有多基因性状,其中的血型是完全没有问题。
四、总结
在WeGene的报告中都明确写明了结果不能用于诊断,并且明确写出了基因检测的局限性:没有覆盖全部位点,复杂疾病及性状受多基因及环境的影响。所以其中关于健康风险的报告基本可以忽略。而其他一些部分的确有一定的参考价值,包括祖源分析、遗传性疾病以及药物指南。
WeGene拥有大约60万个检测位点,在基于芯片的基因检测中算是很大规模的了。这些检测结果可以进一步利用,比如在“遗传性疾病”一项中给出更多单基因疾病的致病变异携带信息。WeGene还有一点做得很好的是每一项检测结果都会给出具体的参考文献,说明WeGene做得是非常专业靠谱的。而且WeGene会提供原始检测结果,使得具有相关专业知识的人可以自己做更多的分析与解读。
总之,WeGene在基于芯片的基因检测方面已经做得很好了,局限性主要来自芯片技术本身及成本考虑以及基因组学研究的现状,WeGene在芯片基因检测的现状下能做的基本都做得很不错了,当然报告包含的信息再多些就更好了。总之目前还是值得体验下的。
最后非常感谢张大妈提供这次众测的机会。
The End.