Wegene基因检测体验,来自一个话痨生物PHD的报告
非常感谢张大妈和wegene给了我体验基因组检测的机会,去年这个时候申请众测没有中,今年的微众测居然中了~有种中了国自然基金的感觉, 哈哈。
作为一名刚毕业的生物PHD,对于生物这个就业神坑早早的有了概念,也积极寻找就业机会,针对生物的各种就业方向都有所涉及。个人基因组数据的检测和解读就是我关注的一个,wegene、mygene、23魔方等新兴公司最近多了好多,但更早之前,还是因为google的股东还是什么人参股了23andme的时候,让我注意到这个领域。23andme在这个领域是当之无愧的先行者和老大,祖源分析、疾病预测等都做到了领域的前列,但FDA的一纸公告,让23andme只保有祖源分析报告,不可出具疾病预测报告,为这个领域的未来引入了一丝不确定因素。话说回来,wegene应该在国内做基因组检测和分析最早的公司之一,对23andme数据的支持和解读,让我对这个公司充满了好感~
先自我介绍一下,我是一名肿瘤细胞生物学的博士毕业生,这几年苦逼的PHD阶段做的是抑癌基因的缺失与肿瘤药物敏感性的关系的课题,已经发了两篇10分左右的文章,还有一篇大的在憋着……用人话说,就是研究病人哪个基因突变了,通过分析基因和药物的机制,确定病人适合用什么药,不适合用什么药。所以wegene的检测结果一方面可以按照常规的套路,看一看wegene的报告中提供的祖源分析、运动基因、营养代谢、健康风险、遗传性疾病、药物指南、遗传特征等,另一方面是从基因突变的角度,简单评估一下自己有哪些与癌症相关基因发生突变。实现声明一下,我自己了解和清楚的是关于肿瘤信号通路,以及药物杀伤和应答机制,生物体内很多因素都不能简单的用一条通路或者机制解释清楚的,我只针对自己了解的比较多的一部分多写一些,像流行病学、遗传学、统计学的知识,我还是欠缺的,大家多多包涵。
先简单交代一下背景,人的遗传信息由细胞内的DNA和表观遗传信息组成(这个太复杂,暂且不说),DNA是承载着绝大部分的遗传信息的材料,生物学有一个中心法则,就是描绘了DNA是如何通过RNA和蛋白实现对人各层面的调控。值得注意的是人是二倍体生物,一般可定义为22对常染色体加1对性染色体(男XY女XX),在交配过程中,来自父母的同一对染色体通过基因分离和自由组合的规律形成下一代,大家可以理解为23对染色体,爸妈各取出一份,放在一个细胞里,变成下一代的23对染色体。其中由于只有男性携带Y染色体,所以通过对Y染色体的测序,实现对确切个体的父系谱系的梳理和分析,这也是wegene祖源分析的理论依据;细胞内的DNA除了细胞核的,在细胞质的线粒体也带有DNA,由于来自父亲的精子几乎不携带线粒体DNA,所以通过分析确切个体的线粒体DNA,可以了解这个人的母系谱系。
下面就是我最关心的领域——癌症,人细胞大约有30000个基因,其中很多被认为是原癌基因(oncogene)和抑癌基因(tumor suppressor),原癌基因一般参与细胞分裂、增殖、代谢、黏附等,例如MYC、KRAS、NRAS、BRAF等,抑癌基因则是细胞的质控部门,保证细胞的遗传信息不出错,并且不异常增殖等,例如p53、PTEN、RB等,这些基因的机制什么的可以说出一本书来。大家需要了解的就是,原癌基因和抑癌基因的突变或者扩增/缺失,会使人很容易或很难发生某项肿瘤,并有可能让病人对某些药物耐药或敏感。例如41%癌症患者发生了p53的突变或缺失,而很多肺癌患者携带EGFR的突变。EGFR早期的靶向药物厄洛替尼对于EGFR L858R(这代表EGFR蛋白的第858位的L氨基酸突变为R)的突变就非常有效,但后面如果病人的癌细胞产生了EGFR T790M突变,厄洛替尼就失效了,只有用三代抑制剂AZD9291,如果继续产生了C797S突变,那只能尝试还在试验阶段的EAI045+西妥昔单抗。
对于广大围观群众,除了上面的背景信息,还需要了解的是,上面的数据都是实验室数据和临床统计数据,但针对具体的每个人要具体对待,并且要明白统计学知识对具体每个人的概念。例如上面提到41%的癌症患者有p53突变,但并不意味带有p53突变就一定会有癌症发生。在临床上一个有显著性差异的数据,落实到具体的每个人身上,并不代表这个人患病的几率会达到一个很可怕的几率。例如XXX基因有A888B突变(假设的),有文献表明携带这个突变位点的人患乳腺癌风险比正常人群高400%,看起来很吓人,但简单计算一下,正常人群10万人有1个得病,携带这个突变的人则是4个得病,这样一看就没那么严重了,因为有可能正常人群患别的癌症就是10万人里有20个呢,所以对于基因组检测结果要保持一个平常心。插句题外话,作为一个研究DNA damage四年多的人,雅诗兰黛广告中提到的ANR DNA修复精华,我只能呵呵呵了 ,细胞内有多少修复的通路,请见我知乎的回答https://www.zhihu.com/question/36165264/answer/76183574。
前面扯了太多基础的信息,咱们说会基因组检测技术。常用的技术是SNP芯片和NGS二代测序两种,简单的说,SNP芯片只能检测特定位点的特定突变,便宜、快速、技术成熟,NGS二代测序是把人细胞的所有DNA全部测序一遍,再和正常序列进行比对分析,覆盖面广很多,信息量巨大,价格昂贵、分析繁琐,我们一般交给生物公司做。据我检索到的资料,wegene使用的是illumina的半定制芯片,属于SNP芯片技术。Illumina公司在NGS领域属于绝对的霸主地位,而在芯片方面则是和affymetrix旗鼓相当,都属于行业内的巨头。
相比于去年众测时候很多人出现的样本抽提失败,本次实验的一次成功给人很强的信心。下面是我收到的样本收集管的照片,一个很精巧的盒子里满满当当的各种文档,其中最重要的就是这个来自DNA genotek公司的Oragene唾液采集管,这也是基因组检测领域最常用和可靠的收养kit了。说明书中提到需要2毫升的唾液,并且要求提前不能进食,所以最好的取样时间就是早晨起床,这样前一天晚上睡前刷牙能保证没有其他人唾液(咦? )和食物样本的污染。起床后不要喝水,用舌头轻轻刮一刮口腔上皮,毕竟收集的就是唾液里的口腔上皮细胞,然后吐到收集管中,注意2毫升体积是不包括泡沫的,如果有的人泡沫丰富,可以等没泡沫了继续吐,保证收集管中有足量的唾液供抽提,然后狠狠的将盖子盖上,盖子里的buffer会流入管子里与唾液反应,再拧下收集管,盖上盖子震荡几下就完事了。这一瞬间,我想起了一次抽提200个小鼠尾巴基因组并PCR鉴定基因型的恐惧……
我个人的Wegene的检测流程和时间节点如下:
可以看到速度还是非常迅速的,二十天完成全套流程,下面我们看一下wegene系统出具的报告,毕竟999大洋买的大部分还是数据的分析和解读,而样品的处理和检测只能算是前期步骤。这个报告其实大家也都有点疲劳了,每个人都是BLABLA一大张图,结合一下自己的实际情况,我也不例外。
前面几张是祖源分析、运动基因、营养代谢、健康风险、遗传性疾病、药物指南、遗传特征的概览,可以看出我是一名北方男性(我爸那边来自河北河南),A型血,没有家族遗传病。
有意思的是祖源分析中,来自我母亲的线粒体基因型被分为X2b型,并认为是印第安人或埃及人,与https://www.familytreedna.com/groups/x/about/background中的介绍一致。但问题是我妈妈是土生土长的安徽人,往上数几十辈都是安徽本地人,有点奇怪。
然后是营养代谢方面,结果表明我对咖啡因不敏感,并且喜欢摄入碳水,这和我的性状非常一致,无论是茶、咖啡还是可乐,喝完都不会感到兴奋和睡不着,极端喜欢吃饭和面食。
然后体重方面我就悲剧了,结果表明运动对体重影响较小,而饮食对体重影响中等。还记得刚开始读研的时候,花了两年时间,每天骑车一两个小时,从90KG减到了75KG,然后半年内由于妹子给我了很多零食,瞬间发胖回90KG……
还有就是我的维生素A代谢较差,和我夜盲的症状相符合。乳糖代谢能力差,我喝牛奶确实也容易拉肚子。
接下来是重头戏,健康风险,我来简单介绍一下自己看的思路。第一眼看到前列腺癌4.3倍风险,我的反应居然是还好还好,前列腺癌发病率高,但是死亡率低啊,可以切掉的嘛……
具体的发病率和死亡率可以参考下图,卫生部陈竺院士发表的china cancer statistics 2015论文,可以看到绿色的乳腺癌和前列腺癌,虽然发病率不低,但是死亡率很低,一是因为这两个地方发现癌症以后容易处理,切了就是嘛,二是这两个地方的癌症早期症状既比较明显,容易引起警觉,也容易检测,摸一摸或者B超。最凶险的胰腺癌,就因为胰腺神经很少,有癌细胞增生也感觉不到疼痛,平时检测也不能很清晰的检测到胰脏的问题,所以能被发现的胰腺癌,基本都是晚期了。此外标红的是发病率和死亡率都很高的食管癌、胃癌、肝癌、肺癌,提醒大家不抽烟不喝酒,不吃烫食,少吃腌制食物,尽可能接种乙肝疫苗。
回到前列腺癌风险,可以看到主要是FGFR4和CDH1的两个突变带来的风险很大,在SNPedia网页搜索基因位点处提供的RS2011077,可以看到正常人是A:A(人是二倍体,A:A表明两个等位基因该位点都是A),其中一个等位基因突变为G,则有是2.4倍风险,如果两个等位基因都是G,则是6.2倍风险,我就是那个不幸的两个等位基因都突变为G的,愉快的打出了GG 。DNA碱基是A-T、C-G互补的,所以wegene报告中的CC对应的SNPedia就是G:G。这里可以看到有个Pubmed的链接,作为生物医学类文献数据库,可以看到提供这个SNP位点风险的原始参考文献,这个位点参考的是日本人的结果,有意思的是这个位点是在intron(内含子),并不导致蛋白氨基酸的改变,可能是通过调节RNA可变剪切或者mRNA稳定性来影响癌症风险的。不过看到自己有突变也不用慌张,前面提到癌症发生机率就是一个很低的概率,哪怕提高了好多倍,其绝对值还是一个很低的水平,这里可以看到正常人群前列腺癌是10万人有10个,携带RS2011077突变的则是42个,不算一个很高的几率,我需要做的就是多喝水多撒尿,少憋尿。
除了查看wegene提供的报告,还可以直接查看和下载自己的原始数据,进入方法是“探索”-“原始数据,这里可以直接输入感兴趣的基因名,查询自己是否带有突变,这里以P53为例,可以看到芯片检测了p53的这么多位点,以及每个位点我的碱基是什么样的,感觉这边欠缺了SNP对应蛋白多少位突变的信息,如果直接看到自己的p53的248或者249有突变,那心情一定很恐怖……
同时原始数据也是可以直接下载下来的,用记事本或者excel打开,这里需要强调的是每一家测序和分析公司的解读都是有各自算法的,所以可以拿这个结果去多家公司分析,或者未来生病了,这个原始数据也是可以重新解读的。wegene网页上也提到:目前数据库样本量尚未达到理想数量,但结果会随着参与人数的增多不断优化。大家日后也可以经常回去看看,自己的报告会有更新解读的。知乎上就有网友的祖源分析更新后更加准确的记录。
总结一下:
就像wegene每个页面下面都有一个解释,提到基因只是影响性状的一部分因素,其他可能的因素包括生活环境和生活方式,基因是爸妈给的,但同时我们的生活习惯也会和基因突变有关,例如吸烟就会增加肺部细胞的突变频率,腌制食品增加消化道细胞的突变频率,强烈日照增加皮肤细胞突变频率。我想跟大家分享的就是,不抽烟(肺癌)不喝酒(消化道癌症),不吃烫食(食管癌),少吃腌制食物(消化道癌症),尽可能接种乙肝疫苗(肝癌),多喝水,不憋尿(膀胱癌),定期体检(我对爸妈的要求是40岁以下1-2年一次,40岁以上1年1-2次),经常运动,降低体重(这点我自己做的不好)。下面这张表是我觉得和癌症相关基因总结比较好的一张表,图片来自伴随诊断的新公司安可济,表中既包括了原癌基因,也包括了抑癌基因,如果大家这几个基因有发现突变,就要引起足够的重视了。
祝大家有一个健康的体魄和开心的心情 。
安和万兴
校验提示文案
值友5680549756
校验提示文案
值友5680549756
校验提示文案
安和万兴
校验提示文案