CORC  > 昆明动物研究所  > 昆明动物研究所
题名利用转录组数据探究老年复杂性疾病
作者郑俊娟
答辩日期2019-01
文献子类博士
授予单位中国科学院大学
授予地点北京
关键词基因的差异表达,阿茨海默症,中风,基因共表达网络,中草药植物 differential Expression Of Genes, Alzheimer's Disease, Stroke, Gene co-Expression Network, Herbal Plant
学位名称理学博士
英文摘要

转录组是在某一特定时间和空间下组织或细胞内基因所有转录产物RNA的总和。转录是基因表达的第一步,也是关键的调控环节,通过基因表达可以将基因携带的遗传信息转变成可识别的表型特征。转录组学是从RNA水平上研究细胞内的基因表达情况,是探究细胞表型和生物分子功能的有效手段。随着二代测序技术发展,各种人类疾病或者生理状态下的转录组数据不断积累,利用不同的数据挖掘方法从基因表达水平探究正常的生物过程和疾病的病理机制成为了研究的热点和难点。为了更好地解决复杂的生物学问题,需要对海量的转录组数据进行整合分析,通过合理有效的方法或者算法,合并多个针对某一疾病或生理状态的独立研究数据集,从而扩大样本量,提高整个分析结果的可信度和一致性。因而,本研究围绕着转录组数据,通过整合其他不同种类的数据和不同的数据挖掘方法,探究老年人群常见的两种复杂疾病——阿茨海默症和中风,进行了以下3个相对独立的研究,并取得了一定的进展。 1. 衰老相关基因NRXN3的低表达增加阿茨海默症的发病风险阿茨海默症(Alzheimer’s disease, AD)是一种常见的神经退行性疾病,衰老被认为是AD最大的一个风险因素,年龄越大的人群发病率越高。本研究的目的是探讨衰老是如何导致AD风险增加的,找到正常衰老人群和AD病人中常见的协同并发的变化,找到具有衰老依赖性的并促进AD发生和发展的基因。我们分别搜集了3组AD和1组衰老相关的表达数据集,并将衰老数据集分青年组、中年组和老年组。通过不同的算法对两类表达数据集进行分析,MetaMA方法计算AD基因的差异表达,SAM方法探寻衰老数据集中与年龄(衰老)密切相关的基因,包括与年龄正相关的和负相关的基因。本研究发现在AD病人的差异表达基因中,有1291个基因是与年龄有密切相关性的,基本上在AD病人中表达上调的基因与衰老具有正相关性,同时在AD病人中表达下调的基因与衰老具有负相关性,即这些基因在AD病人和健康老年人群中表达趋势基本一致。对这1291个基因进行KEGG通路的富集分析,大部分的基因富集到了神经退行性疾病、细胞凋亡、阿茨海默症、泛素介导的蛋白水解等KEGG通路中,说明这些基因在正常衰老个体中增加了老年人人群AD的患病风险。整合与AD发病相关的基因单核苷酸多态性,发现在1291个共有失调基因中有32个基因携带有与AD发病相关的单核苷酸多态性。其中基因NRXN3是AD中排在第二位的差异表达基因(下调),同时NRXN3的表达与年龄呈负相关。因而,我们着重探讨了NRXN3及其相关基因的功能网络,发现NRXN3在突触功能和神经活性方面发挥重要的作用,在健康衰老人群中表达下调的NRXN3是促使AD发生重要的遗传风险因素。2. 通过共表达网络探寻阿茨海默症中的潜在致病基因阿茨海默症(AD)是一种进行性和无法治愈的神经退行性疾病,具有较长的临床前期,因而对AD病人的早期诊断显得尤为重要。AD发生不是单个基因异常的结果,而是大脑内多个区域的细胞间或细胞内相互影响的结果。因而利用基于网络的分析方法研究AD病人的转录组数据,可以系统地探究AD在分子水平上的复杂性。本研究搜集了3组AD相关的转录组数据并进行预处理,通过WGCNA(Weighted gene co-expression network analysis)方法分别在AD病人和健康对照组中构建了16个和29个共表达基因网络。为了比较健康对照组和AD病人的共表达网络之间的差异,将健康对照组的所有共表达基因网络作为参考网络,AD病人的所有共表达基因网络视为测试网络,查看在测试网络中有多少参考网络被保留了下来,有多少参考网络不在测试网络中。我们发现健康对照组中的橙色共表达网络模块在AD病人的共表达网络中是一种很少被保留的状态,即健康对照组中橙色模块内基因所对应的共表达模式在AD病人中发生了很大的改变。因而对橙色共表达网络模块内的33个基因进行了细胞组分、通路富集和拓扑关系分析。发现这33个基因大部分都与细胞内的线粒体组分有关;被富集到的KEGG通路有帕金森氏病、氧化磷酸化、阿尔茨海默症和亨廷顿舞蹈病等,富集结果也说明健康对照组的橙色共表达模块确实与AD的发生有着密切的关系。通过网络节点的中心性(即通过给定节点的最短路径的数量和给定节点是否处于网络的中心位置),对橙色共表达网络的拓扑分析发现有10个基因(AMZ2、TSPAN3、TMEM150C、FIBP、PHB2、MRPL16、CAPZA2、CETN2、COX6B1和LDHB)在两个网络内的中心性显著不同,在各自网络内拓扑位置截然不同,因而在各自的网络中发挥不同的生物学作用。3. 基于化学基因组学-随机森林模型的中草药抗中风活性化合物的互作靶点发掘中风是高发病率和死亡率的一种突发性脑血管疾病,若中风病人没有得到及时的救治,发生损伤的脑区将会产生永久的功能障碍。在我国使用中草药治疗中风有着悠久的历史,但是中草药植物所含的化合物成分比较复杂,在人体中与这些中草药抗中风的活性化合物有相互作用的蛋白质分子究竟有多少及其作用机制都不是很清楚。本研究基于化学基因组学-随机森林方法,以ChEMBL数据库中已有的化合物-蛋白质相互作用的数据作为训练集,构建稳定的预测模型。将治疗中风的中草药相关的活性化合物作为测试集进行筛选,预测获得了人体内可能的与这些中草药化合物有作用的蛋白质靶点1320个,其中有79个蛋白靶点是已知的治疗中风的药物靶点。通过模型预测获得的1320个蛋白靶点中,与100种以上的治疗中风中草药化合物有相互作用的蛋白靶点为588个,联合分析中风病人的差异表达数据,发现其中有17个基因差异表达。这17个基因中有12个基因的表达产物是酶蛋白;参与细胞内多种生物过程;有2个基因(KLF5、JUN)的表达产物是转录因子;另外的3个基因分别与炎症反应、G蛋白偶联受体和微管组成相关;同时有1个基因(PTGS2)是已知的治疗中风药物的靶点,对应的药物是乙酰水杨酸。因此,除了基因PTGS2以外,预测得到的16个蛋白靶点与上百种治疗中风中草药相关的化合物有相互作用,且在中风病人中显著的差异表达,它们有可能成为治疗中风新的蛋白靶点。

语种中文
内容类型学位论文
源URL[http://ir.kiz.ac.cn:8080/handle/152453/12649]  
专题昆明动物研究所_昆明动物研究所
推荐引用方式
GB/T 7714
郑俊娟. 利用转录组数据探究老年复杂性疾病[D]. 北京. 中国科学院大学. 2019.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace