《眼科新进展》  2024年6期 480-486   出版日期:2024-06-03   ISSN:1003-5141   CN:41-1105/R
全外显子组测序在高度近视病因学中的研究进展


高度近视通常是指屈光度<-6.00 D或眼轴长度>26 mm的近视,常引起各种眼部并发症,包括眼底的退行性病变,目前尚无有效治疗手段。高度近视是环境因素和遗传因素相互作用的结果,遗传因素在其中发挥主导作用[1]。高度近视的主要遗传学研究方法包括全基因组测序(WGS)、全外显子组测序(WES)、单核苷酸多态性(SNP)微阵列芯片检测等。
WES是指利用序列捕获技术,将全基因组外显子区域DNA捕捉和富集后进行高通量DNA测序的基因组分析方法[2]。人类基因组约含3×109个碱基对,而约85%以上疾病突变信息发生在外显子区域。WGS几乎能识别基因组上所有变异,可信度高但费用昂贵,时间成本高,而WES仅需对外显子区域的基因组DNA序列(约占所有核酸序列的l%~2%)进行高通量测序,可一次性精准检测人类基因组20 000多个基因中约180 000个外显子的致病变异位点[3],极大地降低了测序成本并可精确定位致病突变的位置,是更适合应用于临床的基因测序技术。同时,WES还可克服SNP微阵列芯片检测具有的SNP分型芯片检测过程中的荧光信号不稳定,芯片检测灵敏度低以及芯片在分型过程中统计学系统误差导致数据点缺失或错误,对填补的罕见变异精度低等缺点。自2009年,Ng等[4]第一次应用WES鉴定出肌球蛋白重链3是Freeman-Sheldon综合症的致病基因以来,WES广泛应用于各类遗传病的病因学研究。
2011年,Shi等[5]首次利用WES从一个常染色体显性遗传模式的高度近视家系中成功鉴定出高度近视新的致病基因锌指蛋白644(ZNF644)。此后,WES广泛应用于高度近视遗传学研究,先后鉴定出基础免疫球蛋白(BSG)、低密度脂蛋白受体相关蛋白1(LRPAP1)、脯氨酰4-羟化酶α多肽Ⅱ(P4HA2)等数十个新的高度近视易感基因及新的致病变异,涉及巩膜重塑、能量代谢、细胞凋亡等生物学途径,可诱发“视网膜-巩膜”信号级联反应引起近视。本文就WES鉴定高度近视研究较多的15个易感基因及其变异的相关信号通路研究进展进行综述。
1 巩膜细胞外基质重塑相关基因
巩膜细胞外基质 (ECM)重塑是近视发生过程中的重要事件。研究表明,高度近视发生过程中视觉转导信号通过激活视网膜转化生长因子β(TGF-β)等信号通路,减少巩膜中的胶原蛋白,诱导巩膜ECM重塑和眼轴增长。近年来,研究者利用WES在高度近视家系或人群中鉴定出BSG、LRPAP1、P4HA2、锌转运蛋白溶质载体家族39成员5(SLC39A5)等4个与巩膜重塑生物学途径相关的高度近视基因。
1.1 BSG
BSG作为肿瘤细胞衍生的胶原酶刺激因子,是免疫球蛋白超家族的成员,位于19p13.3,主要表达于视网膜色素上皮(RPE)细胞中。2017年,Jin等[6]利用WES在18个患有早发性高度近视的核心小家系鉴定出BSG的4个新生突变:c.889G>A,c.661C>T,c.415+1G>A,c.205C>T(表1)。2021年,Zheng等[7]在103个散在高度近视患者中发现了BSG的另一新生突变c.415C>T与高度近视密切相关。其中,BSG(c.889G>A,p.G297S)突变诱发近视表型的功能通过基因敲入小鼠模型进行了验证,与该突变对应建立的BSG(c.901G>A,p.G301S)突变小鼠,其眼轴长度明显长于野生型小鼠。此外,在负透镜诱导型近视豚鼠模型中,发现豚鼠视网膜中BSG的mRNA和蛋白的表达水平随眼轴延长而升高[8],进一步提示我们近视发生发展与视网膜中BSG的表达呈正相关。在成纤维肿瘤细胞共培养模型中,BSG增加了正常成纤维细胞中基质金属蛋白酶(MMP)的产生,使恶性细胞更容易通过ECM迁移,基于其在MMP诱导中的功能参与,故将其重命名为MMP诱导因子[9],此后研究表明,外源重组BSG蛋白可诱导成纤维细胞中MMP-2的mRNA和蛋白表达水平增加[10],这提示我们BSG诱导近视的机制可能与BSG上调眼组织中MMP表达并引起视网膜到巩膜信号级联反应有关,但相关机制还需进一步实验证实。


1.2 LRPAP1
LRPAP1是脂蛋白受体相关蛋白的伴侣,位于4p16.3,是一个广泛表达的基因。2013年,在沙特阿拉伯家系[11]和中国散在早发性高度近视患者[12]中进行的外显子组测序研究中鉴定出LRPAP1的3个纯合移码突变:c.605delA,c.863_864del,c.197delC。临床研究发现,高度近视患者血细胞中LRPAP1蛋白表达量与健康组相比显著降低,TGF-β蛋白表达水平显著高于正常组[11]。利用CRISPR/Cas9技术获得LRPAP1纯合移码突变c.264_268delinsTCTC(p.Lys35Asnfs\*3)的斑马鱼突变株,发现LRPAP1突变斑马鱼与野生型斑马鱼相比,LRPAP1 mRNA与蛋白水平显著降低,TGF-β蛋白表达水平显著升高,眼轴显著延长,眼部细胞凋亡程度高,巩膜胶原纤维变薄、紊乱[33]。以上结果提示,LRPAP1缺失可能通过TGF-β诱导的凋亡信号通路导致眼睛发育中异常的ECM重塑,从而产生近视,但其功能和作用机制尚需进一步实验探讨。
1.3 P4HA2
P4HA2是胶原蛋白的主要同工酶之一,催化胶原链中4-脯氨酰羟化反应,位于5q31.1,广泛表达于人体中。自2015年后,利用WES在中国近视人群[7,13-14,16]与意大利近视人群[15]中共发现了8个新生突变:c.1327A>G,c.419A>G,c.448A>G,c.1147A>G,c.545A>G,c.1561C>T,c.601G>C,c.1349_1350delGT(表1)。研究发现,携带c.1147A>G (p.Lys383Glu)突变的高度近视患者淋巴细胞和成纤维细胞中P4HA2 mRNA和蛋白的表达水平与正常组细胞相比均降低,IV型胶原在胞质内的沉积显著减少,羟基化活性降低[15],这提示我们P4HA2的突变可能引起胶原蛋白和纤维羟基化在ECM的表达减少,从而影响近视发生发展。
1.4 SLC39A5
SLC39A5编码溶质载体家族 39 成员 5,属于锌转运蛋白 ZIP 家族,位于 12q13.3,主要表达于巩膜和视网膜[18],参与眼睛发育的全过程。利用WES,2014年至今共发现14个突变:c.141C>G,c.911T>C,c.726dupA,c.1350delC,c.1023_1024insA,c.860C>T,c.956G>C,c.982C>T,c.1290T>A,c.758C>A,c.877G>A,c.2771C>T,c.145G>A,c.325G>T[7,14,16-20](表1)。研究发现,携带SLC39A5突变c.141C>G(p.Y47\*)的高度近视患者淋巴细胞的SLC39A5蛋白表达明显低于正常组,Smad1的mRNA和蛋白表达水平均显著高于正常组。Smad蛋白是TGF-β信号通路的关键下游转录因子[17],提示我们SLC39A5基因可能通过TGF-β信号通路影响Smad1的表达,诱发高度近视。此外,体外研究发现,SLC39A5基因敲除后人胚肾细胞HEK293细胞系中COL1(CollagenI)等胶原纤维相关基因的mRNA和蛋白表达均下降,锌的水平降低,磷酸化的Smad表达显著降低,说明SLC39A5的表达与锌的表达、TGF-β信号通路的激活呈正相关[34]。以上研究提示我们,SLC39A5基因参与高度近视的发病机制可能与其导致锌缺乏,以及使Smad蛋白失去稳定性,从而抑制TGF-β信号转导与巩膜ECM重塑有关。
2 能量代谢相关基因
高度近视发展与视网膜密切相关,而视网膜是体内代谢最活跃的组织之一,ATP供应的减少将减弱光感受器细胞的光和暗反应,降低光感受器细胞的光敏感性,并可能影响眼睛发育。利用WES发现,泛醌氧化还原酶复合体组装因子7 (NDUFAF7)、细胞色素C氧化酶组装蛋白2(SCO2)与线粒体能量代谢相关。
2.1 NDUFAF7
NDUFAF7编码一种线粒体组装因子,位于2p22.2,表达于线粒体基质,参与线粒体呼吸链系统,该蛋白甲基化Arg-85以帮助NADH泛醌氧化还原酶(复合体I)的组装。2017年以来,三项在中国高度近视人群中的研究[14,18,21]共发现NDUFAF7的4个杂合错义突变:c.995C>A,c.960T>A,c.798C>G,c.799G>A(表1)。此外,在人RPE细胞系ARPE-19中发现NDUFAF7过表达均导致活性氧(ROS)的增加,而NDUFAF7的c.798C>G(p.Asp266Glu)突变抑制了ROS增加,ATP合成水平下降,线粒体复合物I酶活性降低[21]。这提示我们,NDUFAF7基因可能通过线粒体能量代谢合成ATP的下降影响眼睛发育,影响近视的发生发展,但具体机制还需要研究进一步证实。
2.2 SCO2
SCO2是合成线粒体细胞色素C氧化酶活性的铜稳态蛋白,位于22q13.33,在脉络膜、巩膜、视网膜和RPE中表达。自2013年以来,利用WES分别在美国高度近视家系,中国早发性高度近视患者[7,12,22]中发现了SCO2的7个新生突变:c.157C>T,c.341G>A,c.776C>T,c.418G>A,c.334C>T和c.358C>T,c.244_246delAAG(表1)。进一步研究发现,在负透镜诱导近视小鼠模型与形觉剥夺性近视豚鼠模型中[35],SCO2在视网膜中mRNA和蛋白表达水平与正常组相比均显著降低,视网膜变薄,视网膜神经节细胞和内、外核层减少,巩膜胶原含量明显减少,表明SCO2参与近视的过程。然而,在小鼠E129K(相当于人E140K)杂合突变后[35],眼轴长度没有显著增加,说明敲除SCO2等位基因不单独导致近视。SCO2对高度近视的具体调控机制还有待于进一步探索和研究。目前研究中有两种推测,一种为SCO2异常表达可能影响细胞色素C氧化酶的合成和干扰线粒体呼吸链氧化磷酸化,从而导致氧化应激水平升高,破坏视网膜功能和屈光的发展;另一种推测SCO2的异常表达可导致铜代谢失衡,氧化应激水平升高,抗氧化功能下降,影响眼组织代谢,导致细胞凋亡、坏死、线粒体功能障碍,最终导致近视。
3 细胞凋亡相关基因
利用WES发现剪切及多聚腺苷酸化特异因子1(CPSF1)、肿瘤坏死因子受体超家族成员21(TNFRSF21)基因与RPE细胞凋亡相关。
3.1 CPSF1
CPSF1又称CPSF160,是CPSF复合体的最大亚基,位于染色体8q24.23,在人视网膜、巩膜等眼组织中高表达。自2019年以来,通过WES的比较分析分别在中国散在早发性高度近视的患者和家系中发现CPSF1是早发性高度近视的常染色体显性基因,共检测到c.3862_3871dup,c.2823_2824del,c.1858C>T,c.15C>G,c.3823G>T,c.4146-2A>G,c.2252C>T,c.1708C>T,c.2226C>G,c.1270G>T,c.3980C>T等11个不同的CPSF1突变与高度近视共分离[7,14,16,23](表1)。利用寡核苷酸吗啉敲除CPSF1基因,发现斑马鱼的眼睛大小发生变化,视网膜神经节细胞轴突投射数量减少,且CPSF1-mRNA注射可逆转眼部表征,表明CPSF1参与了眼发育和视网膜神经节细胞的轴突投射进程[23]。此外,在剥夺性近视雏鸡模型中视网膜神经纤维层的有髓轴突数量和轴突直径均减少,视网膜变薄[36]。同时,研究表明,CPSF1过表达转染可显著抑制高糖诱导的人视网膜血管内皮细胞(HRVEC)凋亡[37]。提示CPSF1基因的功能与视网膜细胞的凋亡密切相关。以上研究结果提示,CPSF1基因可能通过减少视网膜轴突投射数量或视网膜细胞的凋亡影响近视的发生和发展,但其作用机制尚需进一步研究证实。
3.2 TNFRSF21
TNFRSF21也被称为DR6,属于肿瘤坏死因子受体TNFR超家族,位于6p12.3,主要分布于小鼠视网膜RPE细胞中。利用WES在中国散在高度近视患者[14]与三代高度近视家系[24]中共发现了TNFRSF21的5个突变:c.436C>G,c.718G>T,c.605C>T,c.1319C>G,c.1144C>T(表1),其中突变c.605C>T(p.P202L)在两项研究中均被鉴定。转染c.436C>G(p.P146A)突变的ARPE-19的凋亡水平与正常组相比显著增加[24]。这提示我们,TNFRSF21突变可能通过调节RPE细胞的凋亡而影响近视发展,但具体机制还需要进一步研究。
4 信号转导相关基因
锥体抑制蛋白3(ARR3)又称ARR4基因,属于arrestin家族,位于Xq13.1,在视网膜视锥光感受器细胞和松果体细胞中特异性高表达[25]。2016年,Xiao等[26]首次利用WES在中国三个早发性高度近视多代大家系中,鉴定出ARR3基因的3个SNP突变与高度近视表型密切相关,分别是c.893C>A,c.298C>T 和c.239T>C。此后,2016年至2023年间,应用WES技术在中国、荷兰、匈牙利高度近视人群和家系中,陆续发现ARR3的8个突变:c.100G>C,c.989+1G>A,c.214C>T,c.767+1G>A,c.848delG,c.228T>A,c.666delC,c.569C>G[14,18,25-30](表1)。以上研究均发现,与ARR3突变相关的高度近视患者皆为女性早发性高度近视患者。然而,2021年,Yuan等[30]在中国南方早发性高度近视家系中发现了ARR3的无义突变c.569C>G(p.S190\*)影响7位女性高度近视成员和1位半合子男性患者,从而首次报道了携带ARR3突变的男性早发性高度近视患者;2023年Gu等[28]在中国东部四代家系中再次报道了受ARR3的c.228T>A(p.Tyr76\*)突变影响的男性近视患者,提示我们ARR3的遗传模式有待进一步确认。进一步体外研究表明,ARR3基因的c.569C>G定点突变可抑制RPE中mRNA和蛋白表达丰度。目前并无ARR3基因对高度近视具体调控机制的直接研究,但推测该蛋白可能通过与活化的磷酸化G蛋白偶联受体结合,导致G蛋白偶联受体信号转导的终止,从而在视网膜信号转导中发挥关键作用。
5 转录因子相关基因
ZNF644是一种抑制H3K9甲基转移酶的转录因子,位于1p22.2,在眼中高表达,且在男性眼中的表达水平较高。Shi等[5]首次利用WES对中国成都的早发性高度近视汉族大家系进行测序,发现ZNF644的c.2014A>G(p.S672G)突变与该家系疾病表型共分离。此外,Shi等[5]及其他研究者[12,14]分别在早发性高度近视患者和家系中发现了该基因的I587V,R680G,C699Y,3’UTR+12C>G,3’UTR+592G>A,c.2014A>G,c.2048G>C,c.2551G>C,c.1100C>T,c.3214C>A,c.3261A>C,c.2195C>T共12个变异(表1),其中c.2014A>G(p.S672G)突变在中国早发性高度近视群体中三次被报道。针对ZNF644S672G突变构建同源突变雄性Zfp644S673G转基因小鼠,发现小鼠有明显的眼轴延长和视网膜变薄趋势,证明ZNF644突变会导致高度近视表型[38]。在shRNA介导的ZNF644基因敲除型HEK293细胞系中,发现ZNF644显著且特异性地降低了组蛋白二甲基化(H3K9me2)的表达,ZNF644作为转录因子与组蛋白二甲基化的主要酶G9a/GLP 结合,并共同调节组蛋白二甲基化[39]。在斑马鱼中,发现ZNF644直系同源物znf644a和znf644b通过H3K9me2调控视网膜中的多向分化潜能和增殖的关键调控因子vsx2、ccnd1基因沉默,znf644a和znf644b的吗啡啉突变体抑制视网膜细胞的增殖,视网膜细胞的分化能力与细胞活力下降,造成小眼症[39]。推测ZNF644可以调节与眼睛发育有关的基因转录,在结构域或调控功能中发挥作用,影响正常的眼睛发育,从而导致高度近视患者眼球轴向延长。
6 其他机制相关基因
自2013年以来,Zhao等[31]与Yang等[16]利用WES在中国高度近视家系与散在高度近视患者中发现包含线圈结构域111(CCDC111,4q35.1)基因的3个新生突变:c.265T>G,c.989C>G,c.1106T>C(表1)。该基因在人体中普遍表达,广泛分布在巩膜、视网膜等眼组织中,该蛋白参与DNA复制和RNA引物的合成。
在沙特阿拉伯近亲家系一名1岁男性儿童中发现组织蛋白酶H(CTSH,15q25.1)突变c.485_488del[11]。该基因编码1种木瓜蛋白酶样半胱氨酸蛋白酶,称为半胱氨酸-组织蛋白酶,广泛存在于人类体内,CTSH突变近视患者细胞mRNA与正常组相比显著减少,CTSH敲除小鼠的眼轴长度与野生型小鼠相比增加。
2021年,Zheng等[7]在患有非综合征性高度近视的母子和散在高度近视患者中发现负责的集聚蛋白(AGRN,1p26)的3个突变:c.2627A>T,c.4787C>T,c.5056G>A(表1)。该基因可使突触后膜中乙酰胆碱受体发生集聚和重排,完成神经递质的传递。
此外,Swierkowska等[32]使用WES在波兰7个非综合性高度近视家系中发现FLRT3与SLC35E2B的错义突变:c.1642G>C和c.938C>T(表1)。FLRT3(20p12.1)编码富含纤连蛋白亮氨酸的跨膜蛋白,在视网膜、视杯内层和眼睑上皮内膜中表达。使用玻璃体注射荧光Cre依赖性腺相关病毒进行追踪显示,FLRT3-CreERT2敲入小鼠中视网膜神经节细胞亚群后,特异性地投射到内侧终端核,在驱动视网膜眼球运动以稳定视网膜图像方面发挥作用[40]。SLC35E2B(1p36)在视网膜中有表达。但目前这些基因在高度近视发病机制中的作用需要进一步研究。
7 结束语
由于WGS的成本高、时间长等问题,且高度近视具有高度的遗传异质性,高度近视的遗传学病因尚不明确。WES为高度近视人群确定遗传病因提供了有效可行的方式,使复杂高度近视患者的遗传学研究更易于开展。通过WES,与高度近视发病相关的易感基因及其新生突变陆续被发现,涉及巩膜重塑、能量代谢、细胞凋亡等多种生物学途径。相信未来结合单细胞RNA测序、靶向测序等研究方法,以及更先进的外显子捕获方法和遗传学算法,WES技术可得到进一步的完善和发展,高度近视的遗传学病因可得到全面阐示,并为未来开发高度近视的遗传诊断和靶向干预药物开发提供线索。