《眼科新进展》  2024年6期 487-493   出版日期:2024-06-03   ISSN:1003-5141   CN:41-1105/R
人工智能在儿童眼科疾病诊断中的应用


儿童眼科是儿科与眼科的交叉学科,由于儿童与成人的解剖结构存在差异,儿童与成人的生理及病理特征大为不同,两者之间的治疗及预后也有所区别,因此采用成人眼科的诊疗标准去评价儿童,将无法准确客观地反映眼病的发生、发展及预后。
目前,大多数人工智能在眼科的应用主要集中在成人眼科[1-5],在儿童眼科中的应用进展相对较小。在中国,眼科医生发展不均衡,整体技术水平偏低,眼科医护比例不合理[6]。在全球范围内,眼科发展问题更加严重,如早产儿视网膜病变(ROP)发病率较高,但由于相关眼科专家缺乏等原因,数以万计的早产儿失去了视力[7];此外,人工筛选手段昂贵,低收入群体的儿童白内障患病筛查率与高收入群体差距较大。人工智能在自动化、准确性和易推广性上显现出明显的优势,可作为这些问题的优化解决方案。因此,人工智能在儿童眼科疾病诊断中的应用尤为重要。本文就人工智能在ROP、儿童阅读障碍、幼儿视力筛查、弱视、斜视、屈光不正、儿童白内障等疾病诊断中的应用以及不足之处和未来的发展方向进行综述。
1 儿童眼科的特殊性
儿童眼科疾病与成人眼科疾病相比,在患病率、病因、表现、诊断和治疗方面都有所不同,因此在开发人工智能应用程序时应该尤为重视以上差异。常见的儿童眼科疾病包括:弱视、斜视、ROP、鼻泪管阻塞和先天性眼病[8]。而成人更常见的是白内障、干眼症[9]、黄斑变性[10]、糖尿病视网膜病变[11]和青光眼[12]。此外,即使是同一种疾病,儿童和成人的诊断和治疗方法也不同。例如儿童先天性青光眼患者与成人青光眼患者的病因和表现明显不同,两者的医学诊断也存在差异。
儿童注意力无法集中且行为难以预测,需要时刻保持他们放松的状态并进行快速检查。这使得儿童在医院接受检查和治疗需更长的时间。对于患者配合度要求较高的检查,儿童通常需要采用麻醉等手段后才能进行。同样,成人患者仅需局部麻醉的手术,而儿童患者往往需要全身麻醉。因此,更准确的诊断技术和疾病预测技术可以显著降低儿童麻醉手术的成本和风险[13]
儿童从出生到七八岁期间的视觉发育过程中,眼睛的结构会不断改变。在这个期间,影响儿童眼部的疾病可能会导致弱视或永久性视力丧失。此外,在发育过程中,眼球的结构会显著增长,这会导致屈光不正等疾病产生变化,并增加先天性白内障手术的复杂性。
儿童患者与成人患者的视网膜成像数据也存在差异。由于儿童无法长时间注视和瞳孔小等原因,可能会导致图像模糊、图像遮挡等问题,从而降低临床采集到的图像的质量。对于接受ROP筛查的婴儿来说,他们的眼底成像变化更大,脉络膜血管图像改变更明显,这使得依据图像分类相对困难[14]
2 人工智能在儿童眼科的临床应用 
2.1 人工智能与ROP
儿童眼科领域的重要进展之一是将人工智能应用于ROP的诊断和治疗[8]。ROP是造成儿童失明的主要原因[7,15]。然而,由于儿童配合较差[7,16],导致ROP的检查较困难,检查者之间的结果差异较大,疾病管理非常耗时需要连续检查[17-18]
人工智能在ROP领域的应用主要是从儿童眼底照片中对ROP进行检测和分级。除了实现自动化的ROP筛查和分级外,数字视网膜成像技术还可以减轻儿童接受ROP筛查时的疼痛[19],并增加大范围推广的可能性[20]
早期的眼底图像筛查方法主要关注血管的弯曲度。Capowski等[21]设计了客观的视网膜血管曲折度数字指数,该指数对ROP中发生的血管结构变化特别敏感。之后,各国研究者开发了一系列工具来分析眼底图像中的血管弯曲度和宽度,包括Vessel Finder[22]、VesselMap[23]、ROPtool[24]、视网膜多尺度分析[25-27]、计算机辅助视网膜图像分析[28]和IVAN[29]等工具。最近的研究表明,除了眼底的血管参数外,其他非眼底的血管参数也与ROP相关,例如ROP存在的情况下,患者颞侧血管弓主干开放性会下降[30]。视网膜血管测量值已被用于各种疾病预测模型,如Logistic回归[25]和贝叶斯线性回归模型[17]以及支持向量机(SVM)训练的非线性模型。研究者还使用SIFT算法提取视网膜图像特征[31],并通过SVM训练和多示例学习来预测ROP。
最新的ROP和相关疾病的人工智能检测方法主要基于卷积神经网络(CNN),该网络以患者眼底图像为输入,并自动进行注释。基于CNN开发的系统包括:i-ROP-DL[32]和DeepROP[33],其输出结果与专家诊断意见一致,甚至准确性优于部分专家[4,33]。这些系统可以在预测过程中提供置信分数,i-ROP-DL结合了线性概率预测来计算ROP严重性分数,从而实现对ROP相关参数的客观量化和更精细的疾病分级[34]
这些基于CNN的ROP预测系统都使用了Inception架构,并在ImageNet上进行预训练和迁移学习[35]。然而,这些系统在预处理和后处理方面存在差异。DeepROP系统采用单种病例的多图像学习[33],而其他两种深度学习方法则专注于区分单个图像[4]。此外,这些深度学习系统是在不同的封闭数据库中训练的,因此很难进行比较和系统训练的再现[36]
当前的ROP检测方法对疾病的分类精确度较低,只能区分重度和轻度ROP[33],并不能对疾病阶段和病变区域进行具体分析。除了DeepROP和MiGraph系统外,其他所有ROP系统只检查后极部视图[24,26,32],而忽视了其他视图。虽然有学者研究表明,如果没有后极部血管系统的病变,患者很少会出现严重的眼科疾病[37],但通过其他视图能提高相关诊断的可信度和相关病变的可解释性。
2.2 人工智能与儿童阅读障碍
全球约有10%的儿童受到阅读障碍的影响[38]。由于缺乏客观有效的测试方法[39],眼球追踪异常与阅读障碍之间的因果关系尚未得到有效确认[39]。然而,有两项研究使用SVM模型识别受检者阅读过程中的眼球运动[39],从而能预测8-9岁的儿童以及11岁以上儿童和成人的阅读障碍风险[38]。然而,这些研究样本中的儿童都已经超过了最佳诊断年龄。因此,如果以正处于最佳诊断年龄阶段的儿童为样本,得到的结果可能更具说服力。
2.3 人工智能与幼儿视力障碍筛查
视力障碍是导致全球儿童长期残疾的最重要原因之一,对教育和社会经济造成很大的负面影响[40]。幼儿期是视觉发育的关键时期,及早发现和治疗眼部病变可以避免不可逆的视力丧失[41-42]。然而,由于幼儿无法准确表达所存在的视力问题,传统的视力测试适用性较差[43]。为此,研究人员开发了阿波罗婴儿视力系统(AIS),一种基于智能手机的幼儿视力障碍检测工具,可用于识别现实世界中的幼儿视力障碍[44]。眼部异常动态行为特征,如异常的眼球运动,注视模式或视觉偏好等表现常见于弱视、斜视等眼部疾病,可为诊断幼儿视力障碍提供有价值的线索[45-46]。该系统利用这些特征,通过类似卡通的视频刺激诱导幼儿稳定凝视并收集视频数据,然后使用深度学习模型进行分析。该研究共纳入3 652名儿童,通过记录和分析视觉刺激下的凝视行为和面部特征,AIS能够识别16种眼科疾病引起的视力障碍,包括眼前节和后节疾病、斜视、眼部肿瘤、发育异常以及全身和遗传性疾病的眼部表现。AIS可适用于不同眼部疾病筛查,并且设计简便易行,未经培训的父母或照顾者在家中也可使用,在临床和社区环境中的应用也具有较高的可靠性。其采集的视频数据有效规避了既往研究仅采集单个静态图像的局限[47],成为一种有前途的工具,可用于现实世界环境中幼儿视力丧失的二级预防。该系统的开发对于幼儿眼病早诊早治具有重要临床意义。
2.4 人工智能与儿童弱视辅助诊断
屈光不正、斜视是导致弱视的主要原因。目前检测儿童视力的仪器存在着无法精确筛查的问题,导致儿科医生很难诊断患者是否患有此病。有人通过Bruckner瞳孔红光反射图像和偏心光折射训练等多种不同的机器学习分类器来检测导致儿童屈光不正的危险因素,其中训练最为成功的是C4.5决策树[48]。借此眼科医生可以更加精确地诊断和筛查导致儿童弱视的病理性因素,达到辅助诊断儿童弱视的目的。
2.5 人工智能与儿童斜视
全球大约有2%的儿童患有斜视,这可能导致弱视,影响双眼视力,或者导致抑郁、焦虑和反社会情绪,对患者造成持久的社会心理影响[8,49-50]。近年来,由于新型冠状病毒流感疫情的爆发和互联网通信技术的发展,远程医疗已成为患者获得医疗服务的流行方法,并被视为偶发性面对面接触诊疗的高性价比的替代方案。其在儿科诊疗方面也有一定程度的发展。在远程医疗中,可以利用CNN模型对患者的面部拍摄多张眼部区域的照片,对眼睛进行定位后,利用相机闪光灯在患者眼中生成的亮度位置和角膜缘中心坐标作为检查双眼对准的参数,分析每只眼睛的角膜缘中心与其各自亮度中心之间的变化幅度来评估斜视程度[51-52]。而在医院的检查室中,可以使用基于眼球追踪数据的CNN模型来检测视线偏差程度从而诊断斜视程度[53],或者通过使用高灵敏度的视网膜双折射扫描来实现相同的效果。
2.6 人工智能与儿童屈光不正
高度近视与多种威胁视力的并发症有关[54]。对于有高度近视风险的儿童,可以考虑使用低剂量的阿托品药物来阻止或减缓近视的发展[55]。然而,确定哪些儿童需要这种治疗方法是很困难的。Lin等[56]以中山大学中山眼科中心(包含年龄、球面当量和年进展率等变量)的电子病历作为训练集,将随机森林机器学习用于算法训练和验证,对电子病历中患儿未来8年内患高度近视发展的可能性进行了预测,这对指导进一步的近视防治具有指导意义。
2.7 人工智能与儿童白内障
儿童白内障与成人白内障相比,异质性更大,其严重程度和出现弱视风险的高低决定了手术的风险。裂隙灯检查可以使白内障病变可视化,但其诊断存在主观性、儿童无法积极配合、睫毛和病变等眼部结构干扰等问题,常导致裂隙灯图像质量参差不齐[8,57]。人工智能将有助于儿童白内障的筛查与评估。
CC-Cruiser是一个云端平台[57-58],可以自动从裂隙灯图像中检测出白内障,并进行分级和提出治疗建议。它使用三个不同训练模式的CNN来分别预测白内障是否存在、对白内障进行分级以及提示是否需要手术治疗[59]。Lin等[58]在五个不同的眼科医院使用CC-Cruiser进行了随机对照评估,其在诊断白内障(87.4%)和提供治疗决策(70.8%)方面的准确性明显低于专家水平,但其诊断速度更快,患者的满意度更高。
对于白内障手术后的儿童,其并发症与成人存在不同。Zhang等[60]应用随机森林算法和朴素贝叶斯分类器算法,通过评估患者的个人信息和白内障的严重程度,来预测中央晶状体再生和高眼压这两种常见的术后并发症的发生概率。此外,还存在另一种算法,即使用CNN模型来检测后发性白内障[61]。该算法在ImageNet上以ResNet方法来训练CNN模型,并使用成本敏感性学习算法来处理数据集不平衡问题。同时它也可以通过深度学习的晶状体分割策略和多中心数据集来减少裂隙灯成像照片的噪音,从而提高婴幼儿白内障检测的可推广性[62]
2.8 其他
人工智能已应用于糖尿病视网膜病变[63-66]、年龄相关性黄斑变性[65-71]、青光眼[72]、干眼症诊断[73-75]、圆锥角膜[76]和人工晶状体度数计算[77]等各种成人眼科领域。此外,还可应用于视网膜前膜辅助修复[78]、视网膜血管分割[79-80]以及根据眼底图像预测全身疾病等[81]。其中,人工晶状体度数计算和视网膜血管分割在儿童眼科中也有涉及,可以极大程度上实现对儿童屈光度的快速精准测量和新生儿视网膜病变的筛查。并可快速且全面的收集数据,以实现人工智能的自我迭代和升级,提高诊断的精准度和可信性。
3 人工智能在其他儿童眼科的应用 
3.1 眼科图像合成
通过使用深度学习方法如生成对抗网络(GAN),可以生成逼真的图像,包括视网膜眼底图像[82]。这种合成图像能够解决数据稀缺问题、保护患者隐私、描述疾病变化以及用于住院医师教育[83]
最近,一种名为渐进式生长GAN的技术被应用于合成高分辨率的眼底图像[84],特别是用于合成ROP图像。在渐进式生长GAN的训练过程中使用ROP眼底照片和经过U-net CNN预训练得到的血管分割图进行分析。此外,GAN模型还被用于合成糖尿病视网膜病变的视网膜图像。尽管GAN合成的图像能展现出许多可信的病理特征,但有些图像可能包含其他伪影,因此在使用时需要进行甄别。
3.2 儿童视网膜血管分割
针对年龄较大的儿童眼底图像具有独特特征的问题[85],研究人员已经开发了一些适用于儿童眼底图像分割的方法。
Fraz等[85]提出了一种称为Bagging决策树分类算法的方法,用于儿童眼底图像的分割。该方法利用多种滤波器和多尺度分析来处理儿童眼底图像。这种方法已经在学龄期儿童中进行了验证,并且对于那些已经开发用于成人或早产儿血管分割的程序不再适用的情况,该方法表现出较好的效果。
另外,计算机辅助视网膜图像分析[29]是一种用于多尺度显示视网膜图像的方法,已经应用于患有ROP的婴儿[86]。它通过血管生成模型进行最大似然拟合,从而实现了对儿童眼底图像的多尺度显示。
这些方法的开发和应用使得我们能够更好地处理年龄较大的儿童眼底图像,从而克服了一些已有方法在这方面的局限性,并为儿童眼科研究和诊断提供了更准确和可靠的工具。
3.3 视觉发展
机器学习在视觉发展研究中具有潜力,尤其是在解释面部识别功能下降的现象方面。之前,这种功能下降被认为是由早期视力剥夺导致的[87-88],但最近的研究表明,婴儿期经历的无晶状体矫正和高初始敏锐度可能是导致这些症状的原因[89]。根据这个假设,视觉能力(如面部识别功能)是在视觉敏感度逐步增加的正常视觉发育过程中实现的。人们在使用CNN模型对模糊图像进行训练的研究中发现,逐渐提高的视觉敏锐度可以提高泛化性能,并促进空间感受野的发展[89]
这些研究结果为先天性白内障患者的视觉识别能力下降提供了可能的解释,并表明暂时性的屈光矫正可能有助于视力的恢复。机器学习的应用为我们提供了一种理解视觉发展和视觉功能改善的新途径。
4 目前的不足之处和未来的发展方向
由于人工智能在医学上的应用存在交叉性、壁垒性、信息不透明性和不一致性。目前人工智能在儿童眼科的应用存在迁移失准,数据标记存在分歧,时间信息利用缺乏和人工智能开发安全协议尚未完善等问题;在行业层面存在机器学习结果理解困难和重现性和可比性较差等问题;在社会层面存在远程医疗蓬勃发展诊疗手段单一等问题;在战略层面上存在医学数字化转型推动困难等一系列问题。我们将从以下八点分别论述人工智能在儿童眼科应用的不足之处以及未来的发展方向。
4.1 迁移学习和多任务学习
成人眼科在人工智能模型上已做出了大量的工作,然而由于儿童疾病表达的特异性,在成人患者上训练的机器学习模型运用于儿童上有较大概率出错。目前的迁移学习[35,65]和多任务学习[90]可以解决这个问题,在提供少量的儿童眼科数据情况下使成人模型适应于儿童模型。故可将成人中不同疾病或人群的模型中所取得的成果拓展到儿童患者上,弥补儿童患者中任意一种疾病数据的缺乏。
4.2 数据标记存在分歧
机器学习的最终结果从根本上受到所使用的训练数据质量的限制,而此训练数据往往由临床医师手动进行标记。然而,不同的临床医师对于相同的图片的标记存在显著差异,由此正确且统一的标记变得尤为困难[91-92]。大多数方法是使用多个专家的多数标记作为每个训练实例的标记,或者将图像的标记与临床诊断相结合。另一种方法是将有任何分歧的病例交给专家裁决[64],从而形成共识标记以减少错误。目前我国已经逐渐建立起了相应的眼科人工智能临床研究评价方法和指南[93]
4.3 缺乏时间信息的利用
某些眼科疾病的进展与时间变化密切相关。然而,目前的大多数机器学习模型通常只考虑了实时照片,而忽略了时间序列的信息。在ROP等疾病中,时间变化往往与疾病结果存在明显相关性,时间信息在预测疾病方面发挥重要作用[22,93]。因此,未来的研究可以探索如何利用时间信息来改进眼科疾病的预测和诊断。
4.4 人工智能开发的安全问题
随着人工智能的发展,其应用层面上出现了各种监管缺失、隐私泄露、成本计费等问题。在将精心设计的临床研究用于患者护理之前需要将相应的基本防范措施和保障措施补齐,医生、监管机构和政策制定者需要确保算法在临床护理中的应用经过严格验证和操作[94]
4.5 阐明机器学习模型的步骤
机器学习的确展现出良好的预测性能,但在医学应用中若想要阐明其中的步骤以及决策方式却十分困难[95]。某些情况下,机器学习模型会关注混杂因素而非病理信息。因此,可解释的机器学习方法为临床医师提供了潜在的解决方案,如允许检查神经网络的中间决策步骤、决策的理由和决策的图像特征能提高机器学习的可解释性[96]
4.6 重现性和可比性较差
目前基本上本文所讨论的所有的机器学习研究都是在不同数据库中进行训练和评估的[97],这些数据库和应用软件的源代码通常无法共享,由此使得算法之间的重现性和可比性下降。解决这个问题的一种方法是建立更多的眼科数据库,并且鼓励数据共享和合作,以便更多的研究者可以利用这些数据进行模型的开发和验证。
4.7 远程医疗的发展
疫情期间全世界的管控政策推动了患者对远程医疗的强烈需求。在疫情结束后,指数级增长的远程医疗预计将对眼科产生巨大影响。从远程眼科诊疗中受益的眼部疾病有很多,主要包括糖尿病视网膜病变、ROP、年龄相关性黄斑变性以及青光眼和眼前节疾病。然而远程医疗中存在着诊疗手段单一、诊疗失准等问题,人工智能在儿童眼科上的应用有效地弥补了这些缺点,显示出了巨大的潜力[98]
4.8 我国医疗的数字化转型
中国数字化医疗转型是为了应对当前医疗领域面临的挑战和提升医疗服务质量而进行的重要举措。传统医疗模式存在着信息孤岛、资源分配不均等问题,无法满足人民群众对高质量医疗服务的需求。因此,数字化医疗转型势在必行。然而,数字化医疗转型存在着不同医疗机构之间的信息无法有效共享和整合、数字化医疗涉及到大量的医疗数据和个人隐私信息、医务人员的培训和接受程度等方面的困难。基于“数字中国”“健康中国”战略,人工智能在医疗行业上的发展势在必行刻不容缓,需要强有力的激励措施促进其转型以及应用与创新。
5 结束语
由于儿童眼科的特殊性,在研究人工智能的应用时需要进行特殊考量。目前,人工智能已在ROP、儿童阅读障碍、幼儿视力筛查、弱视、斜视、屈光不正以及儿童白内障等儿童眼科疾病领域上得到较为成熟的应用和发展,其较为有效地解决了儿童眼科疾病的早期诊断问题,缓解了医疗资源压力,并扩大了护理范围。
人工智能在儿童眼科领域具有巨大的应用潜力。目前,人工智能在儿童眼科疾病分级和结果预测的应用相对较少,然而这些应用能够显著减轻医生的诊断压力,提高临床护理水平。值得注意的是,任何在临床应用中部署的人工智能方法都必须匹配或超越医生的表现,并满足临床医生和儿科患者的独特要求。因此,进一步推广这些方法需要医生的配合,并需要加强对实验数据库的评估。