×

袁进、肖鹏:眼科人工智能研究发展存在的挑战及应对

hqy hqy 发表于2025-02-27 01:05:02 浏览14 评论0百度已收录

抢沙发发表评论

引用本文: 袁进, 肖鹏. 眼科人工智能研究发展存在的挑战及应对 [J] . 中华眼科杂志, 2023, 59(4) : 245-249. DOI: 10.3760/cma.j.cn112142-20230221-00061.

随着融合计算机科学、数学、逻辑学的机器学习、深度学习等人工智能(artificial intelligence,AI)技术的迅猛发展,AI与医学大数据的结合在医学领域的应用前景不断扩大[ 1 ]。眼球作为结构精密的光学器官,基于眼科影像进行病变分析是眼病诊疗的重要前提和基础。2016年,Gulshan等[ 2 ]发表了首篇基于眼底像,通过AI算法进行糖尿病视网膜病变(diabetic retinopathy,DR)诊断的研究。该研究的成果可辅助医生在有限的医疗条件下实现DR的高灵敏度及特异度的筛查,标志着AI在眼科应用的开端。据统计,截至2021年,全球AI论文年发表量达334 500篇,其中眼科AI论文约有58 500篇[ 3 ]。AI在眼底病、白内障、青光眼、近视和角膜病等各类眼科疾病的筛查诊断中展现出强大的辅助诊断能力[ 4 , 5 , 6 , 7 ]。眼科AI诊断系统实现了精准、高效的疾病定性辅助诊断和疾病特征定量分析,不仅提升了眼科医生阅片诊断效率,同时也解决了眼科医疗资源分布不均的现状。这为偏远地区及基层医院提供了均质化的辅助诊断决策,带来了眼科诊疗模式的重大变革。

一、眼科AI研究的发展现状

眼科AI应用场景的不断拓展得益于眼科丰富的影像数据来源。早期眼科智能诊疗系统主要集中于彩色眼底像,现在已向相干光层析成像术(optical coherence tomography,OCT)、超声生物显微镜、相干光层析血管成像术、荧光素眼底血管造影、角膜地形图等全领域影像形态延伸,实现了涵盖眼表、眼底等不同疾病的智能辅助诊断系统开发。随着智能技术的快速发展,眼科AI辅助诊断临床级产品技术日趋完善,相关产品标准、指南纷纷建立,多项眼科智能诊断软件和装备也获得了批准。2018年,全球发布了首个基于眼底像的DR人工智能筛查应用指南,对眼底相机硬件配置、数据采集、数据库建立、算法评价、AI临床应用方案等制定了规范[ 8 ]。同年,首款AI医疗设备IDx-DR获得了应用于DR辅助诊断的批准。2020年,国家药品监督管理局批准了国内首批AI辅助DR诊断的软件上市,实现了眼科AI系统从最初的算法建模开发与验证,到应用于临床实践的全过程。

眼科AI辅助诊断系统的第一代使用单一模态影像数据作为输入,实现单一疾病分类诊断或病灶特征识别。随着算法的更新与突破,DeepMind公司利用单一OCT图像训练的AI模型实现了多种疾病的辅助诊断[ 9 ],开启了单模态多任务的新模式。参考医生的临床实践,通过对不同类型、不同模态影像数据进行综合分析实现疾病的精准诊断,采用数据融合深度学习网络,联合彩色眼底像和OCT等检查结果影像,成功实现了年龄相关性黄斑变性(age-related macular degeneration,AMD)等眼底疾病的精准分类诊断[ 10 , 11 , 12 ]。眼科AI辅助诊断系统不断向单模态多病种、双模态单病种等方向发展,进一步提升AI助力眼病诊断效率和准确度。

随着影像数据分析和自动检测技术的突破,眼科智能诊疗系统的临床任务正从单纯的眼病分型诊断,向疾病分级、分期以及疾病转归预测等精准诊断方向发展。眼科影像作为全身唯一可以直接观测到人体终末血管的器官,通过分析眼科影像,还可以实现心血管疾病、糖尿病、肾病等全身性疾病的智能辅助诊断和预测[ 13 , 14 , 15 ]。这些应用场景为眼科智能医学的发展开辟了全新的前景,不仅有助于眼科个体化精准诊疗,也可以为全科医学大规模健康管理提供重要的临床应用价值。

二、眼科AI研究存在的挑战与分析

1.缺乏高质量、标准化的眼病数据集:构建高质量标准化的数据集是眼科AI辅助诊断系统开发的关键环节。尽管眼科医疗影像数据量大、种类多,但已有的公开眼科数据集不同程度存在图像质量低、数据量小或无统一标注标准等问题。例如,印度Eyepacs数据集中的图像存在失焦、曝光问题;法国Messidor数据集仅有1 200张图像,而且两个数据库虽都是DR分级数据,但分级标准却不同。这些问题都限制了眼科AI辅助诊断系统的最终性能。这些问题的根源在于不同医疗机构检查设备多样、操作规范和数据存储模式不一,机构之间缺乏完善的数据共享机制,导致不同医疗机构的数据难以匹配使用,限制大规模数据集构建。其次,高标准数据集依赖人工精确标注,不同人员标注结果参差不齐,标注质量与开发者水平相关,且人工标注成本高、耗时费力。此外,眼科影像往往包含多种疾病特征及信息,现有人工标注模式因标注人员的水平、标准不同而无法全面准确标注,亦限制了高质量标准化数据集的建立[ 16 ]。

2.算法模型缺少对眼科影像数据的深度挖掘,未能体现AI在新诊断靶标发现和筛选上的价值:目前,绝大多数应用于眼科疾病辅助诊断的AI算法采用端对端的监督式学习模型为主。这种模型通过深度学习和已标注数据集直接从图像中实现病灶识别和疾病诊断,可高效快速地对眼病做出初步判断。然而,监督式学习模型依赖于高质量的标注和大规模的数据集,因此模型性能受限于临床医生决策和标注水平。也就是说,标注医生的水平决定了所开发的眼科AI辅助诊断系统的水平。此外,随着眼科高性能成像技术的不断发展,结构成像向功能成像的跨越,带来了细节更多的影像数据,如毛细血管灌注地形图等[ 17 ]。即使是经验丰富的眼科医生也无法准确发现和标注极早期的细微病变特征。原来的端对端AI模型直接从输入图像到疾病或病灶预测输出,缺乏对输入数据的计算分析,难以实现新型特异性敏感影像靶标的挖掘,从而限制了其在疾病早期精准诊断方面的应用。

3.眼科AI辅助诊断系统过多依赖影像数据,缺乏多源信息融合,诊断结果可解释性差:眼病的发生和发展涉及多层次的机制,在不同的阶段呈现不同的病理损伤、临床症状和体征。仅仅依靠影像数据难以包含疾病精准诊断所需的全面信息。例如,常见的眼表疾病干眼,患者除了有明显的主观不适症状和泪膜不稳定外,还涉及角膜上皮、角膜神经、眼表血管等多种组织,单一的影像分析无法实现干眼的精准分型和分级[ 18 ]。因此,临床疾病诊疗往往需要联合患者症状体征相关的多模态影像数据、临床指标、组学信息等多来源的诊断信息,进行相关决策。然而,现有眼科智能诊断模型更多聚焦于单模态、双模态影像数据融合,缺乏对多源信息的整合、加权分析和筛选,无法建立符合临床诊断逻辑的决策模型。对于AI模型诊断结果的临床可解释性,研究者采用类激活映射和Deepshap两种方法实现了眼底图像的可视化[ 19 ],或者梯度加权类激活映射实现输入图像的可视化[ 20 , 21 ],将病灶区域和影像特征进行热图呈现,以佐证诊断依据。然而,在进行疾病分级分期、分型等高层次诊断需求展示时,这些方法缺乏临床决策逻辑内涵,也难以实现多源信息融合的可解释性[ 22 , 23 ]。

三、眼科AI研究的未来方向与思路

1.建立标准化信息共享的眼科数据平台与规范:创建数据标准规范和建立公开、共享的高质量数据库是未来大数据驱动眼科智能诊断系统发展的重要基础。除了基于统一标准的人工标注数据集外,采用数据模型、自然语言处理和深度学习技术,对现阶段医疗大数据中的海量半结构化和非结构化数据(例如病历文本、眼病指南或专家共识、生物组学数据)进行处理,建立结构化、标准化和多模态的医疗大数据。在标准化医疗数据共享过程中,需要进一步加强数据隐私保护和数据安全[ 24 ],建立基于区块链技术的共享机制,应用分布式数据存储和授权使用模式以及加密算法,以保证临床数据的自主性。采用“数字面具”可以对数据进行特征提取,同时又保护患者隐私,这也是未来发展的趋势[ 25 ]。近年来,自治数据库和AI原生数据库(例如Sage DB和Xuanyuan DB)的涌现大幅提升了数据库性能,并成为下一代医学数据库和AI技术发展的新方向。

2.加强契合眼科临床需求的算法创新:符合临床需求的算法不断进化是AI应用在眼科领域的更新迭代方向。例如,对视网膜内囊性积液和视网膜下积液进行定位和范围测量,有助于临床医生做出更准确的诊疗决策和评价治疗效果[ 26 ]。自动分割睑板腺腺体、进行生物测量和统计建模分析,可以提供临床医生所关心的腺体面积、长度、宽度等数值,同时还可以推导出全新的影像参数,例如腺体变异系数、扭曲系数,为睑板腺功能障碍的诊断分级和治疗评价提供全面的诊断靶标[ 6 ]。障碍性算法创新的应用和元学习面向多任务进行联合训练,可以学习任务间的泛化能力,从而精准提取和量化分析眼部细微解剖结构特征,构建眼组织特征参数模型。这将实现病灶识别、生物测量和生物计算的一体化,是未来眼科智能算法模型的重要临床需求。这些模型将为眼病早期诊断和精准分型分级提供全新的量化敏感靶标,并为眼病治疗方案制定、进展预测以及预后判断提供精细化参数指导。

3.实现眼科AI辅助诊断从图像可解释到逻辑可解释的跨越:在眼科医疗实践中,制定诊疗策略通常需要多类型、多维度的数据,包括影像、生理传感器数据以及结构化和非结构化文本。随着AI的发展,我们逐渐加深了对人类思维模式的认识,可解释的AI可以使我们理解和追溯算法如何得出结果,从而信任机器学习算法所产生的输出。美国宾夕法尼亚州匹兹堡大学利用动态眼底图像和静态遗传学信息预测AMD的进展情况,基于梯度反向传播实现晚期AMD进展预测的图像可视化,计算并展示相关遗传变异体和特征重要性热图实现输入数据的解释,为我们提供了新的机会和方向[ 27 ]。

多源信息融合智能技术的发展涉及到各种模态之间的交互、迁移以及对齐,并需要与临床实践紧密结合。然而,各种数据配对的要求导致了前期原始数据采集和后期人工标注的难度和成本的增加。因此,深入探索并设计更智能、具有自主选择能力的多模态数据匹配融合机制变得尤为重要。基于此,我们可以构建符合临床诊疗逻辑的眼病知识图谱,并完成深度学习诊断模型和知识图谱的深度聚合。这将推动联合数据驱动和知识驱动的智能诊断系统研发,并实现具有临床逻辑可解释的眼科智能诊疗系统输出形式。

四、汇聚前沿技术,推动智能眼科模式的发展

当前,AI技术已经在眼科诊疗领域创新中发挥着显著的作用[ 28 ]。5G远程AI辅助眼病诊断系统已经突破了地域限制,使优质医疗资源能够下沉。随着AI技术的不断升级和产业的快速增长,其在眼科领域的潜在应用模式正在发生内涵变化。推动眼科AI场景创新对于促进AI更高水平应用非常重要,从当前的辅助诊断向多维度的临床需求拓展,建立以创新AI算法为核心的深度融合技术方案,如虚拟现实、分布计算、边缘计算、机器人和高性能影像装备等前沿技术,以推进眼科智能医学技术在眼病监测、视力训练与评估、手术导航、远程手术、无人医疗等领域的创新应用。这将成为未来眼科智能医学模式的重点突破方向。通过结合前沿技术的眼科诊疗应用场景创新,可以促进眼科智能医疗关键技术和系统平台的优化升级,形成技术供给和场景需求的互动演进,从而不断推动持续创新力的发展[ 29 ]。

眼科作为AI辅助诊断领域的重要先驱之一,在AI技术不断发展的同时,也在推动着AI技术的突破,以满足眼科临床实际需求。在学科深度交叉融合的背景下,智能医学被确定为《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》的重要战略目标之一,因此眼科智能医学的未来前景广阔。眼科同仁应该明确目标,协同创新,以AI为驱动内核,跨领域深度融通,建立以患者为中心、智能化、多维度人机交互的眼科智能医学新模式,以推动我国智能医学的跨越式发展。