医疗影像智能分析是指运用人工智能技术识别及分析医疗影像,帮助医生定位病症分析病情,辅助做出诊断。目前医疗数据中有超过90%来自医疗影像,这些数据大多要进行人工分析。
人工分析的缺点很明显,第一是不精确,只能凭借经验去判断,很容易误判。中国医学会的一份误诊数据资料显示,中国临床医疗每年的误诊人数约为5700万人,总误诊率为27.8%,器官异位误诊率为60%,恶性肿瘤平均误诊率为40%,如鼻咽癌、白血病、胰腺癌等,肝结核、胃结核等肺外结核的平均误诊率也在40% 以上。第二是缺口大,按照动脉网蛋壳研究院的数据,目前我国医学影像数据的年增长率约为30%,而放射科医师数量的年增长率约为4.1%,其间的差距是23.9%,放射科医师数量增长远不及影像数据增长。这意味着放射科医师在未来处理影像数据的压力会越来越大,甚至远远超过负荷。如果能够运用算法自动分析影像,再将影像与其它病例记录进行对比,就能极大降低医学误诊,帮助做出准诊断。
医疗影像行业的人工智能实现流程大致为:影像数据的预处理—>样本清洗、打标签模型搭建及训练调试大规模数据的训练、验证得到深度学习网络模型,以上流程为人工智能的线下训练过程,较终输出为深度学习模型。接着就可以用用生成的模型进行线上预测或辅助判断。
解决方案介绍
提供医疗影像端到端人工智能解决方案,如下图所示,实现如下三个功能。
(1) 样本数据预处理。医院各个检验科如CT,BT,CR等,把医疗影像数据从终端设备通过万兆/IB网络,传输到并行存储中,数据预处理CPU平台(多个双路CPU服务器NF5280M5组成的集群)从存储中读取数据,运行边缘检测分割、区域增长分割、种子算法等程序,获取目标数据,然后打标签形成训练样本库,存放到并行存储中。CPU程序的管理、调度、监控将由统一管理平台AIStation完成。
(2) 模型训练。模型训练GPU集群(配置单机8卡GPU服务器,如NF5288M5)将读取训练样本库数据从并行存储中,并加载CNN模型,运行深度学习框架,如TensorFlow,Caffe,Mxnet等对初始模型进行训练,经过对大量数据样本的学习训练生成较终模型。训练中涉及多个训练任务的提交,其资源管理、调度、监控将由统一管理平台AIStation完成。