打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
【规范与共识】胸部CT肺结节数据标注与质量控制专家共识(2018)

文章来源:中华放射学杂志,2019,53( 1 ): 9-15

作者:中国食品药品检定研究院 中华医学会放射学分会心胸学组  




摘要  

使用人工智能开展肺结节检测是医疗器械发展的热门方向,有助于帮助影像科医师快速准确地发现肺结节,增强体检和肺癌筛查在肺癌防治方面的效率和作用。为了促进行业发展,保障标注质量,中国食品药品检定研究院和中华医学会放射学分会心胸学组联合研究胸部CT肺结节的数据标注与质量控制方法,用于肺结节人工智能产品的检验用标准数据集的建设实践。本文从肺结节的标注规则、标注流程、质量控制等各个方面介绍专家组达成的共识,有助于帮助业内形成统一认识,提高数据标注的一致性和数据集的质量,为人工智能的发展保驾护航。


肺癌是导致中国癌症死亡的首要原因和癌症防治的重中之重[1,2,3]。肺癌的早期诊断和早期治疗是提高患者生存率、降低医疗负担的关键。根据国外经验[4,5,6,7]和国内专家共识[1,2,3],肺癌的大规模筛查可以有效降低病死率。伴随的挑战是,海量的胸部影像数据需要及时精确的分析,这给影像科医师造成了巨大的压力。

利用人工智能(AI)算法对肺结节进行检测是人工智能医疗器械发展的热点方向[8,9],可协助医师快速准确地发现肺结节,提早判断肺癌风险,增强体检和筛查在肺癌防治方面的效率和作用,有利于肺癌的早期发现、早期诊断、早期治疗。目前,我国人工智能医疗器械在肺结节方面的预期用途包括肺结节的识别、分割、筛查、分类、辅助诊断等。在国家政策的支持和鼓励下,我国相关产业发展迅速,已有大量产品进入注册申报阶段,建立配套的标准规范迫在眉睫,以加速产品上市和促进行业长期健康发展。

由于监督学习的技术本质[10],算法训练与产品测试使用的数据集对全生命周期的质量控制和风险管理有着重要意义,而数据集的发展目前处于各自为战的状态,数据质量和规模参差不齐,不同机构采用的标注方式和结果各不相同,容易引起产品质量风险和'水土不服',急需加强引导和规范。

在此背景下,本专家共识对胸部CT影像肺结节数据标注与质量控制提出指导意见,旨在向全社会共享在标注检验用标准数据集过程中业内专家共同形成的认识、研究的方法和建立的规范,统一对AI专用医学影像数据标注规则与方法的理解,鼓励全社会有序开发医学数据资源,促进医疗AI产业全链条协调发展。本专家共识将会跟随产品技术升级和临床实践演化而更新,逐步建立更为科学合理的统一规范。


一、数据集适用范围和定义

根据我国临床需求和处于注册申报阶段的产品技术现状,数据集适用范围包含体检、筛查、门诊和实验室等不同场合获取的人体图像,使用的设备、设置、剂量能够代表不同地区及不同条件的实际水平。基于这些数据,AI产品可以实现各种功能,比如对肺结节进行检出、分类和分割[9];对结节直径进行测量;对结节生长速度进行测评;对CT图像能够发现的其他呼吸系统疾病或正常组织的变异给出提示。


数据集的图像特征包括肺内实性结节(solid nodules)、肺内亚实性结节[subsolid nodules,包括肺内混合磨玻璃密度结节(mixed ground-glass nodules)或称部分实性结节(part-solid nodules)、肺内纯磨玻璃密度结节(pure ground-glass nodules)]、肺内钙化结节、胸膜结节与胸膜斑块、胸膜钙化结节[1,2,3,6,7,11,12]。其中肺内实性结节、肺内亚实性结节、肺内钙化结节属于肺结节,胸膜结节与胸膜斑块、胸膜钙化结节属于胸膜病灶[11]。3个基本概念定义如下[13]:(1)结节:圆形或类圆形不透光影,边界清楚,最大直径不超过3 cm。(2)磨玻璃成分:肺实质密度增高,病灶内支气管、血管边缘仍能识别者。(3)实性成分:肺实质密度增高,病灶内支气管、血管边缘不能识别者。根据上述3个基本概念,数据集的6类结节的具体定义和示例如下。


1.肺内实性结节:

肺实质内圆形或者类圆形(球体或类球体)边界清楚的局灶密度增高影,且病灶内支气管、血管边缘不能识别,最大径≤3 cm。本次标记首先在肺窗中主观判断结节部位,从而将结节分为肺内结节和胸膜结节。再根据肺窗中结节是否含有磨玻璃成分,将肺内结节分为肺内实性结节(图1,图2)或肺内亚实性结节。


图1,2 CT肺内实性结节(↑)。图1为肺窗模式(窗位-600 HU,窗宽1 500 HU,后文中出现的肺窗与此相同),图2为纵隔窗(窗宽50 HU,窗位360 HU,后文中出现的纵隔窗与此相同)

图3,4 肺内部分实性结节。图3为肺窗,黄色虚线包夹的区域可能为肺内部分实性结节,同时黄色虚线指示病灶与胸膜夹角;图4为纵隔窗,标记者在肺窗中主观判断该结节起源于肺内,将结节分类为肺内结节。再根据在肺窗中结节含有磨玻璃成分,将其分类为肺内亚实性结节。而后参考纵隔窗发现结节(↑)在纵隔窗内部分显示,最终分类为肺内部分实性结节

图5,6 肺内纯磨玻璃密度结节。图5为肺窗,↑示疑似为肺内纯磨玻璃密度结节,其中可见血管结构。图6为纵隔窗,标记者在肺窗中主观判断该结节起源于肺内,将结节归为肺内结节。再根据在肺窗中结节含有磨玻璃成分,将其分类为肺内亚实性结节。而后参考纵隔窗结节无显示,最终分类为肺内纯磨玻璃密度结节

图7,8 肺内钙化结节(↑)。图7为肺窗,图8为纵隔窗

图9,10 胸膜结节(↑)。图9为肺窗,图10为纵隔窗

图11,12 胸膜斑块(↑)。图11为肺窗,图12为纵隔窗

图13,14 胸膜钙化结节(↑)。图13为肺窗,图14为纵隔窗


2.肺内部分实性结节(也称肺内混合磨玻璃密度结节):

肺实质内圆形或者类圆形(球体或类球体)边界清楚的局灶密度增高影,且部分病灶内支气管、血管边缘可识别,最大长径≤3 cm(图3,图4)。


3.肺内纯磨玻璃密度结节:

肺实质内圆形或者类圆形(球体或类球体)边界清楚的局灶密度增高影,且整个病灶内支气管、血管边缘可识别,最大径≤3 cm(图5,图6)。


4.肺内钙化结节:

肺实质内圆形或者类圆形(球体或类球体)边界清楚的完全钙盐沉积灶,最大径≤3 cm,CT值通常达100 HU以上。此处要澄清部分钙化与钙化结节的区别:肺内实性结节内部出现部分钙化成分,分类为实性结节;肺内完全钙化灶,分类为肺内钙化结节(图7,图8)。


5.胸膜结节与胸膜斑块[11]

胸膜结节为起自胸膜的圆形、类圆形(球体、类球体)或不规则形的局灶性密度增高影,常与胸膜广基底相连,最大径≤3 cm(图9,图10)。胸膜斑块为胸膜局限性、广基底的不规则扁平状突出,表面不规则。这里应注意,胸膜结节与胸膜斑块内含有部分钙化成分者,分类为胸膜结节与胸膜斑块(图11,图12)。


6.胸膜钙化结节:

起自胸膜的圆形或者类圆形(球体或类球体)边界清楚的完全钙盐沉积灶,最大径≤3 cm,CT值通常达100 HU以上。与胸膜结节和胸膜斑块的主要区别是,病灶完全钙化者才可归类为胸膜钙化结节(图13,图14)。


二、数据要求

1.伦理批准与患者隐私保护:

肺结节CT影像数据集使用的数据必须是获得医院伦理委员会批准或者豁免的临床脱敏数据,患者的隐私保护应当满足法规的要求。从志愿者、体检中心、社区筛查项目、科研项目等其他数据收集行为同样应当由伦理委员会进行审查和批准,保证数据脱敏、患者隐私安全和患者利益。


2.数据质量要求:

数据集应当使用标准DICOM格式的原始数据,图像矩阵不低于512×512,有条件的医院可使用1 024×1 024。不得进行任何修改、编辑,不得进行有损压缩。每个病例的图像应当保持连续完整,不得出现缺层、错层等情况。每个病例的扫描范围至少从肺尖到肋膈角(包括全肺),不相关的部位可以删除(如下颈部或上腹部)。图像重建视野应当覆盖整个胸部横截面。成像过程应当符合其他临床规范和专家共识要求[1,2,3],患者吸气末一次屏气完成扫描,避免运动伪影、误操作等。成像过程使用的扫描仪应当是处于产品有效期内、符合质控要求的合格设备。


3.数据多样性要求:

为保证数据集具有充分的临床代表性,控制偏倚,数据应当尽可能覆盖到更多具有通用性的统计维度并给出统计描述,才能更科学地对模型效果进行评估。这些维度包括:(1)患者维度:从产品可能的预期使用人群出发,建议考虑个体差异,尽量覆盖不同地理区域;患者年龄、性别、适应证等具体分布应参考流行病学和统计学要求。(2)场景维度:从产品可能的部署环境出发,建议考虑场景差异,如体检、筛查、门诊等不同场所。(3)设备与配置维度:从成像与原始数据采集角度出发,建议考虑硬件差异,如厂家、硬件配置等因素,这些因素影响图像的对比度、分辨率、细节丰富程度和读片结果。从操作层面来说,可以依据以下参数范围进行选择。


①层厚与层间距:推荐扫描层厚0.50~1.25 mm,层厚≤1.00 mm时,可以无间隔连续重建;层厚>1.00 mm时,重建间隔选择准直层厚的50%~80%。推荐图像重建层厚≤5.00 mm。


②设备厂家:符合DICOM 3.0协议标准数据、有医疗器械注册证的国内外厂家。


③探测器:16排以上。


④扫描参数:低剂量扫描和(或)标准剂量扫描(管电压70~140 kV,管电流10~400 mA组合)。


⑤辐射剂量:按照尽可能的低剂量(as low as reasonably achievable,ALARA)原则,根据不同机型及扫描目的选择。


⑥窗宽窗位:推荐肺窗(窗位-700~-600 HU,窗宽1 500~1 600 HU)和纵隔窗(窗位30~70 HU,窗宽350~400 HU);其他窗宽、窗位可以根据需要用于辅助读片,例如骨窗等。


⑦重建算法:纵隔窗采用标准算法或软组织算法,肺窗采用标准算法和(或)肺算法。


三、标注规范

(一)流程设计与质控

1.标注医师的选拔:

(1)为保证标注医师(grader)的代表性,建议面向全国公开考试选拔标注医师。医师的资质建议要求在三甲医院从事阅片工作5年以上,职称为住院医师以上。考试内容应包括数据集覆盖的全部病种和图像特征的检出(用包围盒bounding box紧密包裹病灶,bounding box可简写为bbox)与分类,由权威专家对参考标准进行审核与把关。按照检出的精确度、分类的敏感度和特异度、边界分割的交并比等关键指标择优录取,建议以上指标要求不低于80%。(2)入选的标注医师应当接受培训,统一对标注规则的认识,熟悉标注软件操作。


2.流程设计:

为提高标注的准确性和敏感度,降低假阳性率,避免记忆偏倚,标注流程建议多轮次分组交叉进行,优化人力资源,主要包含肺结节的检出、分类(图15)、边界分割和尺寸测量(图16)。考虑不同环节的工作量和人员资质的差异,标注工作需要标注医师、标注组长和仲裁专家3种级别的医师参加。标注组长由工作经验10年以上的副主任医师担任,仲裁专家由工作经验15年以上的副主任医师或主任医师担任。每一批标注任务由标注组长带领两名标注医师承担,分为4个主要环节。


图15 肺结节分类工作流程图


图16 肺结节标注工作流程


(1)检出环节:3名标注医师背靠背独立标注,然后用计算机自动判断检出的一致性,以所有人标注结果的并集作为结果。


(2)分类环节:3名标注医师背靠背进行分类,分类结果同样由计算机自动判断一致性和进行合并,同时保留不同意见。


(3)审核环节:由其他标注组长和仲裁专家各自独立对检出和分类结果进行审核与修改,纠正漏诊、误诊和误判。如果遇到疑难问题,仲裁专家可以进行集体讨论与确认。本环节过后,每个病例至少由5名医师进行过阅片,其中至少由两名具有高级职称的医生进行过审核。


(4)边界分割与尺寸测量:在检出与分类完成之后,由于边界分割相对简单,建议普通病例的边界分割由1名标注医师执行,由1名审核专家进行审核。遇到复杂征象时,可酌情增加审核人数,以保证标注质量。结节的尺寸根据手工边界由计算机自动生成,标注医师和仲裁专家可以手动修改。


(二)结节分类标注规则

根据上文给出的几种结节的定义,建议按照图15所示的流程具体进行结节分类的工作。


第1步是在横断面图像上,在肺窗下判断某个区域是否为结节。应注意避免把血管、支气管、淋巴结等生理结构以及纤维条索伴钙化、胸膜增厚、支气管增厚等情况判为结节。


第2步是明确结节属于肺内还是胸膜。此处的难点在于某些肺内结节存在向胸膜延伸或者牵拉的情况,而某些胸膜结节也存在会向肺内生长,影响判断。建议从肺内部分与胸膜的边界入手。一般来说,肺内结节的长径大于其向胸膜延伸的部分,肺内部分与胸膜交界的夹角容易呈现为锐角。相反,胸膜结节向肺内延伸时,周围往往存在一定的胸膜增厚,病灶与胸膜的夹角相对更大。


从第3步开始,根据前面各类型的定义判断结节的类型,主要难点是如何区分实性成分和纯磨玻璃成分。根据国内外文献,目前尚无公认有效的窗宽窗位区分实性成分和磨玻璃成分。建议主要依据实性成分和磨玻璃成分的定义,观察肺实质密度的升高是否导致病灶内支气管血管边缘不可识别。如果整个病灶内的支气管、血管边缘都不可识别,则肺实质密度的升高由实性成分引起,应判为实性结节;如果病灶内的支气管、血管边缘可识别,则肺实质密度的升高由磨玻璃成分引起,应判为亚实性结节,再根据纵隔窗判断有无实性成分,如果有则判为部分实性结节,否则为纯磨玻璃密度结节。当结节完全钙化时,判为钙化结节;如果结节内有钙化和软组织成分混合,则判为实性结节。


结节标注应当在专用标片环境下进行。为保证标注医师的准确性和一致性,背景亮度、温度、湿度等环境因素应当进行设计和控制;标注显示器应为满足DICOM标准、符合质控要求的医用专业灰度显示器,分辨率不低于2 M像素;标注软件应当记录供应商、型号、版本号,软件功能满足标注需求并经过确认。在单屏单幅图像条件下,CT图像最大放大倍数不低于5。软件应具有多平面重组(MPR)功能。标注软件应满足网络安全和数据保护要求。这里注意,结节整体CT值的测量和基于结节CT值的分析不在本文讨论范围内。


(三)区域分割

边界分割的操作需要根据结节边界分几种典型情况讨论。


1.实性结节边界分割:

在图像任意放大比例中能读出结节边缘,边界明确者,归入实性成分边界分割的情形(图17,图18,图19,图20)。


图17,18 肺内实性结节分割示意图。图17为肺窗下的肺内实性结节,↑指示结节区域,与肺内空腔、血管、胸膜之间的边界均清晰可辨。图18为肺窗下的肺内实性结节区域分割示例,绿色代表实性结节区域。在此情况下,在↑所标记结节周围,围绕结节在结节外的第一个像素处标记轮廓

图19,20 像素级边界分割示意图。图19为结节区域,图20中的绿色覆盖病灶,绿色像素位于病灶内部

图21,22 亚实性结节边界分割示意图,↑指示结节区域。图21为肺窗下磨玻璃结节,图22为磨玻璃结节区域分割,绿色像素代表结节区域内部,结节外血管部分已排除

图23~26 指节边缘与血管相连时的分割方案示意图。图23~25分别为原图横断面(图23)、矢状面(图24)、冠状面(图25),由多平面重组确认血管走行。图26为推荐的病灶分割方式,以绿色像素标出拟分割的结节,结节外血管部分已排除

图27,28 胸膜凹陷时的分割方案示意图。图27为原图,图28以绿色像素指示拟分割的结节区域


2.亚实性结节边界分割:

亚实性结节的结构相对复杂,涉及其他成分的混合(图21,图22)。


3.结节边缘征象处理:

勾画结节本体部分,对于结节本体以外部分(例如血管、胸膜等)不予勾画(图23,图24,图25,图26,图27,图28)。


(四)尺寸测量

对于结节每个被分割边界的涉及层面,当该层结节边界手动分割完成后,建议由标注软件根据边界自动给出结节该层的长径和短径,最后由标注医师检查后确认。参照国际指南和研究文献[14],长径定义为结节内最大横截面空间最远两点距离。短径定义为结节内垂直于长径的最长距离(图29)。


图29 长径和短径的示意图。蓝色轮廓指示结节轮廓,可见长径和短径均落在结节内部,且保持垂直。这里应注意,结节内部空腔或空洞不做特殊考虑,仍视为结节自身的组成部分


(五)关于结节尺寸描述方式

1.量纲:

所有尺寸参数的记录应精确至毫米或立方毫米,包括:(1)结节最大横截面长径及短径。(2)结节空间最长直径。(3)结节体积。


2.结节尺寸测量方法:

(1)结节最大横截面长径及短径,首先对结节所有横断面计算其平均直径。以平均直径最大者为最大层面,平均直径为(长径+短径)/2,该结节尺寸记录为'最大层面的长径与短径'。(2)结节空间最长直径,根据医师对结节的分割结果,计算出该结节立体空间内最远两点距离。(3)结节体积,根据医师对结节的分割结果,根据结节所包含体素的数量计算结节体积。


四、部分争议问题讨论

1.部分肺结节分类命名解释:

肺内结节本次标记分类为肺内实性结节、肺内亚实性结节(包括肺内部分实性结节、肺内纯磨玻璃密度结节)、肺内钙化结节。我们没有采用肺内非实性结节的命名方法,而是用肺内纯磨玻璃密度结节,主要是为了避免对'非实性结节'的理解偏误。中文'非实性结节'既可以理解为亚实性结节,也可以理解为纯磨玻璃密度结节。本次标注中肺内部分实性结节与肺内混合性磨玻璃密度结节概念相同。


2.有关标记涉及的主观判断部分:

本次标记基于科学、实用、可操作、可重复等原则设计标记规则,尽量避免或减少标记医师主观判断所带来的不确定性。但是由于很多问题目前并不存在客观、统一且被业内广泛接受的标准,所以在标记时还会借助标记医师自身的主观判断,这也是我们对于标记医师的工作经验有基础要求的根本原因。


(1)关于病灶是否是肺结节的判断:目前主要依靠标记医师主观判断。标记医师首先在横断面进行观察,确定可疑病灶位置后,可以参考该病灶冠状面或矢状面来进一步明确该病灶与肺内结节的定义是否接近,从而做出主观判断。


(2)关于结节的起源定位判断:目前主要依靠标记医师基于病灶主体形态、部位、密度等特征主观判断。在上文中我们也提到了部分分辨病灶起源部位的方法,但是我们没有办法穷举具体分类方法,所以在结节起源定位判断中仍需要标记医师主观判断。


(3)关于磨玻璃密度判别的主观判断:在本次标记中,结节是否存在磨玻璃密度是将结节分类为实性结节或亚实性结节的唯一标准。根据磨玻璃密度的定义(肺实质密度增高,病灶内支气管、血管边缘仍能识别),标记医师需要全面观察结节并仔细比较结节内是否存在磨玻璃密度。如果结节内存在磨玻璃密度,即将结节分类为亚实性结节;反之,即将结节分类为实性结节。


(4)关于亚实性结节再分类的主观判断:在本次标记中,所有被分类为肺内亚实性的结节,标记医师将再次参考其纵隔窗。通过纵隔窗结节能否显示,来区分肺内部分实性结节与肺内纯磨玻璃密度结节。在此,标记医师应仔细观察,排除结节内血管等正常组织在纵隔窗显示对于结节分类的干扰。标记医师对于灰度的敏感性差异也会造成对于部分结节分类的差异。


委员会成员

执笔者:王浩,中国食品药品检定研究院医疗器械检定所光机电室,北京102629;刘凯,第二军医大学长征医院影像科,上海200003


专家组成员(排名不分先后):刘士远(第二军医大学长征医院影像科)、任海萍(中国食品药品检定研究院医疗器械检定所光机电室)、郭佑民(西安交通大学第一附属医院医学影像科)、伍建林(大连大学附属中山医院影像科)、萧毅(第二军医大学长征医院影像科)、王浩(中国食品药品检定研究院医疗器械检定所光机电室)、刘凯(第二军医大学长征医院影像科)、张惠茅(吉林大学白求恩第一医院放射科)、叶兆祥(天津医科大学附属肿瘤医院放射科)、张敏鸣(浙江大学医学院附属第二医院放射科)、赵绍宏(解放军总医院放射科)、陈起航(卫生部北放射科)、宋伟(北京协和医院放射科)、王培军(同济大学附属同济医院放射科)、吴宁(中国医学科学院肿瘤医院影像诊断科)、王建卫(中国医学科学院肿瘤医院影像诊断科)、胡海(中山大学孙逸仙纪念医院肿瘤科)、夏黎明(华中科技大学同济医学院附属武汉同济医院放射科)、胡春洪(苏州大学附属第一医院放射科)、叶剑定(上海胸科医院放射科)、张立娜(中国医科大学附属第一医院放射科)、史河水(华中科技大学同济医学院附属武汉协和医院医学影像科)、郭顺林(兰州大学第一附属医院放射科)、刘挨师(内蒙古医科大学附属医院影像科)、柳学国(中山大学附属第五医院放射科)、史景云(上海肺科医院影像科)、施裕新(上海市公共卫生临床中心影像科)、王云华(中南大学湘雅二医院放射科)、孟祥峰(中国食品药品检定研究院医疗器械检定所光机电室)、王权(中国食品药品检定研究院医疗器械检定所光机电室)、李佳戈(中国食品药品检定研究院医疗器械检定所光机电室)、郝烨(中国食品药品检定研究院医疗器械检定所光机电室)、唐桥虹(中国食品药品检定研究院医疗器械检定所光机电室)、滑炎卿(复旦大学附属华东医院放射科)、杨立(解放军总医院放射科)、杨志刚(四川大学华西医院放射科)、于红(同济大学附属东方医院医学影像科)、曾庆思(广州医学院第一附属医院医学影像科)、张志勇(上海市公共卫生临床中心医学影像科)、赵振军(广东省人民医院放射科)、范丽(第二军医大学长征医院影像科)、李琼(第二军医大学长征医院影像科)


参考文献(略)




本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
病例分享(2021.3.19):原位腺癌手不手术要区分对待,这样的需要手术干预!
【每日晨读】这样的SFT(孤立性纤维瘤),你可识得
【新冠肺炎影像诊断系列】新冠肺炎超早期与早期影像表现
肺大细胞神经内分泌癌
【广西群读片系列】“炎性”“恶性”傻傻分不清
11.19针对GGO结节
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服