打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
血流动力学监测的的移动设备及ICU人工智能
50 血流动力学移动监测设备
50.1
引言

首款iPhone发布于2007年。此后,移动技术迅速发展,智能手机已成为日常生活不可或缺的一部分。智能手机是指能执行多种计算机功能的手机,通常具有触摸屏,互联网访问权限以及能够运行可下载应用程序的操作系统[1]。现在,使用无线互联网的智能手机和其他移动设备得到了广泛应用,例如发送电子邮件,获取最新资讯和使用社交软件。此外,物联网(即通过互联网将日常用品中的传感器与移动设备和其他计算设备互连,从而可以获得大量新数据源)现在也可以让数据通过无线网络传输。在数以百万计的应用程序(“apps”)中,有许多用于医疗保健和医疗用途的数字应用程序[2]。它们中的大多数可以通过个人移动设备来追踪体育锻炼,减肥或者对治疗的依从性[3]。在本章中,我们将讨论如何将移动设备用于血液动力学监测。

血液动力学监测是指对心血管变量进行反复连续的观察或测量,以确保患者安全并指导治疗。血流动力学监测和管理对于围手术期和重症监护中的患者照护至关重要。在手术室和重症监护室(ICU)中,心血管变量的监测有助于优化和个性化血液动力学治疗策略,从而提高患者安全性并改善预后[4-6]。然而,血液动力学监测装置及其传感器通常是侵入性的且很笨重,而不是无线的或集成的,除了昂贵,对于清醒的患者而言也很不舒服。因此,连续的血液动力学监测目前仅限于手术室和ICU。尽管对普通病房患者进行监测可以发现在急危重症发作前几分钟或几小时内生命体征的恶化[9,10],但仍只具备基本的功能且不能长期监测[7,8]。因此,目前的监测水平通常会遗漏生命体征的异常,导致患者出现危及生命的并发症及“抢救失败”的情况[11]。在医院外,患者通常得不能监测[7]。入院前后的监测通常很少,而且数据通常不会被转移到患者的医疗记录中。移动技术可能具有解决当今血液动力学监测系统中某些问题的潜力。它可以创建一个可访问,集成和互连的平台,该平台具有优化患者照护的潜力[12]。随着智能手机和其他移动设备的普及,监测和记录移动设备上的生理信息成了可能,进一步促进了相应工具和应用程序的开发,这些工具和应用程序可以获取并核实生理信息来提高患者安全性并指导治疗[13]。
 
50.2
数字听诊器

移动设备可以起到数字听诊器的作用。听诊器膜可以是手机外壳的一部分(如Steth IO、Bothell、WA、USA),也可以是与智能手机兼容的手持无线设备(如Stethee、M3DICINE、Brisbane, Australia)。数字听诊器设备都基于相同的方法:放大和数字化捕获的心音,做到心音的“可视化”和潜在心脏杂音的识别(图50.1)[14]。因此,心脏杂音的评估和监测可以通过移动设备来实现,这些移动设备可以记录、回放、识别和发送心脏杂音给远程的专家,并允许对不同时间段的心脏杂音进行比较。


50.3
心电图

房颤是最常见的心律失常,它与死亡率和脑血管事件的显著增加相关[16]。至少三分之一的患者无症状,25%的中风或短暂性脑缺血发作患者有未确诊的房颤[17],这些突出了对房颤进行初级预防筛查的必要性。智能手机有可能做为心电图监测器,做到记录、存储和传输心电图。一款叫“心律”(Cardiio;Cambridge, MA,USA)的APP使用基于智能手机摄像头对脉冲波形的光电容积描记法的测算来测量放在智能手机LED闪光灯和摄像头上的手指反射光强度的搏动性变化[18]。在1013名门诊患者中,”心律”APP检测房颤的敏感性为93%,特异性为98%[19]。每位患者的光电容积描记法测量仅耗时17秒,且在医生的监督下进行以避免由于手指放置不当或移动而造成的假阳性[19]。在家自检的可行性和可靠性还需要进一步的研究。这个APP只需要自己的智能手机而不需要额外的硬件,从而可以使大规模人群的房颤筛查成为可能[19]。

图50.1 数码听诊器:听诊器膜是手机外壳的一部分,声音是数字化的,可以做到“可视化”和心脏杂音的识别。

 
另一项随机对照试验使用单导手持式心电图监测仪AliveCorKardia (AliveCor; Mountain View, CA, USA)连接到一个支持无线网络的移动设备,设备外壳中嵌入了额外的传感器,用于筛查年龄≤65岁、高中风风险的房颤患者[20]。对照组由医师进行常规随访,干预组每周进行两次长达30s的心电图记录,并将其无线传输到安全服务器进行评估。评估的主要结果是确诊房颤的时间。本研究显示,与对照组相比,用智能手机心电图监测的患者被检测到房颤的概率大大增加。然而,智能手机心电图监测有很高的假阳性率。在772名内科病人中使用AliveCorKardia监护仪进行房颤的筛查是可行的,同时也出现了较高的假阳性率[21]。尽管如此,论文作者发现了筛查的一个重要好处——它可以帮助患者意识到与房颤相关的疾病。进一步的技术进步和大型试验的评估可以提高这种监测设备在高危患者中筛查房颤的潜力。

一项小规模的试点研究显示使用AliveCor监测仪进行心电图记录甚至可以检测到心肌缺血。该研究显示传统的12导联心电图与智能手机心电图之间存在极高的相关性[22]。基于这些发现,一个更大规模的、观察性的、多中心的试验正在进行中,即比较单导联心电图与标准的12导联心电图诊断ST段抬高性心肌梗死(STEMI)的准确性[23]。这一结果将表明智能手机心电图是否可能成为一种潜在的简化STEMI早期检测的方法,从而缩短从发病到治疗的时间。
 
50.4
血压

血压是心血管系统的一个关键变量。连续测量是许多医学领域血流动力学监测的重要组成部分。有研究证实低血压与手术患者[4]和危重患者[24]的器官功能障碍有关,这表明即使是短期的低血压也需要预防[25]。另一方面,高血压是心血管不良事件的一个可改变的主要危险因素,在人群中发病率很高[26]。准确的血压监测对诊断和准确治疗高血压至关重要。由于使用侵入性动脉导管的金标准测量仅限于手术室和ICU,在其他环境下,血压通常用上臂袖带振荡波测量法测量,这种方法的准确性有限。此外,在家中无时不刻测量血压以筛查高血压的做法也不现实。

将血压测量装置集成到合适的移动无线设备中可以解决其中的一些问题,目前这一技术正在推广开来,从而产生了许多新的应用和工具。TheCareTaker (Empirical Technologies Cooperation, Charlottesville, Virginia, USA)是一个低压手指袖带,与一个手腕压电传感器相连接,该传感器可以将压力脉冲转换为电信号,并在移动设备上无线记录和显示动脉压力波形[28,29]。在大型腹部手术患者中,这种无创血压测量方法与传统的桡动脉有创血压测量方法有很好的相关性[29]。未来的研究需要评估如何将这种方法应用于居家或普通病房的血压监测,从而通过早期发现血压调节障碍,提高患者的安全性。

另一种无线集成的血压测量方法是振荡波手指按压法[30],它是基于使用预先安装在智能手机上的力传感器进行的光电容积描记法。用户将指尖按在手机上,不断增加对动脉的外部压力,导致血容量振荡,同时也增加了对移动设备的压力,而移动设备作为传感器,从中计算出血压(图50.2)[30]。该方法还需要进一步的改进以产生可靠的结果,例如移动设备的位置可以显著影响测量的血压值[30]。
图 50.2 振荡波手指按压法。(a)智能手机应用程序,通过智能手机屏幕下的压力传感器测量手指压力,通过手机前置摄像头测量手指血容量振荡。(b)在测量开始时获取指尖宽度和高度数据。(c)将智能手机水平放置在与心脏齐平的位置进行测量:将指尖置于之前获取的手指宽度和高度的矩形框内,然后加大按压力度,使压力保持在两条蓝线内。
 
最近出现了一种用于非接触式血压测量的透皮光学成像方法[31]。该方法利用先进的机器学习算法分析智能手机摄像头拍摄的面部视频中的面部血流数据。一项纳入1328名正常成人的观察性研究显示,在良好的对照研究条件下,与参考方法(上臂袖带振荡测量法)相比,经皮光学成像血压测量法的准确性达到了临床可接受的水平(定义为平均差值在5±8mmHg内)[31]。如果未来的研究能在自我监测的情况下验证经皮光学成像在低血压和高血压患者中的准确性,这种非侵入性、非接触式和集成的工具可以改善患者的监测和治疗依从性。

随着许多新应用程序和工具的不断出现,存在着“新奇盲点”的风险——使得人们很容易在没有适当验证其临床价值的情况下将它们应用到临床实践中[32]。例如,有一款超过14万人下载的血压监测应用程序“InstantBlood Pressure”,在13个月后就被下架了。原因是有文章指出其测量结果高度不准确,漏掉了78%的高血压患者[32]。

然而,通过移动技术进行长期的血压监测可以帮助提高人们对疾病的认识,增强患者的治疗依从性,并可能降低心血管疾病的发病率。
 
50.5
先进的血流动力学监测

在外科手术和危重病人中,心血管动力学的变化需要立即被发现,以识别潜在的病理生理原因,优化血流动力学状态,并最终改善病人的预后。血管内液体状态的评估在这一过程中起着关键作用,除了功能测试外,动态心脏前负荷变量如脉压变化(PPV)和每搏量变化(SVV)可用于评估机械通气患者窦性心律下的液体反应性[33]。由于高血容量(主要引起组织水肿)和低血容量(导致周围低灌注)的并发症都对患者预后不利,因此准确预测液体反应是至关重要的[34]。评估PPV需要先进的血流动力学监测技术,因为手动计算PPV很耗时,而目肉眼估计的PPV并不可靠[35]。有一款新的智能手机应用程序——Capstesia(Galenic App, VitoriaGasteiz,Spain),它可以根据监视器屏幕上显示的侵入性动脉压波自动计算PPV和心输出量。一项模拟研究表明,通过Capstesia应用程序计算的PPV与手动计算的PPV之间存在良好的相关性[36]。最近的研究表明,在心脏外科患者[37]和肿瘤外科患者(如女性泌尿系统肿瘤,胃肠道肿瘤或胸腔肿瘤)[38]中,Capstesia应用程序计算的PPV与从公认的脉冲轮廓分析监视器获得的PPV有良好的相关性。未来还需要更多的研究来探讨这种应用程序的临床用途和对患者预后的影响。

心脏功能评估是心脏病学、围手术期和重症监护医学的关键。评估个体心脏功能(如心脏收缩力)的一个公认指标是左心室射血分数(LVEF)。目前,这项指标要么通过经胸超声心动图或心脏磁共振成像(MRI)(成本较高)进行无创评估,要么通过经食道超声心动图或血管造影进行有创评估。上述检查需要耗费一定的时间,因此不适合快速评估心脏功能的突然或意外变化。在手术或ICU病房中,由前负荷和/或后负荷[39]变化引起的血流动力学的改变可以影响LVEF,因此需要快速诊断和处理。最近开发的一款用于评估LVEF的应用程序,是将智能手机摄像头置于颈动脉上,从心动周期的皮肤位移图像中捕捉信号并对其进行分析,以提取隐藏的振荡(也称为固有频率)[40]。一项对72名年龄在20-92岁之间的被试进行的观察性比较研究表明,使用固有频率算法计算的LVEF与通过心脏MRI测量的LVEF之间存在显著的相关性(r= 0.74)。然而,有50%的LVEF<40%的患者未被检测出,而且两种方法的一致性极差(±19%)[40,41]。
 
50.6
输血管理

优化心血管动力学和供氧的关键是在术中失血时进行液体复苏和输血。然而,客观、及时地确定术中失血量是具有挑战性的,不规范的,因此常常是不准确的。有研究表明术中输血增加了围手术期并发症的风险,因此防止不必要的术中输血至关重要[42]。最近有一款应用程序——Triton(Gauss Surgical, Palo Alto, CA),它可以对手术海绵和负压吸引器中的失血量进行定量,从而更具有客观性。Triton通过分析手术海绵和负压吸引器的照片来计算血红蛋白的质量,并推断出实时的失血情况。一项验证性研究表明,应用Triton评估失血量的精确度已高于传统的测量方法(如重量法或目测法)[43,44]。

 
50.7
超声

超声成像的应用在医疗活动中无处不在,不可或缺。小型、手持式和口袋大小的超声探头,可以为心脏病专家或在围手术期和重症监护医学中提供床边的即时超声图像[45]。移动技术可能会促进超声更广泛的应用,因为回声探头也可以通过有线或无线直接连接到智能手机或其他移动设备上[12]。与传统超声设备相比,这种集成设备有可能将成本降至最低,提供床边评估和病理记录,并使随后的图像传输和远程专家的评估成为可能。获得远程专业建议可以帮助指导关键决策,如随时评估偏远地区的潜在器官捐赠者[46]。

 
50.8
传感器技术
在不久的将来,新型生物传感器材料[47]和其他技术的发展将使微型化装置能够在医院内/外持续监测血流动力学和其他生理变量。微型和纳米电子机械系统的创新可能会导致小型粘附传感器的发展(例如提供动脉压信号)[48]。其他传感器,如无创电磁监测系统,可以检测肺水含量的变化,以监测和管理心衰患者的肺充血情况[49]。

像苹果和谷歌这样的科技初创公司和巨头已经发现了这个潜在的市场,并已开始开发和研究可行的智能传感器技术。
 
50.9
总结

移动设备能够进行无创、小型、无线和集成的血流动力学监测。非侵入性移动设备有可能使医疗监测更加方便,它可以将实时血流动力学监测应用到更广泛的患者群体中去,甚至可以实现病房和居家的监测。使用移动设备和应用程序获取和记录血流动力学改变可能有助于做出客观及时的临床决策,并提高患者的治疗依从性。但是,在新应用程序和工具被应用于临床之前,必须进行严谨的验证研究。关键挑战之一是通过持续监测获得的大量数据。数据存储、隐私保护以及防止误报的智能评估算法是将移动技术可靠地应用到日常医疗中的关键。

移动设备的易用性和连接性有助于评估、监测和记录心血管动力学的变化。通过持续监测和识别高危患者,移动设备可能成为以患者为中心的医疗保健服务的关键要素(图50.3)
图50.3 用于血流动力学监测的移动设备。微型化的可穿戴设备和粘附式或植入式传感器可以记录和传输生理信息到移动设备和应用程序。数据可以直接在移动设备或应用程序内进行评估。它也可以被发送到云端进行数据存储,再分享给其他医疗服务提供商。云端的数据可以同步到个人医疗记录或医院信息系统中,也可以由医生或智能算法进行分析。
 

51 人工智能与重症监护室
51.1
引言

在过去的一个世纪里,我们进行复杂计算的能力有了巨大的提高。20世纪50年代的晶体管,以及随之而来的硅集成电路,加速了计算能力的发展,并产生了众所周知的摩尔定律。根据这一原理,封装在高密度集成电路中的晶体管数量每两年翻一番。由此得出的结论是,计算速度每隔两年也会翻一番。图51.1是对摩尔定律的图释,显示了计算能力的指数增长(纵坐标为每1000美元可以购买的每秒计算次数)。根据图表所示,计算能力从20世纪早期的机械分析引擎到今天个人笔记本电脑的i7四核芯片增加了1018倍。

图51.1 计算机能力的增长:在过去的一个世纪中每1000美元的每秒计算能力,以及与计算能力增加的相关技术的重大发展。
 
计算能力的增长是由于集成电路的不断缩小而得以实现的,有些元件的大小可以达到100纳米以下。当我们接近硅晶片尺寸的物理极限时,其他材料正在被开发出来。一种可能的替代材料是碳纳米管,它由一层碳原子排列成六边形,并可以卷成一个直径约2纳米的管道,从而变成不同的电路元件。这一新兴技术以及量子计算的发展,保证了摩尔定律在未来很长一段时间内都能适用。

随着处理器功率的增长,个人电脑开始大规模普及,因特网的发展也进入了一个新的阶段。因特网是由美国高级研究计划局(ARPA)设计的一种通讯结构——阿帕网(ARPANET)——演变而来的数字网络。互联网促进了软件的自由传播,并为计算机科学家开发强大的算法以模拟人类智能提供了动力。

根据《大英百科全书》,人工智能(AI)指的是一个“被赋予人类特有智力”的系统,它具有推理、发现意义、概括或从过去经验中学习的能力。人工智能计算机系统能够执行通常需要人类智力才能完成的任务,比如控制自动驾驶汽车或影响消费者的购物决策。

在医学领域,人工智能已被应用于药物研发、个体化诊断和治疗、分子生物学、生物信息学和医学影像领域。人工智能应用程序还能够通过检查和分析存储在电子医疗记录中的大量数字信息来识别疾病的特征。最近出台了一份旨在规范医疗设备中人工智能软件使用的提案,美国食品药品管理局(FDA)指出,“基于医疗过程中产生的大数据,人工智能技术有望为改变医疗模式提供全新及重要的视角”[1]。
 
51.2
机器学习

人类智力的定义是抽象思维、运用理性解决问题、制定计划、理解复杂思想以及从经验中学习的能力[2]。大部分人类智力都涉及模式识别,这是一个将视觉或其他类型的刺激与大脑中存储的类似信息相匹配的过程。虽然人类具有抽象思维和非凡的想象力,但人类的记忆能力是有限的。据估计,大脑在任何时候都不能存储超过4“块”的短期记忆[3]。此外,人类很难从n维空间的角度进行思考或对嵌入在大量数据中的模式进行形象化。相反,计算机有巨大的内存容量,擅长处理多维问题,甚至可以在大量数据中识别出微小或“模糊”的关联。

利用计算机来指导危重病人的治疗并不是一个新概念。过去曾有人提出将计算机系统用于ICU患者的监测[4]、机械通气机的管理[5,6]、急性呼吸窘迫综合征(acuterespiratory distress syndrome, ARDS)患者的护理指导[7]、动脉氧合的管理[8],但结果并不一致。这些早期的计算机系统被编制了高度具体和连续的“如果/那么/否则”(IF/THEN/ELSE)逻辑表达式,这些逻辑表达式基于公认的生理学原理和/或临床经验来评估某种条件的正确性(图51.2)。根据这些表达式,“如果”(IF)一个给定的条件被判断为“真”(true),“那么”(THEN)程序执行指令1,“否则”(ELSE)执行指令2。
图51.2IF逻辑表达式。条件由表达式进行评估,如果为真则执行指令1,否则执行指令2。
 
人工智能基于一种与传统计算机编程完全不同的方法。人工智能算法不是指示计算机评估给定的条件,或根据详细的编程指令执行特定的任务,而是以类似于儿童吸收知识的方式,从大量例子中学习。人工智能算法建立它们自己的行为规则,甚至可以通过整合应用这些规则所产生的额外经验来提高它们的“智力”。

机器学习是人工智能的一个子集,机器学习从可用的信息中学习或提取知识,但不对信息进行评估。机器学习将统计分析技术与计算机科学相结合,从而产生能够进行“统计学习”的算法。广义上讲,机器学习的结构有两种:监督式和非监督式(图51.3)。
图51.3机器学习是人工智能的一个分支,包括两种主要方法:监督式学习和非监督式学习。在每个分支下面显示的是模型开发中使用的算法类型。

51.2.1监督式机器学习
监督式机器学习的目标是开发一种能够预测特定输入时唯一输出的算法。换言之,输入(x)会得出相应的输出(y),并得出方程式y= f(x)。机器学习基于大量的数据集进行预测,这些数据集包含无数的将一个或多个输入变量与单个输出关联起来的示例。预期的效果是,当接触到从未见过的新数据时,该算法将提供准确的预测。在构建大型数据集来训练和测试算法时,监督式学习需要大量的人力投入。监督式学习有两种主要类型:回归和分类。
 
51.2.1.1回归学习
大多数临床医生都熟悉回归分析,这是一种统计技术,可以生成一个数学表达式,将一个输入变量与另一个输入变量(线性回归)或多个输入变量与一个因变量(多元回归)联系起来。在回归分析中,输出是输入的连续函数。换言之,预测的变量将随着输入变量的变化而变化。回归通常用于检验涉及因果关系的假设,模型的选择基于其显著性和拟合优度。
 
51.2.1.2分类学习
分类监督式学习是一种模式识别的形式,旨在从一个预定义的可能性列表中预测单个非数值输出或“类别”。分类算法使用多组数据进行训练,每一组有多个输入变量和一个期望输出值。例如,设计用来识别某一犬种的模型,可以用列出其特征的数据组进行训练,例如身高、毛发类型和尾巴长度。每一组都与一个特定的品种相关联。一旦经过训练,当给定一组新的输入变量时,该模型就可以预测狗的品种。构建分类模型需要两个重要步骤。首先是建立模型需要识别的“类别”数量。第二步是确定描述“类别”所需的变量数量。变量和“类别”越少,需要训练数据也越少,也可以产生更简单、更准确的模型。最简单的分类模型是二元分类模型,该模型只在“是”和“否”之间进行选择。

“类别”可以是实体物件(如椅子、桌子等)、疾病(如败血症、ARDS、慢性阻塞性肺病[COPD]等)、临床或生理异常(如不同类型的心律失常或人机对抗)。每个“类别”都与一些输入变量相关联。在机器学习术语中,输入变量被称为“特性”,每一组数据都包含几个“特性”和一个“类别”。

假设我们要开发一个分类算法来识别五种不同的动物(图51.4)。在这个例子中,每一组数据都包含一个动物类别和几个描述动物的特征,比如海洋或陆地居住、鱼类或哺乳动物。这是一个非常简单的例子,每个类别只有一个实体。因此,如果这个模型的目的是区分不同的狗或猫品种,那么它就完全不合适。在这种情况下,需要更多的实体来描述不同类型的狗和猫。实体越细分,就需要越多的特性来描述。
另一方面,增加特征的数量会导致复杂模型需要更大的计算能力和更长的运行时间,这种情况被称为“维度灾难”。机器学习中一个重要的指导原则是“少即是最好的”。
图51.4一个分类学习的例子,它描述了五类动物的特性。每一行代表一个实体。
在数学上,一个“特性”矩阵包含n个特性和m个实体,它与一个m长度的分类向量相关联:

开发分类模型:开发机器学习模型中最重要的一步可能是对问题有一个清晰的定义,并确定它是否适合机器学习。下一步是确定特性矩阵和分类向量的大小(图51.5)。人类能在几个例子的基础上发展出广义的概念,而训练一个机器学习算法需要大量的数据。创建一个包含分类向量的大型特性矩阵需要收集尽可能多的实例。一旦我们收集了足够多的例子,我们将特性矩阵分割为“训练”数据集和“测试”数据集。原始数据中的例子会被随机分配到每个数据集中。常见的做法是将70%或80%的数据用于训练,其余的用于测试。

“测试”数据集的目的是对从未见过的数据评估算法的准确性。准确性的定义是算法在“测试”数据集上回答正确的百分比。如果准确率低于预期值,我们可以选择收集更多的“训练”数据,或者换一种类型的机器学习算法。

图51.5创建机器学习模型的过程

 
有几种分类算法可以用来建立机器学习模型,其中包括决策树、随机森林、k-邻近法等(图51.3)。一种流行的分类算法是神经网络,它可以模仿人类神经元处理信息的方式。神经网络的基本元素——感知机——可以由几个输入产生一个单一的二进制输出。神经网络是由几个感知机相互作用产生的。包含多层复杂神经网络的高级机器学习系统称为深度学习。

它已经超出了本章的目的——描述这些算法的理论与应用(图51.3),但感兴趣的读者可以访问“scikit-learn”(https://scikit-learn.org/stable/),这是一个由Python编程语言(https://www.python.org/)编写的开源机器学习库。这个程序库使得开发分类监督机器学习算法变得更加容易。

在构建分类模型时,必须使用“训练”数据集和“测试”数据集来提升效用,从而做出准确的预测。要注意高度复杂的模型,这些模型可能与“训练”集非常一致,但是当应用到“测试”数据集时,准确性很差,这种现象称为“过度拟合”。
 
51.2.2非监督式机器学习
在这种类型的机器学习中,算法没有得到如何处理数据的指令。相反,计算机被要求从大量未分类的数据中提取信息,这些数据没有已知的输出或规则。由于缺乏标签信息,研究者在评估非监督式算法时面临的主要挑战是如何确定结果的效用,或是否得到了正确的输出。然而,非监督式算法在理解大数据的探索性尝试中非常有用。最常用的技术是聚类、异常检测和降维。

在聚类算法中,算法被要求识别或划分大数据集中具有相似特征的子区域和模式。在异常检测算法中,算法被要求检测数据集中的非典型模式,如搜索离群值。降维算法在分析具有许多特征或维度的数据时非常有用。这些算法能够将以更简单的形式表现出来,总结其基本特征,使人类或其他机器学习算法更容易理解。

需要记住的是,任何机器学习算法(不管其准确性如何)都不是模型的唯一选择。其他算法可能能够提供良好的拟合,并从数据中得出其他有用的推论。如果想深入研究机器学习模型的开发,可以找Muller和Guido的书[9]或访问网站(https://www.geeksforgeeks.org/learning-model-building-scikit-learn-pythonmachine-learning-library/)。
 
51.3
人工智能在重症监护中的应用

在医院中有许多应用人工智能的场景。非监督式机器学习技术已经被用于研究记录于电子病历中的大数据。目前已经开发了模型来获取患者的重要信息[10]并识别治疗费用高的患者[11]。鉴于对图像强大的自动识别能力,监督式机器学习算法已证明其在放射学[12]和组织病理学[13]中的效用。机器学习已广泛应用于外科学领域中的机器人[14],心脏病学领域[15]中的检测早期心力衰竭[16],以及癌症研究领域的分析肿瘤类型和生长速度[17]。

尽管将机器学习引入ICU还处于起步阶段,但已经有几篇描述该技术在危重病人管理中的应用研究报告发表了。一些研究使用了大数据来预测住院时间、ICU再入院率、死亡率,以及出现并发症如脓毒症和ARDS等疾病的风险。其他一些研究分析了较小的临床和生理数据,以协助对接受机械通气患者的监测。
 
51.3.1住院时间
Houthooft等人使用14480名患者的数据,训练了一个支持向量机模型来预测患者的生存率和住院时间。模型的曲线下面积(AUC)为0.82。这与一项临床研究形成对比,该研究显示,医生预测ICU留置时间的准确性仅为53%[19]。将隐马尔可夫模型框架应用于ICU入院前48小时的生理数据,也可以预测ICU的住院时间,且准确度较高[20]。用神经网络算法来分析重症监护III医疗信息集(MIMIC-III)数据库来研究ICU再入院问题。这是一个开源的免费数据库,收集了自2001年至2012年间贝斯以色列女执事医疗中心重症监护病房的患者数据。该算法能够识别出有ICU再入院风险的患者,敏感性为0.74,AUC为0.79[21]。
 
51.3.2ICU死亡率
Awad等人使用多种机器学习算法(包括决策树、随机森林和朴素贝叶斯)对11722例首次入院的MIMIC-II数据进行预测ICU死亡率。特性包括人口统计学、生理学和实验室数据。这些模型优于APACHE-II、顺序器官衰竭评估(SOFA)和简化急性生理评分(SAPS)等标准评分系统,这一发现在使用时间序列分析的后续研究中得到了同一组研究人员的证实[23]。一个使用人工神经网络的瑞典系统被用来分析20余万例首次入住ICU患者的数据,与SAPS-3相比,该系统在预测死亡风险方面的表现也更佳[24]。机器学习模型也被用来预测创伤[25]和儿科ICU患者[26]的死亡率。

与标准死亡率预测评分系统相比,上述ICU生存模型虽然表现更佳,但使用起来有些麻烦,需要大量的变量,而且还需要进行前瞻性的测试。
 
51.3.3并发症与风险分层
Yoon等人开发了一种基于logistic回归和随机森林模型对心电图(ECG)检测到的心动过速进行分析来预测ICU患者的血流动力学不稳定性,其准确性为0.81,AUC为0.87[27]。这项研究发表时附带了一篇Vistisen等人的社论。该社论全面分析了机器学习方法预测ICU患者并发症的优势和缺陷[28]。

最近的一项研究使用随机森林分类算法对20多万名住院患者的电子健康记录进行分析来预测脓毒症和脓毒症休克的发生。虽然该算法具有很高的特异性(98%),但它的灵敏度只有26%,严重限制了它的效用[29]。还有其他研究使用机器学习模型计算特定患者的肺栓塞的风险分数[30]及ARDS的危险分层[31],预测严重烧伤患者或ICU患者的急性肾损伤[32-33],预测液体管理后的容积反应[34]及识别可能出现的梭状芽胞杆菌感染[35]。
 
51.3.4机械通气
尽管现今的机械通气设备能很好地将空气输送到病变的肺部,但它们是“前馈”系统或开环系统,在这种系统中,输入信号或通气方式在很大程度上不受其输出——即通气是否充分——的影响。因此,呼吸器缺乏评估患者对呼吸的反应能力。一个理想的解决方案是开发自主呼吸机,这是一种可以持续监测患者对通气反应的设备,同时调整通气参数,为患者提供舒适、最佳的呼吸。尽管我们离这个理想的装置还很远,但目前已经取得了重大进展。

在过去的十年中,识别人机对抗并对其进行分类越来越受到重视,人机对抗是指患者对通气支持的反应[36]。机器学习方法通过压力和流量信号的变化来识别人机对抗。Chen等[37]开发了一种算法,从气道压力和流量的呼气部分的最大偏差来识别无效通气。在24名参与研究的患者中,58%的患者存在无效通气。分析了5899次通气后发现,识别无效通气的敏感性和特异性均大于90%。Blanch等[38]开发了一种算法,将理论指数呼气流量曲线与实际流量曲线进行比较。偏差超过42%被认为是无效通气。他们将从16名患者中随机抽取1024次通气的预测结果与5名专家的预测结果进行了比较,结果显示敏感性为91.5%,特异性为91.7%,预测值为80.3%。为了进一步验证效用,该小组还分析了51例机械通气患者的气道监测信号,并能够使用隐马尔可夫模型预测从一个呼吸期到下一个呼吸期人机对抗发生的概率[39]。在这些研究中使用的这套系统已被商业化,名叫BetterCare®,它能够获取、同步、记录和分析来自床边监护仪和机械通气设备的数字信号[38]。

Rhem等[40]和Adams等[41]开发了一套算法来识别与动态过度充气、双重触发和气流不同步相关的两种人机对抗类型。基于16名患者的5075次通气的训练数据,他们开发了根据床边监测信息识别双重触发的算法。动态过度充气是呼出潮气量与吸入潮气量的比值。用另一组患者(n= 17)的数据对算法进行了验证,结果显示敏感性和特异性为>90%。

Sottile等[42]评估了几种类型的机器学习算法,包括随机森林、朴素贝叶斯和AdaBoost,这些算法记录了62名ARDS患者的机械通气数据。他们根据临床观察和信号描述选择了116个特性,能够识别同步呼吸以及三种类型的人机对抗,包括双重触发、流量受限和无效触发,AUC>0.89。

作者承认,他们的算法不能识别所有类型的人机对抗,特别是呼吸机过早终止通气或循环异步。

Gholami等[43]开发了一个随机森林分类算法,该算法来自5个专家的训练数据集,他们评估了来自11个机械通气患者的1377个呼吸周期,以评估循环异步。患者接受压力控制容积通气。该模型能准确地检测是否存在二次同步,灵敏度为89%。Mulqueeny等[44]使用朴素贝叶斯机器学习算法并纳入21个特性(包括呼吸频率,潮气量,呼吸力学和呼气流量形态学)对包含5624次通气的数据集(由一位临床医生进行手动分类)进行分析,准确率达到了84%,但敏感性只有59%。Loo等[45]训练了一个具有5500个异常呼吸周期和5500个正常呼吸周期的卷积神经网络,旨在开发一种能够识别正常呼吸周期与异常呼吸周期的算法,其灵敏度为96.9%,特异性为63.7%。
 
51.4
准确性VS可靠性

机器学习算法的准确性是由它正确预测未知测试数据集的能力来判断的。模型是通过从同一个数据集中挑选出的例子来训练和测试的,越来越多的文献报道机器学习具有非常高的准确性。如果选择了合适的特性,例子数量足够多,并选择了合适的算法,那么就可以得到一个高度精确的模型。如果数据真实可靠,那么模型的预测也必然是可靠的。另一方面,当使用未经测试或错误的数据训练而成的模型对数据进行分析时,预测的结果可能是准确的,但完全不可靠。简而言之,进去的是垃圾,出来的也是垃圾。

这就引出了一个问题:模型可靠性的极限是什么?虽然人工智能能够纳入大量的变量,并将数据分类中的人为偏差最小化,但它并不能保证模型的可靠性。因此,在创建临床机器学习模型时,最大的挑战在于确定分类时使用的金标准。我们在医学上看到的和做的很多事情都是高度主观的,而达成一致的意见很少。例如,一项关于不同临床医生根据柏林定义诊断ARDS的可靠信程度研究发现,可靠信程度仅为中度水平(kappa= 0.50) [46]。主要原因是对胸片的解读存在偏差。临床医师在评估青光眼患者的视盘照片时也出现了类似的结果(kappa0.40-0.52) [47]。因此,即使在最好的情况下,ICU中的模型可靠性也不可能会超过60-70%。
 
51.5
总结

经验丰富的重症监护医师擅长收集、分类和分析临床信息,以便迅速做出诊断并决定治疗方案。然而,在当今ICU的数据密集型环境中,重症监护医师必须应对源源不断的信息,其中一些有用,而大多数没用。根据AlanMorris的一篇文章[48],重症监护医师在治疗需要机械通气的病人时必须应对不少于236个变量。对这些变量进行分类和关联的能力远远超出了临床医生的能力,即使是最有知识和洞察力的人也做不到这一点。

合理地应用人工智能技术可以帮助我们应对信息过载。机器学习算法已被用于分析电子病历中存储的数据,以预测ICU的死亡率和住院时间。它们还增进了我们对可能有疾病进展危险或可能出现并发症的人群的了解。这些回顾性研究可能有助于对患者进行早期识别和分级,但这只是人工智能研究中较低层次的成果。

一项更困难的任务,也许是一项更有前景的任务,是开发智能机器学习监测仪,这种监测仪能够连续不断地评估人类对危重疾病的反应,具有很高的确定性。这类监测仪的发展将提供创建半自动ICU所需的知识和经验,在这种环境中,智能机器将会提供目前由人类负责的大部分照护工作。

一旦人工智能成为重症监护医师值得信赖的助手,它的全部潜力将会释放出来。通过帮助我们应对信息过载,搭载人工智能的机器可能会让我们的思考能力、想象力和同情心在关心处于困境中的人类同胞时发挥更大的潜能。人工智能在重症监护室的未来是光明的。就像所有的新技术一样,会有狂热者和保守者,会有起起落落,会有喜悦和失望,也会有棘手的伦理问题。然而,我毫不怀疑,人工智能将继续存在,为了患者的福祉,我们有必要熟悉这项技术。

-THE END-


编译:王骏阳

来源:Annual Update in Intensive Care and Emergency Medicine-2020

东风文献速递-浙大二院急诊医学科文献解读团队

关注急诊医学资讯

↓↓↓

◆ ◆ ◆  ◆ 

·  急诊  ·  医学  ·  资讯  ·  

我的2020,与10w+读者一起

观医生医事,学医学知识

点"在看"写想法
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
重症大数据应用中国专家共识(2022)
重症监护室(ICU)里的人工智能
【SCI论文翻译】重症监护患者压力性损伤的预测:机器学习模型
一位90后统计学硕士的深悟与真思:统计其实有门道!人工智能还能这样学!(精荐40本图书 20个视频资...
基于StockRanker的AI量化选股策略
张志华:机器学习=统计与计算之恋
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服