临床预测模型第二十一期：基于五种机器学习模型预测ISSNHL患者治疗1个月后听力恢复的有效性

小编今天解读的是Clinical and Experimental Otorhinolaryngology（IF=3.372）上发表的一篇文章《Machine Learning Models for Predicting Hearing Prognosis in Unilateral Idiopathic Sudden Sensorineural Hearing Loss》，这是一项回顾性分析，而预测特发性突发性感音神经性耳聋（ISSNHL）是一个重要的挑战，本文就是预测单侧特发性突发性感音神经性聋听力预后的机器学习模型。一起来看看这篇文章是怎么写的。

01 研究背景

特发性突发性感音神经性耳聋(ISSNHL)是指在72小时内至少有三个连续频率的快速发作的听力损失超过30分贝。该病是一种常见的耳科急症，估计发病率为10-20/10万人年，患病率为5-160/10万人年。尽管ISSNHL的确切病因和发病机制尚不清楚，但病毒疾病和血管受损已被强烈建议为病因。

在以前的一份报告中，几个机器学习模型，包括LR、支持向量机(SVMs)、多层感知器(MLP)和深度信念网络(DBN)被应用于预测突发性感音神经性耳聋的听力结果。该研究的样本量为1220个，分析了149个变量。在变量选择方面，本研究利用了单变量统计的结果(P<0.05)和专家知识。

在本研究中，研究了五种潜在的机器学习模型(K最近邻[KNN]、随机森林[RF]、支持向量机、自适应增强[AdaBoost]和MLP)预测ISSNHL患者听力恢复的有效性。本研究的样本量为227个，共有32个变量。此外，我们还基于RF算法和医学领域知识进行了变量选择。本研究旨在评估上述五种机器学习模型在预测ISSNHL患者治疗1个月后听力恢复的有效性。

02 材料和方法

1.研究设计和人口

我们对某医院住院治疗ISSNHL的患者进行了回顾性研究。我们检查了2010年1月至2017年10月入选的523例单侧ISSNHL患者。在这项研究中，我们分析了227名患者治疗1个月后听力改善的情况，并对所有变量进行了分析。ISSNHL的诊断标准包括在3天内至少有3个连续频率的突发性听力损失(30分贝或以上)。我们评估了他们的全部病史、实验室检查和听力学结果。

排除标准为：

(1)双侧ISSNHL；

(2)传导性听力损失>10分贝；

(3)前庭神经鞘瘤，

(4)数据缺失值。

Siegel标准分为：

(1)完全恢复包括最终听力水平>25分贝；

(2)部分恢复>15-分贝，最终听力在25~45分贝之间；

(3)轻微恢复>15-分贝，最终听力较差<45分贝；

(4)无改善<15-分贝，或最终听力较差<75分贝。

在这项研究中，根据Siegel的标准，听力改善至少“部分恢复”，即完全恢复和部分恢复的患者被认为是恢复组。按Siegel标准分为轻度恢复组和未恢复组。这项研究的总体过程如图1所示。

2.变量筛选

最初的变量数量是32个(31个预测变量和1个响应变量)，从人口统计数据、医疗记录、内耳症状、纯音测听和实验室数据中提取。治疗1个月后听力改善以Siegel标准为基础，将完全恢复和部分恢复的患者视为恢复组(分级为阳性)。其余为未恢复组(分类为阴性)。具体来说，有11个独立的分类变量：性别、吸烟状况、高血压、糖尿病、高脂血症、中风、慢性肾脏疾病、心肌梗死/心绞痛、头晕、耳鸣和ITDI发生的时间。

4.统计分析

我们总共获得了227名患者，恢复组106名，未恢复组121名。所有的统计假设检验都是双面的。为了检验恢复组与未恢复组之间的差异，对连续型随机变量进行两样本t检验，对分类随机变量进行卡方检验或Fisher精确检验。在双尾P值小于0.05的情况下，差异被认为具有统计学意义。

我们将数据(n=227)分成训练集和测试集。训练集和测试集的规模之比分别为7：3，得到了样本规模为158的训练集和样本规模为69的测试集。然后，我们对五种不同的机器学习模型进行了评估，并对训练集进行了三次交叉验证，以确定每个模型的超参数，通过计算验证集的准确度来优化验证精度。因此，我们为每个模型选择了最优的超参数，以最大化验证集的精度。然后，我们使用测试集上选择的超参数来评估我们的模型。训练集被随机分为三个大小相似的子集，其中两个用于训练每个模型，一个用作验证子集以验证模型的有效性。使用召回率(敏感度)和F-Score进行机器学习，并比较五种模型的预测性能。

03 研究结果

1.基线分析

研究人群包括227名单侧ISSNHL患者，其中121名未恢复，106名恢复。男70例，女157例，平均年龄46.43±14.77岁，标准差(SD)51.3±99.65岁。表1按病人的康复情况列出了他们的临床特征。

2.变量筛选

对于使用RF的变量选择，使用了平均降低精度和基尼系数。特定变量置换后RF的精度下降越大，该变量就越重要。因此，在预测听力结果时，精确度均值下降较大的变量更为重要。当基尼系数显著降低时，父节点被拆分为两个子节点。平均基尼系数下降越大，在预测听力结果时变量就越重要。

当随机训练具有1,000个树和6个变量的RF时，变量重要性分数根据平均下降精度和平均下降基尼系数计算，如图2所示。每个准则中不包括按频率的初始听力(0.125、0.25、0.5、1、2、3、4和8 KHz)的前5个变量，以及按频率的初始听力的所有值。

结果，15个变量，包括首次听力频率、BUN结果、ITDI时间、从发病到治疗的天数、头晕、发病年龄、肌酐结果和aPTT结果如图2所示。此外，将原始变量和选择的变量应用于五个机器学习模型，以比较两组变量在治疗1个月后预测听力结果的效果。

3.模型性能

选择变量的支持向量机模型被确定为最好的预测模型(准确率，75.36%；F-Score，0.74)，选择变量的RF模型次之(准确率为73.91%；F-Score为0.74)。原始变量的RF模型与选择变量的RF模型的精度相同(精度，73.91；F-Score，0.73)。

然而，选择变量的支持向量机模型对测试集(n=69)的预测时间几乎为零，而RF模型的预测时间为0.01s。

因此，选择变量的支持向量机模型比选择变量的RF模型更好地考虑了实际临床情况下分类所需的精度和计算时间。综上所述，具有31个预测因子的支持向量机模型是最好的模型，而次佳的模型是具有15个预测因子的RF(表2，图8)。

04 总结

1.结论

综上所述，为75.36%，RF为73.91%，MLP为72.46%，AdaBoost为72.46%，KNN为65.22%，与先前1220个样本量的研究结果相当。因此，在给定更大的样本量和更多的预测值的情况下，我们可以预期我们的模型具有更好的预测性能。此外，选择变量的支持向量机模型(准确率为75.36%)对临床医生预测ISSNHL患者的听力预后最有帮助。

2.局限性

1.这项研究的样本量小(227名患者)，而之前的研究包括1,220名患者和1,113名患者。

2.与先前使用149个潜在预测因素的研究相比，预测因素的数量可能还不够。

机器学习的性能取决于样本大小和预测器的数量。随着样本量和预报器数量的增加，模型的性能有望提高。因此，需要进行更大样本量的进一步研究。

结语

临床研究的根本使命是发现并解决生命科学领域亟待解决的临床问题，同时，为即将发生的临床难题提供备选解决方案。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。