弗吉尼亚理工大学计算机科学教授Daphne Yao希望提高机器学习模型在医疗应用中的预测精度。不准确的预测可能会导致危及生命的后果。这些预测误差可能会导致错误计算病人在急诊室就诊时死亡或癌症存活的可能性。

她的研究结果最近发表在《医学通讯》杂志上,该杂志致力于发表高质量的研究、评论和论文,涵盖所有临床、转化和公共卫生研究领域。

Yao说,许多临床数据集是不平衡的,因为它们被多数群体样本所主导。在典型的适用于所有人的一台机器学习模型范式中,种族和年龄差异很可能存在,但可能被忽略。

Yao和她的研究团队与Charles B. Nemeroff合作,Nemeroff是美国国家医学院的成员,也是德克萨斯大学奥斯汀分校戴尔医学院精神病学和行为科学系的教授,研究训练数据中的偏差如何影响预测结果,特别是对代表性不足的患者的影响,如年轻患者或有色人种患者。

Nemeroff说:“我非常高兴能与Yao合作,她是先进机器学习领域的世界领导者。”“她和我讨论了一个概念,即机器学习的新进展可以应用于临床研究人员经常遇到的一个非常重要的问题,即通常参加临床试验的少数族裔人数相对较少。”

这导致医疗结论主要是针对多数群体(欧洲裔白人患者)得出的,这可能不适用于少数族裔群体。

Nemeroff称:“这份新报告提供了一种方法来提高对少数群体的预测准确性。”“显然,这些发现对改善少数民族患者的临床护理具有非常重要的意义。”

Yao的弗吉尼亚理工大学团队由计算机科学系的博士生Sharmin Afrose和Wenjia Song以及化学工程系的Chang Lu,Fred W. Bull教授组成。为了进行研究,她们在两个数据集上对四种不同的预后任务进行了实验,使用了一种新的双优先级(DP)偏差校正方法,为特定的种族或年龄组训练定制模型。

“我们的工作展示了一种新的人工智能公平技术,可以纠正预测错误,”四年级博士生Song说,她的研究领域包括数字健康和网络安全中的机器学习。“我们的DP方法提高了少数民族班级的表现高达38%,并显著减少了不同人口统计群体之间的预测差异,比其他抽样方法好88%。”

监测、流行病学和最终结果数据集被Song用于乳腺癌和肺癌生存率的任务,而五年级博士生Afrose则使用来自波士顿Beth Israel Deaconess医疗中心的数据集进行住院死亡率预测和失代偿预测任务。

“我们很高兴找到了减少偏见的解决方案,”Afrose说,她的研究重点包括医疗保健和软件安全中的机器学习。“我们的DP偏差校正技术将减少对少数群体潜在的威胁生命的预测错误。”

随着这些发现的发表和公开访问,该团队渴望与其他研究人员合作,在他们自己的临床数据分析中使用这些方法。

Song说:“我们的方法很容易部署在各种机器学习模型上,可以帮助提高任何具有表征偏差的预后任务的性能。”

Loading

作者 aibbs