2019 年 9 月 5 日

医疗保健中的机器学习：提升患者结果的 5 个用例

Anaconda 团队

4 分钟

机器学习正在加速各个科学领域的发现步伐，医学也不例外。从加速研究的语言处理工具到提醒医务人员即将发生心脏病发作的预测算法，机器学习在各个医学学科中补充了人类的洞察力和实践。

然而，鉴于围绕 AI 和机器学习技术的所有“解决方案主义”，医疗保健提供商对它将如何真正帮助患者并带来投资回报持谨慎态度是可以理解的。市场上许多用于医疗保健目的的 AI 解决方案都是为了解决非常具体的问题而量身定制的，例如识别患脓毒症的风险或诊断乳腺癌。这些开箱即用的 AI 解决方案使公司难以或不可能自定义其模型并最大限度地利用其投资。

开源数据科学使医疗保健公司能够使用最新的机器学习技术（例如音频和视觉数据处理）调整模型以应对各种挑战。通过使用开源工具，数据科学家可以以满足医疗保健 IT 的严格要求的方式自定义构建应用程序，并在各种环境中改善患者护理，最终使组织从竞争对手中脱颖而出。以下是医疗保健领域可以使用开源数据科学工具开发并适应不同功能的五个机器学习用例。

1. 用于管理任务的自然语言处理 (NLP)

《新英格兰医学杂志》去年进行的一项研究发现，83% 的受访者报告称，医生倦怠是他们组织中的一个问题。其中一半人报告说，“卸载管理任务”将有助于解决这个问题，使医生能够花更多时间与患者在一起。这些管理任务的很大一部分涉及审查和更新电子健康记录 (EHR)。美国几乎每家医院都使用 EHR 系统，大多数诊所也是如此。提高 EHR 更新效率是大多数人的首要任务。这就是 NLP 工具的用武之地。

通过利用使用算法来识别和分类单词和短语的 NLP 工具，医生可以在患者就诊期间直接向 EHR 口述记录。医生和患者都可以查看由 NLP 工具整齐编译的图表和摘要，而不必通读笔记和测试结果来了解患者的整体健康状况。通过减少维护 EHR 的时间，医生可以花更多时间与患者在一起。

2. 患者风险识别

在世界各地，医疗保健提供商已开始使用从机器学习模型构建的工具，这些模型使用异常检测算法来预测心脏病发作、中风、脓毒症和其他严重并发症。这些工具使用来自患者历史记录、每日评估以及实时生命体征测量（例如心率和血压）的数据，以提醒工作人员患者即将面临的风险，以便他们可以立即采取预防措施。

El Camino 医院就是一个例子。他们的研究人员使用电子健康记录、床报警数据和护士呼叫数据开发了一种工具，用于预测患者跌倒。这种新工具会在患者跌倒风险较高时提醒工作人员，以便他们可以采取行动来降低风险。他们成功地将跌倒次数减少了 39%。根据医疗转型联合委员会的数据，因跌倒造成的住院病人损伤平均会使住院时间增加 6.3 天，并花费 14,000 美元。另一个例子是 Mayo Clinic 开发的脓毒症嗅探器算法 (SSA)。SSA 使用人口统计数据和生命体征测量值来触发警报，只要患脓毒症的风险增加，就可将人工筛查时间缩短 72%。这使医生和护士可以将更多时间用于治疗患者最初因之而来的疾病。

3. 加速医学研究洞察

科学家和医生必须阅读和处理大量的报告和研究，才能跟上特定医学研究领域的趋势。例如，仅在 2007 年至 2016 年间，学者们就发表了超过 342,000 篇关于药物评估和分析的文章。使用 NLP 工具和神经网络来解析文献将在未来几年为医学研究人员提供宝贵的见解。

数据可视化来自：使用生物医学文献进行不良药物发现

例如，来自美国和爱尔兰的一个研究团队共同进行了一项关于不良药物事件 (ADE) 的研究，他们使用文本挖掘、预测分析和神经网络来分析庞大的医学文献数据库和社交媒体帖子，以查找与药物副作用相关的评论。在分析了来自医学期刊的 300,000 多篇文章和社交媒体上 160 多万条评论后，该团队使用数据可视化工具来显示药物与副作用之间的关系。

NLP 也被用于挖掘 EHR 中的非结构化数据以获取见解，例如来自心电图结果的数据或手动书写笔记的副本，这些副本已上传到患者的记录中，但未输入到表单字段中。cTAKES 是由 Mayo Clinic、波士顿儿童医院和其他组织开展的开源 NLP 项目的一个例子，旨在开发一种工具，用于解析 EHR 中的非结构化数据以提取见解。

4. 用于肿瘤检测的视觉数据处理

近年来，放射科医生的工作量显着增加。一些研究发现，平均放射科医生必须每 3-4 秒解读一张图像才能满足需求。研究人员开发了基于先前捕获的放射影像训练的深度学习算法，以识别肺部、乳房、大脑和其他区域肿瘤的早期发展。可以训练算法来识别放射影像数据中的复杂模式。它们可以以惊人的准确度从乳房 X 线照片中检测出乳腺癌。休斯顿卫理公会研究所开发的一种早期乳腺癌检测工具以99% 的准确率解读乳房 X 线照片，并提供比人类快 30 倍的诊断信息。这些工具还减少了活检的需求。大多数放射科医生都认为这些工具可以帮助他们改善患者护理。它们使他们更擅长自己的工作，但不会取代他们。

5. 使用卷积神经网络 (CNN) 进行皮肤癌诊断

CNN 是用于识别和分类图像的强大工具。一些研究人员使用 TensorFlow、scikit-learn、keras 和其他开源工具开发了用于皮肤癌检测的机器学习模型，准确率达到 87-95%。相比之下，皮肤科医生在检测黑色素瘤方面的准确率在 65% 到 85% 之间。模型使用数千张恶性和良性皮肤病变的图像进行训练。Github 上有一个这样的开源项目可供公众使用。除了皮肤癌诊断外，研究人员还在使用 CNN 开发用于诊断肺结核、心脏病、阿尔茨海默病和其他疾病的工具。

符合规范的医学数据科学

虽然医疗保健组织在安全、治理和合规方面必须比大多数其他行业更加谨慎，但他们仍然可以使用匿名数据训练机器学习模型，以符合 HIPAA 要求。确保您的软件环境的完整性对于处理真实用户医疗数据至关重要。Anaconda Enterprise 为高度监管领域的从业人员提供了一个稳定且安全的环境，让他们可以使用突破性的开源机器学习技术。它还提供对安全、可治理的软件包存储库的访问，以便数据科学家可以在创新模型的开发中访问 IT 批准的数据科学软件包。

您可能也对以下内容感兴趣

与专家交流

与我们的专家之一交流，为您的 AI 之旅寻找解决方案。

与专家交流

医疗保健中的机器学习：提升患者结果的 5 个用例

为什么能效是 AI 创新的关键，以及这对硬件和软件制造商意味着什么

介绍使用 FSSpec 的远程内容缓存

使用 Modin 扩展您的 pandas 工作流程 - 无需重写

与专家交流