今日文献主题:大语言模型技术在病理组学中的应用
这次从厦门开会回来以后,一直在思考大语言模型在病理AI中的一个应用场景,为了辅助自己得出一个科学的结论,我搜集了最新发表的30篇与之相关的文献,用6期推文分别与大家探讨一下这个问题的答案,最后会有一篇汇总的推文,系统的总结这几十篇文献背后暗含的发展趋势。


一作&通讯
| 角色 | 姓名 | 单位名称(中文) |
|---|---|---|
| 第一作者 | Hanwen Xu | 微软研究院,华盛顿州雷德蒙德,美国 |
| 第一作者(共同) | Naoto Usuyama | 华盛顿大学保罗G.艾伦计算机科学与工程学院,华盛顿州西雅图,美国 |
| 通讯作者 | Carlo Bifulco | Providence基因组学,俄勒冈州波特兰,美国 |
| 通讯作者(共同) | Sheng Wang | 华盛顿大学保罗G.艾伦计算机科学与工程学院,华盛顿州西雅图,美国 |
| 通讯作者(共同) | Hoifung Poon | 微软研究院,华盛顿州雷德蒙德,美国 |
这篇文章介绍了Prov-GigaPath,一个基于大规模真实世界数据预训练的全切片数字病理基础模型,它通过创新的GigaPath架构在多种病理学任务上实现了最先进的性能。
背景与挑战:
Prov-GigaPath模型:
预训练方法:
评估与性能:
多模态预训练:
模型架构与应用:
开放资源:
未来展望:
文章强调了大规模预训练和超大型上下文建模的重要性,并展示了Prov-GigaPath在各种数字病理任务中的卓越性能。
图1提供了对Prov-GigaPath模型架构的清晰概览,该模型是一个用于数字病理学应用的深度学习系统。

以下是对模型架构的分析:
a. Prov-GigaPath架构流程:
b. 使用DINOv2进行瓦片级预训练:
c. 使用带掩码的自编码器和LongNet进行切片级预训练:
整个Prov-GigaPath模型的设计允许它有效地从局部和全局角度捕获病理切片的复杂特征,这些特征对于精确的病理诊断和分析至关重要。
通过这种多尺度的预训练和特征提取方法,Prov-GigaPath能够为各种病理学任务提供强大的基础模型。

一作&通讯
| 作者角色 | 作者姓名 | 单位(英文) | 单位(中文) |
|---|---|---|---|
| 第一作者 | Irbaz Bin Riaz, MD, MS, MBI, PhD | Division of Hematology and Oncology, Department of Internal Medicine, Mayo Clinic, Phoenix, AZ | 亚利桑那州梅奥诊所内科血液学和肿瘤学系 |
| 通讯作者 | Liang Cheng, MD, MS | Department of Pathology and Laboratory Medicine, Department of Surgery (Urology), Brown University Warren Alpert Medical School, Lifespan Health, and the Legorreta Cancer Center at Brown University, Providence, RI | 布朗大学沃伦·阿尔珀特医学院病理学和实验室医学系,外科(泌尿外科),布朗大学生命健康系统,布朗大学莱戈雷塔癌症中心,罗德岛州普罗维登斯 |
文章探讨了人工智能(AI)在前列腺癌护理中的应用,旨在提高护理效率和患者预后。
文章强调了AI在前列腺癌护理中的潜力,并讨论了实现这一潜力所需的挑战和未来方向。
FIG 1 描述了在前列腺癌治疗过程中,转化型人工智能(AI)算法的主要应用领域。

局部疾病阶段(Localized Disease Setting):
治疗选择和决策优化:
复发疾病阶段(Recurrent Disease):
复发和晚期疾病阶段(Recurrent and Late-Stage Disease):
技术应用:
总之,FIG 1 强调了AI在前列腺癌治疗不同阶段的多样化应用,从早期诊断到疾病监测和预后评估,AI技术有潜力提高治疗的精确性和个性化水平。

一作&通讯
| 角色 | 姓名 | 单位(英文) | 单位(中文) |
|---|---|---|---|
| 第一作者 | Jerome Cheng | Department of Pathology, University of Michigan | 密歇根大学病理学系 |
这篇文章综述了大型语言模型(LLMs)在病理学实践和教育中的多种应用,并讨论了它们的优势、局限性和未来发展方向。
引言:
教育:
信息提取:
文本分类:
报告和内容生成:
提示工程:
编程:
临床病理学:
多模态大型语言模型:
挑战和限制:
结论:
未来方向:
文章强调了LLMs在病理学中的潜力,同时也指出了其局限性和需要改进的地方。
文章中的Figure 1展示了一个例子,其中ChatGPT-4 Turbo按照给定的提示适当地执行了任务。

具体的提示是:“你是一位经验丰富的病理学家。请以表格格式给我列出12种伴有相关免疫组化染色和分子检测的癌。” 这意味着ChatGPT-4 Turbo接收到了一个明确的指令,要求它生成一个包含特定信息的表格。
遵循指令:ChatGPT-4 Turbo能够理解并遵循具体的任务指令,这表明LLMs具备理解和执行复杂任务的能力。
专业领域知识:提示要求模型以病理学家的身份提供信息,这暗示了LLMs能够模拟具有特定专业知识的角色。
数据组织能力:要求以表格格式提供信息,显示了LLMs能够组织和展示数据,使其易于阅读和理解。
信息的准确性和可靠性:尽管LLMs可以生成看似专业的列表,但文章也强调了验证LLMs生成的信息的重要性,以确保其准确性和可靠性。
教育和实践中的应用:这个例子可能用于教育目的,展示如何使用LLMs来辅助学习和实践,同时也可能用于临床实践,作为快速获取信息的工具。
技术集成:这个例子还表明了LLMs可以如何被集成到工作流程中,以提高效率和生产力。
潜在的局限性:尽管这个例子显示了LLMs的能力,但文章也提到了LLMs可能产生的错误,包括“幻觉”(即生成不准确或不存在的信息)。
总的来说,Figure 1中的例子展示了LLMs在特定任务中的能力,同时也提醒我们在使用这些工具时需要谨慎,确保生成的信息经过适当的验证。

一作&通讯
| 角色 | 姓名 | 单位(英文) | 单位(中文) |
|---|---|---|---|
| 第一作者 | Andrew Y. Wang | Schulich School of Medicine and Dentistry, Western University, London, Ontario, Canada | 西安大略大学舒利克医学和牙科学院,伦敦,安大略,加拿大 |
| 第一作者 | Sherman Lin | Department of Pathology and Laboratory Medicine, Western University and London Health Sciences Centre, London, Ontario, Canada | 西安大略大学病理学和实验室医学系,伦敦健康科学中心,伦敦,安大略,加拿大 |
| 通讯作者 | Matthew J. Cecchini | London Health Sciences Centre, Laboratory Medicine and Pathology, London, ON, Canada | 伦敦健康科学中心,实验室医学和病理学,伦敦,安大略,加拿大 |
这篇文章研究了ChatGPT在病理学范畴内特定知识的表现,并与人类病理学家的表现进行了比较,发现其具有辅助病理学诊断和教育的潜力。
背景:
研究目的:
研究设计:
结果:
结论:
讨论:
方法和材料:
限制和未来工作:
文章强调了大型语言模型在医学教育和病理学领域的潜力,并指出了其在准确性和教育应用方面的未来机会。
Google Forms
https://www.google.cn/intl/zh_cn/forms/about/
Google Forms 是 Google 提供的一种在线表单工具,它允许用户创建和分享电子表单,以收集数据、进行调查或管理任务。

创建表单:用户可以通过选择不同的问题类型(如文本框、复选框、下拉菜单、评分表等)来设计表单。
数据收集:表单可以通过电子邮件或共享链接发送给参与者,参与者在线填写后,数据会自动收集到 Google Sheets 中,便于管理和分析。
协作:Google Forms 支持多人协作,团队成员可以共同编辑和查看表单。
个性化:可以根据需要定制表单的外观和样式,包括主题、颜色和字体。
响应验证:可以设置问题的回答规则,确保收集到的数据符合预期格式。
逻辑分支:表单可以包含逻辑分支,根据参与者的回答自动跳转到不同的问题,提高表单的灵活性和针对性。
隐私保护:Google Forms 提供了隐私设置,允许控制谁可以查看和编辑表单。
集成:Google Forms 可以与其他 Google 应用(如 Google Sheets、Google Drive)集成,方便数据的存储和共享。
移动支持:Google Forms 支持移动设备,用户可以通过手机或平板电脑填写和查看表单。
免费使用:基本的 Google Forms 功能是免费的,对于大多数用户来说已经足够使用。
Google Forms 是一个非常实用的工具,适用于教育、商业、非营利组织等多种场景。
GraphPad Prism 7
GraphPad Prism 是一款科学绘图和统计分析软件,广泛应用于生物科学、医学研究、化学和其他科学领域。

数据组织:Prism 提供了灵活的数据表,可以方便地输入、编辑和组织数据。
图表绘制:支持多种图表类型,包括条形图、散点图、折线图、柱状图、面积图、饼图等。用户可以根据需要选择图表类型,并自定义图表的样式和颜色。
统计分析:内置多种统计分析工具,包括 t 检验、方差分析(ANOVA)、回归分析、非参数检验等,帮助用户进行科学的数据比较和分析。
图形导出:可以轻松将图表导出为多种格式,如 TIFF、JPEG、PNG 等,适用于发表在期刊、演示文稿或报告中。
数据导入:支持从 Excel、CSV 文件和其他数据源导入数据,简化数据准备过程。
图形编辑:提供了丰富的图形编辑工具,用户可以调整图表的标题、图例、坐标轴标签等,使图表更加清晰和专业。
数据拟合:支持多种曲线拟合模型,如线性、多项式、指数、对数等,帮助用户分析数据之间的关系。
科学计算:内置科学计算器,可以进行复杂的数学运算和转换。
数据管理:可以创建和管理多个数据集和项目,方便用户在不同研究项目中切换和比较数据。
用户界面:界面直观易用,适合初学者和专业人士使用。
支持多平台:GraphPad Prism 支持 Windows 和 macOS 系统,提供跨平台的一致体验。
GraphPad Prism 7 是科研人员和数据分析师的重要工具,帮助他们更高效、更准确地处理和展示科学数据。

一作&通讯
| 作者角色 | 作者姓名 | 单位(英文) | 单位(中文) |
|---|---|---|---|
| 第一作者 | Ehsan Ullah | Anatomical Pathology, Department of Pathology and Laboratory Medicine, Te Toka Tumai Auckland, Te Whatu Ora (Health New Zealand) | 解剖病理学,病理学和实验室医学系,奥克兰 Te Toka Tumai,Te Whatu Ora(新西兰健康) |
| 通讯作者 | Rajendra Singh | Director of Dermatopathology and Digital Pathology, Summit Health, Woodland Park, NJ, USA | 皮肤科病理学和数字病理学主任,Summit Health,新泽西州伍德兰公园,美国 |
这篇文章综述了在诊断医学中使用大型语言模型(LLMs)所面临的挑战和机遇,并强调了进一步研究和合作的必要性。
背景:
方法:
结果:
讨论:
结论:
未来考虑:
文章强调了在诊断医学中整合LLMs的重要性,并指出了实现这一目标所需的关键步骤和考虑因素。
Fig. 1展示了大型语言模型(LLMs)在诊断病理学中的作用。

在诊断病理学中,LLMs可能在以下几个方面发挥作用:
数据收集与预处理:LLMs需要大量的数据来训练和学习,这可能包括医学图像、临床记录和实验室结果。预处理步骤可能涉及将这些数据转换成适合LLMs输入的格式。
模型选择与训练:选择适合的LLM架构或预训练模型,并在特定的诊断任务上进行训练。这可能包括针对医学应用进行微调的模型。
特征提取与图像分析:LLMs可以被训练来自动识别和提取医学图像中的相关特征,比如肿瘤、骨折或其他解剖标志。
图像分类与诊断:LLMs可以被训练来根据图像中特定疾病或状况的存在与否对医学图像进行分类,提供初步的诊断。
图像分割与病变特征描述:LLMs可以用来将医学图像分割成不同的组织类型,或者识别和描述病变,为治疗规划和预后提供信息。
实验室测试结果分析:LLMs可以被训练来解释实验室测试结果,并将其与患者的医疗历史和其他临床数据结合起来,帮助临床医生识别模式并做出准确诊断。
疾病风险预测:使用LLMs开发预测模型,根据遗传和生活方式因素估计患者发展某些疾病的风险。
新生物标志物的识别:LLMs可以用来分析大量实验室测试结果数据集,以识别可能与特定疾病相关的新生物标志物。
临床验证:与医疗专业人员合作,验证基于LLM的诊断工具的临床相关性和实用性。
伦理考虑:在部署LLMs时,需要考虑与患者数据隐私、偏见和公平性相关的伦理问题。