CLAM 病理图像分析实战：从 WSI 分割到弱监督分类的 5 步完整流程

📅 2026/7/5 17:06:21 👁️ 阅读次数 📝 编程学习

CLAM 病理图像分析实战：从 WSI 分割到弱监督分类的 5 步完整流程

病理图像分析一直是医学影像领域的重要研究方向，而全切片图像（Whole Slide Image, WSI）的处理更是其中的难点。传统的WSI分析方法往往需要大量人工标注，这不仅耗时耗力，而且难以规模化。CLAM（Clustering-constrained Attention Multiple Instance Learning）模型的出现，为解决这一问题提供了新的思路。本文将详细介绍如何使用CLAM模型完成从WSI分割到弱监督分类的完整流程，帮助研究人员和算法工程师快速上手这一技术。

1. 环境准备与数据组织

在开始之前，我们需要准备好开发环境和数据。CLAM基于Python和PyTorch实现，因此需要安装这些基础工具。推荐使用conda创建虚拟环境以避免依赖冲突：

conda create -n clam python=3.8 conda activate clam pip install torch torchvision openslide-python pandas scikit-learn

数据组织是项目成功的关键。WSI通常以.svs、.ndpi等格式存储，文件体积巨大（通常超过1GB）。建议按以下结构组织数据：

data/ ├── raw_slides/ # 存放原始WSI文件 │ ├── case_001.svs │ └── case_002.svs ├── patches/ # 将存放提取的patch └── features/ # 将存放提取的特征

关键参数说明：

seg_level: WSI下采样级别，默认为-1（自动选择最接近64倍下采样的级别）
sthresh: 分割阈值（正整数，默认8，值越大检测到的前景越少）
mthresh: 中值滤波器大小（正奇数，默认7）

2. WSI分割与Patch提取

WSI分割是CLAM流程的第一步，目的是从整张切片中识别出有组织的区域。CLAM提供了create_patches_fp.py脚本完成这一任务：

python create_patches_fp.py \ --source data/raw_slides \ --save_dir results \ --patch_size 256 \ --seg \ --patch \ --stitch

这个命令会执行以下操作：

对每张WSI进行组织分割
提取256×256大小的patch
生成patch坐标和拼接可视化

常见问题处理：

如果分割结果不理想，可以调整以下参数：
- 增加sthresh值减少背景检测
- 调整a_t（组织区域过滤阈值）和a_h（孔洞过滤阈值）

对于特定WSI，建议先单独运行分割检查结果：

python create_patches_fp.py --source data/raw_slides/case_001.svs --save_dir results --patch_size 256 --seg

3. 特征提取与表示学习

获得patch后，下一步是提取特征。CLAM默认使用ResNet50的ImageNet预训练权重，但也支持更先进的编码器如UNI和CONCH：

CUDA_VISIBLE_DEVICES=0 python extract_features_fp.py \ --data_h5_dir results/patches \ --data_slide_dir data/raw_slides \ --csv_path results/process_list.csv \ --feat_dir results/features \ --batch_size 512 \ --slide_ext .svs

特征提取完成后，目录结构如下：

results/features/ ├── h5_files/ # 包含特征和坐标的HDF5文件 │ ├── case_001.h5 │ └── case_002.h5 └── pt_files/ # 仅包含特征的PyTorch tensor文件 ├── case_001.pt └── case_002.pt

高级选项：

使用UNI或CONCH编码器：

export UNI_CKPT_PATH=checkpoints/uni/pytorch_model.bin python extract_features_fp.py --model_name uni_v1 ...

多GPU加速：设置CUDA_VISIBLE_DEVICES=0,1,2,3并使用--num_workers

4. CLAM模型训练与调优

有了特征表示后，就可以训练CLAM模型了。CLAM提供单分支（clam_sb）和多分支（clam_mb）两种架构：

python main.py \ --task task_name \ --exp_code experiment_name \ --data_root_dir results/features \ --split_dir splits \ --model_type clam_sb \ --model_size small \ --k 8 \ --bag_weight 0.8 \ --inst_loss svm \ --subtyping \ --early_stopping

关键训练参数：

参数	说明	推荐值
k	注意力分数top-k数量	8
bag_weight	bag loss权重	0.7-0.9
lr	学习率	2e-4
reg	L2正则化	1e-5
dropout	Dropout率	0.25

训练过程中，CLAM会输出以下指标：

Slide-level AUC：整个WSI的分类性能
Instance-level AUC：patch级别的分类性能
Attention热图：可视化模型关注区域

5. 结果可视化与模型解释

CLAM的一个重要优势是其可解释性。我们可以生成注意力热图来理解模型的决策过程：

from visualization.create_heatmaps import create_heatmaps create_heatmaps( slide_path="data/raw_slides/case_001.svs", patch_path="results/patches/case_001.h5", feat_path="results/features/pt_files/case_001.pt", model_path="results/models/best_model.pth", output_dir="results/heatmaps" )

热图会以两种形式呈现：

Overlay模式：注意力分数叠加在原始WSI上
- 红色：高注意力区域（模型认为重要的诊断区域）
- 蓝色：低注意力区域（模型认为不重要的区域）
Side-by-side模式：原始WSI与热图并排显示

临床应用建议：

对于新数据集，建议先在小样本上验证模型性能
注意力热图可用于辅助病理医生定位关键区域
模型预测结果应与临床诊断相结合使用

在实际项目中，CLAM已经成功应用于多种癌症亚型分类和转移检测任务。例如，在肾细胞癌（RCC）亚型分类中，仅使用200张WSI和slide-level标签，就能达到超过90%的分类准确率。这种高效的学习方式使得CLAM特别适合数据稀缺的医学影像分析场景。

编程学习技术分享实战经验

资讯详情

CLAM 病理图像分析实战：从 WSI 分割到弱监督分类的 5 步完整流程