剪枝指南

概述

项目提供基于 torch-pruning 的 iterative structured pruning + 微调框架。该阶段以自动选择出的基座模型 checkpoint 为输入，输出 pruning checkpoint，供后续 QAT / ONNX 阶段恢复使用。

pruning 阶段负责：

扫描 output/base_model/<model>/ 下的实验目录并收集候选基座权重
读取候选目录 best_val_acc_info.txt 的最后一条有效记录，按 val_acc 降序、val_loss 升序选择最佳实验
恢复默认模型并严格加载被选中的基座权重
执行多轮 iterative pruning
每轮进行验证与可选微调
仅最终轮保存 pruning checkpoint

pruning 阶段不负责读取 pruning checkpoint 并恢复模型；该职责由后续 QAT / ONNX 模块承担。

数据侧约定：

数据仍使用 Data/<class>/*.npy 目录组织
样本支持 2D (H, W) 与 3D (C, H, W)
类别数运行时从 --data_dir 的一级子目录动态推断，并用于校验所选基座 checkpoint 的分类头

环境前提

需要用户手动安装的项目

git
pixi
uv
direnv（可选）

自动安装的内容

pixi install
- Python 3.12 运行时
- GCC / G++ / Make / CMake
- CUDA runtime、cuDNN、CANN toolkit 等工具链内容
uv sync
- torch
- torch-pruning
- 以及其余 Python 包依赖

工作流

output/base_model/<model>/<experiment_dir>/best_model.pth
  -> 自动选择最佳基座实验
  -> 恢复基座模型
  -> iterative structured pruning
  -> 每轮提取 topology(channel_cfg + architecture_signature)
  -> 每轮微调恢复（可选）
  -> 仅最终轮保存 pruning checkpoint

基座模型来源约定

剪枝入口会自动扫描：

output/base_model/<model>/<experiment_dir>/best_model.pth

选择规则：

遍历 output/base_model/<model>/ 下所有直接子目录
读取每个子目录 best_val_acc_info.txt 的最后一条有效记录
按 val acc 优先、val loss 次优选择最佳实验
checkpoint 中的 model_structure.model_name 必须与命令行 --model 一致

CLI 参数总览

参数	默认值	说明
`--model`	必填	基座模型名；程序会据此扫描 `output/base_model/<model>/` 并自动选择最佳 `best_model.pth`
`--model_path`	`best_pruned_model.pth`	最终剪枝模型文件名
`--data_dir`	`Data`	数据集路径
`--data_dtype`	`fp16`	数据集输出 tensor 精度
`--full_load`	`False`	是否全量加载数据集
`--num_workers`	`None`	DataLoader 工作线程数
`--prefetch_factor`	`2`	DataLoader 预取因子
`--persistent_workers`	`True`	是否保持 DataLoader 工作线程
`--pin_memory`	`True`	是否启用 `pin_memory`
`--pruning_ratio`	`0.30`	最终总剪枝率，统一规范到 2 位小数
`--pruning_steps`	`5`	iterative pruning 的剪枝轮数
`--global_pruning`	`True`	是否启用全局剪枝
`--ignore_fc`	`True`	是否忽略分类头
`--finetune_epochs`	`10`	每轮剪枝后的微调轮数
`--batch_size`	`64`	批次大小
`--lr`	`1e-4`	微调学习率
`--weight_decay`	`1e-4`	权重衰减
`--warmup_ratio`	`0.05`	Warmup 占总步数比例
`--warmup_steps`	`0`	Warmup 步数
`--min_lr`	`1e-7`	最小学习率
`--cudnn_benchmark`	`True`	是否启用 cuDNN benchmark
`--cudnn_deterministic`	`False`	是否启用 cuDNN 确定性算法
`--evaluate_test`	`True`	是否在最终阶段评估测试集

命令示例

最小剪枝命令

uv run python -m pruning --model resnet6_2d

指定总剪枝率与轮数

uv run python -m pruning \
  --model resnet18_2d \
  --pruning_ratio 0.30 \
  --pruning_steps 5 \
  --global_pruning True \
  --finetune_epochs 10

不做微调，仅保存最终剪枝结果

uv run python -m pruning \
  --model resnet14_2d \
  --finetune_epochs 0 \
  --evaluate_test False

说明：

--model 只选择上游基座模型家族；样本 shape 与类别数仍从 --data_dir 动态推断

输出目录

output/pruning/<model>/ratio<ratio>_steps<steps>_<global|local>_ft<epochs>_bs<batch_size>/

典型产物：

best_pruned_model.pth
best_pruned_info.txt
pruning_summary.json
Confusion_matrix.png（仅最终测试阶段生成）
runs/round_<n>/

`pruning_summary.json` 结构

顶层摘要包括：

model_name
pruning_steps
labels
baseline
rounds
pruning_meta
finetune_summary
final
final_topology
checkpoint_link_path
resolved_checkpoint_path

其中：

rounds[*].before_finetune.topology 保留每轮剪枝过程拓扑
final_topology 保留最终模型拓扑快照
顶层 pruning_meta 是最终轮的紧凑摘要

pruning checkpoint 结构

best_pruned_model.pth 主要字段包括：

model_state_dict
epoch
best_acc
best_val_loss
train_context
model_structure
pruning_meta

其中 model_structure 保存：

model_name
model_class
model_kwargs
include_top
in_channels
init_channels
input_tensor_meta
channel_cfg
architecture_signature

说明：

后续所有消费该 pruning checkpoint 的 .pth 链路，都会对 architecture_signature 执行强校验
后续 ONNX / AMCT / ATC 阶段统一通过对应 summary 读取并校验上游签名与来源信息

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

剪枝指南

概述

环境前提

需要用户手动安装的项目

自动安装的内容

推荐初始化顺序

工作流

基座模型来源约定

CLI 参数总览

命令示例

最小剪枝命令

指定总剪枝率与轮数

不做微调，仅保存最终剪枝结果

输出目录

`pruning_summary.json` 结构

pruning checkpoint 结构

FilesExpand file tree

PRUNING_GUIDE.md

Latest commit

History

PRUNING_GUIDE.md

File metadata and controls

剪枝指南

概述

环境前提

需要用户手动安装的项目

自动安装的内容

推荐初始化顺序

工作流

基座模型来源约定

CLI 参数总览

命令示例

最小剪枝命令

指定总剪枝率与轮数

不做微调，仅保存最终剪枝结果

输出目录

pruning_summary.json 结构

pruning checkpoint 结构

`pruning_summary.json` 结构