用于 Fashion-MNIST 分类实验的多尺度残差聚合网络 (Multi-Scale Residual Aggregation Network)。
本仓库是深度学习课程研究项目。Zalando 官方 Fashion-MNIST 仓库作为带许可证的
参考资料保留在 fashion-mnist/ 中;本项目新增的实验代码均位于 src/、
scripts/ 和 configs/。
conda env create -f environment.yml
conda activate msra-net
pip install -e .
python scripts/prepare_data.py
python scripts/train.py --config configs/baseline_cnn.yaml每次运行都会在 outputs/experiments/ 下创建独立目录,其中包含最终配置、
环境元数据、日志、检查点、指标、预测结果和图像。
已完成实验的轻量记录提交在 outputs/run_records/ 中;模型检查点仅保留在本地,
不会提交到 Git。
仓库文件说明见 docs/FILE_GUIDE.md,评估规则见
docs/EXPERIMENT_PROTOCOL.md。
bash scripts/run_baselines.sh
python scripts/train.py --config configs/msra_net.yaml
bash scripts/run_ablations.sh
python scripts/aggregate_results.py最终的多随机种子重复实验使用:
bash scripts/run_repeated_trials.sh三个随机种子的测试结果:
| 模型 | 准确率 | 参数量 | MACs |
|---|---|---|---|
| MSRA-Net | 94.60% +/- 0.16% | 603K | 61.34M |
| 小型 ResNet | 94.56% +/- 0.21% | 696K | 81.39M |
| CNN | 93.95% +/- 0.14% | 871K | 19.40M |
| Tiny ViT | 91.20% +/- 0.09% | 803K | 26.52M |
| MLP | 90.50% +/- 0.15% | 537K | 0.54M |
MSRA-Net 在干净测试集上的准确率与小型 ResNet 相当,同时参数量减少约 13.3%,
MACs 减少约 24.6%。在人工噪声、旋转和遮挡下,其性能下降也明显更慢。
详细解释与局限性见 docs/RESULT_ANALYSIS.md。
Fashion-MNIST 由 Xiao、Rasul 和 Vollgraf 于 2017 年提出。
fashion-mnist/ 中的第三方仓库快照保留其原始 MIT 许可证。