本指南将帮助您在 10 分钟内完成环境配置并开始微调 Qwen3-4B 模型。
- MacBook with Apple Silicon (M1/M2/M3)
- 至少 16GB 统一内存(推荐 32GB)
- macOS 13.0 或更高版本
- Python 3.8 或更高版本
git clone <your-repo-url>
cd qwen3_test# 创建虚拟环境
python3 -m venv .venv
# 激活虚拟环境
source .venv/bin/activate# 安装所有必需的包
pip install -r requirements.txt# 下载自我认知数据集
modelscope download --dataset swift/self-cognition --local_dir ./self-cognition
# 转换数据格式
python trans_data.py
# 下载 Qwen3-4B 模型
modelscope download --model Qwen/Qwen3-4B --local_dir ./Qwen3-4B# 使用 LoRA 进行微调
mlx_lm.lora --config ft_qwen3_lora.yaml运行以下命令验证环境是否正确配置:
# 检查 Python 版本
python --version
# 检查 MLX 是否正确安装
python -c "import mlx.core as mx; print(mx.__version__)"
# 检查 MLX-LM 是否正确安装
mlx_lm --help完成微调后,您可以:
-
测试模型对话
mlx_lm.chat --model Qwen3-4B --adapter-path my_qwen3_4b
-
部署 API 服务
mlx_lm.server --model Qwen3-4B --adapter-path my_qwen3_4b
-
性能测试
evalscope perf \ --parallel 1 \ --number 10 \ --model Qwen3-4B \ --url http://127.0.0.1:8080/v1/chat/completions \ --api openai
- 查看 README.md 中的常见问题部分
- 搜索 GitHub Issues
- 创建新的 Issue 寻求帮助
修改 ft_qwen3_lora.yaml 来调整训练参数:
# 关键参数
batch_size: 1 # 批次大小(内存受限时减小)
iters: 500 # 训练迭代次数
learning_rate: 1e-4 # 学习率
num_layers: 28 # 微调层数
# LoRA 参数
lora_parameters:
rank: 8 # LoRA 秩(增大可能提升效果但增加计算)
scale: 20.0 # LoRA 缩放因子恭喜!您已经成功完成了 Qwen3-4B 模型的微调。享受您的定制模型吧!
如有疑问,欢迎查看详细文档或提交 Issue。