前言本文介绍了使用 DPO 微调 Llama 2。
Hugging Face Github 主页: https://github.com/huggingface
操作系统:Windows 11 家庭中文版
参考文档
Fine-tune L
2024-08-03