2024-08-03
00150 使用 DPO 微调 Llama 2
2024-08-03
大语言模型
00147 预处理数据
2024-07-28
大语言模型
00144 ChatGPT 背后的“功臣”——RLHF 技术详解
2024-06-30
大语言模型
00143 文本生成策略
2024-06-30
大语言模型
00142 共享自定义模型
2024-06-30
大语言模型
00141 GPU 推理
2024-06-29
大语言模型
00140 CPU 推理
2024-06-29
大语言模型
00139 DeepSpeed
2024-06-28
大语言模型
00138 完全分片数据并行
2024-06-27
大语言模型