2024-08-03
00152 “StackLLaMA”: 用 RLHF 训练 LLaMA 的手把手教程
2024-08-03
大语言模型
00151 面向生产的 LLM 优化
2024-08-03
大语言模型
00150 使用 DPO 微调 Llama 2
2024-08-03
大语言模型
00147 预处理数据
2024-07-28
大语言模型
00144 ChatGPT 背后的“功臣”——RLHF 技术详解
2024-06-30
大语言模型
00143 文本生成策略
2024-06-30
大语言模型
00142 共享自定义模型
2024-06-30
大语言模型
00141 GPU 推理
2024-06-29
大语言模型
00140 CPU 推理
2024-06-29
大语言模型