2024-08-03
                            
                            
                        
                     00150 使用 DPO 微调 Llama 2
                            
                            00150 使用 DPO 微调 Llama 2
                        
                            
                                2024-08-03
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00147 预处理数据
                            
                            00147 预处理数据
                        
                            
                                2024-07-28
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00144 ChatGPT 背后的“功臣”——RLHF 技术详解
                            
                            00144 ChatGPT 背后的“功臣”——RLHF 技术详解
                        
                            
                                2024-06-30
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00143 文本生成策略
                            
                            00143 文本生成策略
                        
                            
                                2024-06-30
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00142 共享自定义模型
                            
                            00142 共享自定义模型
                        
                            
                                2024-06-30
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00141 GPU 推理
                            
                            00141 GPU 推理
                        
                            
                                2024-06-29
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00140 CPU 推理
                            
                            00140 CPU 推理
                        
                            
                                2024-06-29
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00139 DeepSpeed
                            
                            00139 DeepSpeed
                        
                            
                                2024-06-28
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00138 完全分片数据并行
                            
                            00138 完全分片数据并行
                        
                            
                                2024-06-27
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     
                            
                             
                            
                            