2024-08-08
                            
                            
                        
                     00160 PEFT:在低资源硬件上对十亿规模模型进行参数高效微调
                            
                            00160 PEFT:在低资源硬件上对十亿规模模型进行参数高效微调
                        
                            
                                2024-08-07
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00153 开源大语言模型作为 LangChain 智能体
                            
                            00153 开源大语言模型作为 LangChain 智能体
                        
                            
                                2024-08-03
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00152 “StackLLaMA”: 用 RLHF 训练 LLaMA 的手把手教程
                            
                            00152 “StackLLaMA”: 用 RLHF 训练 LLaMA 的手把手教程
                        
                            
                                2024-08-03
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00151 面向生产的 LLM 优化
                            
                            00151 面向生产的 LLM 优化
                        
                            
                                2024-08-03
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00150 使用 DPO 微调 Llama 2
                            
                            00150 使用 DPO 微调 Llama 2
                        
                            
                                2024-08-03
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00147 预处理数据
                            
                            00147 预处理数据
                        
                            
                                2024-07-28
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00144 ChatGPT 背后的“功臣”——RLHF 技术详解
                            
                            00144 ChatGPT 背后的“功臣”——RLHF 技术详解
                        
                            
                                2024-06-30
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     00143 文本生成策略
                            
                            00143 文本生成策略
                        
                            
                                2024-06-30
                            
                            
                                
                                
                                
                                
                                大语言模型
                                
                                
                                
                            
                        
                     
                            
                             
                            
                             
                            
                            