分类: 大语言模型 | LuYF-Lemon-love の Blog

文章分类
计算机基础 32 实用技巧 9 C/C++和Python混合编程 6 硬件 1 博客 4 C++ 14 杂项 19 Python 73 Paper 33 大语言模型 110 PyTorch 10 动态壁纸 4 干饭 9 Linux 12 人工智能 3 Verilog 4 基础软件 3 数学 2 刷题 2
                            
                            00218 NLP Course - A full training
                        
                                前言现在我们将看到如何在不使用Trainer类的情况下，获得与上一部分相同的结果。再次提醒，我们假设你已经完成了第二部分的数据处理。下面是一个涵盖你所需要的一切的简短总结：
from datasets import load_dataset
                            
                                2024-11-02
                            
                                    大语言模型
                                
                            深度学习
                        
                            大语言模型
                        
                            huggingface
                        
                            00217 NLP Course - Fine-tuning a model with the Trainer API
                        
                                前言🤗 Transformers 提供了一个 Trainer 类，帮助您在您自己的数据集上微调它提供的任何预训练模型。一旦您完成了上一节中的所有数据预处理工作，您只需几个步骤就可以定义 Trainer 了。最困难的部分可能是准备运行 Tr
                            
                                2024-10-30
                            
                                    大语言模型
                                
                            深度学习
                        
                            大语言模型
                        
                            huggingface
                        
                            00216 NLP Course - Processing the data
                        
                                前言继续上一章的例子，以下是我们在 PyTorch 中如何在一个批次上训练序列分类器的步骤：
import torch
from transformers import AdamW, AutoTokenizer, AutoModelForS
                            
                                2024-10-29
                            
                                    大语言模型
                                
                            深度学习
                        
                            大语言模型
                        
                            huggingface
                        
                            00215 NLP Course - Introduction
                        
                                前言在第2章中，我们探讨了如何使用分词器和预训练模型来做出预测。但是，如果你想要针对自己的数据集微调一个预训练模型呢？这就是本章的主题！你将学习：

如何从 Hub 准备大型数据集
如何使用高级 Trainer API 微调模型
如何使用自
                            
                                2024-10-28
                            
                                    大语言模型
                                
                            深度学习
                        
                            大语言模型
                        
                            huggingface
                        
                            00214 NLP Course - Basic usage completed!
                        
                                前言太棒了，你一直跟到了这里！回顾一下，在本章中你学习了：

学习了 Transformer 模型的基本构建块。
了解了组成分词管道的内容。
看到了如何在实际中使用 Transformer 模型。
学习了如何利用分词器将文本转换为模型可以理
                            
                                2024-10-28
                            
                                    大语言模型
                                
                            深度学习
                        
                            大语言模型
                        
                            huggingface
                        
                            00213 NLP Course - Putting it all together
                        
                                前言在过去的几节中，我们一直在尽力手动完成大部分工作。我们探讨了标记器是如何工作的，并查看了标记化、转换为输入ID、填充、截断和注意力掩码。
然而，正如我们在第2节看到的，🤗 Transformers API 可以通过一个高级函数为我们处
                            
                                2024-10-27
                            
                                    大语言模型
                                
                            深度学习
                        
                            大语言模型
                        
                            huggingface
                        
                            00212 NLP Course - Handling multiple sequences
                        
                                前言在上一节中，我们探讨了最简单的用例：对单个短序列进行推理。然而，已经出现了一些问题：

我们如何处理多个序列？
我们如何处理不同长度的多个序列？
词汇索引是允许模型良好工作的唯一输入吗？
有没有所谓的过长序列？

让我们看看这些问题提出
                            
                                2024-10-27
                            
                                    大语言模型
                                
                            深度学习
                        
                            大语言模型
                        
                            huggingface
                        
                            00211 NLP Course - Tokenizers
                        
                                前言分词器是 NLP 管道中的核心组件之一。它们有一个目的：将文本转换成模型可以处理的数据。模型只能处理数字，所以分词器需要将我们的文本输入转换为数值数据。在本节中，我们将探索分词管道中确切发生的事情。
在自然语言处理任务中，通常处理的数据
                            
                                2024-10-27
                            
                                    大语言模型
                                
                            深度学习
                        
                            大语言模型
                        
                            huggingface
                        
                            00210 NLP Course - Models
                        
                                前言在本节中，我们将更深入地了解如何创建和使用模型。我们将使用 AutoModel 类，这在您想要从检查点实例化任何模型时会非常方便。
AutoModel 类及其所有相关类实际上是对库中可用的各种模型的一种简单封装。它是一个巧妙的封装，因为
                            
                                2024-10-26
                            
                                    大语言模型
                                
                            深度学习
                        
                            大语言模型
                        
                            huggingface
                        
                            00209 NLP Course - Behind the pipeline
                        
                                前言让我们从一个完整的例子开始，回顾一下我们在第一章执行以下代码时幕后发生了什么：
from transformers import pipeline

classifier = pipeline("sentiment-analysis")
                            
                                2024-10-25
                            
                                    大语言模型
                                
                            深度学习
                        
                            大语言模型
                        
                            huggingface
                        
                            00208 NLP Course - Introduction
                        
                                前言正如您在第一章中看到的，Transformer模型通常非常大。拥有数百万到数十亿个参数，训练和部署这些模型是一项复杂的任务。此外，每天都有新的模型发布，而且每个模型都有自己的实现方式，尝试它们绝非易事。
🤗 Transformers库
                            
                                2024-10-25
                            
                                    大语言模型
                                
                            深度学习
                        
                            大语言模型
                        
                            huggingface
                        
                            00206 收集的数据集
                        
                                前言介绍一些数据集。
Operating System: Ubuntu 22.04.4 LTS
文本Text Generationpre-training datasets
LLaMA-Factory/Wiki Demo (en)
                            
                                2024-10-20
                            
                                    大语言模型
                                
                            深度学习
                        
                            大语言模型
                        
                            huggingface