LuYF-Lemon-love の Blog
00215 NLP Course - Introduction 00215 NLP Course - Introduction
前言在第2章中,我们探讨了如何使用分词器和预训练模型来做出预测。但是,如果你想要针对自己的数据集微调一个预训练模型呢?这就是本章的主题!你将学习: 如何从 Hub 准备大型数据集 如何使用高级 Trainer API 微调模型 如何使用自
00214 NLP Course - Basic usage completed! 00214 NLP Course - Basic usage completed!
前言太棒了,你一直跟到了这里!回顾一下,在本章中你学习了: 学习了 Transformer 模型的基本构建块。 了解了组成分词管道的内容。 看到了如何在实际中使用 Transformer 模型。 学习了如何利用分词器将文本转换为模型可以理
00213 NLP Course - Putting it all together 00213 NLP Course - Putting it all together
前言在过去的几节中,我们一直在尽力手动完成大部分工作。我们探讨了标记器是如何工作的,并查看了标记化、转换为输入ID、填充、截断和注意力掩码。 然而,正如我们在第2节看到的,🤗 Transformers API 可以通过一个高级函数为我们处
00212 NLP Course - Handling multiple sequences 00212 NLP Course - Handling multiple sequences
前言在上一节中,我们探讨了最简单的用例:对单个短序列进行推理。然而,已经出现了一些问题: 我们如何处理多个序列? 我们如何处理不同长度的多个序列? 词汇索引是允许模型良好工作的唯一输入吗? 有没有所谓的过长序列? 让我们看看这些问题提出
00211 NLP Course - Tokenizers 00211 NLP Course - Tokenizers
前言分词器是 NLP 管道中的核心组件之一。它们有一个目的:将文本转换成模型可以处理的数据。模型只能处理数字,所以分词器需要将我们的文本输入转换为数值数据。在本节中,我们将探索分词管道中确切发生的事情。 在自然语言处理任务中,通常处理的数据
00210 NLP Course - Models 00210 NLP Course - Models
前言在本节中,我们将更深入地了解如何创建和使用模型。我们将使用 AutoModel 类,这在您想要从检查点实例化任何模型时会非常方便。 AutoModel 类及其所有相关类实际上是对库中可用的各种模型的一种简单封装。它是一个巧妙的封装,因为
00209 NLP Course - Behind the pipeline 00209 NLP Course - Behind the pipeline
前言让我们从一个完整的例子开始,回顾一下我们在第一章执行以下代码时幕后发生了什么: from transformers import pipeline classifier = pipeline("sentiment-analysis")
00208 NLP Course - Introduction 00208 NLP Course - Introduction
前言正如您在第一章中看到的,Transformer模型通常非常大。拥有数百万到数十亿个参数,训练和部署这些模型是一项复杂的任务。此外,每天都有新的模型发布,而且每个模型都有自己的实现方式,尝试它们绝非易事。 🤗 Transformers库
00206 收集的数据集 00206 收集的数据集
前言介绍一些数据集。 Operating System: Ubuntu 22.04.4 LTS 文本Text Generationpre-training datasets LLaMA-Factory/Wiki Demo (en)
00205 NLP Course - Summary 00205 NLP Course - Summary
前言在这一章中,您看到了如何使用 🤗 Transformers 中的高级 pipeline() 函数来处理不同的 NLP 任务。您还学习了如何在 Hub 中搜索和使用模型,以及如何使用 Inference API 在您的浏览器中直接测试模
00204 NLP Course - Bias and limitations 00204 NLP Course - Bias and limitations
前言如果您打算在生产环境中使用预训练模型或微调版本,请注意,虽然这些模型是非常强大的工具,但它们也存在局限性。其中最大的局限性在于,为了能够在大量数据上进行预训练,研究人员通常会尽可能地抓取他们能找到的所有内容,包括互联网上可用的最好和最差
00202 Hugging Face 常用函数 00202 Hugging Face 常用函数
前言简单的介绍Hugging Face - 常用函数。 Operating System: Ubuntu 22.04.4 LTS transformersHfArgumentParserapi link: https://huggingfa
4 / 8