LuYF-Lemon-love の Blog
00271 PEFT - Fine-tune large models using 🤗 peft adapters, transformers & bitsandbytes 00271 PEFT - Fine-tune large models using 🤗 peft adapters, transformers & bitsandbytes
前言在本教程中,我们将介绍如何使用最新的peft库和bitsandbytes库以8位格式加载大型模型,进而对大型语言模型进行微调。微调方法将依赖于一种最近的方法,称为“低秩适配器”(LoRA)。您无需微调整个模型,只需微调这些适配器并将它们
00270 PEFT - Quicktour 00270 PEFT - Quicktour
前言PEFT(参数高效微调)是一个库,它能够高效地将大型预训练模型适配到各种下游应用,而无需微调模型的所有参数,因为这样做成本过高。PEFT方法仅微调少量(额外)的模型参数,显著降低计算和存储成本,同时还能达到与完全微调模型相当的性能。这使
00269 Python MethodType 方法 00269 Python MethodType 方法
前言Python MethodType 方法. Operating System: Ubuntu 22.04.4 LTS 参考文档介绍MethodType 是 Python 标准库 types 模块中的一个类,它用于表示一个绑定到具体实例的
2025-01-16
00268 linux查看操作系统的命令 00268 linux查看操作系统的命令
前言linux查看操作系统的命令. Operating System: Ubuntu 22.04.4 LTS 参考文档在Linux操作系统中,您可以使用多个命令来查看操作系统的相关信息。以下是一些常用的命令: uname -a:显示全部的
2025-01-16
00267 Python chain函数 00267 Python chain函数
前言Python chain 函数. Operating System: Ubuntu 22.04.4 LTS 参考文档介绍在Python中,chain函数是itertools模块中的一个功能,它可以用来将多个可迭代对象连接成一个迭代器,这
2025-01-16
00266 NLP Course - Byte-Pair Encoding tokenization 00266 NLP Course - Byte-Pair Encoding tokenization
前言字节对编码(Byte-Pair Encoding,BPE)最初是作为一种文本压缩算法开发的,然后被OpenAI用于在预训练GPT模型时进行分词。它被许多Transformer模型使用,包括GPT、GPT-2、RoBERTa、BART和D
00265 difflib --- 计算差异的辅助工具 00265 difflib --- 计算差异的辅助工具
前言此模块提供用于比较序列的类和函数。 例如,它可被用于比较文件,并可产生多种格式的不同文件差异信息,包括 HTML 和上下文以及统一的 diff 数据。 有关比较目录和文件,另请参阅 filecmp 模块。 Operating Syste
2025-01-11
00264 处理文本数据 00264 处理文本数据
前言本指南展示了处理文本数据集的特定方法。学习如何: 使用 map() 对数据集进行分词。 为 NLI 数据集将数据集标签与标签 ID 对齐。 有关如何处理任何类型数据集的指南,请查看通用处理指南。 src link: https://
00263 NLP Course - Normalization and pre-tokenization 00263 NLP Course - Normalization and pre-tokenization
前言在深入探讨 Transformer 模型中常用的三种最常见的子词分词算法(Byte-Pair Encoding [BPE],WordPiece 和 Unigram)之前,我们首先来看看每个分词器对文本应用的预处理步骤。以下是分词管道中步
00262 roc_auc_score 函数 00262 roc_auc_score 函数
前言roc_auc_score 函数. Operating System: Ubuntu 22.04.4 LTS 参考文档介绍roc_auc_score 是一个在机器学习中常用的评估指标,它用于衡量分类模型的好坏,特别是在不平衡数据集的情况
2025-01-11
00261 Python __hash__ 方法 00261 Python __hash__ 方法
前言Python __hash__ 方法. Operating System: Ubuntu 22.04.4 LTS 参考文档介绍在Python中,__hash__ 方法是一个特殊的方法,用于定义一个类的实例如何被哈希化。哈希化是用于快速比
2025-01-11
00260 Python UUID 函数 00260 Python UUID 函数
前言Python UUID 函数. Operating System: Ubuntu 22.04.4 LTS 参考文档介绍在Python中,UUID(Universally Unique Identifier)是一种用于生成唯一标识符的机制
2025-01-11
3 / 25