LuYF-Lemon-love の Blog
00335 收集的 pytorch 函数——create_completion_mask 00335 收集的 pytorch 函数——create_completion_mask
前言介绍create_completion_mask函数。 Operating System: Ubuntu 22.04.4 LTS 函数原型def create_completion_mask(completion_ids, eos_to
2025-05-05
00334 accelerator.gather和accelerator.wait_for_everyone 00334 accelerator.gather和accelerator.wait_for_everyone
前言介绍accelerator.gather函数和accelerator.wait_for_everyone函数 Operating System: Ubuntu 22.04.4 LTS accelerator.gatheraccelera
00333 NLP Course - Training a causal language model from scratch 00333 NLP Course - Training a causal language model from scratch
前言到目前为止,我们主要使用预训练模型,并通过重用预训练的权重来微调它们以适用于新的用例。正如我们在第一章中看到的,这通常被称为迁移学习,这是一种非常成功的策略,用于将Transformer模型应用于大多数现实世界的用例,其中标记数据稀缺。
00332 NLP Course - Summarization 00332 NLP Course - Summarization
前言在这一部分,我们将探讨如何使用Transformer模型将长文档浓缩成摘要,这一任务被称为文本摘要。这是自然语言处理中最具挑战性的任务之一,因为它需要多种能力,如理解长篇文章并生成连贯的文本,抓住文档中的主要主题。然而,当做得好时,文本
00331 NLP Course - Introduction 00331 NLP Course - Introduction
前言在第3章中,你了解了如何微调文本分类模型。在本章中,我们将探讨以下常见的语言任务,这些任务对于使用传统的NLP模型和现代的LLM都至关重要: Token classification Masked language modeling
00330 NLP Course - Tokenizers, check! 00330 NLP Course - Tokenizers, check!
前言完成这一章做得很棒! 在深入研究了令牌化器之后,你应该: 能够使用旧的令牌化器作为模板来训练新的令牌化器。 了解如何使用偏移量来将令牌的位置映射到它们在原始文本中的范围。 了解 BPE、WordPiece 和 Unigram 之间的区
00329 从零开始编写 GRPO 00329 从零开始编写 GRPO
前言从零开始编写 GRPO:使用 Qwen2.5-1.5B-Instruct 进行分布式实现的指南 在这个教程中,我们展示了如何使用 GRPO(Group Relative Policy Optimization)方法构建一个分布式强化学
00328 Verilog 组合逻辑和时序逻辑 00328 Verilog 组合逻辑和时序逻辑
前言本文介绍了 Verilog 组合逻辑和时序逻辑。 操作系统:Windows 11 家庭中文版 信号时钟信号(Clock Signal)时钟信号的名称 在Verilog设计中,时钟信号一般用作电路的时序驱动,用于触发寄存器、状态机等时序逻
2025-04-27
00327 exec > >(tee -a ) 2>&1 命令 00327 exec > >(tee -a ) 2>&1 命令
前言exec > >(tee -a ) 2>&1 命令 Operating System: Ubuntu 22.04.4 LTS 介绍这个命令是一个 Bash 的重定向组合,用于将脚本的标准输出(stdout)和标
2025-04-27
00326 tee 命令 00326 tee 命令
前言tee命令 Operating System: Ubuntu 22.04.4 LTS 介绍tee 是 Linux 和类 Unix 系统中的一个常用命令行工具,主要用于将标准输入(stdin)的数据同时输出到标准输出(stdout)和一个
2025-04-27
00325 Hydra - Basic Tutorial 学习笔记 00325 Hydra - Basic Tutorial 学习笔记
前言基本教程涵盖了基本的Hydra概念。 Operating System: Ubuntu 22.04.4 LTS 参考文档 Tutorials intro Basic Tutorial 一个简单的命令行应用程序 link: https:
2025-04-21
00324 Hydra - Getting started 学习笔记 00324 Hydra - Getting started 学习笔记
前言Hydra:用于优雅配置复杂应用程序的框架。 无样板: Hydra让您可以专注于手头的问题,而不是将时间花在命令行标志、加载配置文件、日志记录等样板代码上。 强大的配置: 使用Hydra,您可以动态组合配置,使您能够轻松获得每次运行的
2025-04-21
2 / 29