LuYF-Lemon-love の Blog
00331 NLP Course - Introduction 00331 NLP Course - Introduction
前言在第3章中,你了解了如何微调文本分类模型。在本章中,我们将探讨以下常见的语言任务,这些任务对于使用传统的NLP模型和现代的LLM都至关重要: Token classification Masked language modeling
00330 NLP Course - Tokenizers, check! 00330 NLP Course - Tokenizers, check!
前言完成这一章做得很棒! 在深入研究了令牌化器之后,你应该: 能够使用旧的令牌化器作为模板来训练新的令牌化器。 了解如何使用偏移量来将令牌的位置映射到它们在原始文本中的范围。 了解 BPE、WordPiece 和 Unigram 之间的区
00329 从零开始编写 GRPO 00329 从零开始编写 GRPO
前言从零开始编写 GRPO:使用 Qwen2.5-1.5B-Instruct 进行分布式实现的指南 在这个教程中,我们展示了如何使用 GRPO(Group Relative Policy Optimization)方法构建一个分布式强化学
00328 Verilog 组合逻辑和时序逻辑 00328 Verilog 组合逻辑和时序逻辑
前言本文介绍了 Verilog 组合逻辑和时序逻辑。 操作系统:Windows 11 家庭中文版 信号时钟信号(Clock Signal)时钟信号的名称 在Verilog设计中,时钟信号一般用作电路的时序驱动,用于触发寄存器、状态机等时序逻
2025-04-27
00327 exec > >(tee -a ) 2>&1 命令 00327 exec > >(tee -a ) 2>&1 命令
前言exec > >(tee -a ) 2>&1 命令 Operating System: Ubuntu 22.04.4 LTS 介绍这个命令是一个 Bash 的重定向组合,用于将脚本的标准输出(stdout)和标
2025-04-27
00326 tee 命令 00326 tee 命令
前言tee命令 Operating System: Ubuntu 22.04.4 LTS 介绍tee 是 Linux 和类 Unix 系统中的一个常用命令行工具,主要用于将标准输入(stdin)的数据同时输出到标准输出(stdout)和一个
2025-04-27
00325 Hydra - Basic Tutorial 学习笔记 00325 Hydra - Basic Tutorial 学习笔记
前言基本教程涵盖了基本的Hydra概念。 Operating System: Ubuntu 22.04.4 LTS 参考文档 Tutorials intro Basic Tutorial 一个简单的命令行应用程序 link: https:
2025-04-21
00324 Hydra - Getting started 学习笔记 00324 Hydra - Getting started 学习笔记
前言Hydra:用于优雅配置复杂应用程序的框架。 无样板: Hydra让您可以专注于手头的问题,而不是将时间花在命令行标志、加载配置文件、日志记录等样板代码上。 强大的配置: 使用Hydra,您可以动态组合配置,使您能够轻松获得每次运行的
2025-04-21
00323 QwQ-32B: 领略强化学习之力 00323 QwQ-32B: 领略强化学习之力
前言QwQ-32B: 领略强化学习之力。 QWEN CHAT: https://chat.qwen.ai/ Hugging Face: https://huggingface.co/Qwen/QwQ-32B ModelScope: htt
00322 Inference - Chat with models - Templates 学习笔记 00322 Inference - Chat with models - Templates 学习笔记
前言聊天管道指南介绍了TextGenerationPipeline以及与模型对话的聊天提示或聊天模板的概念。在这个高级管道的背后,是apply_chat_template方法。聊天模板是tokenizer的一部分,它指定了如何将对话转换为预
00321 Inference - Chat with models - Chat basics 学习笔记 00321 Inference - Chat with models - Chat basics 学习笔记
前言聊天模型是指你可以发送和接收消息的对话模型。有许多聊天模型可供选择,但一般来说,更大的模型往往表现更好,不过情况并非总是如此。模型大小通常包含在名称中,如“8B”或“70B”,它描述了参数的数量。混合专家模型(MoE)的名称如“8x7B
00320 DeepSpeed-Ulysses (论文学习笔记) 00320 DeepSpeed-Ulysses (论文学习笔记)
前言Microsoft DeepSpeed-Ulysses论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:DeepSpeed Ulysses: System Optimization
2025-04-13
2 / 29