我的梦想
不是每个人都应该像我这样去建造一座水晶大教堂,但是每个人都应该拥有自己的梦想,设计自己的梦想,追求自己的梦想,实现自己的梦想。梦想是生命的灵魂,是心灵的灯塔,是引导人走向成功的信仰。有了崇高的梦想,只要矢志不渝地追求,梦想就会成为现实,奋斗就会变成壮举,生命就会创造奇迹。——罗伯·舒乐
  推荐文章
计算机基础

00075-谈谈我对攻读计算机研究生的看法——转载

前言一篇上古年代(04年左右)的关于攻读计算机研究生看法的文章,其中关于如何学习计算机的看法在我看来至今受用,因此特此转载与诸君共勉。 我参考的版本为(参考文档是我在网上

阅读更多
动态壁纸

00155 动态壁纸目录

前言介绍一些收集的动态壁纸。 动态壁纸主要收集于喜雨虫,可以使用Lively Wallpaper作为动态壁纸的软件。 所有的壁纸可以从 h

阅读更多
干饭

00188 干饭指南目录

前言介绍一些美食的制作方法。 Operating System: Ubuntu 22.04.4 LTS 素菜 00181 干饭指南 - 炒茄

阅读更多
大语言模型

00121 学习笔记目录

前言学习笔记目录,包含论文笔记. 操作系统:Windows 11 家庭中文版 论文学习笔记 00122 神经语言模型的缩放定律 (论文学习笔记): 神经语言模型的缩放定律

阅读更多
大语言模型

00206 收集的数据集

前言介绍一些数据集。 Operating System: Ubuntu 22.04.4 LTS 文本Text Generationpre-t

阅读更多
杂项

00076-学习过程中收集的一些优秀工具网站

前言学习过程中收集的一些优秀工具网站。 操作系统:Windows 10 专业版 .green-details {

阅读更多
刷题

00113 LeetCode 刷题笔记 Python 版本

前言自己的 LeetCode 刷题记录. LeetCode 官网: https://leetcode.cn/ 。 我一共刷了150+236+12=398道题:

阅读更多
00325 Hydra - Basic Tutorial 学习笔记 00325 Hydra - Basic Tutorial 学习笔记
前言基本教程涵盖了基本的Hydra概念。 Operating System: Ubuntu 22.04.4 LTS 参考文档 Tutorials intro Basic Tutorial 一个简单的命令行应用程序 link: https:
2025-04-21
00324 Hydra - Getting started 学习笔记 00324 Hydra - Getting started 学习笔记
前言Hydra:用于优雅配置复杂应用程序的框架。 无样板: Hydra让您可以专注于手头的问题,而不是将时间花在命令行标志、加载配置文件、日志记录等样板代码上。 强大的配置: 使用Hydra,您可以动态组合配置,使您能够轻松获得每次运行的
2025-04-21
00323 QwQ-32B: 领略强化学习之力 00323 QwQ-32B: 领略强化学习之力
前言QwQ-32B: 领略强化学习之力。 QWEN CHAT: https://chat.qwen.ai/ Hugging Face: https://huggingface.co/Qwen/QwQ-32B ModelScope: htt
00322 Inference - Chat with models - Templates 学习笔记 00322 Inference - Chat with models - Templates 学习笔记
前言聊天管道指南介绍了TextGenerationPipeline以及与模型对话的聊天提示或聊天模板的概念。在这个高级管道的背后,是apply_chat_template方法。聊天模板是tokenizer的一部分,它指定了如何将对话转换为预
00321 Inference - Chat with models - Chat basics 学习笔记 00321 Inference - Chat with models - Chat basics 学习笔记
前言聊天模型是指你可以发送和接收消息的对话模型。有许多聊天模型可供选择,但一般来说,更大的模型往往表现更好,不过情况并非总是如此。模型大小通常包含在名称中,如“8B”或“70B”,它描述了参数的数量。混合专家模型(MoE)的名称如“8x7B
00320 DeepSpeed-Ulysses (论文学习笔记) 00320 DeepSpeed-Ulysses (论文学习笔记)
前言Microsoft DeepSpeed-Ulysses论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:DeepSpeed Ulysses: System Optimization
2025-04-13
00319 DAPO (论文学习笔记) 00319 DAPO (论文学习笔记)
前言ByteDance DAPO论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:DAPO: An Open-Source LLM Reinforcement Learning Sys
2025-04-07
00318 HybridFlow (论文学习笔记) 00318 HybridFlow (论文学习笔记)
前言ByteDance HybridFlow论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:HybridFlow: A Flexible and Efficient RLHF Fra
2025-04-04
00317 Mermaid语法的入门教程 00317 Mermaid语法的入门教程
前言Mermaid语法的入门教程。 官方文档:https://mermaid.js.org 在线调试:https://mermaid.live Operating System: Ubuntu 22.04.4 LTS 参考文档入门教程Mer
2025-03-26
00316 NLP Course - Building a tokenizer, block by block 00316 NLP Course - Building a tokenizer, block by block
前言正如我们在前面的部分所看到的,分词包括几个步骤: 标准化(对文本进行必要的清理,例如删除空格或重音、Unicode 标准化等) 预分词(将输入分解为单词) 通过模型运行输入(使用预分词的单词生成一系列标记) 后处理(添加分词器的特殊标
00315 NLP Course - Unigram tokenization 00315 NLP Course - Unigram tokenization
前言Unigram算法通常用于SentencePiece中,这是AlBERT、T5、mBART、Big Bird和XLNet等模型使用的分词算法。 💡 本节深入介绍了Unigram算法,甚至展示了一个完整的实现。如果您只想了解分词算法的
00314 NLP Course - WordPiece tokenization 00314 NLP Course - WordPiece tokenization
前言WordPiece是谷歌开发用于预训练BERT的标记化算法。自那以后,它在许多基于BERT的Transformer模型中得到了重新使用,例如DistilBERT、MobileBERT、Funnel Transformers和MPNET。
1 / 28