前言

学习笔记目录,包含论文笔记。

操作系统:Windows 11 家庭中文版

Linux & Windows

  1. 00163 如何使用WSL在Windows上安装Linux windows11: 如何使用WSL在Windows上安装Linux。

LaTex

  1. 00114 初识 LaTeX-ubuntu: 初识 LaTex,主要集中于基础语法知识。
  2. 00115 利用 LaTeX 做 PPT (Beamer)-ubuntu: 基于 Beamer,利用 LaTex 做 PPT。
  3. 00116 Beamer 主题-ubuntu: 介绍一些 Beamer 主题。
  4. 00118 本地配置 LaTeX 环境-windows11: 利用 VSCode 在本地配置 LaTex 编译环境。

Github

  1. 00117 Github 主页设置贪吃蛇详细教程-windows11: 如何在 Github 主页上设置贪吃蛇。
  2. 00119 常用的 GitHub Workflows windows11: 常用的 GitHub Workflows。

Python

  1. 00120 Python 日期和时间 windows11: Python 日期和时间。
  2. 00164 Python concurrent 包 学习笔记 windows11: concurrent.futures — 启动并行任务。
  3. 00169 argparse 学习笔记 ubuntu: argparse — 用于命令行选项、参数和子命令的解析器。
  4. 00166 PEP 8 – Style Guide for Python Code windows11: PEP 8-Python代码样式指南。
  5. 00167 在VS Code中格式化Python windows11: 在VS Code中格式化Python
  6. 00148 Python Fire 学习笔记 windows11: Python Fire是一个库,用于从绝对任何Python对象自动生成命令行界面(CLI)。

论文学习笔记

  1. 00122 神经语言模型的缩放定律 (论文学习笔记) windows11: 神经语言模型的缩放定律(2020)。
  2. 00123 零冗余优化器 论文学习笔记 windows11: 零冗余优化器(2020)。
  3. 00124 MiniCPM 论文学习笔记 windows11: MiniCPM 小型的语言模型(2024)。
  4. 00125 Phi-3 论文学习笔记 windows11: Phi-3 小型的语言模型(2024)。
  5. 00168 ChatGLM 论文学习笔记 ubuntu: ChatGLM 语言模型(2024)。

PyTorch

  1. 00149 Fully Sharded Data Parallel(FSDP) 学习笔记 windows11: Fully Sharded Data Parallel(FSDP) 学习笔记。

Hugging Face

教程

  1. 00147 预处理数据 windows11: 预处理数据。
  2. 00126 微调预训练模型 windows11: 微调预训练模型。
  3. 00127 🤗 加速分布式训练 windows11: 🤗 加速分布式训练。
  4. 00128 使用 🤗 PEFT 加载adapters windows11: 使用 🤗 PEFT加载adapters。

指南

  1. 00142 共享自定义模型 windows11: 共享自定义模型。
  2. 00143 文本生成策略 windows11: 文本生成策略。

任务

  1. 00129 文本分类 windows11: 文本分类。
  2. 00130 Token 分类 windows11: Token 分类。
  3. 00131 问答 windows11: 问答。
  4. 00132 因果语言建模 windows11: 因果语言建模。
  5. 00133 掩码语言建模 windows11: 掩码语言建模。
  6. 00134 翻译 windows11: 翻译。

性能和可扩展性

训练

  1. 00135 性能与可扩展性 windows11: 性能与可扩展性。
  2. 00136 在单个GPU上进行高效训练的方法和工具 windows11: 在单个GPU上进行高效训练的方法。
  3. 00137 在多个GPU上进行高效训练 windows11: 在多个GPU上进行高效训练的方法。
  4. 00138 完全分片数据并行 windows11: 完全分片数据并行。
  5. 00139 DeepSpeed windows11: DeepSpeed。

推理

  1. 00140 CPU 推理 windows11: CPU推理。
  2. 00141 GPU 推理 windows11: GPU推理。

博客

  1. 00144 ChatGPT 背后的“功臣”——RLHF 技术详解 windows11: ChatGPT 背后的“功臣”——RLHF 技术详解。
  2. 00152 “StackLLaMA”: 用 RLHF 训练 LLaMA 的手把手教程 windows11: 用 RLHF 训练 LLaMA 的手把手教程。
  3. 00150 使用 DPO 微调 Llama 2 windows11: 使用 DPO 微调 Llama 2。
  4. 🤗 PEFT:在低资源硬件上对十亿规模模型进行参数高效微调: 在低资源硬件上对十亿规模模型进行参数高效微调。
  5. 00162 大规模 Transformer 模型 8 比特矩阵乘简介 windows11: 大规模 Transformer 模型 8 比特矩阵乘简介 - 基于 Hugging Face Transformers、Accelerate 以及 bitsandbytes。
  6. 00151 面向生产的 LLM 优化 windows11: 面向生产的 LLM 优化。
  7. 00161 How to generate text: using different decoding methods for language generation with Transformers - windows11: 通过 Transformers 用不同的解码方法生成文本。
  8. 00153 开源大语言模型作为 LangChain 智能体 windows11: 开源大语言模型作为 LangChain 智能体。
  9. 00146 Cheat Sheet: Mastering Temperature and Top_p in ChatGPT API windows11: 掌握ChatGPTAPI中的温度和Top_p。

求学时的岁月

  1. 00094-读的论文清单-windows10:读研时阅读过的论文。

结语

第一百二十一篇博文写完,开心!!!!

今天,也是充满希望的一天。