LuYF-Lemon-love の Blog
00278 DeepSeek-R1:通过强化学习激励LLM中的推理能力 (论文学习笔记) 00278 DeepSeek-R1:通过强化学习激励LLM中的推理能力 (论文学习笔记)
前言DeepSeek-AI DeepSeek-R1:通过强化学习激励LLM中的推理能力论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:DeepSeek-R1: Incentivizi
2025-01-30
00277 OpenR:用于大型语言模型高级推理的开源框架 (论文学习笔记) 00277 OpenR:用于大型语言模型高级推理的开源框架 (论文学习笔记)
前言University College London OpenR:用于大型语言模型高级推理的开源框架论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:OpenR: An Open S
2025-01-28
00276 istyle-verilog-formatter 格式化 verilog 代码 00276 istyle-verilog-formatter 格式化 verilog 代码
前言Verilog源代码的快速免费自动格式化。 操作系统:Windows 11 家庭中文版 参考文档 thomasrussellmurphy/istyle-verilog-formatter SystemVerilog Forma
2025-01-24
00275 np.random 学习笔记 00275 np.random 学习笔记
前言介绍 np.random。 Operating System: Ubuntu 22.04.4 LTS 参考文档np.random.RandomStatenp.random.RandomState 是 NumPy 库中的一个类,它用于生成
2025-01-21
00274 通过自动过程监督改进语言模型中的数学推理 (论文学习笔记) 00274 通过自动过程监督改进语言模型中的数学推理 (论文学习笔记)
前言DeepMind 通过自动过程监督改进语言模型中的数学推理论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:Improve Mathematical Reasoning in La
2025-01-20
00273 Qwen2.5-Coder技术报告 (论文学习笔记) 00273 Qwen2.5-Coder技术报告 (论文学习笔记)
前言AlibabaGroup Qwen2.5-Coder技术报告论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:Qwen2.5-Coder Technical Report 发表年份
2025-01-20
00272 Python random 库 00272 Python random 库
前言Python 的 random 模块是一个非常实用的模块,它提供了生成随机数的工具。以下是一些基本的 random 模块教程. Operating System: Ubuntu 22.04.4 LTS 参考文档 random — 生成伪
2025-01-19
00271 PEFT - Fine-tune large models using 🤗 peft adapters, transformers & bitsandbytes 00271 PEFT - Fine-tune large models using 🤗 peft adapters, transformers & bitsandbytes
前言在本教程中,我们将介绍如何使用最新的peft库和bitsandbytes库以8位格式加载大型模型,进而对大型语言模型进行微调。微调方法将依赖于一种最近的方法,称为“低秩适配器”(LoRA)。您无需微调整个模型,只需微调这些适配器并将它们
00270 PEFT - Quicktour 00270 PEFT - Quicktour
前言PEFT(参数高效微调)是一个库,它能够高效地将大型预训练模型适配到各种下游应用,而无需微调模型的所有参数,因为这样做成本过高。PEFT方法仅微调少量(额外)的模型参数,显著降低计算和存储成本,同时还能达到与完全微调模型相当的性能。这使
00269 Python MethodType 方法 00269 Python MethodType 方法
前言Python MethodType 方法. Operating System: Ubuntu 22.04.4 LTS 参考文档介绍MethodType 是 Python 标准库 types 模块中的一个类,它用于表示一个绑定到具体实例的
2025-01-16
00268 linux查看操作系统的命令 00268 linux查看操作系统的命令
前言linux查看操作系统的命令. Operating System: Ubuntu 22.04.4 LTS 参考文档在Linux操作系统中,您可以使用多个命令来查看操作系统的相关信息。以下是一些常用的命令: uname -a:显示全部的
2025-01-16
00267 Python chain函数 00267 Python chain函数
前言Python chain 函数. Operating System: Ubuntu 22.04.4 LTS 参考文档介绍在Python中,chain函数是itertools模块中的一个功能,它可以用来将多个可迭代对象连接成一个迭代器,这
2025-01-16
6 / 29