LuYF-Lemon-love の Blog
00348 Search-o1 (论文学习笔记) 00348 Search-o1 (论文学习笔记)
前言Renmin University of China Search-o1论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:Search-o1: Agentic Search-Enh
2025-07-06
00347 推理模型 gradio 示例 00347 推理模型 gradio 示例
前言推理模型 gradio 示例。 Operating System: Ubuntu 22.04.4 LTS 参考文档 Building with Visibly Thinking LLMs 脚本import os import grad
00346 HippoRAG 2 (论文学习笔记) 00346 HippoRAG 2 (论文学习笔记)
前言The Ohio State University HippoRAG 2论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:From RAG to Memory: Non-Param
2025-06-24
00345 Dr. GRPO (论文学习笔记) 00345 Dr. GRPO (论文学习笔记)
前言National University of Singapore Dr. GRPO论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:Understanding R1-Zero-Li
2025-06-08
00344 Seed1.5-Thinking (论文学习笔记) 00344 Seed1.5-Thinking (论文学习笔记)
前言ByteDance Seed1.5-Thinking论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:Seed1.5-Thinking: Advancing Superb Reas
2025-06-08
00343 VAPO (论文学习笔记) 00343 VAPO (论文学习笔记)
前言ByteDance VAPO论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:VAPO: Efficient and Reliable Reinforcement Learning
2025-06-05
00342 YaRN (论文学习笔记) 00342 YaRN (论文学习笔记)
前言EleutherAI YaRN论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:YaRN: Efficient Context Window Extension of Large
2025-06-01
00341 FastAPI教程 00341 FastAPI教程
前言FastAPI 教程:将 Python 函数封装为 API。 Operating System: Ubuntu 22.04.4 LTS 将 Python 函数封装为 API1. FastAPI 简介FastAPI 是一个现代、快速(高
2025-06-01
00340 python monkey patch 00340 python monkey patch
前言python monkey patch。 Operating System: Ubuntu 22.04.4 LTS Python Monkey Patch 详解Monkey Patch(猴子补丁) 是一种在运行时动态修改代码的技术,允许
2025-05-31
00339 linux查看两个文件差异的命令 00339 linux查看两个文件差异的命令
前言linux查看两个文件差异的命令。 Operating System: Ubuntu 22.04.4 LTS 命令在 Linux 中,查看两个文件差异的常用命令是 diff,此外还有 vimdiff 和 colordiff 等工具。以下
2025-05-31
00338 RLOO 公式推导 00338 RLOO 公式推导
问题描述:详细推理下面的公式 ✅ 推导过程: 原始公式 第一步:展开 $\tilde{A}_{i,t}$假设 即 $\tilde{A}_{i,t}$ 是当前样本的reward减去所有样本reward的平均。 第二步:将 $\tild
2025-05-12
00337 GRPO (论文学习笔记) 00337 GRPO (论文学习笔记)
前言DeepSeek-AI GRPO论文的学习笔记。 Operating System: Ubuntu 22.04.4 LTS 信息论文题目:DeepSeekMath: Pushing the Limits of Mathematical
2025-05-10
3 / 31