LuYF-Lemon-love の Blog
00251 NLP Course - Training a new tokenizer from an old one 00251 NLP Course - Training a new tokenizer from an old one
前言如果你感兴趣的语言中没有语言模型,或者你的语料库与你的语言模型训练的语料库非常不同,你很可能会想使用适合你数据的标记器从头开始重新训练模型。这将需要在你的数据集上训练一个新的标记器。但这究竟意味着什么呢?当我们在第二章中第一次查看标记器
00250 NLP Course - Introduction 00250 NLP Course - Introduction
前言在第三章中,我们探讨了如何在给定任务上微调模型。当我们这样做时,我们使用与模型预训练时相同的标记器——但是,当我们想从头开始训练一个模型时,我们该怎么办呢?在这些情况下,使用在其他领域或语言语料库上预训练的标记器通常不是最佳选择。例如,
00249 NLP Course - 🤗 Datasets, check! 00249 NLP Course - 🤗 Datasets, check!
前言哇,这真是一次穿越🤗 Datasets库的旅程——恭喜你走了这么远!从本章中获得的知识,你应该能够: 从任何地方加载数据集,无论是Hugging Face Hub、你的笔记本电脑,还是你公司的远程服务器。 使用Dataset.map
00243 NLP Course - Semantic search with FAISS 00243 NLP Course - Semantic search with FAISS
前言在第5节中,我们创建了来自🤗 Datasets仓库的GitHub问题和评论的数据集。在本节中,我们将使用这些信息构建一个搜索引擎,帮助我们找到关于库的最紧迫问题的答案! src link: https://huggingface.co
00242 vLLM 学习笔记 00242 vLLM 学习笔记
前言vLLM是一个快速且易于使用的LLM推理和服务库。 vLLM速度很快: 最先进的服务吞吐量 使用PagedNote有效管理注意力键和值内存 传入请求的连续批处理 使用CUDA/HIP图快速执行模型 量化:GPTQ、A
00241 NLP Course - Creating your own dataset 00241 NLP Course - Creating your own dataset
前言有时,构建一个自然语言处理(NLP)应用程序所需的数据集并不存在,因此你需要自己创建它。在本节中,我们将向你展示如何创建一个GitHub问题的语料库,这些问题通常用于跟踪GitHub仓库中的错误或特性。这个语料库可以用于多种目的,包括:
00240 NLP Course - Big data? 🤗 Datasets to the rescue! 00240 NLP Course - Big data? 🤗 Datasets to the rescue!
前言如今,发现自己正在处理多吉字节数据集的情况并不少见,特别是如果你计划从头开始预训练像 BERT 或 GPT-2 这样的变压器模型。在这些情况下,即使是加载数据也可能是一个挑战。例如,用于预训练 GPT-2 的 WebText 语料库包含
00236 QwQ-32B-Preview 00236 QwQ-32B-Preview
前言QwQ: 思忖未知之界。 github: https://github.com/QwenLM/Qwen2.5 huggingface: https://huggingface.co/collections/Qwen/qwq-67476
00233 Qwen2.5-Coder 00233 Qwen2.5-Coder
前言Qwen2.5-Coder 全系列: 强大、多样、实用。 github: https://github.com/QwenLM/Qwen2.5-Coder huggingface: https://huggingface.co/col
00232 Ollama Python Library 00232 Ollama Python Library
前言The Ollama Python library provides the easiest way to integrate Python 3.8+ projects with Ollama. Operating System: Ub
00231 Ollama 学习笔记 (手动安装) 00231 Ollama 学习笔记 (手动安装)
前言与大型语言模型一起启动并运行。 Operating System: Ubuntu 22.04.4 LTS 参考文档 Ollama ollama - manual install InstallTo install Ollama, ru
00230 Ollama 学习笔记 00230 Ollama 学习笔记
前言与大型语言模型一起启动并运行。 Operating System: Ubuntu 22.04.4 LTS 参考文档 Ollama ollama - github 安装macOS https://ollama.com/download/
2 / 8