00194 NLP Course - Sequence-to-sequence models ubuntu

发表于2024-10-09|更新于2024-10-09|持续维护的工具学习笔记

|字数总计:287|阅读时长:1分钟

前言

编码器-解码器模型（也称为序列到序列模型）使用了Transformer架构的两部分。在每一个阶段，编码器的注意力层可以访问初始句子中的所有单词，而解码器的注意力层只能访问输入中给定单词之前的单词。

这些模型的预训练可以使用编码器或解码器模型的目标来进行，但通常涉及更复杂的方法。例如，T5模型通过用单个特殊掩码词替换文本中的随机跨度（可能包含多个单词）来进行预训练，然后目标就是预测这个掩码词所替代的文本。

序列到序列模型最适合围绕根据给定输入生成新句子的任务，例如摘要、翻译或生成式问题回答。

这个家族模型的代表包括：

src link: https://huggingface.co/learn/nlp-course/chapter1/7

Operating System: Ubuntu 22.04.4 LTS

参考文档

NLP Course - Sequence-to-sequence models

结语

第一百九十四篇博文写完，开心！！！！

今天，也是充满希望的一天。

文章作者: LuYF-Lemon-love

文章链接: https://luyf-lemon-love.space/311254883/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 LuYF-Lemon-love の Blog！

人工智能深度学习大语言模型 huggingface

打赏

wechat
alipay

相关推荐

00121 学习笔记目录 windows11

00206 收集的数据集 - ubuntu

00224 NLP Course - Part 1 completed! ubuntu

00223 NLP Course - Building a model card ubuntu

00222 NLP Course - Sharing pretrained models ubuntu

00221 NLP Course - Using pretrained models ubuntu

数据库加载中