前言到目前为止,我们主要使用预训练模型,并通过重用预训练的权重来微调它们以适用于新的用例。正如我们在第一章中看到的,这通常被称为迁移学习,这是一种非常成功的策略,用于将Transformer模型应用于大多数现实世界的用例,其中标记数据稀缺。
2025-05-05