LoRa 学习笔记

LoRa是什么？

LoRA，出自论文《LoRA: Low-Rank Adaptation of Large Language Models》，是Microsoft 于 2021 年推出的一项新技术，用于微调大型语言模型 (LLM)。
比如，GPT-3有1750亿参数，为了让它能干特定领域的活儿，需要做微调，但是如果直接对GPT-3做微调，成本太高太麻烦了。
LoRA的做法是，冻结预训练好的模型权重参数，然后在每个Transformer（Transforme就是GPT的那个T）块里注入可训练的层，由于不需要对模型的权重参数重新计算梯度，所以，大大减少了需要训练的计算量。
研究发现，LoRA的微调质量与全模型微调相当，我愿称之为神器。
要做个比喻的话，就好比是大模型的一个小模型，或者说是一个插件。
LoRA本来是给大语言模型准备的，但把它用在cross-attention layers（交叉关注层）也能影响用文字生成图片的效果。