更新时间:2024-08-29 GMT+08:00
什么情况下需要微调
微调的目的是为了提升模型在某个特定任务或领域的表现。在大多数场景下,通过Prompt工程,通用模型也能给出比较满意的回答。但如果您的场景涉及以下几种情况,则建议采用微调的手段来解决:
- 目标任务依赖垂域背景知识:通用模型学习到的知识大部分都是来自互联网上的开源数据,如果目标任务本身属于某个领域(如金融、政务、法律、医疗、工业等),需要依赖很深的领域背景知识,那么通用模型可能无法满足这些要求,需要在该领域的数据集上进行微调,以增强模型的泛化能力。
- 回答的风格或格式有特殊要求:虽然通用模型学习了相当可观的基础知识,但如果目标任务要求回答必须符合特定的风格或格式,这将造成和基础知识的数据分布差异。例如,需要模型使用某银行客服的口吻进行线上问答,此时需要使用符合该银行风格和格式的数据集进行微调,以提升模型的遵循度。
- Prompt工程后,效果仍无法达到预期:当对模型做了大量的Prompt工程,加之目标任务的难度也较高,通用模型的回答可能无法达到预期,此时建议采用目标任务的数据进行微调,以提升模型回答的准确性。
父主题: 典型训练问题和优化策略