训练tokenizer文件说明
ChatGLMv3-6B
在训练开始前,针对ChatGLMv3-6B模型中的tokenizer文件,需要修改代码。修改文件chatglm3-6b/tokenization_chatglm.py 。
271行要添加注释,修改后如图1所示。
291至300行要修改,修改后如图2所示。
Qwen系列
在进行HuggingFace权重转换Megatron前,针对Qwen系列模型中的tokenizer 文件,需要修改代码。
修改tokenizer目录下面modeling_qwen.py文件的第38和39行,修改后如图3所示。