Kevin Kwok 3 роки тому
батько
коміт
dde89950f3
1 змінених файлів з 6 додано та 1 видалено
  1. 6 1
      export_state_dict_checkpoint.py

+ 6 - 1
export_state_dict_checkpoint.py

@@ -21,7 +21,12 @@ lora_model = PeftModel.from_pretrained(
     torch_dtype=torch.float16,
 )
 
-lora_model.eval()  # merge weights
+# merge weights
+for layer in lora_model.base_model.model.model.layers:
+    layer.self_attn.q_proj.merge_weights = True
+    layer.self_attn.v_proj.merge_weights = True
+    
+lora_model.train(False)
 
 lora_model_sd = lora_model.state_dict()