3 年前 · 07f5b68e0f
--- a/generate.py
+++ b/generate.py
@@ -1,3 +1,4 @@
 
															+import torch
														
 
															 from peft import PeftModel
														
 
															 from transformers import LLaMATokenizer, LLaMAForCausalLM, GenerationConfig
														
@@ -41,13 +42,14 @@ def evaluate(instruction, input=None, **kwargs):
 
															         num_beams=4,
														
 
															         **kwargs,
														
 
															     )
														
 
															-    generation_output = model.generate(
														
 
															-        input_ids=input_ids,
														
 
															-        generation_config=generation_config,
														
 
															-        return_dict_in_generate=True,
														
 
															-        output_scores=True,
														
 
															-        max_new_tokens=256,
														
 
															-    )
														
 
															+    with torch.no_grad():
														
 
															+        generation_output = model.generate(
														
 
															+            input_ids=input_ids,
														
 
															+            generation_config=generation_config,
														
 
															+            return_dict_in_generate=True,
														
 
															+            output_scores=True,
														
 
															+            max_new_tokens=256,
														
 
															+        )
														
 
															     s = generation_output.sequences[0]
														
 
															     output = tokenizer.decode(s)
														
 
															     return output.split("### Response:")[1].strip()