hace 3 años · c83e30ab78
--- a/generate.py
+++ b/generate.py
@@ -10,6 +10,9 @@ from transformers import LlamaTokenizer, LlamaForCausalLM, GenerationConfig
 
				 
			
 
				 tokenizer = LlamaTokenizer.from_pretrained("decapoda-research/llama-7b-hf")
			
 
				 
			
 
				+BASE_MODEL = "decapoda-research/llama-7b-hf"
			
 
				+LORA_WEIGHTS = "tloen/alpaca-lora-7b"
			
 
				+
			
 
				 if torch.cuda.is_available():
			
 
				     device = "cuda"
			
 
				 else:
			
@@ -23,33 +26,31 @@ except:
 
				 
			
 
				 if device == "cuda":
			
 
				     model = LlamaForCausalLM.from_pretrained(
			
 
				-        "decapoda-research/llama-7b-hf",
			
 
				+        "chavinlo/alpaca-native",
			
 
				         load_in_8bit=True,
			
 
				         torch_dtype=torch.float16,
			
 
				         device_map="auto",
			
 
				     )
			
 
				-    model = PeftModel.from_pretrained(
			
 
				-        model, "tloen/alpaca-lora-7b", torch_dtype=torch.float16
			
 
				-    )
			
 
				+    # model = PeftModel.from_pretrained(model, LORA_WEIGHTS, torch_dtype=torch.float16)
			
 
				 elif device == "mps":
			
 
				     model = LlamaForCausalLM.from_pretrained(
			
 
				-        "decapoda-research/llama-7b-hf",
			
 
				+        BASE_MODEL,
			
 
				         device_map={"": device},
			
 
				         torch_dtype=torch.float16,
			
 
				     )
			
 
				     model = PeftModel.from_pretrained(
			
 
				         model,
			
 
				-        "tloen/alpaca-lora-7b",
			
 
				+        LORA_WEIGHTS,
			
 
				         device_map={"": device},
			
 
				         torch_dtype=torch.float16,
			
 
				     )
			
 
				 else:
			
 
				     model = LlamaForCausalLM.from_pretrained(
			
 
				-        "decapoda-research/llama-7b-hf", device_map={"": device}, low_cpu_mem_usage=True
			
 
				+        BASE_MODEL, device_map={"": device}, low_cpu_mem_usage=True
			
 
				     )
			
 
				     model = PeftModel.from_pretrained(
			
 
				         model,
			
 
				-        "tloen/alpaca-lora-7b",
			
 
				+        LORA_WEIGHTS,
			
 
				         device_map={"": device},
			
 
				     )
			
 
				 
			
@@ -75,6 +76,8 @@ def generate_prompt(instruction, input=None):
 
				 
			
 
				 
			
 
				 model.eval()
			
 
				+if torch.__version__ >= "2":
			
 
				+    model = torch.compile(model)
			
 
				 
			
 
				 
			
 
				 def evaluate(