před 3 roky · a2607faff0
--- a/finetune.py
+++ b/finetune.py
@@ -68,7 +68,7 @@ def generate_prompt(data_point):
 
															 {data_point["output"]}"""
														
 
															-data = data.map(
														
 
															+data = data.shuffle().map(
														
 
															     lambda data_point: tokenizer(
														
 
															         generate_prompt(data_point),
														
 
															         truncation=True,
														
@@ -77,17 +77,9 @@ data = data.map(
 
															     )
														
 
															 )
														
 
															-
														
 
															-train_testvalid = data.train_test_split(test_size=2000, shuffle=True, seed=42)
														
 
															-test_valid = train_testvalid["test"].train_test_split(test_size=1000)
														
 
															-train_data = train_testvalid["train"]
														
 
															-valid_data = test_valid["train"]
														
 
															-test_data = test_valid["test"]
														
 
															-
														
 
															 trainer = transformers.Trainer(
														
 
															     model=model,
														
 
															-    train_dataset=train_data,
														
 
															-    eval_dataset=valid_data,
														
 
															+    train_dataset=data["train"],
														
 
															     args=transformers.TrainingArguments(
														
 
															         per_device_train_batch_size=MICRO_BATCH_SIZE,
														
 
															         gradient_accumulation_steps=GRADIENT_ACCUMULATION_STEPS,
														
@@ -95,7 +87,7 @@ trainer = transformers.Trainer(
 
															         num_train_epochs=EPOCHS,
														
 
															         learning_rate=LEARNING_RATE,
														
 
															         fp16=True,
														
 
															-        logging_steps=10,
														
 
															+        logging_steps=1,
														
 
															         output_dir="lora-alpaca",
														
 
															         save_total_limit=3,
														
 
															     ),