Răsfoiți Sursa

Default dataset to cleaned alpaca dataset from HF (#202)

Gene Ruebsamen 3 ani în urmă
părinte
comite
28eb8cac3c
1 a modificat fișierele cu 1 adăugiri și 1 ștergeri
  1. 1 1
      finetune.py

+ 1 - 1
finetune.py

@@ -26,7 +26,7 @@ from transformers import LlamaForCausalLM, LlamaTokenizer  # noqa: F402
 def train(
     # model/data params
     base_model: str = "",  # the only required argument
-    data_path: str = "./alpaca_data_cleaned.json",
+    data_path: str = "yahma/alpaca-cleaned",
     output_dir: str = "./lora-alpaca",
     # training hyperparams
     batch_size: int = 128,