Переглянути джерело

Default dataset to cleaned alpaca dataset from HF (#202)

Gene Ruebsamen 3 роки тому
батько
коміт
28eb8cac3c
1 змінених файлів з 1 додано та 1 видалено
  1. 1 1
      finetune.py

+ 1 - 1
finetune.py

@@ -26,7 +26,7 @@ from transformers import LlamaForCausalLM, LlamaTokenizer  # noqa: F402
 def train(
     # model/data params
     base_model: str = "",  # the only required argument
-    data_path: str = "./alpaca_data_cleaned.json",
+    data_path: str = "yahma/alpaca-cleaned",
     output_dir: str = "./lora-alpaca",
     # training hyperparams
     batch_size: int = 128,