Explorar el Código

Default dataset to cleaned alpaca dataset from HF (#202)

Gene Ruebsamen hace 3 años
padre
commit
28eb8cac3c
Se han modificado 1 ficheros con 1 adiciones y 1 borrados
  1. 1 1
      finetune.py

+ 1 - 1
finetune.py

@@ -26,7 +26,7 @@ from transformers import LlamaForCausalLM, LlamaTokenizer  # noqa: F402
 def train(
     # model/data params
     base_model: str = "",  # the only required argument
-    data_path: str = "./alpaca_data_cleaned.json",
+    data_path: str = "yahma/alpaca-cleaned",
     output_dir: str = "./lora-alpaca",
     # training hyperparams
     batch_size: int = 128,