Explorar o código

Default dataset to cleaned alpaca dataset from HF (#202)

Gene Ruebsamen %!s(int64=3) %!d(string=hai) anos
pai
achega
28eb8cac3c
Modificáronse 1 ficheiros con 1 adicións e 1 borrados
  1. 1 1
      finetune.py

+ 1 - 1
finetune.py

@@ -26,7 +26,7 @@ from transformers import LlamaForCausalLM, LlamaTokenizer  # noqa: F402
 def train(
     # model/data params
     base_model: str = "",  # the only required argument
-    data_path: str = "./alpaca_data_cleaned.json",
+    data_path: str = "yahma/alpaca-cleaned",
     output_dir: str = "./lora-alpaca",
     # training hyperparams
     batch_size: int = 128,