浏览代码

256 -> 512 -> 256

Eric Wang 3 年之前
父节点
当前提交
3b79ea4029
共有 1 个文件被更改,包括 1 次插入1 次删除
  1. 1 1
      finetune.py

+ 1 - 1
finetune.py

@@ -33,7 +33,7 @@ def train(
     micro_batch_size: int = 4,
     num_epochs: int = 3,
     learning_rate: float = 3e-4,
-    cutoff_len: int = 512,
+    cutoff_len: int = 256,
     val_set_size: int = 2000,
     # lora hyperparams
     lora_r: int = 8,