|
|
před 3 roky | |
|---|---|---|
| .gitignore | před 3 roky | |
| DATA_LICENSE | před 3 roky | |
| LICENSE | před 3 roky | |
| README.md | před 3 roky | |
| alpaca_data.json | před 3 roky | |
| conversion.py | před 3 roky | |
| finetune.py | před 3 roky | |
| generate.py | před 3 roky | |
| iteration.ipynb | před 3 roky | |
| lengths.ipynb | před 3 roky |
This repository contains code for reproducing the Stanford Alpaca results. Users will need to have LLaMA weights on hand and be ready to fork transformers.
Install dependencies
pip install -q bitsandbytes datasets accelerate loralib
pip install -q git+https://github.com/zphang/transformers@llama_push
pip install -q git+https://github.com/huggingface/peft.git\
Convert weights
python conversion.py --input_dir [LLAMA_DIR]/LLaMA --model_size 7B --output_dir ./7B
Modify hyperparams in finetune.py
MICRO_BATCH_SIZE = 12
BATCH_SIZE = 36
EPOCHS = 3
LEARNING_RATE = 2e-5
Run experiments
python finetune.py