Gene Ruebsamen
|
28eb8cac3c
Default dataset to cleaned alpaca dataset from HF (#202)
|
3 vuotta sitten |
Claudio Aracena
|
17c5f8a31f
Add spanish alpaca lora 13b link (#201)
|
3 vuotta sitten |
Eric J. Wang
|
345c8fbb7b
Remove tagline from README
|
3 vuotta sitten |
Jiaxin Shan
|
4a3c7e2231
Add option to share Gradio demo publicly (#189)
|
3 vuotta sitten |
Eric J. Wang
|
f3876137f7
Clarify that dataset is still ODC-By
|
3 vuotta sitten |
кѳѳsнī
|
55b664f46f
Enabling model parallelism (training 30b on 2x 3090s and beyond) (#131)
|
3 vuotta sitten |
Eric Wang
|
3b79ea4029
256 -> 512 -> 256
|
3 vuotta sitten |
Eric Wang
|
804d22ad43
remove asserts
|
3 vuotta sitten |
Angainor Development
|
69b9d9ea8b
Fix a warning (#186)
|
3 vuotta sitten |
Eric J. Wang
|
dbd04f3560
Fix linters (#185)
|
3 vuotta sitten |
NanoCode012
|
69b31e0fed
Feat: Add wandb (#168)
|
3 vuotta sitten |
Eric J. Wang
|
95b30a256c
Fix lint.yml
|
3 vuotta sitten |
claysauruswrecks
|
1310547f9f
Add HF dataset loading, add linters, pyproject.toml (#175)
|
3 vuotta sitten |
Xie Zejian
|
b00629d773
Add Chinese 13b lora link (#178)
|
3 vuotta sitten |
Angainor Development
|
9d6b822019
Avoid a deprecation warning (#181)
|
3 vuotta sitten |
Eric Wang
|
683810b4a1
Print warning on checkpoint not found
|
3 vuotta sitten |
Eric Wang
|
da6b427a08
resume_from_checkpoint
|
3 vuotta sitten |
Eric Wang
|
b948f892ba
restore default settings
|
3 vuotta sitten |
Eric J. Wang
|
d358124af6
Add dotslash to example data_path
|
3 vuotta sitten |
Eric J. Wang
|
5fa807d106
Use CLI arguments (#159)
|
3 vuotta sitten |
Andrea Santilli
|
e2f07029aa
Add Italian 7b model to readme (#156)
|
3 vuotta sitten |
Eric J. Wang
|
af30df1999
Unified tokenizer update PR (#146)
|
3 vuotta sitten |
Martin Thissen
|
d3760cd84a
Added fine-tuned7b model for German language (#134)
|
3 vuotta sitten |
Thaweewat
|
6853b8802e
Add Thai weight URL on READ.ME (#132)
|
3 vuotta sitten |
Eric Wang
|
fcdb143f1f
Amend README
|
3 vuotta sitten |
Eric Wang
|
72aabcb5a4
Remove LLaMA download code, as a precaution
|
3 vuotta sitten |
Eric Wang
|
8955a9c5a1
bos, eos in generate.py
|
3 vuotta sitten |
Eric J. Wang
|
1384a4d24c
Update README.md for multi-GPU training
|
3 vuotta sitten |
bofeng huang
|
c7eabb86e2
Add french version "vigogne" (#127)
|
3 vuotta sitten |
Eric J. Wang
|
a74793c571
Rearrange resources on README, add 13B-30B models
|
3 vuotta sitten |