Eric Wang
|
72aabcb5a4
Remove LLaMA download code, as a precaution
|
3 vuotta sitten |
Eric Wang
|
8955a9c5a1
bos, eos in generate.py
|
3 vuotta sitten |
Eric J. Wang
|
1384a4d24c
Update README.md for multi-GPU training
|
3 vuotta sitten |
bofeng huang
|
c7eabb86e2
Add french version "vigogne" (#127)
|
3 vuotta sitten |
Eric J. Wang
|
a74793c571
Rearrange resources on README, add 13B-30B models
|
3 vuotta sitten |
Eric Wang
|
b12c3b90f8
Unwind input masking to avoid confusion
|
3 vuotta sitten |
Eric Wang
|
e04897baae
fix fp16 inference
|
3 vuotta sitten |
Eric J. Wang
|
052da42cbb
Replace Colab with HF in README
|
3 vuotta sitten |
Eric Wang
|
7fb06c6c22
Revert "Mask out prompt tokens for real"
|
3 vuotta sitten |
Eric Wang
|
2204a71505
set EPOCHS back to 3
|
3 vuotta sitten |
Eric Wang
|
4a712d4d8e
Mask out prompt tokens for real
|
3 vuotta sitten |
Eric Wang
|
fac53721a2
masking bugfix
|
3 vuotta sitten |
Eric J. Wang
|
3cdbfe5b0c
Update README.md
|
3 vuotta sitten |
Eric J. Wang
|
c08c34eabb
mention chatbot project in README.md
|
3 vuotta sitten |
Eric J. Wang
|
f0082d8e8b
Link to resources more prominently
|
3 vuotta sitten |
Eric J. Wang
|
d38802e843
Point volunteers to Open Assistant
|
3 vuotta sitten |
Kohaku-Blueleaf
|
b5a1a0bca7
Add support for valid set size 0 (#83)
|
3 vuotta sitten |
Kohaku-Blueleaf
|
0af44f0262
Add option for output dir (#84)
|
3 vuotta sitten |
Kohaku-Blueleaf
|
450206caaf
Fix torch.compile call on windows (#81)
|
3 vuotta sitten |
Karun
|
81eb72f707
cleans up alphabetical prompts (#76)
|
3 vuotta sitten |
Eric Wang
|
997f6cd81f
slider for tokens generated
|
3 vuotta sitten |
Eric Wang
|
cfad895aa1
mask prompt in loss
|
3 vuotta sitten |
Eric J. Wang
|
d66908c0ca
Remove messy test code
|
3 vuotta sitten |
Yaqub Mahmoud
|
0e752ea5f3
Update requirements.txt (#67)
|
3 vuotta sitten |
Eric Wang
|
c83e30ab78
generate.py tweaks
|
3 vuotta sitten |
Eric Wang
|
80fd9833db
don't share publicly
|
3 vuotta sitten |
Eric Wang
|
6ced8d9907
fix HF export script
|
3 vuotta sitten |
Eric J. Wang
|
8dc0f614c6
Update README.md
|
3 vuotta sitten |
Eric J. Wang
|
d9c19ff34e
Update README.md
|
3 vuotta sitten |
Kakigōri Maker
|
9dab7ba438
add multi-gpu support (ddp) (#54)
|
3 vuotta sitten |