Commit Verlauf

Autor SHA1 Nachricht Datum
  Eric Wang 72aabcb5a4 Remove LLaMA download code, as a precaution vor 3 Jahren
  Eric Wang 8955a9c5a1 bos, eos in generate.py vor 3 Jahren
  Eric J. Wang 1384a4d24c Update README.md for multi-GPU training vor 3 Jahren
  bofeng huang c7eabb86e2 Add french version "vigogne" (#127) vor 3 Jahren
  Eric J. Wang a74793c571 Rearrange resources on README, add 13B-30B models vor 3 Jahren
  Eric Wang b12c3b90f8 Unwind input masking to avoid confusion vor 3 Jahren
  Eric Wang e04897baae fix fp16 inference vor 3 Jahren
  Eric J. Wang 052da42cbb Replace Colab with HF in README vor 3 Jahren
  Eric Wang 7fb06c6c22 Revert "Mask out prompt tokens for real" vor 3 Jahren
  Eric Wang 2204a71505 set EPOCHS back to 3 vor 3 Jahren
  Eric Wang 4a712d4d8e Mask out prompt tokens for real vor 3 Jahren
  Eric Wang fac53721a2 masking bugfix vor 3 Jahren
  Eric J. Wang 3cdbfe5b0c Update README.md vor 3 Jahren
  Eric J. Wang c08c34eabb mention chatbot project in README.md vor 3 Jahren
  Eric J. Wang f0082d8e8b Link to resources more prominently vor 3 Jahren
  Eric J. Wang d38802e843 Point volunteers to Open Assistant vor 3 Jahren
  Kohaku-Blueleaf b5a1a0bca7 Add support for valid set size 0 (#83) vor 3 Jahren
  Kohaku-Blueleaf 0af44f0262 Add option for output dir (#84) vor 3 Jahren
  Kohaku-Blueleaf 450206caaf Fix torch.compile call on windows (#81) vor 3 Jahren
  Karun 81eb72f707 cleans up alphabetical prompts (#76) vor 3 Jahren
  Eric Wang 997f6cd81f slider for tokens generated vor 3 Jahren
  Eric Wang cfad895aa1 mask prompt in loss vor 3 Jahren
  Eric J. Wang d66908c0ca Remove messy test code vor 3 Jahren
  Yaqub Mahmoud 0e752ea5f3 Update requirements.txt (#67) vor 3 Jahren
  Eric Wang c83e30ab78 generate.py tweaks vor 3 Jahren
  Eric Wang 80fd9833db don't share publicly vor 3 Jahren
  Eric Wang 6ced8d9907 fix HF export script vor 3 Jahren
  Eric J. Wang 8dc0f614c6 Update README.md vor 3 Jahren
  Eric J. Wang d9c19ff34e Update README.md vor 3 Jahren
  Kakigōri Maker 9dab7ba438 add multi-gpu support (ddp) (#54) vor 3 Jahren