Историја ревизија

Аутор SHA1 Порука Датум
  Eric Wang 8955a9c5a1 bos, eos in generate.py пре 3 година
  Eric J. Wang 1384a4d24c Update README.md for multi-GPU training пре 3 година
  bofeng huang c7eabb86e2 Add french version "vigogne" (#127) пре 3 година
  Eric J. Wang a74793c571 Rearrange resources on README, add 13B-30B models пре 3 година
  Eric Wang b12c3b90f8 Unwind input masking to avoid confusion пре 3 година
  Eric Wang e04897baae fix fp16 inference пре 3 година
  Eric J. Wang 052da42cbb Replace Colab with HF in README пре 3 година
  Eric Wang 7fb06c6c22 Revert "Mask out prompt tokens for real" пре 3 година
  Eric Wang 2204a71505 set EPOCHS back to 3 пре 3 година
  Eric Wang 4a712d4d8e Mask out prompt tokens for real пре 3 година
  Eric Wang fac53721a2 masking bugfix пре 3 година
  Eric J. Wang 3cdbfe5b0c Update README.md пре 3 година
  Eric J. Wang c08c34eabb mention chatbot project in README.md пре 3 година
  Eric J. Wang f0082d8e8b Link to resources more prominently пре 3 година
  Eric J. Wang d38802e843 Point volunteers to Open Assistant пре 3 година
  Kohaku-Blueleaf b5a1a0bca7 Add support for valid set size 0 (#83) пре 3 година
  Kohaku-Blueleaf 0af44f0262 Add option for output dir (#84) пре 3 година
  Kohaku-Blueleaf 450206caaf Fix torch.compile call on windows (#81) пре 3 година
  Karun 81eb72f707 cleans up alphabetical prompts (#76) пре 3 година
  Eric Wang 997f6cd81f slider for tokens generated пре 3 година
  Eric Wang cfad895aa1 mask prompt in loss пре 3 година
  Eric J. Wang d66908c0ca Remove messy test code пре 3 година
  Yaqub Mahmoud 0e752ea5f3 Update requirements.txt (#67) пре 3 година
  Eric Wang c83e30ab78 generate.py tweaks пре 3 година
  Eric Wang 80fd9833db don't share publicly пре 3 година
  Eric Wang 6ced8d9907 fix HF export script пре 3 година
  Eric J. Wang 8dc0f614c6 Update README.md пре 3 година
  Eric J. Wang d9c19ff34e Update README.md пре 3 година
  Kakigōri Maker 9dab7ba438 add multi-gpu support (ddp) (#54) пре 3 година
  Eric Wang a0295813b0 normalize cleaned data row with missing output пре 3 година