Историја ревизија

Аутор SHA1 Порука Датум
  Eric Wang 3b79ea4029 256 -> 512 -> 256 пре 3 година
  Eric Wang 804d22ad43 remove asserts пре 3 година
  Angainor Development 69b9d9ea8b Fix a warning (#186) пре 3 година
  Eric J. Wang dbd04f3560 Fix linters (#185) пре 3 година
  NanoCode012 69b31e0fed Feat: Add wandb (#168) пре 3 година
  Eric J. Wang 95b30a256c Fix lint.yml пре 3 година
  claysauruswrecks 1310547f9f Add HF dataset loading, add linters, pyproject.toml (#175) пре 3 година
  Xie Zejian b00629d773 Add Chinese 13b lora link (#178) пре 3 година
  Angainor Development 9d6b822019 Avoid a deprecation warning (#181) пре 3 година
  Eric Wang 683810b4a1 Print warning on checkpoint not found пре 3 година
  Eric Wang da6b427a08 resume_from_checkpoint пре 3 година
  Eric Wang b948f892ba restore default settings пре 3 година
  Eric J. Wang d358124af6 Add dotslash to example data_path пре 3 година
  Eric J. Wang 5fa807d106 Use CLI arguments (#159) пре 3 година
  Andrea Santilli e2f07029aa Add Italian 7b model to readme (#156) пре 3 година
  Eric J. Wang af30df1999 Unified tokenizer update PR (#146) пре 3 година
  Martin Thissen d3760cd84a Added fine-tuned7b model for German language (#134) пре 3 година
  Thaweewat 6853b8802e Add Thai weight URL on READ.ME (#132) пре 3 година
  Eric Wang fcdb143f1f Amend README пре 3 година
  Eric Wang 72aabcb5a4 Remove LLaMA download code, as a precaution пре 3 година
  Eric Wang 8955a9c5a1 bos, eos in generate.py пре 3 година
  Eric J. Wang 1384a4d24c Update README.md for multi-GPU training пре 3 година
  bofeng huang c7eabb86e2 Add french version "vigogne" (#127) пре 3 година
  Eric J. Wang a74793c571 Rearrange resources on README, add 13B-30B models пре 3 година
  Eric Wang b12c3b90f8 Unwind input masking to avoid confusion пре 3 година
  Eric Wang e04897baae fix fp16 inference пре 3 година
  Eric J. Wang 052da42cbb Replace Colab with HF in README пре 3 година
  Eric Wang 7fb06c6c22 Revert "Mask out prompt tokens for real" пре 3 година
  Eric Wang 2204a71505 set EPOCHS back to 3 пре 3 година
  Eric Wang 4a712d4d8e Mask out prompt tokens for real пре 3 година