Historial de Commits

Autor SHA1 Mensaje Fecha
  Eric J. Wang 345c8fbb7b Remove tagline from README hace 3 años
  Jiaxin Shan 4a3c7e2231 Add option to share Gradio demo publicly (#189) hace 3 años
  Eric J. Wang f3876137f7 Clarify that dataset is still ODC-By hace 3 años
  кѳѳsнī 55b664f46f Enabling model parallelism (training 30b on 2x 3090s and beyond) (#131) hace 3 años
  Eric Wang 3b79ea4029 256 -> 512 -> 256 hace 3 años
  Eric Wang 804d22ad43 remove asserts hace 3 años
  Angainor Development 69b9d9ea8b Fix a warning (#186) hace 3 años
  Eric J. Wang dbd04f3560 Fix linters (#185) hace 3 años
  NanoCode012 69b31e0fed Feat: Add wandb (#168) hace 3 años
  Eric J. Wang 95b30a256c Fix lint.yml hace 3 años
  claysauruswrecks 1310547f9f Add HF dataset loading, add linters, pyproject.toml (#175) hace 3 años
  Xie Zejian b00629d773 Add Chinese 13b lora link (#178) hace 3 años
  Angainor Development 9d6b822019 Avoid a deprecation warning (#181) hace 3 años
  Eric Wang 683810b4a1 Print warning on checkpoint not found hace 3 años
  Eric Wang da6b427a08 resume_from_checkpoint hace 3 años
  Eric Wang b948f892ba restore default settings hace 3 años
  Eric J. Wang d358124af6 Add dotslash to example data_path hace 3 años
  Eric J. Wang 5fa807d106 Use CLI arguments (#159) hace 3 años
  Andrea Santilli e2f07029aa Add Italian 7b model to readme (#156) hace 3 años
  Eric J. Wang af30df1999 Unified tokenizer update PR (#146) hace 3 años
  Martin Thissen d3760cd84a Added fine-tuned7b model for German language (#134) hace 3 años
  Thaweewat 6853b8802e Add Thai weight URL on READ.ME (#132) hace 3 años
  Eric Wang fcdb143f1f Amend README hace 3 años
  Eric Wang 72aabcb5a4 Remove LLaMA download code, as a precaution hace 3 años
  Eric Wang 8955a9c5a1 bos, eos in generate.py hace 3 años
  Eric J. Wang 1384a4d24c Update README.md for multi-GPU training hace 3 años
  bofeng huang c7eabb86e2 Add french version "vigogne" (#127) hace 3 años
  Eric J. Wang a74793c571 Rearrange resources on README, add 13B-30B models hace 3 años
  Eric Wang b12c3b90f8 Unwind input masking to avoid confusion hace 3 años
  Eric Wang e04897baae fix fp16 inference hace 3 años