Bump transformers (16-bit llama must be reconverted/redownloaded)

2023-04-06 16:04:03 -03:00 · 2023-04-06 16:04:03 -03:00 · 113f94b61e
commit 113f94b61e
parent 5f4f38ca5d
3 changed files with 8 additions and 2 deletions
--- a/modules/models.py
+++ b/modules/models.py
@ -10,7 +10,7 @@ import torch
 import transformers
 from accelerate import infer_auto_device_map, init_empty_weights
 from transformers import (AutoConfig, AutoModelForCausalLM, AutoTokenizer,
-                          BitsAndBytesConfig)
+                          BitsAndBytesConfig, LlamaTokenizer)

 import modules.shared as shared

@ -172,6 +172,8 @@ def load_model(model_name):
    # Loading the tokenizer
    if any((k in shared.model_name.lower() for k in ['gpt4chan', 'gpt-4chan'])) and Path(f"{shared.args.model_dir}/gpt-j-6B/").exists():
        tokenizer = AutoTokenizer.from_pretrained(Path(f"{shared.args.model_dir}/gpt-j-6B/"))
+    elif type(model) is transformers.LlamaForCausalLM:
+        tokenizer = LlamaTokenizer.from_pretrained(Path(f"{shared.args.model_dir}/{shared.model_name}/"), clean_up_tokenization_spaces=True)
    else:
        tokenizer = AutoTokenizer.from_pretrained(Path(f"{shared.args.model_dir}/{shared.model_name}/"))
    tokenizer.truncation_side = 'left'