Support for MPT, INCITE, WizardLM, StableLM, Galactica, Vicuna, Guanaco, and Baize instruction following (#1596)

2023-05-10 09:07:31 +09:30 · 2023-05-10 09:07:31 +09:30 · 814f754451
commit 814f754451
parent 06c7db017d
51 changed files with 352 additions and 28 deletions
--- a/modules/GPTQ_loader.py
+++ b/modules/GPTQ_loader.py
@ -145,12 +145,12 @@ def load_quantized(model_name):
    # Find the model type
    if not shared.args.model_type:
        name = model_name.lower()
-        if any((k in name for k in ['llama', 'alpaca', 'vicuna', 'llava'])):
-            model_type = 'llama'
-        elif any((k in name for k in ['opt-', 'galactica'])):
+        if any((k in name for k in ['opt-', 'opt_', 'opt1', 'opt3', 'optfor', 'galactica', 'galpaca', 'pygmalion-350m'])):
            model_type = 'opt'
-        elif any((k in name for k in ['gpt-j', 'pygmalion-6b'])):
+        elif any((k in name for k in ['gpt-j', 'gptj', 'gpt4all-j', 'malion-6b', 'pygway'])):
            model_type = 'gptj'
+        elif any((k in name for k in ['llama', 'alpac', 'vicuna', 'guanaco', 'koala', 'llava', 'wizardlm'])):
+            model_type = 'llama'
        else:
            logging.error("Can't determine model type from model name. Please specify it manually using --model_type argument")
            exit()