Exllamav2 lora support (#4229)

--------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com>
2023-10-14 19:12:41 +00:00 · 2023-10-14 19:12:41 +00:00 · 8cce1f1126
commit 8cce1f1126
parent 1f5a2c5597
4 changed files with 47 additions and 12 deletions
--- a/modules/LoRA.py
+++ b/modules/LoRA.py
@ -13,6 +13,8 @@ def add_lora_to_model(lora_names):
        add_lora_autogptq(lora_names)
    elif shared.model.__class__.__name__ in ['ExllamaModel', 'ExllamaHF'] or shared.args.loader == 'ExLlama':
        add_lora_exllama(lora_names)
+    elif shared.model.__class__.__name__ in ['Exllamav2Model', 'Exllamav2HF'] or shared.args.loader == ['ExLlamav2', 'ExLlamav2_HF']:
+        add_lora_exllamav2(lora_names)
    else:
        add_lora_transformers(lora_names)

@ -64,8 +66,36 @@ def add_lora_exllama(lora_names):
        return


-# Adapted from https://github.com/Ph0rk0z/text-generation-webui-testing
+def add_lora_exllamav2(lora_names):
+
+    from exllamav2 import ExLlamaV2Lora
+
+    if isinstance(shared.model.loras, list):
+        for lora in shared.model.loras:
+            lora.unload()
+
+    if len(lora_names) > 0:
+        logger.info("Applying the following LoRAs to {}: {}".format(shared.model_name, ', '.join(lora_names)))
+        shared.model.loras = []
+        for lora_name in lora_names:
+            lora_path = get_lora_path(lora_name)
+            if shared.model.__class__.__name__ == 'Exllamav2Model':
+                lora = ExLlamaV2Lora.from_directory(shared.model.model, str(lora_path))
+            else:
+                lora = ExLlamaV2Lora.from_directory(shared.model.ex_model, str(lora_path))
+
+            shared.model.loras.append(lora)
+
+        shared.lora_names = lora_names
+    else:
+        shared.lora_names = []
+        shared.model.loras = None
+
+
 def add_lora_autogptq(lora_names):
+    '''
+    Adapted from https://github.com/Ph0rk0z/text-generation-webui-testing
+    '''

    try:
        from auto_gptq import get_gptq_peft_model