Add low vram mode on llama cpp (#3076)

2023-07-12 11:05:13 -03:00 · 2023-07-12 11:05:13 -03:00 · eedb3bf023
commit eedb3bf023
parent 180420d2c9
5 changed files with 5 additions and 0 deletions
--- a/modules/llamacpp_model.py
+++ b/modules/llamacpp_model.py
@ -49,6 +49,7 @@ class LlamaCppModel:
            'n_batch': shared.args.n_batch,
            'use_mmap': not shared.args.no_mmap,
            'use_mlock': shared.args.mlock,
+            'low_vram': shared.args.low_vram,
            'n_gpu_layers': shared.args.n_gpu_layers
        }