[GGML] Support for customizable RoPE (#3083)

--------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com>
2023-07-18 03:32:37 +02:00 · 2023-07-18 03:32:37 +02:00 · a69955377a
commit a69955377a
parent 89e0d15cf5
3 changed files with 9 additions and 1 deletions
--- a/modules/llamacpp_model.py
+++ b/modules/llamacpp_model.py
@ -50,7 +50,9 @@ class LlamaCppModel:
            'use_mmap': not shared.args.no_mmap,
            'use_mlock': shared.args.mlock,
            'low_vram': shared.args.low_vram,
-            'n_gpu_layers': shared.args.n_gpu_layers
+            'n_gpu_layers': shared.args.n_gpu_layers,
+            'rope_freq_base': 10000 * shared.args.alpha_value ** (64/63.),
+            'rope_freq_scale': 1.0 / shared.args.compress_pos_emb,
        }

        result.model = Llama(**params)