force patch_merger tensors to f16/f32

2025-12-17 05:36:01 +01:00 · 2025-12-17 05:36:01 +01:00 · a7ab470832
parent 58062860af
commit a7ab470832
1 changed files with 1 additions and 1 deletions
--- a/convert_hf_to_gguf.py
+++ b/convert_hf_to_gguf.py
@ -1838,7 +1838,7 @@ class MmprojModel(ModelBase):

    def tensor_force_quant(self, name, new_name, bid, n_dims):
        del bid, name, n_dims  # unused
-        if ".patch_embd.weight" in new_name:
+        if ".patch_embd.weight" in new_name or ".patch_merger.weight" in new_name:
            return gguf.GGMLQuantizationType.F16 if self.ftype == gguf.LlamaFileType.MOSTLY_F16 else gguf.GGMLQuantizationType.F32
        return False