fix(clip): do not imply GPUs by default

mudler · mudler · commit 2bf140cd3138 · 2025-03-13T12:51:18.000+01:00
Until a better solution is found upstream, be conservative and default to GPU. ggml-org/llama.cpp#12322 ggml-org/llama.cpp#12322 (comment) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
diff --git a/backend/cpp/llama/grpc-server.cpp b/backend/cpp/llama/grpc-server.cpp
@@ -511,7 +511,10 @@ struct llama_server_context
         if (!params.mmproj.empty()) {
             multimodal = true;
             LOG_INFO("Multi Modal Mode Enabled", {});
-            clp_ctx = clip_model_load(params.mmproj.c_str(), /*verbosity=*/ 1);
+            clp_ctx = clip_init(params.mmproj.c_str(), clip_context_params {
+                /* use_gpu */ false,
+                /*verbosity=*/ 1,
+            });
             if(clp_ctx == nullptr) {
                 LOG_ERR("unable to load clip model: %s", params.mmproj.c_str());
                 return false;