fix(router): /v1/models endpoint

Shows now all available models
2026-02-13 16:27:06 +01:00 · 2026-02-13 16:27:06 +01:00 · c9ff384bb2
commit c9ff384bb2
parent 4d80dc5e7c
1 changed files with 20 additions and 8 deletions
--- a/router.py
+++ b/router.py
@ -2758,7 +2758,9 @@ async def openai_models_proxy(request: Request):
    """
    # 1. Query Ollama endpoints for all models via /api/tags
    ollama_tasks = [fetch.endpoint_details(ep, "/api/tags", "models") for ep in config.endpoints if "/v1" not in ep]
-    # 2. Query llama-server endpoints for loaded models via /v1/models
+    # 2. Query external OpenAI endpoints (Groq, OpenAI, etc.) via /models
+    ext_openai_tasks = [fetch.endpoint_details(ep, "/models", "data", config.api_keys.get(ep)) for ep in config.endpoints if is_ext_openai_endpoint(ep)]
+    # 3. Query llama-server endpoints for loaded models via /v1/models
    # Also query endpoints from llama_server_endpoints that may not be in config.endpoints
    all_llama_endpoints = set(config.llama_server_endpoints) | set(ep for ep in config.endpoints if ep in config.llama_server_endpoints)
    llama_tasks = [
@ -2767,6 +2769,7 @@ async def openai_models_proxy(request: Request):
    ]

    ollama_models = await asyncio.gather(*ollama_tasks) if ollama_tasks else []
+    ext_openai_models = await asyncio.gather(*ext_openai_tasks) if ext_openai_tasks else []
    llama_models = await asyncio.gather(*llama_tasks) if llama_tasks else []

    models = {'data': []}
@ -2781,11 +2784,20 @@ async def openai_models_proxy(request: Request):
                    model['name'] = model['id']
                models['data'].append(model)

-    # Add llama-server models (filter for loaded only, if any)
+    # Add external OpenAI models (if any)
+    if ext_openai_models:
+        for modellist in ext_openai_models:
+            for model in modellist:
+                if not "id" in model.keys():
+                    model['id'] = model.get('name', model.get('id', ''))
+                else:
+                    model['name'] = model['id']
+                models['data'].append(model)
+
+    # Add llama-server models (all available, not just loaded)
    if llama_models:
        for modellist in llama_models:
-            loaded_models = [item for item in modellist if _is_llama_model_loaded(item)]
-            for model in loaded_models:
+            for model in modellist:
                if not "id" in model.keys():
                    model['id'] = model.get('name', model.get('id', ''))
                else: