Fix ollama embeddings client to work (#285)

2026-04-25 00:16:23 +02:00 · 2025-01-27 23:47:15 +00:00 · 2025-01-27 23:47:15 +00:00 · 75a72b0d2d
commit 75a72b0d2d
parent 552637c1f7
2 changed files with 19 additions and 5 deletions
--- a/trustgraph-flow/setup.py
+++ b/trustgraph-flow/setup.py
@ -49,6 +49,7 @@ setuptools.setup(
        "langchain-core",
        "langchain-text-splitters",
        "neo4j",
+        "ollama",
        "openai",
        "pinecone[grpc]",
        "prometheus-client",
--- a/trustgraph-flow/trustgraph/embeddings/ollama/processor.py
+++ b/trustgraph-flow/trustgraph/embeddings/ollama/processor.py
@ -3,12 +3,13 @@
 Embeddings service, applies an embeddings model selected from HuggingFace.
 Input is text, output is embeddings vector.
 """
-from langchain_community.embeddings import OllamaEmbeddings

 from ... schema import EmbeddingsRequest, EmbeddingsResponse
 from ... schema import embeddings_request_queue, embeddings_response_queue
 from ... log_level import LogLevel
 from ... base import ConsumerProducer
+from ollama import Client
+import os

 module = ".".join(__name__.split(".")[1:-1])

@ -16,7 +17,7 @@ default_input_queue = embeddings_request_queue
 default_output_queue = embeddings_response_queue
 default_subscriber = module
 default_model="mxbai-embed-large"
-default_ollama = 'http://localhost:11434'
+default_ollama = os.getenv("OLLAMA_HOST", 'http://localhost:11434')

 class Processor(ConsumerProducer):

@ -26,6 +27,9 @@ class Processor(ConsumerProducer):
        output_queue = params.get("output_queue", default_output_queue)
        subscriber = params.get("subscriber", default_subscriber)

+        ollama = params.get("ollama", default_ollama)
+        model = params.get("model", default_model)
+
        super(Processor, self).__init__(
            **params | {
                "input_queue": input_queue,
@ -33,10 +37,13 @@ class Processor(ConsumerProducer):
                "subscriber": subscriber,
                "input_schema": EmbeddingsRequest,
                "output_schema": EmbeddingsResponse,
+                "ollama": ollama,
+                "model": model,
            }
        )

-        self.embeddings = OllamaEmbeddings(base_url=ollama, model=model)
+        self.client = Client(host=ollama)
+        self.model = model

    def handle(self, msg):

@ -49,10 +56,16 @@ class Processor(ConsumerProducer):
        print(f"Handling input {id}...", flush=True)

        text = v.text
-        embeds = self.embeddings.embed_query([text])
+        embeds = self.client.embed(
+            model = self.model,
+            input = text
+        )

        print("Send response...", flush=True)
-        r = EmbeddingsResponse(vectors=[embeds])
+        r = EmbeddingsResponse(
+            vectors=embeds.embeddings,
+            error=None,
+        )

        self.producer.send(r, properties={"id": id})