Improve request/response handling (#18)

* Request/response error handling with common client * Fixup error handling change
2026-07-18 09:41:03 +02:00 · 2024-08-22 17:02:18 +01:00 · 2024-08-22 17:02:18 +01:00 · 1297cdb1d0
commit 1297cdb1d0
parent 19c826c387
21 changed files with 1038 additions and 908 deletions
--- a/trustgraph/clients/embeddings_client.py
+++ b/trustgraph/clients/embeddings_client.py
@ -1,9 +1,11 @@

-import pulsar
-import _pulsar
 from pulsar.schema import JsonSchema
 from .. schema import EmbeddingsRequest, EmbeddingsResponse
 from .. schema import embeddings_request_queue, embeddings_response_queue
+from . base import BaseClient
+
+import pulsar
+import _pulsar
 import hashlib
 import uuid
 import time
@ -14,7 +16,7 @@ WARN=_pulsar.LoggerLevel.Warn
 INFO=_pulsar.LoggerLevel.Info
 DEBUG=_pulsar.LoggerLevel.Debug

-class EmbeddingsClient:
+class EmbeddingsClient(BaseClient):

    def __init__(
            self, log_level=ERROR,
@ -24,72 +26,23 @@ class EmbeddingsClient:
            pulsar_host="pulsar://pulsar:6650",
    ):

-        self.client = None
-
        if input_queue == None:
            input_queue=embeddings_request_queue

        if output_queue == None:
            output_queue=embeddings_response_queue

-        if subscriber == None:
-            subscriber = str(uuid.uuid4())
-
-        self.client = pulsar.Client(
-            pulsar_host,
-            logger=pulsar.ConsoleLogger(log_level),
+        super(EmbeddingsClient, self).__init__(
+            log_level=log_level,
+            subscriber=subscriber,
+            input_queue=input_queue,
+            output_queue=output_queue,
+            pulsar_host=pulsar_host,
+            input_schema=EmbeddingsRequest,
+            output_schema=EmbeddingsResponse,
        )

-        self.producer = self.client.create_producer(
-            topic=input_queue,
-            schema=JsonSchema(EmbeddingsRequest),
-            chunking_enabled=True,
-        )
+    def request(self, text, timeout=30):
+        return self.call(text=text, timeout=timeout).vectors

-        self.consumer = self.client.subscribe(
-            output_queue, subscriber,
-            schema=JsonSchema(EmbeddingsResponse),
-        )
-
-    def request(self, text, timeout=10):
-
-        id = str(uuid.uuid4())
-
-        r = EmbeddingsRequest(
-            text=text
-        )
-        self.producer.send(r, properties={ "id": id })
-
-        end_time = time.time() + timeout
-
-        while time.time() < end_time:
-
-            try:
-                msg = self.consumer.receive(timeout_millis=5000)
-            except pulsar.exceptions.Timeout:
-                continue
-
-            mid = msg.properties()["id"]
-
-            if mid == id:
-                resp = msg.value().vectors
-                self.consumer.acknowledge(msg)
-                return resp
-
-            # Ignore messages with wrong ID
-            self.consumer.acknowledge(msg)
-
-        raise TimeoutError("Timed out waiting for response")
-
-    def __del__(self):
-
-        if hasattr(self, "consumer"):
-#             self.consumer.unsubscribe()
-            self.consumer.close()
-            
-        if hasattr(self, "producer"):
-            self.producer.flush()
-            self.producer.close()
-            
-        self.client.close()

--- a/trustgraph/clients/graph_embeddings_client.py
+++ b/trustgraph/clients/graph_embeddings_client.py
@ -9,6 +9,7 @@ import time
 from .. schema import GraphEmbeddingsRequest, GraphEmbeddingsResponse
 from .. schema import graph_embeddings_request_queue
 from .. schema import graph_embeddings_response_queue
+from . base import BaseClient

 # Ugly
 ERROR=_pulsar.LoggerLevel.Error
@ -16,7 +17,7 @@ WARN=_pulsar.LoggerLevel.Warn
 INFO=_pulsar.LoggerLevel.Info
 DEBUG=_pulsar.LoggerLevel.Debug

-class GraphEmbeddingsClient:
+class GraphEmbeddingsClient(BaseClient):

    def __init__(
            self, log_level=ERROR,
@ -31,66 +32,19 @@ class GraphEmbeddingsClient:

        if output_queue == None:
            output_queue = graph_embeddings_response_queue
-
-        if subscriber == None:
-            subscriber = str(uuid.uuid4())
-
-        self.client = pulsar.Client(
-            pulsar_host,
-            logger=pulsar.ConsoleLogger(log_level),
-        )
-
-        self.producer = self.client.create_producer(
-            topic=input_queue,
-            schema=JsonSchema(GraphEmbeddingsRequest),
-            chunking_enabled=True,
-        )
-
-        self.consumer = self.client.subscribe(
-            output_queue, subscriber,
-            schema=JsonSchema(GraphEmbeddingsResponse),
-        )
-
-    def request(self, vectors, limit=10, timeout=500):
-
-        id = str(uuid.uuid4())
-
-        r = GraphEmbeddingsRequest(
-            vectors=vectors,
-            limit=limit,
-        )
-
-        self.producer.send(r, properties={ "id": id })
-
-        end_time = time.time() + timeout
-
-        while time.time() < end_time:
-
-            try:
-                msg = self.consumer.receive(timeout_millis=5000)
-            except pulsar.exceptions.Timeout:
-                continue
-
-            mid = msg.properties()["id"]
-
-            if mid == id:
-                resp = msg.value().entities
-                self.consumer.acknowledge(msg)
-                return resp
-
-            # Ignore messages with wrong ID
-            self.consumer.acknowledge(msg)
-
-        raise TimeoutError("Timed out waiting for response")
-
-    def __del__(self):
-
-        if hasattr(self, "consumer"):
-            self.consumer.close()
            
-        if hasattr(self, "producer"):
-            self.producer.flush()
-            self.producer.close()
-            
-        self.client.close()
+        super(GraphEmbeddingsClient, self).__init__(
+            log_level=log_level,
+            subscriber=subscriber,
+            input_queue=input_queue,
+            output_queue=output_queue,
+            pulsar_host=pulsar_host,
+            input_schema=GraphEmbeddingsRequest,
+            output_schema=GraphEmbeddingsResponse,
+        )
+
+    def request(self, vectors, limit=10, timeout=30):
+        return self.call(
+            vectors=vectors, limit=limit, timeout=timeout
+        ).entities

--- a/trustgraph/clients/graph_rag_client.py
+++ b/trustgraph/clients/graph_rag_client.py
@ -4,6 +4,7 @@ import _pulsar
 from pulsar.schema import JsonSchema
 from .. schema import GraphRagQuery, GraphRagResponse
 from .. schema import graph_rag_request_queue, graph_rag_response_queue
+from . base import BaseClient

 import hashlib
 import uuid
@ -15,71 +16,36 @@ WARN=_pulsar.LoggerLevel.Warn
 INFO=_pulsar.LoggerLevel.Info
 DEBUG=_pulsar.LoggerLevel.Debug

-class GraphRagClient:
+class GraphRagClient(BaseClient):

    def __init__(
-            self, log_level=ERROR, subscriber=None,
+            self,
+            log_level=ERROR,
+            subscriber=None,
+            input_queue=None,
+            output_queue=None,
            pulsar_host="pulsar://pulsar:6650",
    ):

-        if subscriber == None:
-            subscriber = str(uuid.uuid4())
+        if input_queue == None:
+            input_queue = graph_rag_request_queue

-        self.client = pulsar.Client(
-            pulsar_host,
-            logger=pulsar.ConsoleLogger(log_level),
-        )
-
-        self.producer = self.client.create_producer(
-            topic=graph_rag_request_queue,
-            schema=JsonSchema(GraphRagQuery),
-            chunking_enabled=True,
-        )
-
-        self.consumer = self.client.subscribe(
-            graph_rag_response_queue, subscriber,
-            schema=JsonSchema(GraphRagResponse),
+        if output_queue == None:
+            output_queue = graph_rag_response_queue
+  
+        super(GraphRagClient, self).__init__(
+            log_level=log_level,
+            subscriber=subscriber,
+            input_queue=input_queue,
+            output_queue=output_queue,
+            pulsar_host=pulsar_host,
+            input_schema=GraphRagQuery,
+            output_schema=GraphRagResponse,
        )

    def request(self, query, timeout=500):

-        id = str(uuid.uuid4())
-
-        r = GraphRagQuery(
-            query=query
-        )
-        self.producer.send(r, properties={ "id": id })
-
-        end_time = time.time() + timeout
-
-        while time.time() < end_time:
-
-            try:
-                msg = self.consumer.receive(timeout_millis=5000)
-            except pulsar.exceptions.Timeout:
-                continue
-
-            mid = msg.properties()["id"]
-
-            if mid == id:
-                resp = msg.value().response
-                self.consumer.acknowledge(msg)
-                return resp
-
-            # Ignore messages with wrong ID
-            self.consumer.acknowledge(msg)
-
-        raise TimeoutError("Timed out waiting for response")
-
-    def __del__(self):
-
-        if hasattr(self, "consumer"):
-#             self.consumer.unsubscribe()
-            self.consumer.close()
-            
-        if hasattr(self, "producer"):
-            self.producer.flush()
-            self.producer.close()
-            
-        self.client.close()
+        return self.call(
+            query=query, timeout=timeout
+        ).response

--- a/trustgraph/clients/llm_client.py
+++ b/trustgraph/clients/llm_client.py
@ -9,6 +9,8 @@ import time
 from .. schema import TextCompletionRequest, TextCompletionResponse
 from .. schema import text_completion_request_queue
 from .. schema import text_completion_response_queue
+from .. exceptions import *
+from . base import BaseClient

 # Ugly
 ERROR=_pulsar.LoggerLevel.Error
@ -16,7 +18,7 @@ WARN=_pulsar.LoggerLevel.Warn
 INFO=_pulsar.LoggerLevel.Info
 DEBUG=_pulsar.LoggerLevel.Debug

-class LlmClient:
+class LlmClient(BaseClient):

    def __init__(
            self, log_level=ERROR,
@ -26,71 +28,19 @@ class LlmClient:
            pulsar_host="pulsar://pulsar:6650",
    ):

-        if input_queue == None:
-            input_queue = text_completion_request_queue
+        if input_queue is None: input_queue = text_completion_request_queue
+        if output_queue is None: output_queue = text_completion_response_queue

-        if output_queue == None:
-            output_queue = text_completion_response_queue
-
-        if subscriber == None:
-            subscriber = str(uuid.uuid4())
-
-        self.client = pulsar.Client(
-            pulsar_host,
-            logger=pulsar.ConsoleLogger(log_level),
-        )
-
-        self.producer = self.client.create_producer(
-            topic=input_queue,
-            schema=JsonSchema(TextCompletionRequest),
-            chunking_enabled=True,
-        )
-
-        self.consumer = self.client.subscribe(
-            output_queue, subscriber,
-            schema=JsonSchema(TextCompletionResponse),
+        super(LlmClient, self).__init__(
+            log_level=log_level,
+            subscriber=subscriber,
+            input_queue=input_queue,
+            output_queue=output_queue,
+            pulsar_host=pulsar_host,
+            input_schema=TextCompletionRequest,
+            output_schema=TextCompletionResponse,
        )

    def request(self, prompt, timeout=30):
-
-        id = str(uuid.uuid4())
-
-        r = TextCompletionRequest(
-            prompt=prompt
-        )
-
-        end_time = time.time() + timeout
-
-        self.producer.send(r, properties={ "id": id })
-
-        while time.time() < end_time:
-
-            try:
-                msg = self.consumer.receive(timeout_millis=5000)
-            except pulsar.exceptions.Timeout:
-                continue
-
-            mid = msg.properties()["id"]
-
-            if mid == id:
-                resp = msg.value().response
-                self.consumer.acknowledge(msg)
-                return resp
-
-            # Ignore messages with wrong ID
-            self.consumer.acknowledge(msg)
-
-        raise TimeoutError("Timed out waiting for response")
-
-    def __del__(self):
-
-        if hasattr(self, "consumer"):
-#             self.consumer.unsubscribe()
-            self.consumer.close()
-            
-        if hasattr(self, "producer"):
-            self.producer.flush()
-            self.producer.close()
-            
-        self.client.close()
+        return self.call(prompt=prompt, timeout=timeout).response

--- a/trustgraph/clients/prompt_client.py
+++ b/trustgraph/clients/prompt_client.py
@ -9,6 +9,7 @@ import time
 from .. schema import PromptRequest, PromptResponse, Fact
 from .. schema import prompt_request_queue
 from .. schema import prompt_response_queue
+from . base import BaseClient

 # Ugly
 ERROR=_pulsar.LoggerLevel.Error
@ -16,7 +17,7 @@ WARN=_pulsar.LoggerLevel.Warn
 INFO=_pulsar.LoggerLevel.Info
 DEBUG=_pulsar.LoggerLevel.Debug

-class PromptClient:
+class PromptClient(BaseClient):

    def __init__(
            self, log_level=ERROR,
@ -32,133 +33,35 @@ class PromptClient:
        if output_queue == None:
            output_queue = prompt_response_queue

-        if subscriber == None:
-            subscriber = str(uuid.uuid4())
-
-        self.client = pulsar.Client(
-            pulsar_host,
-            logger=pulsar.ConsoleLogger(log_level),
-        )
-
-        self.producer = self.client.create_producer(
-            topic=input_queue,
-            schema=JsonSchema(PromptRequest),
-            chunking_enabled=True,
-        )
-
-        self.consumer = self.client.subscribe(
-            output_queue, subscriber,
-            schema=JsonSchema(PromptResponse),
+        super(PromptClient, self).__init__(
+            log_level=log_level,
+            subscriber=subscriber,
+            input_queue=input_queue,
+            output_queue=output_queue,
+            pulsar_host=pulsar_host,
+            input_schema=PromptRequest,
+            output_schema=PromptResponse,
        )

    def request_definitions(self, chunk, timeout=30):

-        id = str(uuid.uuid4())
-
-        r = PromptRequest(
-            kind="extract-definitions",
-            chunk=chunk,
-        )
-
-        self.producer.send(r, properties={ "id": id })
-
-        end_time = time.time() + timeout
-
-        while time.time() < end_time:
-
-            try:
-                msg = self.consumer.receive(timeout_millis=5000)
-            except pulsar.exceptions.Timeout:
-                continue
-
-            mid = msg.properties()["id"]
-
-            if mid == id:
-                resp = msg.value().definitions
-                self.consumer.acknowledge(msg)
-                return resp
-
-            # Ignore messages with wrong ID
-            self.consumer.acknowledge(msg)
-
-        raise TimeoutError("Timed out waiting for response")
+        return self.call(kind="extract-definitions", chunk=chunk,
+                         timeout=timeout).definitions

    def request_relationships(self, chunk, timeout=30):

-        id = str(uuid.uuid4())
-
-        r = PromptRequest(
-            kind="extract-relationships",
-            chunk=chunk,
-        )
-
-        self.producer.send(r, properties={ "id": id })
-
-        end_time = time.time() + timeout
-
-        while time.time() < end_time:
-
-            try:
-                msg = self.consumer.receive(timeout_millis=5000)
-            except pulsar.exceptions.Timeout:
-                continue
-
-            mid = msg.properties()["id"]
-
-            if mid == id:
-                resp = msg.value().relationships
-                self.consumer.acknowledge(msg)
-                return resp
-
-            # Ignore messages with wrong ID
-            self.consumer.acknowledge(msg)
-
-        raise TimeoutError("Timed out waiting for response")
+        return self.call(kind="extract-relationships", chunk=chunk,
+                         timeout=timeout).relationships

    def request_kg_prompt(self, query, kg, timeout=30):

-        id = str(uuid.uuid4())
-
-        r = PromptRequest(
+        return self.call(
            kind="kg-prompt",
            query=query,
            kg=[
                Fact(s=v[0], p=v[1], o=v[2])
                for v in kg
            ],
-        )
-
-        self.producer.send(r, properties={ "id": id })
-
-        end_time = time.time() + timeout
-
-        while time.time() < end_time:
-
-            try:
-                msg = self.consumer.receive(timeout_millis=5000)
-            except pulsar.exceptions.Timeout:
-                continue
-
-            mid = msg.properties()["id"]
-
-            if mid == id:
-                resp = msg.value().answer
-                self.consumer.acknowledge(msg)
-                return resp
-
-            # Ignore messages with wrong ID
-            self.consumer.acknowledge(msg)
-
-        raise TimeoutError("Timed out waiting for response")
-
-    def __del__(self):
-
-        if hasattr(self, "consumer"):
-            self.consumer.close()
-            
-        if hasattr(self, "producer"):
-            self.producer.flush()
-            self.producer.close()
-            
-        self.client.close()
+            timeout=timeout
+        ).answer

--- a/trustgraph/clients/triples_query_client.py
+++ b/trustgraph/clients/triples_query_client.py
@ -10,6 +10,7 @@ import time
 from .. schema import TriplesQueryRequest, TriplesQueryResponse, Value
 from .. schema import triples_request_queue
 from .. schema import triples_response_queue
+from . base import BaseClient

 # Ugly
 ERROR=_pulsar.LoggerLevel.Error
@ -17,7 +18,7 @@ WARN=_pulsar.LoggerLevel.Warn
 INFO=_pulsar.LoggerLevel.Info
 DEBUG=_pulsar.LoggerLevel.Debug

-class TriplesQueryClient:
+class TriplesQueryClient(BaseClient):

    def __init__(
            self, log_level=ERROR,
@ -33,23 +34,14 @@ class TriplesQueryClient:
        if output_queue == None:
            output_queue = triples_response_queue

-        if subscriber == None:
-            subscriber = str(uuid.uuid4())
-
-        self.client = pulsar.Client(
-            pulsar_host,
-            logger=pulsar.ConsoleLogger(log_level),
-        )
-
-        self.producer = self.client.create_producer(
-            topic=input_queue,
-            schema=JsonSchema(TriplesQueryRequest),
-            chunking_enabled=True,
-        )
-
-        self.consumer = self.client.subscribe(
-            output_queue, subscriber,
-            schema=JsonSchema(TriplesQueryResponse),
+        super(TriplesQueryClient, self).__init__(
+            log_level=log_level,
+            subscriber=subscriber,
+            input_queue=input_queue,
+            output_queue=output_queue,
+            pulsar_host=pulsar_host,
+            input_schema=TriplesQueryRequest,
+            output_schema=TriplesQueryResponse,
        )

    def create_value(self, ent):
@ -61,48 +53,12 @@ class TriplesQueryClient:

        return Value(value=ent, is_uri=False)

-    def request(self, s, p, o, limit=10, timeout=500):
-
-        id = str(uuid.uuid4())
-
-        r = TriplesQueryRequest(
+    def request(self, s, p, o, limit=10, timeout=30):
+        return self.call(
            s=self.create_value(s),
            p=self.create_value(p),
            o=self.create_value(o),
            limit=limit,
-        )
-
-        self.producer.send(r, properties={ "id": id })
-
-        end_time = time.time() + timeout
-
-        while time.time() < end_time:
-
-            try:
-                msg = self.consumer.receive(timeout_millis=5000)
-            except pulsar.exceptions.Timeout:
-                continue
-
-            mid = msg.properties()["id"]
-
-            if mid == id:
-                resp = msg.value().triples
-                self.consumer.acknowledge(msg)
-                return resp
-
-            # Ignore messages with wrong ID
-            self.consumer.acknowledge(msg)
-
-        raise TimeoutError("Timed out waiting for response")
-
-    def __del__(self):
-
-        if hasattr(self, "consumer"):
-            self.consumer.close()
-            
-        if hasattr(self, "producer"):
-            self.producer.flush()
-            self.producer.close()
-            
-        self.client.close()
+            timeout=timeout,
+        ).triples

--- a/trustgraph/embeddings/hf/hf.py
+++ b/trustgraph/embeddings/hf/hf.py
@ -6,7 +6,7 @@ Input is text, output is embeddings vector.

 from langchain_huggingface import HuggingFaceEmbeddings

-from ... schema import EmbeddingsRequest, EmbeddingsResponse
+from ... schema import EmbeddingsRequest, EmbeddingsResponse, Error
 from ... schema import embeddings_request_queue, embeddings_response_queue
 from ... log_level import LogLevel
 from ... base import ConsumerProducer
@ -48,14 +48,36 @@ class Processor(ConsumerProducer):

        print(f"Handling input {id}...", flush=True)

-        text = v.text
-        embeds = self.embeddings.embed_documents([text])
+        try:

-        print("Send response...", flush=True)
-        r = EmbeddingsResponse(vectors=embeds)
-        self.producer.send(r, properties={"id": id})
+            text = v.text
+            embeds = self.embeddings.embed_documents([text])

-        print("Done.", flush=True)
+            print("Send response...", flush=True)
+            r = EmbeddingsResponse(vectors=embeds, error=None)
+            self.producer.send(r, properties={"id": id})
+
+            print("Done.", flush=True)
+
+
+        except Exception as e:
+
+            print(f"Exception: {e}")
+
+            print("Send error response...", flush=True)
+
+            r = EmbeddingsResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)
+            

    @staticmethod
    def add_args(parser):
--- a/trustgraph/exceptions.py
+++ b/trustgraph/exceptions.py
@ -2,3 +2,13 @@
 class TooManyRequests(Exception):
    pass

+class LlmError(Exception):
+    pass
+
+class ParseError(Exception):
+    pass
+
+
+
+
+
--- a/trustgraph/model/prompt/generic/service.py
+++ b/trustgraph/model/prompt/generic/service.py
@ -6,7 +6,7 @@ Language service abstracts prompt engineering from LLM.
 import json

 from .... schema import Definition, Relationship, Triple
-from .... schema import PromptRequest, PromptResponse
+from .... schema import PromptRequest, PromptResponse, Error
 from .... schema import TextCompletionRequest, TextCompletionResponse
 from .... schema import text_completion_request_queue
 from .... schema import text_completion_response_queue
@ -89,91 +89,151 @@ class Processor(ConsumerProducer):

    def handle_extract_definitions(self, id, v):

-        prompt = to_definitions(v.chunk)
-
-        ans = self.llm.request(prompt)
-
-        # Silently ignore JSON parse error
        try:
-            defs = json.loads(ans)
-        except:
-            print("JSON parse error, ignored", flush=True)
-            defs = []

-        output = []
+            prompt = to_definitions(v.chunk)

-        for defn in defs:
+            ans = self.llm.request(prompt)

+            # Silently ignore JSON parse error
            try:
-                e = defn["entity"]
-                d = defn["definition"]
-
-                output.append(
-                    Definition(
-                        name=e, definition=d
-                    )
-                )
-
+                defs = json.loads(ans)
            except:
-                print("definition fields missing, ignored", flush=True)
+                print("JSON parse error, ignored", flush=True)
+                defs = []

-        print("Send response...", flush=True)
-        r = PromptResponse(definitions=output)
-        self.producer.send(r, properties={"id": id})
+            output = []

-        print("Done.", flush=True)
+            for defn in defs:
+
+                try:
+                    e = defn["entity"]
+                    d = defn["definition"]
+
+                    output.append(
+                        Definition(
+                            name=e, definition=d
+                        )
+                    )
+
+                except:
+                    print("definition fields missing, ignored", flush=True)
+
+            print("Send response...", flush=True)
+            r = PromptResponse(definitions=output, error=None)
+            self.producer.send(r, properties={"id": id})
+
+            print("Done.", flush=True)
        
+        except Exception as e:
+
+            print(f"Exception: {e}")
+
+            print("Send error response...", flush=True)
+
+            r = PromptResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)
+
    def handle_extract_relationships(self, id, v):

-        prompt = to_relationships(v.chunk)
-
-        ans = self.llm.request(prompt)
-
-        # Silently ignore JSON parse error
        try:
-            defs = json.loads(ans)
-        except:
-            print("JSON parse error, ignored", flush=True)
-            defs = []

-        output = []
+            prompt = to_relationships(v.chunk)

-        for defn in defs:
+            ans = self.llm.request(prompt)

+            # Silently ignore JSON parse error
            try:
-                output.append(
-                    Relationship(
-                        s = defn["subject"],
-                        p = defn["predicate"],
-                        o = defn["object"],
-                        o_entity = defn["object-entity"],
+                defs = json.loads(ans)
+            except:
+                print("JSON parse error, ignored", flush=True)
+                defs = []
+
+            output = []
+
+            for defn in defs:
+
+                try:
+                    output.append(
+                        Relationship(
+                            s = defn["subject"],
+                            p = defn["predicate"],
+                            o = defn["object"],
+                            o_entity = defn["object-entity"],
+                        )
                    )
-                )

-            except Exception as e:
-                print("relationship fields missing, ignored", flush=True)
+                except Exception as e:
+                    print("relationship fields missing, ignored", flush=True)

-        print("Send response...", flush=True)
-        r = PromptResponse(relationships=output)
-        self.producer.send(r, properties={"id": id})
+            print("Send response...", flush=True)
+            r = PromptResponse(relationships=output, error=None)
+            self.producer.send(r, properties={"id": id})

-        print("Done.", flush=True)
+            print("Done.", flush=True)
+
+        except Exception as e:
+
+            print(f"Exception: {e}")
+
+            print("Send error response...", flush=True)
+
+            r = PromptResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)
        
    def handle_kg_prompt(self, id, v):

-        prompt = to_kg_query(v.query, v.kg)
+        try:

-        print(prompt)
+            prompt = to_kg_query(v.query, v.kg)

-        ans = self.llm.request(prompt)
+            print(prompt)

-        print(ans)
+            ans = self.llm.request(prompt)

-        print("Send response...", flush=True)
-        r = PromptResponse(answer=ans)
-        self.producer.send(r, properties={"id": id})
+            print(ans)

-        print("Done.", flush=True)
+            print("Send response...", flush=True)
+            r = PromptResponse(answer=ans, error=None)
+            self.producer.send(r, properties={"id": id})
+
+            print("Done.", flush=True)
+
+        except Exception as e:
+
+            print(f"Exception: {e}")
+
+            print("Send error response...", flush=True)
+
+            r = PromptResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)
        
    @staticmethod
    def add_args(parser):
--- a/trustgraph/model/text_completion/azure/llm.py
+++ b/trustgraph/model/text_completion/azure/llm.py
@ -7,7 +7,7 @@ serverless endpoint service.  Input is prompt, output is response.
 import requests
 import json

-from .... schema import TextCompletionRequest, TextCompletionResponse
+from .... schema import TextCompletionRequest, TextCompletionResponse, Error
 from .... schema import text_completion_request_queue
 from .... schema import text_completion_response_queue
 from .... log_level import LogLevel
@ -89,6 +89,9 @@ class Processor(ConsumerProducer):
        if resp.status_code == 429:
            raise TooManyRequests()

+        if resp.status_code != 200:
+            raise RuntimeError("LLM failure")
+
        result = resp.json()

        message_content = result['choices'][0]['message']['content']
@ -110,15 +113,49 @@ class Processor(ConsumerProducer):
            v.prompt
        )

-        response = self.call_llm(prompt)
+        try:

-        print("Send response...", flush=True)
+            response = self.call_llm(prompt)

-        resp = response.replace("```json", "")
-        resp = response.replace("```", "")
+            print("Send response...", flush=True)

-        r = TextCompletionResponse(response=resp)
-        self.producer.send(r, properties={"id": id})
+            resp = response.replace("```json", "")
+            resp = response.replace("```", "")
+
+            r = TextCompletionResponse(response=resp)
+            self.producer.send(r, properties={"id": id})
+
+        except TooManyRequests:
+
+            print("Send rate limit response...", flush=True)
+
+            r = TextCompletionResponse(
+                error=Error(
+                    type = "rate-limit",
+                    message = str(e),
+                )
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)
+
+        except Exception as e:
+
+            print(f"Exception: {e}")
+
+            print("Send error response...", flush=True)
+
+            r = TextCompletionResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                )
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)

        print("Done.", flush=True)

--- a/trustgraph/model/text_completion/bedrock/llm.py
+++ b/trustgraph/model/text_completion/bedrock/llm.py
@ -7,7 +7,7 @@ Input is prompt, output is response. Mistral is default.
 import boto3
 import json

-from .... schema import TextCompletionRequest, TextCompletionResponse
+from .... schema import TextCompletionRequest, TextCompletionResponse, Error
 from .... schema import text_completion_request_queue
 from .... schema import text_completion_response_queue
 from .... log_level import LogLevel
@ -130,40 +130,81 @@ class Processor(ConsumerProducer):
        accept = 'application/json'
        contentType = 'application/json'

-        # FIXME: Consider catching request limits and raise TooManyRequests
-        # See https://boto3.amazonaws.com/v1/documentation/api/latest/guide/retries.html
-        response = self.bedrock.invoke_model(body=promptbody, modelId=self.model, accept=accept, contentType=contentType)
-        
-        # Mistral Response Structure
-        if self.model.startswith("mistral"):
-            response_body = json.loads(response.get("body").read())
-            outputtext = response_body['outputs'][0]['text']
+        try:

-        # Claude Response Structure
-        elif self.model.startswith("anthropic"):
-            model_response = json.loads(response["body"].read())
-            outputtext = model_response['content'][0]['text']
+            # FIXME: Consider catching request limits and raise TooManyRequests
+            # See https://boto3.amazonaws.com/v1/documentation/api/latest/guide/retries.html
+            response = self.bedrock.invoke_model(body=promptbody, modelId=self.model, accept=accept, contentType=contentType)

-        # Llama 3.1 Response Structure
-        elif self.model.startswith("meta"):
-            model_response = json.loads(response["body"].read())
-            outputtext = model_response["generation"]
+            # Mistral Response Structure
+            if self.model.startswith("mistral"):
+                response_body = json.loads(response.get("body").read())
+                outputtext = response_body['outputs'][0]['text']

-        # Use Mistral as default
-        else:
-            response_body = json.loads(response.get("body").read())
-            outputtext = response_body['outputs'][0]['text']            
- 
-        print(outputtext, flush=True)
+            # Claude Response Structure
+            elif self.model.startswith("anthropic"):
+                model_response = json.loads(response["body"].read())
+                outputtext = model_response['content'][0]['text']

-        resp = outputtext.replace("```json", "")
-        resp = outputtext.replace("```", "")    
-    
-        print("Send response...", flush=True)
-        r = TextCompletionResponse(response=resp)
-        self.send(r, properties={"id": id})
+            # Llama 3.1 Response Structure
+            elif self.model.startswith("meta"):
+                model_response = json.loads(response["body"].read())
+                outputtext = model_response["generation"]

-        print("Done.", flush=True)
+            # Use Mistral as default
+            else:
+                response_body = json.loads(response.get("body").read())
+                outputtext = response_body['outputs'][0]['text']            
+
+            print(outputtext, flush=True)
+
+            resp = outputtext.replace("```json", "")
+            resp = outputtext.replace("```", "")    
+
+            print("Send response...", flush=True)
+            r = TextCompletionResponse(
+                error=None,
+                response=resp
+            )
+
+            self.send(r, properties={"id": id})
+
+            print("Done.", flush=True)
+
+
+        # FIXME: Wrong exception, don't know what Bedrock throws
+        # for a rate limit
+        except TooManyRequests:
+
+            print("Send rate limit response...", flush=True)
+
+            r = TextCompletionResponse(
+                error=Error(
+                    type = "rate-limit",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)
+
+        except Exception as e:
+
+            print(f"Exception: {e}")
+
+            print("Send error response...", flush=True)
+
+            r = TextCompletionResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.consumer.acknowledge(msg)

    @staticmethod
    def add_args(parser):
--- a/trustgraph/model/text_completion/claude/llm.py
+++ b/trustgraph/model/text_completion/claude/llm.py
@ -6,11 +6,12 @@ Input is prompt, output is response.

 import anthropic

-from .... schema import TextCompletionRequest, TextCompletionResponse
+from .... schema import TextCompletionRequest, TextCompletionResponse, Error
 from .... schema import text_completion_request_queue
 from .... schema import text_completion_response_queue
 from .... log_level import LogLevel
 from .... base import ConsumerProducer
+from .... exceptions import TooManyRequests

 module = ".".join(__name__.split(".")[1:-1])

@ -65,33 +66,71 @@ class Processor(ConsumerProducer):

        prompt = v.prompt

-        # FIXME: Rate limits?
-        response = message = self.claude.messages.create(
-            model=self.model,
-            max_tokens=self.max_output,
-            temperature=self.temperature,
-            system = "You are a helpful chatbot.",
-            messages=[
-                {
-                    "role": "user",
-                    "content": [
-                        {
-                            "type": "text",
-                            "text": prompt
-                        }
-                    ]
-                }
-            ]
-        )
+        try:

-        resp = response.content[0].text
-        print(resp, flush=True)
+            # FIXME: Rate limits?
+            response = message = self.claude.messages.create(
+                model=self.model,
+                max_tokens=self.max_output,
+                temperature=self.temperature,
+                system = "You are a helpful chatbot.",
+                messages=[
+                    {
+                        "role": "user",
+                        "content": [
+                            {
+                                "type": "text",
+                                "text": prompt
+                            }
+                        ]
+                    }
+                ]
+            )

-        print("Send response...", flush=True)
-        r = TextCompletionResponse(response=resp)
-        self.send(r, properties={"id": id})
+            resp = response.content[0].text
+            print(resp, flush=True)

-        print("Done.", flush=True)
+            print("Send response...", flush=True)
+            r = TextCompletionResponse(response=resp)
+            self.send(r, properties={"id": id})
+
+            print("Done.", flush=True)
+
+        # FIXME: Wrong exception, don't know what this LLM throws
+        # for a rate limit
+        except TooManyRequests:
+
+            print("Send rate limit response...", flush=True)
+
+            r = TextCompletionResponse(
+                error=Error(
+                    type = "rate-limit",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)
+
+        except Exception as e:
+
+            print(f"Exception: {e}")
+
+            print("Send error response...", flush=True)
+
+            r = TextCompletionResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)

    @staticmethod
    def add_args(parser):
--- a/trustgraph/model/text_completion/cohere/llm.py
+++ b/trustgraph/model/text_completion/cohere/llm.py
@ -6,11 +6,12 @@ Input is prompt, output is response.

 import cohere

-from .... schema import TextCompletionRequest, TextCompletionResponse
+from .... schema import TextCompletionRequest, TextCompletionResponse, Error
 from .... schema import text_completion_request_queue
 from .... schema import text_completion_response_queue
 from .... log_level import LogLevel
 from .... base import ConsumerProducer
+from .... exceptions import TooManyRequests

 module = ".".join(__name__.split(".")[1:-1])

@ -61,28 +62,65 @@ class Processor(ConsumerProducer):

        prompt = v.prompt

-        # FIXME: Deal with rate limits?
-        output = self.cohere.chat( 
-            model=self.model,
-            message=prompt,
-            preamble = "You are a helpful AI-assistant.",
-            temperature=self.temperature,
-            chat_history=[],
-            prompt_truncation='auto',
-            connectors=[]
-        )
+        try:

-        resp = output.text
-        print(resp, flush=True)
+            output = self.cohere.chat( 
+                model=self.model,
+                message=prompt,
+                preamble = "You are a helpful AI-assistant.",
+                temperature=self.temperature,
+                chat_history=[],
+                prompt_truncation='auto',
+                connectors=[]
+            )

-        resp = resp.replace("```json", "")
-        resp = resp.replace("```", "")
-        
-        print("Send response...", flush=True)
-        r = TextCompletionResponse(response=resp)
-        self.send(r, properties={"id": id})
+            resp = output.text
+            print(resp, flush=True)

-        print("Done.", flush=True)
+            resp = resp.replace("```json", "")
+            resp = resp.replace("```", "")
+
+            print("Send response...", flush=True)
+            r = TextCompletionResponse(response=resp)
+            self.send(r, properties={"id": id})
+
+            print("Done.", flush=True)
+
+        # FIXME: Wrong exception, don't know what this LLM throws
+        # for a rate limit
+        except TooManyRequests:
+
+            print("Send rate limit response...", flush=True)
+
+            r = TextCompletionResponse(
+                error=Error(
+                    type = "rate-limit",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)
+
+        except Exception as e:
+
+            print(f"Exception: {e}")
+
+            print("Send error response...", flush=True)
+
+            r = TextCompletionResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)

    @staticmethod
    def add_args(parser):
--- a/trustgraph/model/text_completion/ollama/llm.py
+++ b/trustgraph/model/text_completion/ollama/llm.py
@ -7,11 +7,12 @@ Input is prompt, output is response.
 from langchain_community.llms import Ollama
 from prometheus_client import Histogram, Info, Counter

-from .... schema import TextCompletionRequest, TextCompletionResponse
+from .... schema import TextCompletionRequest, TextCompletionResponse, Error
 from .... schema import text_completion_request_queue
 from .... schema import text_completion_response_queue
 from .... log_level import LogLevel
 from .... base import ConsumerProducer
+from .... exceptions import TooManyRequests

 module = ".".join(__name__.split(".")[1:-1])

@ -66,19 +67,56 @@ class Processor(ConsumerProducer):

        prompt = v.prompt

-        # FIXME: Rate limits?
-        response = self.llm.invoke(prompt)
+        try:

-        print("Send response...", flush=True)
+            response = self.llm.invoke(prompt)

-        resp = response.replace("```json", "")
-        resp = response.replace("```", "")
+            print("Send response...", flush=True)

-        r = TextCompletionResponse(response=resp)
+            resp = response.replace("```json", "")
+            resp = response.replace("```", "")

-        self.send(r, properties={"id": id})
+            r = TextCompletionResponse(response=resp)

-        print("Done.", flush=True)
+            self.send(r, properties={"id": id})
+
+            print("Done.", flush=True)
+
+        # FIXME: Wrong exception, don't know what this LLM throws
+        # for a rate limit
+        except TooManyRequests:
+
+            print("Send rate limit response...", flush=True)
+
+            r = TextCompletionResponse(
+                error=Error(
+                    type = "rate-limit",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)
+
+        except Exception as e:
+
+            print(f"Exception: {e}")
+
+            print("Send error response...", flush=True)
+
+            r = TextCompletionResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)

    @staticmethod
    def add_args(parser):
--- a/trustgraph/model/text_completion/openai/llm.py
+++ b/trustgraph/model/text_completion/openai/llm.py
@ -6,11 +6,12 @@ Input is prompt, output is response.

 from openai import OpenAI

-from .... schema import TextCompletionRequest, TextCompletionResponse
+from .... schema import TextCompletionRequest, TextCompletionResponse, Error
 from .... schema import text_completion_request_queue
 from .... schema import text_completion_response_queue
 from .... log_level import LogLevel
 from .... base import ConsumerProducer
+from .... exceptions import TooManyRequests

 module = ".".join(__name__.split(".")[1:-1])

@ -65,37 +66,75 @@ class Processor(ConsumerProducer):

        prompt = v.prompt

-        # FIXME: Rate limits
-        resp = self.openai.chat.completions.create(
-            model=self.model,
-            messages=[
-                {
-                    "role": "user",
-                    "content": [
-                        {
-                            "type": "text",
-                            "text": prompt
-                        }
-                    ]
+        try:
+
+            # FIXME: Rate limits
+            resp = self.openai.chat.completions.create(
+                model=self.model,
+                messages=[
+                    {
+                        "role": "user",
+                        "content": [
+                            {
+                                "type": "text",
+                                "text": prompt
+                            }
+                        ]
+                    }
+                ],
+                temperature=self.temperature,
+                max_tokens=self.max_output,
+                top_p=1,
+                frequency_penalty=0,
+                presence_penalty=0,
+                response_format={
+                    "type": "text"
                }
-            ],
-            temperature=self.temperature,
-            max_tokens=self.max_output,
-            top_p=1,
-            frequency_penalty=0,
-            presence_penalty=0,
-            response_format={
-                "type": "text"
-            }
-        )
+            )

-        print(resp.choices[0].message.content, flush=True)
+            print(resp.choices[0].message.content, flush=True)

-        print("Send response...", flush=True)
-        r = TextCompletionResponse(response=resp.choices[0].message.content)
-        self.send(r, properties={"id": id})
+            print("Send response...", flush=True)
+            r = TextCompletionResponse(response=resp.choices[0].message.content)
+            self.send(r, properties={"id": id})

-        print("Done.", flush=True)
+            print("Done.", flush=True)
+
+        # FIXME: Wrong exception, don't know what this LLM throws
+        # for a rate limit
+        except TooManyRequests:
+
+            print("Send rate limit response...", flush=True)
+
+            r = TextCompletionResponse(
+                error=Error(
+                    type = "rate-limit",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)
+
+        except Exception as e:
+
+            print(f"Exception: {e}")
+
+            print("Send error response...", flush=True)
+
+            r = TextCompletionResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)

    @staticmethod
    def add_args(parser):
--- a/trustgraph/model/text_completion/vertexai/llm.py
+++ b/trustgraph/model/text_completion/vertexai/llm.py
@ -21,7 +21,7 @@ from vertexai.preview.generative_models import (
    Tool,
 )

-from .... schema import TextCompletionRequest, TextCompletionResponse
+from .... schema import TextCompletionRequest, TextCompletionResponse, Error
 from .... schema import text_completion_request_queue
 from .... schema import text_completion_response_queue
 from .... log_level import LogLevel
@ -136,7 +136,12 @@ class Processor(ConsumerProducer):
            resp = resp.replace("```", "")

            print("Send response...", flush=True)
-            r = TextCompletionResponse(response=resp)
+
+            r = TextCompletionResponse(
+                error=None,
+                response=resp,
+            )
+
            self.producer.send(r, properties={"id": id})

            print("Done.", flush=True)
@ -144,12 +149,39 @@ class Processor(ConsumerProducer):
            # Acknowledge successful processing of the message
            self.consumer.acknowledge(msg)

-        except google.api_core.exceptions.ResourceExhausted:
+        except google.api_core.exceptions.ResourceExhausted as e:

-            # 429 / rate limits case
-            raise TooManyRequests
+            print("Send rate limit response...", flush=True)

-        # Let other exceptions fall through
+            r = TextCompletionResponse(
+                error=Error(
+                    type = "rate-limit",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)
+
+        except Exception as e:
+
+            print(f"Exception: {e}")
+
+            print("Send error response...", flush=True)
+
+            r = TextCompletionResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)

    @staticmethod
    def add_args(parser):
--- a/trustgraph/query/graph_embeddings/milvus/service.py
+++ b/trustgraph/query/graph_embeddings/milvus/service.py
@ -5,7 +5,8 @@ entities
 """

 from .... direct.milvus import TripleVectors
-from .... schema import GraphEmbeddingsRequest, GraphEmbeddingsResponse, Value
+from .... schema import GraphEmbeddingsRequest, GraphEmbeddingsResponse
+from .... schema import Error, Value
 from .... schema import graph_embeddings_request_queue
 from .... schema import graph_embeddings_response_queue
 from .... base import ConsumerProducer
@ -47,38 +48,58 @@ class Processor(ConsumerProducer):
        
    def handle(self, msg):

-        v = msg.value()
+        try:

-        # Sender-produced ID
-        id = msg.properties()["id"]
+            v = msg.value()

-        print(f"Handling input {id}...", flush=True)
+            # Sender-produced ID
+            id = msg.properties()["id"]

-        entities = set()
+            print(f"Handling input {id}...", flush=True)

-        for vec in v.vectors:
+            entities = set()

-            resp = self.vecstore.search(vec, limit=v.limit)
+            for vec in v.vectors:

-            for r in resp:
-                ent = r["entity"]["entity"]
-                entities.add(ent)
+                resp = self.vecstore.search(vec, limit=v.limit)

-        # Convert set to list
-        entities = list(entities)
+                for r in resp:
+                    ent = r["entity"]["entity"]
+                    entities.add(ent)

-        ents2 = []
+            # Convert set to list
+            entities = list(entities)

-        for ent in entities:
-            ents2.append(self.create_value(ent))
+            ents2 = []

-        entities = ents2
+            for ent in entities:
+                ents2.append(self.create_value(ent))

-        print("Send response...", flush=True)
-        r = GraphEmbeddingsResponse(entities=entities)
-        self.producer.send(r, properties={"id": id})
+            entities = ents2

-        print("Done.", flush=True)
+            print("Send response...", flush=True)
+            r = GraphEmbeddingsResponse(entities=entities, error=None)
+            self.producer.send(r, properties={"id": id})
+
+            print("Done.", flush=True)
+
+        except Exception as e:
+
+            print(f"Exception: {e}")
+
+            print("Send error response...", flush=True)
+
+            r = GraphEmbeddingsResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)

    @staticmethod
    def add_args(parser):
--- a/trustgraph/query/triples/cassandra/service.py
+++ b/trustgraph/query/triples/cassandra/service.py
@ -5,7 +5,7 @@ null.  Output is a list of triples.
 """

 from .... direct.cassandra import TrustGraph
-from .... schema import TriplesQueryRequest, TriplesQueryResponse
+from .... schema import TriplesQueryRequest, TriplesQueryResponse, Error
 from .... schema import Value, Triple
 from .... schema import triples_request_queue
 from .... schema import triples_response_queue
@ -48,90 +48,110 @@ class Processor(ConsumerProducer):

    def handle(self, msg):

-        v = msg.value()
+        try:

-        # Sender-produced ID
-        id = msg.properties()["id"]
+            v = msg.value()

-        print(f"Handling input {id}...", flush=True)
+            # Sender-produced ID
+            id = msg.properties()["id"]

-        triples = []
+            print(f"Handling input {id}...", flush=True)

-        if v.s is not None:
-            if v.p is not None:
-                if v.o is not None:
-                    resp = self.tg.get_spo(
-                        v.s.value, v.p.value, v.o.value,
-                        limit=v.limit
-                    )
-                    triples.append((v.s.value, v.p.value, v.o.value))
+            triples = []
+
+            if v.s is not None:
+                if v.p is not None:
+                    if v.o is not None:
+                        resp = self.tg.get_spo(
+                            v.s.value, v.p.value, v.o.value,
+                            limit=v.limit
+                        )
+                        triples.append((v.s.value, v.p.value, v.o.value))
+                    else:
+                        resp = self.tg.get_sp(
+                            v.s.value, v.p.value,
+                            limit=v.limit
+                        )
+                        for t in resp:
+                            triples.append((v.s.value, v.p.value, t.o))
                else:
-                    resp = self.tg.get_sp(
-                        v.s.value, v.p.value,
-                        limit=v.limit
-                    )
-                    for t in resp:
-                        triples.append((v.s.value, v.p.value, t.o))
+                    if v.o is not None:
+                        resp = self.tg.get_os(
+                            v.o.value, v.s.value, 
+                            limit=v.limit
+                        )
+                        for t in resp:
+                            triples.append((v.s.value, t.p, v.o.value))
+                    else:
+                        resp = self.tg.get_s(
+                            v.s.value,
+                            limit=v.limit
+                        )
+                        for t in resp:
+                            triples.append((v.s.value, t.p, t.o))
            else:
-                if v.o is not None:
-                    resp = self.tg.get_os(
-                        v.o.value, v.s.value, 
-                        limit=v.limit
-                    )
-                    for t in resp:
-                        triples.append((v.s.value, t.p, v.o.value))
+                if v.p is not None:
+                    if v.o is not None:
+                        resp = self.tg.get_po(
+                            v.p.value, v.o.value,
+                            limit=v.limit
+                        )
+                        for t in resp:
+                            triples.append((t.s, v.p.value, v.o.value))
+                    else:
+                        resp = self.tg.get_p(
+                            v.p.value,
+                            limit=v.limit
+                        )
+                        for t in resp:
+                            triples.append((t.s, v.p.value, t.o))
                else:
-                    resp = self.tg.get_s(
-                        v.s.value,
-                        limit=v.limit
-                    )
-                    for t in resp:
-                        triples.append((v.s.value, t.p, t.o))
-        else:
-            if v.p is not None:
-                if v.o is not None:
-                    resp = self.tg.get_po(
-                        v.p.value, v.o.value,
-                        limit=v.limit
-                    )
-                    for t in resp:
-                        triples.append((t.s, v.p.value, v.o.value))
-                else:
-                    resp = self.tg.get_p(
-                        v.p.value,
-                        limit=v.limit
-                    )
-                    for t in resp:
-                        triples.append((t.s, v.p.value, t.o))
-            else:
-                if v.o is not None:
-                    resp = self.tg.get_o(
-                        v.o.value,
-                        limit=v.limit
-                    )
-                    for t in resp:
-                        triples.append((t.s, t.p, v.o.value))
-                else:
-                    resp = self.tg.get_all(
-                        limit=v.limit
-                    )
-                    for t in resp:
-                        triples.append((t.s, t.p, t.o))
+                    if v.o is not None:
+                        resp = self.tg.get_o(
+                            v.o.value,
+                            limit=v.limit
+                        )
+                        for t in resp:
+                            triples.append((t.s, t.p, v.o.value))
+                    else:
+                        resp = self.tg.get_all(
+                            limit=v.limit
+                        )
+                        for t in resp:
+                            triples.append((t.s, t.p, t.o))

-        triples = [
-            Triple(
-                s=self.create_value(t[0]),
-                p=self.create_value(t[1]), 
-                o=self.create_value(t[2])
+            triples = [
+                Triple(
+                    s=self.create_value(t[0]),
+                    p=self.create_value(t[1]), 
+                    o=self.create_value(t[2])
+                )
+                for t in triples
+            ]
+
+            print("Send response...", flush=True)
+            r = TriplesQueryResponse(triples=triples, error=None)
+            self.producer.send(r, properties={"id": id})
+
+            print("Done.", flush=True)
+
+        except Exception as e:
+
+            print(f"Exception: {e}")
+
+            print("Send error response...", flush=True)
+
+            r = TriplesQueryResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                ),
+                response=None,
            )
-            for t in triples
-        ]

-        print("Send response...", flush=True)
-        r = TriplesQueryResponse(triples=triples)
-        self.producer.send(r, properties={"id": id})
+            self.producer.send(r, properties={"id": id})

-        print("Done.", flush=True)
+            self.consumer.acknowledge(msg)

    @staticmethod
    def add_args(parser):
--- a/trustgraph/query/triples/neo4j/service.py
+++ b/trustgraph/query/triples/neo4j/service.py
@ -6,7 +6,7 @@ null.  Output is a list of triples.

 from neo4j import GraphDatabase

-from .... schema import TriplesQueryRequest, TriplesQueryResponse
+from .... schema import TriplesQueryRequest, TriplesQueryResponse, Error
 from .... schema import Value, Triple
 from .... schema import triples_request_queue
 from .... schema import triples_response_queue
@ -57,245 +57,265 @@ class Processor(ConsumerProducer):

    def handle(self, msg):

-        v = msg.value()
+        try:

-        # Sender-produced ID
-        id = msg.properties()["id"]
+            v = msg.value()

-        print(f"Handling input {id}...", flush=True)
+            # Sender-produced ID
+            id = msg.properties()["id"]

-        triples = []
+            print(f"Handling input {id}...", flush=True)

-        if v.s is not None:
-            if v.p is not None:
-                if v.o is not None:
+            triples = []

-                    # SPO
+            if v.s is not None:
+                if v.p is not None:
+                    if v.o is not None:

-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node {uri: $src})-[rel:Rel {uri: $rel}]->(dest:Literal {value: $value}) "
-                        "RETURN $src as src",
-                        src=v.s.value, rel=v.p.value, value=v.o.value,
-                        database_=self.db,
-                    )
+                        # SPO

-                    for rec in records:
-                        triples.append((v.s.value, v.p.value, v.o.value))
-                    
-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node {uri: $src})-[rel:Rel {uri: $rel}]->(dest:Node {uri: $uri}) "
-                        "RETURN $src as src",
-                        src=v.s.value, rel=v.p.value, uri=v.o.value,
-                        database_=self.db,
-                    )
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node {uri: $src})-[rel:Rel {uri: $rel}]->(dest:Literal {value: $value}) "
+                            "RETURN $src as src",
+                            src=v.s.value, rel=v.p.value, value=v.o.value,
+                            database_=self.db,
+                        )

-                    for rec in records:
-                        triples.append((v.s.value, v.p.value, v.o.value))
+                        for rec in records:
+                            triples.append((v.s.value, v.p.value, v.o.value))
+
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node {uri: $src})-[rel:Rel {uri: $rel}]->(dest:Node {uri: $uri}) "
+                            "RETURN $src as src",
+                            src=v.s.value, rel=v.p.value, uri=v.o.value,
+                            database_=self.db,
+                        )
+
+                        for rec in records:
+                            triples.append((v.s.value, v.p.value, v.o.value))
+
+                    else:
+
+                        # SP
+
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node {uri: $src})-[rel:Rel {uri: $rel}]->(dest:Literal) "
+                            "RETURN dest.value as dest",
+                            src=v.s.value, rel=v.p.value,
+                            database_=self.db,
+                        )
+
+                        for rec in records:
+                            data = rec.data()
+                            triples.append((v.s.value, v.p.value, data["dest"]))
+
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node {uri: $src})-[rel:Rel {uri: $rel}]->(dest:Node) "
+                            "RETURN dest.uri as dest",
+                            src=v.s.value, rel=v.p.value,
+                            database_=self.db,
+                        )
+
+                        for rec in records:
+                            data = rec.data()
+                            triples.append((v.s.value, v.p.value, data["dest"]))

                else:

-                    # SP
-                    
-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node {uri: $src})-[rel:Rel {uri: $rel}]->(dest:Literal) "
-                        "RETURN dest.value as dest",
-                        src=v.s.value, rel=v.p.value,
-                        database_=self.db,
-                    )
+                    if v.o is not None:

-                    for rec in records:
-                        data = rec.data()
-                        triples.append((v.s.value, v.p.value, data["dest"]))
-                    
-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node {uri: $src})-[rel:Rel {uri: $rel}]->(dest:Node) "
-                        "RETURN dest.uri as dest",
-                        src=v.s.value, rel=v.p.value,
-                        database_=self.db,
-                    )
+                        # SO
+
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node {uri: $src})-[rel:Rel]->(dest:Literal {value: $value}) "
+                            "RETURN rel.uri as rel",
+                            src=v.s.value, value=v.o.value,
+                            database_=self.db,
+                        )
+
+                        for rec in records:
+                            data = rec.data()
+                            triples.append((v.s.value, data["rel"], v.o.value))
+
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node {uri: $src})-[rel:Rel]->(dest:Node {uri: $uri}) "
+                            "RETURN rel.uri as rel",
+                            src=v.s.value, uri=v.o.value,
+                            database_=self.db,
+                        )
+
+                        for rec in records:
+                            data = rec.data()
+                            triples.append((v.s.value, data["rel"], v.o.value))
+
+                    else:
+
+                        # S
+
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node {uri: $src})-[rel:Rel]->(dest:Literal) "
+                            "RETURN rel.uri as rel, dest.value as dest",
+                            src=v.s.value,
+                            database_=self.db,
+                        )
+
+                        for rec in records:
+                            data = rec.data()
+                            triples.append((v.s.value, data["rel"], data["dest"]))
+
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node {uri: $src})-[rel:Rel]->(dest:Node) "
+                            "RETURN rel.uri as rel, dest.uri as dest",
+                            src=v.s.value,
+                            database_=self.db,
+                        )
+
+                        for rec in records:
+                            data = rec.data()
+                            triples.append((v.s.value, data["rel"], data["dest"]))

-                    for rec in records:
-                        data = rec.data()
-                        triples.append((v.s.value, v.p.value, data["dest"]))

            else:

-                if v.o is not None:
+                if v.p is not None:

-                    # SO
+                    if v.o is not None:

-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node {uri: $src})-[rel:Rel]->(dest:Literal {value: $value}) "
-                        "RETURN rel.uri as rel",
-                        src=v.s.value, value=v.o.value,
-                        database_=self.db,
-                    )
+                        # PO

-                    for rec in records:
-                        data = rec.data()
-                        triples.append((v.s.value, data["rel"], v.o.value))
-                    
-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node {uri: $src})-[rel:Rel]->(dest:Node {uri: $uri}) "
-                        "RETURN rel.uri as rel",
-                        src=v.s.value, uri=v.o.value,
-                        database_=self.db,
-                    )
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node)-[rel:Rel {uri: $uri}]->(dest:Literal {value: $value}) "
+                            "RETURN src.uri as src",
+                            uri=v.p.value, value=v.o.value,
+                            database_=self.db,
+                        )

-                    for rec in records:
-                        data = rec.data()
-                        triples.append((v.s.value, data["rel"], v.o.value))
+                        for rec in records:
+                            data = rec.data()
+                            triples.append((data["src"], v.p.value, v.o.value))
+
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node)-[rel:Rel {uri: $uri}]->(dest:Node {uri: $uri}) "
+                            "RETURN src.uri as src",
+                            uri=v.p.value, dest=v.o.value,
+                            database_=self.db,
+                        )
+
+                        for rec in records:
+                            data = rec.data()
+                            triples.append((data["src"], v.p.value, v.o.value))
+
+                    else:
+
+                        # P
+
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node)-[rel:Rel {uri: $uri}]->(dest:Literal) "
+                            "RETURN src.uri as src, dest.value as dest",
+                            uri=v.p.value,
+                            database_=self.db,
+                        )
+
+                        for rec in records:
+                            data = rec.data()
+                            triples.append((data["src"], v.p.value, data["dest"]))
+
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node)-[rel:Rel {uri: $uri}]->(dest:Node) "
+                            "RETURN src.uri as src, dest.uri as dest",
+                            uri=v.p.value,
+                            database_=self.db,
+                        )
+
+                        for rec in records:
+                            data = rec.data()
+                            triples.append((data["src"], v.p.value, data["dest"]))

                else:

-                    # S
+                    if v.o is not None:

-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node {uri: $src})-[rel:Rel]->(dest:Literal) "
-                        "RETURN rel.uri as rel, dest.value as dest",
-                        src=v.s.value,
-                        database_=self.db,
-                    )
+                        # O

-                    for rec in records:
-                        data = rec.data()
-                        triples.append((v.s.value, data["rel"], data["dest"]))
-                    
-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node {uri: $src})-[rel:Rel]->(dest:Node) "
-                        "RETURN rel.uri as rel, dest.uri as dest",
-                        src=v.s.value,
-                        database_=self.db,
-                    )
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node)-[rel:Rel]->(dest:Literal {value: $value}) "
+                            "RETURN src.uri as src, rel.uri as rel",
+                            value=v.o.value,
+                            database_=self.db,
+                        )

-                    for rec in records:
-                        data = rec.data()
-                        triples.append((v.s.value, data["rel"], data["dest"]))
+                        for rec in records:
+                            data = rec.data()
+                            triples.append((data["src"], data["rel"], v.o.value))

+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node)-[rel:Rel]->(dest:Node {uri: $uri}) "
+                            "RETURN src.uri as src, rel.uri as rel",
+                            uri=v.o.value,
+                            database_=self.db,
+                        )

-        else:
+                        for rec in records:
+                            data = rec.data()
+                            triples.append((data["src"], data["rel"], v.o.value))

-            if v.p is not None:
+                    else:

-                if v.o is not None:
+                        # *

-                    # PO
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node)-[rel:Rel]->(dest:Literal) "
+                            "RETURN src.uri as src, rel.uri as rel, dest.value as dest",
+                            database_=self.db,
+                        )

-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node)-[rel:Rel {uri: $uri}]->(dest:Literal {value: $value}) "
-                        "RETURN src.uri as src",
-                        uri=v.p.value, value=v.o.value,
-                        database_=self.db,
-                    )
+                        for rec in records:
+                            data = rec.data()
+                            triples.append((data["src"], data["rel"], data["dest"]))

-                    for rec in records:
-                        data = rec.data()
-                        triples.append((data["src"], v.p.value, v.o.value))
-                    
-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node)-[rel:Rel {uri: $uri}]->(dest:Node {uri: $uri}) "
-                        "RETURN src.uri as src",
-                        uri=v.p.value, dest=v.o.value,
-                        database_=self.db,
-                    )
+                        records, summary, keys = self.io.execute_query(
+                            "MATCH (src:Node)-[rel:Rel]->(dest:Node) "
+                            "RETURN src.uri as src, rel.uri as rel, dest.uri as dest",
+                            database_=self.db,
+                        )

-                    for rec in records:
-                        data = rec.data()
-                        triples.append((data["src"], v.p.value, v.o.value))
+                        for rec in records:
+                            data = rec.data()
+                            triples.append((data["src"], data["rel"], data["dest"]))

-                else:
+            triples = [
+                Triple(
+                    s=self.create_value(t[0]),
+                    p=self.create_value(t[1]), 
+                    o=self.create_value(t[2])
+                )
+                for t in triples
+            ]

-                    # P
+            print("Send response...", flush=True)
+            r = TriplesQueryResponse(triples=triples)
+            self.producer.send(r, properties={"id": id})

-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node)-[rel:Rel {uri: $uri}]->(dest:Literal) "
-                        "RETURN src.uri as src, dest.value as dest",
-                        uri=v.p.value,
-                        database_=self.db,
-                    )
+            print("Done.", flush=True)

-                    for rec in records:
-                        data = rec.data()
-                        triples.append((data["src"], v.p.value, data["dest"]))
-                    
-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node)-[rel:Rel {uri: $uri}]->(dest:Node) "
-                        "RETURN src.uri as src, dest.uri as dest",
-                        uri=v.p.value,
-                        database_=self.db,
-                    )
+        except Exception as e:

-                    for rec in records:
-                        data = rec.data()
-                        triples.append((data["src"], v.p.value, data["dest"]))
+            print(f"Exception: {e}")

-            else:
+            print("Send error response...", flush=True)

-                if v.o is not None:
-
-                    # O
-
-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node)-[rel:Rel]->(dest:Literal {value: $value}) "
-                        "RETURN src.uri as src, rel.uri as rel",
-                        value=v.o.value,
-                        database_=self.db,
-                    )
-
-                    for rec in records:
-                        data = rec.data()
-                        triples.append((data["src"], data["rel"], v.o.value))
-                    
-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node)-[rel:Rel]->(dest:Node {uri: $uri}) "
-                        "RETURN src.uri as src, rel.uri as rel",
-                        uri=v.o.value,
-                        database_=self.db,
-                    )
-
-                    for rec in records:
-                        data = rec.data()
-                        triples.append((data["src"], data["rel"], v.o.value))
-
-                else:
-
-                    # *
-
-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node)-[rel:Rel]->(dest:Literal) "
-                        "RETURN src.uri as src, rel.uri as rel, dest.value as dest",
-                        database_=self.db,
-                    )
-
-                    for rec in records:
-                        data = rec.data()
-                        triples.append((data["src"], data["rel"], data["dest"]))
-                    
-                    records, summary, keys = self.io.execute_query(
-                        "MATCH (src:Node)-[rel:Rel]->(dest:Node) "
-                        "RETURN src.uri as src, rel.uri as rel, dest.uri as dest",
-                        database_=self.db,
-                    )
-
-                    for rec in records:
-                        data = rec.data()
-                        triples.append((data["src"], data["rel"], data["dest"]))
-
-        triples = [
-            Triple(
-                s=self.create_value(t[0]),
-                p=self.create_value(t[1]), 
-                o=self.create_value(t[2])
+            r = TriplesQueryResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                ),
+                response=None,
            )
-            for t in triples
-        ]

-        print("Send response...", flush=True)
-        r = TriplesQueryResponse(triples=triples)
-        self.producer.send(r, properties={"id": id})
-
-        print("Done.", flush=True)
+            self.producer.send(r, properties={"id": id})

+            self.consumer.acknowledge(msg)
+            
    @staticmethod
    def add_args(parser):

--- a/trustgraph/retrieval/graph_rag/rag.py
+++ b/trustgraph/retrieval/graph_rag/rag.py
@ -4,7 +4,7 @@ Simple RAG service, performs query using graph RAG an LLM.
 Input is query, output is response.
 """

-from ... schema import GraphRagQuery, GraphRagResponse
+from ... schema import GraphRagQuery, GraphRagResponse, Error
 from ... schema import graph_rag_request_queue, graph_rag_response_queue
 from ... schema import prompt_request_queue
 from ... schema import prompt_response_queue
@ -99,21 +99,40 @@ class Processor(ConsumerProducer):

    def handle(self, msg):

-        v = msg.value()
+        try:

-        # Sender-produced ID
+            v = msg.value()

-        id = msg.properties()["id"]
+            # Sender-produced ID
+            id = msg.properties()["id"]

-        print(f"Handling input {id}...", flush=True)
+            print(f"Handling input {id}...", flush=True)

-        response = self.rag.query(v.query)
+            response = self.rag.query(v.query)

-        print("Send response...", flush=True)
-        r = GraphRagResponse(response = response)
-        self.producer.send(r, properties={"id": id})
+            print("Send response...", flush=True)
+            r = GraphRagResponse(response = response, error=None)
+            self.producer.send(r, properties={"id": id})

-        print("Done.", flush=True)
+            print("Done.", flush=True)
+
+        except Exception as e:
+
+            print(f"Exception: {e}")
+
+            print("Send error response...", flush=True)
+
+            r = GraphRagResponse(
+                error=Error(
+                    type = "llm-error",
+                    message = str(e),
+                ),
+                response=None,
+            )
+
+            self.producer.send(r, properties={"id": id})
+
+            self.consumer.acknowledge(msg)

    @staticmethod
    def add_args(parser):
--- a/trustgraph/schema.py
+++ b/trustgraph/schema.py
@ -8,6 +8,12 @@ def topic(topic, kind='persistent', tenant='tg', namespace='flow'):

 ############################################################################

+class Error(Record):
+    type = String()
+    message = String()
+
+############################################################################
+
 class Value(Record):
    value = String()
    is_uri = Boolean()
@ -78,6 +84,7 @@ class GraphEmbeddingsRequest(Record):
    limit = Integer()

 class GraphEmbeddingsResponse(Record):
+    error = Error()
    entities = Array(Value())

 graph_embeddings_request_queue = topic(
@ -110,6 +117,7 @@ class TriplesQueryRequest(Record):
    limit = Integer()

 class TriplesQueryResponse(Record):
+    error = Error()
    triples = Array(Triple())

 triples_request_queue = topic(
@ -131,6 +139,7 @@ class TextCompletionRequest(Record):
    prompt = String()

 class TextCompletionResponse(Record):
+    error = Error()
    response = String()

 text_completion_request_queue = topic(
@ -148,6 +157,7 @@ class EmbeddingsRequest(Record):
    text = String()

 class EmbeddingsResponse(Record):
+    error = Error()
    vectors = Array(Array(Double()))

 embeddings_request_queue = topic(
@ -165,6 +175,7 @@ class GraphRagQuery(Record):
    query = String()

 class GraphRagResponse(Record):
+    error = Error()
    response = String()

 graph_rag_request_queue = topic(
@ -207,6 +218,7 @@ class PromptRequest(Record):
    kg = Array(Fact())

 class PromptResponse(Record):
+    error = Error()
    answer = String()
    definitions = Array(Definition())
    relationships = Array(Relationship())