Fix ontology RAG pipeline + add query concurrency (#691)

- Fix ontology RAG pipeline: embeddings API, chunker provenance, and query concurrency - Fix ontology embeddings to use correct response shape from embed() API (returns list of vectors, not list of list of vectors). - Simplify chunker URI logic to append /c{index} to parent ID instead of parsing page/doc URI structure which was fragile. - Add provenance tracking and librarian integration to token chunker, matching recursive chunker capabilities. - Add configurable concurrency (default 10) to Cassandra, Qdrant, and embeddings query services.
2026-06-23 13:48:06 +02:00 · 2026-03-12 11:34:42 +00:00 · 2026-03-12 11:34:42 +00:00 · 45e6ad4abc
commit 45e6ad4abc
parent 312174eb88
9 changed files with 148 additions and 50 deletions
--- a/trustgraph-base/trustgraph/base/document_embeddings_query_service.py
+++ b/trustgraph-base/trustgraph/base/document_embeddings_query_service.py
@ -17,12 +17,14 @@ from . producer_spec import ProducerSpec
 logger = logging.getLogger(__name__)

 default_ident = "doc-embeddings-query"
+default_concurrency = 10

 class DocumentEmbeddingsQueryService(FlowProcessor):

    def __init__(self, **params):

        id = params.get("id")
+        concurrency = params.get("concurrency", default_concurrency)

        super(DocumentEmbeddingsQueryService, self).__init__(
            **params | { "id": id }
@ -32,7 +34,8 @@ class DocumentEmbeddingsQueryService(FlowProcessor):
            ConsumerSpec(
                name = "request",
                schema = DocumentEmbeddingsRequest,
-                handler = self.on_message
+                handler = self.on_message,
+                concurrency = concurrency,
            )
        )

@ -83,6 +86,13 @@ class DocumentEmbeddingsQueryService(FlowProcessor):

        FlowProcessor.add_args(parser)

+        parser.add_argument(
+            '-c', '--concurrency',
+            type=int,
+            default=default_concurrency,
+            help=f'Number of concurrent requests (default: {default_concurrency})'
+        )
+
 def run():

    Processor.launch(default_ident, __doc__)
--- a/trustgraph-base/trustgraph/base/graph_embeddings_query_service.py
+++ b/trustgraph-base/trustgraph/base/graph_embeddings_query_service.py
@ -17,12 +17,14 @@ from . producer_spec import ProducerSpec
 logger = logging.getLogger(__name__)

 default_ident = "graph-embeddings-query"
+default_concurrency = 10

 class GraphEmbeddingsQueryService(FlowProcessor):

    def __init__(self, **params):

        id = params.get("id")
+        concurrency = params.get("concurrency", default_concurrency)

        super(GraphEmbeddingsQueryService, self).__init__(
            **params | { "id": id }
@ -32,7 +34,8 @@ class GraphEmbeddingsQueryService(FlowProcessor):
            ConsumerSpec(
                name = "request",
                schema = GraphEmbeddingsRequest,
-                handler = self.on_message
+                handler = self.on_message,
+                concurrency = concurrency,
            )
        )

@ -83,6 +86,13 @@ class GraphEmbeddingsQueryService(FlowProcessor):

        FlowProcessor.add_args(parser)

+        parser.add_argument(
+            '-c', '--concurrency',
+            type=int,
+            default=default_concurrency,
+            help=f'Number of concurrent requests (default: {default_concurrency})'
+        )
+
 def run():

    Processor.launch(default_ident, __doc__)