MCP client support (#427)

- MCP client service - Tool request/response schema - API gateway support for mcp-tool - Message translation for tool request & response - Make mcp-tool using configuration service for information about where the MCP services are.
2026-04-27 09:26:22 +02:00 · 2025-07-07 23:52:23 +01:00 · 2025-07-07 23:52:23 +01:00 · e56186054a
commit e56186054a
parent 21bee4cd83
13 changed files with 356 additions and 2 deletions
--- a/trustgraph-base/trustgraph/base/init.py
+++ b/trustgraph-base/trustgraph/base/init.py
@ -28,4 +28,5 @@ from . triples_client import TriplesClientSpec
 from . document_embeddings_client import DocumentEmbeddingsClientSpec
 from . agent_service import AgentService
 from . graph_rag_client import GraphRagClientSpec
 from . tool_service import ToolService
--- a/trustgraph-base/trustgraph/base/tool_service.py
+++ b/trustgraph-base/trustgraph/base/tool_service.py
@ -0,0 +1,121 @@
 """
 Tool invocation base class
 """
 import json
 from prometheus_client import Counter
 from .. schema import ToolRequest, ToolResponse, Error
 from .. exceptions import TooManyRequests
 from .. base import FlowProcessor, ConsumerSpec, ProducerSpec
 default_concurrency = 1
 class ToolService(FlowProcessor):
    def __init__(self, **params):
        id = params.get("id")
        concurrency = params.get("concurrency", 1)
        super(ToolService, self).__init__(**params | {
            "id": id,
            "concurrency": concurrency,
        })
        self.register_specification(
            ConsumerSpec(
                name = "request",
                schema = ToolRequest,
                handler = self.on_request,
                concurrency = concurrency,
            )
        )
        self.register_specification(
            ProducerSpec(
                name = "response",
                schema = ToolResponse
            )
        )
        if not hasattr(__class__, "tool_invocation_metric"):
            __class__.tool_invocation_metric = Counter(
                'tool_invocation_count', 'Tool invocation count',
                ["id", "flow", "name"],
            )
    async def on_request(self, msg, consumer, flow):
        try:
            request = msg.value()
            # Sender-produced ID
            id = msg.properties()["id"]
            response = await self.invoke_tool(
                request.name,
                json.loads(request.parameters) if request.parameters else {},
            )
            if isinstance(response, str):
                await flow("response").send(
                    ToolResponse(
                        error=None,
                        text=response,
                        object=None,
                    ),
                    properties={"id": id}
                )
            else:
                await flow("response").send(
                    ToolResponse(
                        error=None,
                        text=None,
                        object=json.dumps(response),
                    ),
                    properties={"id": id}
                )
            __class__.tool_invocation_metric.labels(
                id = self.id, flow = flow.name, name = request.name,
            ).inc()
        except TooManyRequests as e:
            raise e
        except Exception as e:
            # Apart from rate limits, treat all exceptions as unrecoverable
            print(f"Exception: {e}")
            print("Send error response...", flush=True)
            await flow.producer["response"].send(
                ToolResponse(
                    error=Error(
                        type = "tool-error",
                        message = str(e),
                    ),
                    text=None,
                    object=None,
                ),
                properties={"id": id}
            )
    @staticmethod
    def add_args(parser):
        parser.add_argument(
            '-c', '--concurrency',
            type=int,
            default=default_concurrency,
            help=f'Concurrent processing threads (default: {default_concurrency})'
        )
        FlowProcessor.add_args(parser)
--- a/trustgraph-base/trustgraph/messaging/init.py
+++ b/trustgraph-base/trustgraph/messaging/init.py
@ -16,6 +16,7 @@ from .translators.document_loading import DocumentTranslator, TextDocumentTransl
 from .translators.config import ConfigRequestTranslator, ConfigResponseTranslator
 from .translators.flow import FlowRequestTranslator, FlowResponseTranslator
 from .translators.prompt import PromptRequestTranslator, PromptResponseTranslator
 from .translators.tool import ToolRequestTranslator, ToolResponseTranslator
 from .translators.embeddings_query import (
    DocumentEmbeddingsRequestTranslator, DocumentEmbeddingsResponseTranslator,
    GraphEmbeddingsRequestTranslator, GraphEmbeddingsResponseTranslator
@ -88,6 +89,12 @@ TranslatorRegistry.register_service(
    PromptResponseTranslator()
 )
 TranslatorRegistry.register_service(
    "tool", 
    ToolRequestTranslator(), 
    ToolResponseTranslator()
 )
 TranslatorRegistry.register_service(
    "document-embeddings-query", 
    DocumentEmbeddingsRequestTranslator(), 
--- a/trustgraph-base/trustgraph/messaging/translators/tool.py
+++ b/trustgraph-base/trustgraph/messaging/translators/tool.py
@ -0,0 +1,51 @@
 import json
 from typing import Dict, Any, Tuple
 from ...schema import ToolRequest, ToolResponse
 from .base import MessageTranslator
 class ToolRequestTranslator(MessageTranslator):
    """Translator for ToolRequest schema objects"""
    def to_pulsar(self, data: Dict[str, Any]) -> ToolRequest:
        # Handle both "name" and "parameters" input keys
        name = data.get("name", "")
        if "parameters" in data:
            parameters = json.dumps(data["parameters"])
        else:
            parameters = None
        return ToolRequest(
            name = name,
            parameters = parameters,
        )
    def from_pulsar(self, obj: ToolRequest) -> Dict[str, Any]:
        result = {}
        if obj.name:
            result["name"] = obj.name
        if obj.parameters is not None:
            result["parameters"] = json.loads(obj.parameters)
        return result
 class ToolResponseTranslator(MessageTranslator):
    """Translator for ToolResponse schema objects"""
    def to_pulsar(self, data: Dict[str, Any]) -> ToolResponse:
        raise NotImplementedError("Response translation to Pulsar not typically needed")
    def from_pulsar(self, obj: ToolResponse) -> Dict[str, Any]:
        result = {}
        if obj.text:
            result["text"] = obj.text
        if obj.object:
            result["object"] = json.loads(obj.object)
        return result
    def from_response_with_completion(self, obj: ToolResponse) -> Tuple[Dict[str, Any], bool]:
        """Returns (response_dict, is_final)"""
        return self.from_pulsar(obj), True
--- a/trustgraph-base/trustgraph/schema/models.py
+++ b/trustgraph-base/trustgraph/schema/models.py
@ -30,3 +30,22 @@ class EmbeddingsResponse(Record):
    error = Error()
    vectors = Array(Array(Double()))
 ############################################################################
 # Tool request/response
 class ToolRequest(Record):
    name = String()
    # Parameters are JSON encoded
    parameters = String()
 class ToolResponse(Record):
    error = Error()
    # Plain text aka "unstructured"
    text = String()
    # JSON-encoded object aka "structured"
    object = String()
--- a/trustgraph-flow/scripts/mcp-tool
+++ b/trustgraph-flow/scripts/mcp-tool
@ -0,0 +1,6 @@
 #!/usr/bin/env python3
 from trustgraph.agent.mcp_tool import run
 run()
--- a/trustgraph-flow/setup.py
+++ b/trustgraph-flow/setup.py
@ -49,6 +49,7 @@ setuptools.setup(
        "langchain-community",
        "langchain-core",
        "langchain-text-splitters",
        "mcp",
        "minio",
        "mistralai",
        "neo4j",
@ -99,6 +100,7 @@ setuptools.setup(
        "scripts/kg-store",
        "scripts/kg-manager",
        "scripts/librarian",
        "scripts/mcp-tool",
        "scripts/metering",
        "scripts/object-extract-row",
        "scripts/oe-write-milvus",
--- a/trustgraph-flow/trustgraph/agent/mcp_tool/init.py
+++ b/trustgraph-flow/trustgraph/agent/mcp_tool/init.py
@ -0,0 +1,3 @@
 from . service import *
--- a/trustgraph-flow/trustgraph/agent/mcp_tool/main.py
+++ b/trustgraph-flow/trustgraph/agent/mcp_tool/main.py
@ -0,0 +1,7 @@
 #!/usr/bin/env python3
 from . service import run
 if __name__ == '__main__':
    run()
--- a/trustgraph-flow/trustgraph/agent/mcp_tool/service.py
+++ b/trustgraph-flow/trustgraph/agent/mcp_tool/service.py
@ -0,0 +1,105 @@
 """
 MCP tool-calling service, calls an external MCP tool.  Input is
 name + parameters, output is the response, either a string or an object.
 """
 import json
 from mcp.client.streamable_http import streamablehttp_client
 from mcp import ClientSession
 from ... base import ToolService
 default_ident = "mcp-tool"
 class Service(ToolService):
    def __init__(self, **params):
        super(Service, self).__init__(
            **params
        )
        self.register_config_handler(self.on_mcp_config)
        self.mcp_services = {}
    async def on_mcp_config(self, config, version):
        print("Got config version", version)
        if "mcp" not in config: return
        self.mcp_services = {
            k: json.loads(v)
            for k, v in config["mcp"].items()
        }
    async def invoke_tool(self, name, parameters):
        try:
            if name not in self.mcp_services:
                raise RuntimeError(f"MCP service {name} not known")
            if "url" not in self.mcp_services[name]:
                raise RuntimeError(f"MCP service {name} URL not defined")
            url = self.mcp_services[name]["url"]
            if "name" in self.mcp_services[name]:
                remote_name = self.mcp_services[name]["name"]
            else:
                remote_name = name
            print("Invoking", remote_name, "at", url, flush=True)
            # Connect to a streamable HTTP server
            async with streamablehttp_client(url) as (
                    read_stream,
                    write_stream,
                    _,
            ):
                # Create a session using the client streams
                async with ClientSession(read_stream, write_stream) as session:
                    # Initialize the connection
                    await session.initialize()
                    # Call a tool
                    result = await session.call_tool(
                        remote_name,
                        parameters
                    )
                    if result.structuredContent:
                        return result.structuredContent
                    elif hasattr(result, "content"):
                            return "".join([
                                x.text
                                for x in result.content
                            ])
                    else:
                        return "No content"
        except BaseExceptionGroup as e:
            for child in e.exceptions:
                print(child)
            raise e.exceptions[0]
        except Exception as e:
            print(e)
            raise e
    @staticmethod
    def add_args(parser):
        ToolService.add_args(parser)
 def run():
    Service.launch(default_ident, __doc__)
--- a/trustgraph-flow/trustgraph/gateway/dispatch/manager.py
+++ b/trustgraph-flow/trustgraph/gateway/dispatch/manager.py
@ -17,7 +17,7 @@ from . document_rag import DocumentRagRequestor
 from . triples_query import TriplesQueryRequestor
 from . embeddings import EmbeddingsRequestor
 from . graph_embeddings_query import GraphEmbeddingsQueryRequestor
-from . prompt import PromptRequestor
+from . mcp_tool import McpToolRequestor
 from . text_load import TextLoad
 from . document_load import DocumentLoad
@ -40,6 +40,7 @@ request_response_dispatchers = {
    "agent": AgentRequestor,
    "text-completion": TextCompletionRequestor,
    "prompt": PromptRequestor,
    "mcp-tool": McpToolRequestor,
    "graph-rag": GraphRagRequestor,
    "document-rag": DocumentRagRequestor,
    "embeddings": EmbeddingsRequestor,
--- a/trustgraph-flow/trustgraph/gateway/dispatch/mcp_tool.py
+++ b/trustgraph-flow/trustgraph/gateway/dispatch/mcp_tool.py
@ -0,0 +1,32 @@
 from ... schema import ToolRequest, ToolResponse
 from ... messaging import TranslatorRegistry
 from . requestor import ServiceRequestor
 class McpToolRequestor(ServiceRequestor):
    def __init__(
            self, pulsar_client, request_queue, response_queue, timeout,
            consumer, subscriber,
    ):
        super(McpToolRequestor, self).__init__(
            pulsar_client=pulsar_client,
            request_queue=request_queue,
            response_queue=response_queue,
            request_schema=ToolRequest,
            response_schema=ToolResponse,
            subscription = subscriber,
            consumer_name = consumer,
            timeout=timeout,
        )
        self.request_translator = TranslatorRegistry.get_request_translator("tool")
        self.response_translator = TranslatorRegistry.get_response_translator("tool")
    def to_request(self, body):
        return self.request_translator.to_pulsar(body)
    def from_response(self, message):
        return self.response_translator.from_response_with_completion(message)
--- a/trustgraph-mcp/trustgraph/mcp_version.py
+++ b/trustgraph-mcp/trustgraph/mcp_version.py
@ -1 +0,0 @@
 __version__ = "1.1.0"