token errors

2026-06-24 06:08:05 +02:00 · 2026-04-12 16:42:39 +01:00 · 2026-04-12 16:42:39 +01:00 · 05c29de5bc
commit 05c29de5bc
parent fc9c0cf0b4
11 changed files with 92 additions and 61 deletions
--- a/trustgraph-base/trustgraph/api/async_flow.py
+++ b/trustgraph-base/trustgraph/api/async_flow.py
@ -476,9 +476,9 @@ class AsyncFlowInstance:
        result = await self.request("text-completion", request_data)
        return TextCompletionResult(
            text=result.get("response", ""),
-            in_token=result.get("in_token", 0) or 0,
-            out_token=result.get("out_token", 0) or 0,
-            model=result.get("model", "") or "",
+            in_token=result.get("in_token"),
+            out_token=result.get("out_token"),
+            model=result.get("model"),
        )

    async def graph_rag(self, query: str, user: str, collection: str,
--- a/trustgraph-base/trustgraph/api/async_socket_client.py
+++ b/trustgraph-base/trustgraph/api/async_socket_client.py
@ -212,9 +212,9 @@ class AsyncSocketClient:
                content=content,
                end_of_stream=resp.get("end_of_stream", False),
                error=None,
-                in_token=resp.get("in_token", 0) or 0,
-                out_token=resp.get("out_token", 0) or 0,
-                model=resp.get("model", "") or "",
+                in_token=resp.get("in_token"),
+                out_token=resp.get("out_token"),
+                model=resp.get("model"),
            )

    async def aclose(self):
@ -290,9 +290,9 @@ class AsyncSocketFlowInstance:
            result = await self.client._send_request("text-completion", self.flow_id, request)
            return TextCompletionResult(
                text=result.get("response", ""),
-                in_token=result.get("in_token", 0) or 0,
-                out_token=result.get("out_token", 0) or 0,
-                model=result.get("model", "") or "",
+                in_token=result.get("in_token"),
+                out_token=result.get("out_token"),
+                model=result.get("model"),
            )

    async def _text_completion_streaming(self, request):
--- a/trustgraph-base/trustgraph/api/flow.py
+++ b/trustgraph-base/trustgraph/api/flow.py
@ -387,9 +387,9 @@ class FlowInstance:

        return TextCompletionResult(
            text=result.get("response", ""),
-            in_token=result.get("in_token", 0) or 0,
-            out_token=result.get("out_token", 0) or 0,
-            model=result.get("model", "") or "",
+            in_token=result.get("in_token"),
+            out_token=result.get("out_token"),
+            model=result.get("model"),
        )

    def agent(self, question, user="trustgraph", state=None, group=None, history=None):
--- a/trustgraph-base/trustgraph/api/socket_client.py
+++ b/trustgraph-base/trustgraph/api/socket_client.py
@ -405,9 +405,9 @@ class SocketClient:
                content=content,
                end_of_stream=resp.get("end_of_stream", False),
                error=None,
-                in_token=resp.get("in_token", 0) or 0,
-                out_token=resp.get("out_token", 0) or 0,
-                model=resp.get("model", "") or "",
+                in_token=resp.get("in_token"),
+                out_token=resp.get("out_token"),
+                model=resp.get("model"),
            )

    def _build_provenance_event(self, resp: Dict[str, Any]) -> ProvenanceEvent:
@ -566,9 +566,9 @@ class SocketFlowInstance:
        else:
            return TextCompletionResult(
                text=result.get("response", ""),
-                in_token=result.get("in_token", 0) or 0,
-                out_token=result.get("out_token", 0) or 0,
-                model=result.get("model", "") or "",
+                in_token=result.get("in_token"),
+                out_token=result.get("out_token"),
+                model=result.get("model"),
            )

    def _text_completion_generator(self, result: Iterator[StreamingChunk]) -> Iterator[RAGChunk]:
@ -696,10 +696,10 @@ class SocketFlowInstance:
            streaming=True, include_provenance=True
        )

-    def _rag_generator(self, result: Iterator[StreamingChunk]) -> Iterator[str]:
+    def _rag_generator(self, result: Iterator[StreamingChunk]) -> Iterator[RAGChunk]:
        for chunk in result:
-            if hasattr(chunk, 'content'):
-                yield chunk.content
+            if isinstance(chunk, RAGChunk):
+                yield chunk

    def prompt(
        self,
@ -707,8 +707,12 @@ class SocketFlowInstance:
        variables: Dict[str, str],
        streaming: bool = False,
        **kwargs: Any
-    ) -> Union[str, Iterator[str]]:
-        """Execute a prompt template with optional streaming."""
+    ) -> Union[TextCompletionResult, Iterator[RAGChunk]]:
+        """Execute a prompt template with optional streaming.
+
+        Non-streaming: returns a TextCompletionResult with text and token counts.
+        Streaming: returns an iterator of RAGChunk (with token counts on the final chunk).
+        """
        request = {
            "id": id,
            "variables": variables,
@ -721,7 +725,12 @@ class SocketFlowInstance:
        if streaming:
            return self._rag_generator(result)
        else:
-            return result.get("response", "")
+            return TextCompletionResult(
+                text=result.get("text", result.get("response", "")),
+                in_token=result.get("in_token"),
+                out_token=result.get("out_token"),
+                model=result.get("model"),
+            )

    def graph_embeddings_query(
        self,
--- a/trustgraph-base/trustgraph/api/types.py
+++ b/trustgraph-base/trustgraph/api/types.py
@ -210,9 +210,9 @@ class RAGChunk(StreamingChunk):
    chunk_type: str = "rag"
    end_of_stream: bool = False
    error: Optional[Dict[str, str]] = None
-    in_token: int = 0
-    out_token: int = 0
-    model: str = ""
+    in_token: Optional[int] = None
+    out_token: Optional[int] = None
+    model: Optional[str] = None

@dataclasses.dataclass
 class TextCompletionResult:
@ -225,14 +225,14 @@ class TextCompletionResult:

    Attributes:
        text: Complete response text (None in streaming mode)
-        in_token: Input token count
-        out_token: Output token count
-        model: Model identifier
+        in_token: Input token count (None if not available)
+        out_token: Output token count (None if not available)
+        model: Model identifier (None if not available)
    """
    text: Optional[str]
-    in_token: int = 0
-    out_token: int = 0
-    model: str = ""
+    in_token: Optional[int] = None
+    out_token: Optional[int] = None
+    model: Optional[str] = None

@dataclasses.dataclass
 class ProvenanceEvent:
--- a/trustgraph-base/trustgraph/base/text_completion_client.py
+++ b/trustgraph-base/trustgraph/base/text_completion_client.py
@ -8,9 +8,9 @@ from .. schema import TextCompletionRequest, TextCompletionResponse
@dataclass
 class TextCompletionResult:
    text: Optional[str]
-    in_token: int = 0
-    out_token: int = 0
-    model: str = ""
+    in_token: Optional[int] = None
+    out_token: Optional[int] = None
+    model: Optional[str] = None

 class TextCompletionClient(RequestResponse):

@ -28,9 +28,9 @@ class TextCompletionClient(RequestResponse):

        return TextCompletionResult(
            text = resp.response,
-            in_token = getattr(resp, "in_token", 0) or 0,
-            out_token = getattr(resp, "out_token", 0) or 0,
-            model = getattr(resp, "model", "") or "",
+            in_token = resp.in_token,
+            out_token = resp.out_token,
+            model = resp.model,
        )

    async def text_completion_stream(
@ -62,9 +62,9 @@ class TextCompletionClient(RequestResponse):

        return TextCompletionResult(
            text = None,
-            in_token = getattr(final, "in_token", 0) or 0,
-            out_token = getattr(final, "out_token", 0) or 0,
-            model = getattr(final, "model", "") or "",
+            in_token = final.in_token,
+            out_token = final.out_token,
+            model = final.model,
        )

 class TextCompletionClientSpec(RequestResponseSpec):
--- a/trustgraph-base/trustgraph/messaging/translators/prompt.py
+++ b/trustgraph-base/trustgraph/messaging/translators/prompt.py
@ -53,11 +53,11 @@ class PromptResponseTranslator(MessageTranslator):
        # Always include end_of_stream flag for streaming support
        result["end_of_stream"] = getattr(obj, "end_of_stream", False)

-        if obj.in_token:
+        if obj.in_token is not None:
            result["in_token"] = obj.in_token
-        if obj.out_token:
+        if obj.out_token is not None:
            result["out_token"] = obj.out_token
-        if obj.model:
+        if obj.model is not None:
            result["model"] = obj.model

        return result
--- a/trustgraph-base/trustgraph/messaging/translators/text_completion.py
+++ b/trustgraph-base/trustgraph/messaging/translators/text_completion.py
@ -29,11 +29,11 @@ class TextCompletionResponseTranslator(MessageTranslator):
    def encode(self, obj: TextCompletionResponse) -> Dict[str, Any]:
        result = {"response": obj.response}

-        if obj.in_token:
+        if obj.in_token is not None:
            result["in_token"] = obj.in_token
-        if obj.out_token:
+        if obj.out_token is not None:
            result["out_token"] = obj.out_token
-        if obj.model:
+        if obj.model is not None:
            result["model"] = obj.model

        # Always include end_of_stream flag for streaming support
--- a/trustgraph-base/trustgraph/schema/services/llm.py
+++ b/trustgraph-base/trustgraph/schema/services/llm.py
@ -17,9 +17,9 @@ class TextCompletionRequest:
 class TextCompletionResponse:
    error: Error | None = None
    response: str = ""
-    in_token: int = 0
-    out_token: int = 0
-    model: str = ""
+    in_token: int | None = None
+    out_token: int | None = None
+    model: str | None = None
    end_of_stream: bool = False  # Indicates final message in stream

 ############################################################################
--- a/trustgraph-base/trustgraph/schema/services/prompt.py
+++ b/trustgraph-base/trustgraph/schema/services/prompt.py
@ -42,8 +42,8 @@ class PromptResponse:
    end_of_stream: bool = False

    # Token usage from the underlying text completion
-    in_token: int = 0
-    out_token: int = 0
-    model: str = ""
+    in_token: int | None = None
+    out_token: int | None = None
+    model: str | None = None

 ############################################################################