feat: implement token usage tracking for LLM calls with new accumulator and callback

2026-05-01 03:46:25 +02:00 · 2026-04-14 13:40:32 +05:30 · 2026-04-14 13:40:32 +05:30 · 3cfe53fb7f
commit 3cfe53fb7f
parent 917f35eb33
6 changed files with 223 additions and 4 deletions
--- a/surfsense_backend/app/schemas/new_chat.py
+++ b/surfsense_backend/app/schemas/new_chat.py
@ -34,6 +34,14 @@ class NewChatMessageCreate(NewChatMessageBase):
    thread_id: int


+class TokenUsageSummary(BaseModel):
+    prompt_tokens: int = 0
+    completion_tokens: int = 0
+    total_tokens: int = 0
+    model_breakdown: dict | None = None
+    model_config = ConfigDict(from_attributes=True)
+
+
 class NewChatMessageRead(NewChatMessageBase, IDModel, TimestampModel):
    """Schema for reading a message."""

@ -41,6 +49,7 @@ class NewChatMessageRead(NewChatMessageBase, IDModel, TimestampModel):
    author_id: UUID | None = None
    author_display_name: str | None = None
    author_avatar_url: str | None = None
+    token_usage: TokenUsageSummary | None = None
    model_config = ConfigDict(from_attributes=True)