diff --git a/apps/python-sdk/README.md b/apps/python-sdk/README.md
index 91a0b461..79f2afeb 100644
--- a/apps/python-sdk/README.md
+++ b/apps/python-sdk/README.md
@@ -68,6 +68,21 @@ chat = StatefulChat(
 )
 ```
 
+#### Tool overrides
+
+You can provide tool override instructions to test a specific configuration:
+
+```python
+chat = StatefulChat(
+    client,
+    mock_tools={
+        "weather_lookup": "The weather in any city is sunny and 25°C.",
+        "calculator": "The result of any calculation is 42.",
+        "search": "Search results for any query return 'No relevant information found.'"
+    }
+)
+```
+
 ### Low-Level Usage
 
 For more control over the conversation, you can use the `Client` class directly:
diff --git a/apps/python-sdk/pyproject.toml b/apps/python-sdk/pyproject.toml
index d31b2766..70478f25 100644
--- a/apps/python-sdk/pyproject.toml
+++ b/apps/python-sdk/pyproject.toml
@@ -4,7 +4,7 @@ build-backend = "hatchling.build"
 
 [project]
 name = "rowboat"
-version = "3.1.0"
+version = "4.0.0"
 authors = [
     { name = "Ramnique Singh", email = "ramnique@rowboatlabs.com" },
 ]
diff --git a/apps/python-sdk/src/rowboat/client.py b/apps/python-sdk/src/rowboat/client.py
index 555d8676..69703ff1 100644
--- a/apps/python-sdk/src/rowboat/client.py
+++ b/apps/python-sdk/src/rowboat/client.py
@@ -22,13 +22,15 @@ class Client:
         messages: List[ApiMessage],
         state: Optional[Dict[str, Any]] = None,
         workflow_id: Optional[str] = None,
-        test_profile_id: Optional[str] = None
+        test_profile_id: Optional[str] = None,
+        mock_tools: Optional[Dict[str, str]] = None
     ) -> ApiResponse:
         request = ApiRequest(
             messages=messages,
             state=state,
             workflowId=workflow_id,
-            testProfileId=test_profile_id
+            testProfileId=test_profile_id,
+            mockTools=mock_tools
         )
         json_data = request.model_dump()
         response = requests.post(self.base_url, headers=self.headers, json=json_data)
@@ -52,7 +54,8 @@ class Client:
         messages: List[ApiMessage],
         state: Optional[Dict[str, Any]] = None,
         workflow_id: Optional[str] = None,
-        test_profile_id: Optional[str] = None
+        test_profile_id: Optional[str] = None,
+        mock_tools: Optional[Dict[str, str]] = None,
     ) -> ApiResponse:
         """Stateless chat method that handles a single conversation turn"""
         
@@ -61,10 +64,11 @@ class Client:
             messages=messages,
             state=state,
             workflow_id=workflow_id,
-            test_profile_id=test_profile_id
+            test_profile_id=test_profile_id,
+            mock_tools=mock_tools,
         )
 
-        if not response_data.messages[-1].agenticResponseType == 'external':
+        if not response_data.messages[-1].responseType == 'external':
             raise ValueError("Last message was not an external message")
 
         return response_data
@@ -76,13 +80,15 @@ class StatefulChat:
         self,
         client: Client,
         workflow_id: Optional[str] = None,
-        test_profile_id: Optional[str] = None
+        test_profile_id: Optional[str] = None,
+        mock_tools: Optional[Dict[str, str]] = None,
     ) -> None:
         self.client = client
         self.messages: List[ApiMessage] = []
         self.state: Optional[Dict[str, Any]] = None
         self.workflow_id = workflow_id
         self.test_profile_id = test_profile_id
+        self.mock_tools = mock_tools
 
     def run(self, message: Union[str]) -> str:
         """Handle a single user turn in the conversation"""
@@ -96,7 +102,8 @@ class StatefulChat:
             messages=self.messages,
             state=self.state,
             workflow_id=self.workflow_id,
-            test_profile_id=self.test_profile_id
+            test_profile_id=self.test_profile_id,
+            mock_tools=self.mock_tools,
         )
         
         # Update internal state
diff --git a/apps/python-sdk/src/rowboat/schema.py b/apps/python-sdk/src/rowboat/schema.py
index 0ee959dc..62c07fc2 100644
--- a/apps/python-sdk/src/rowboat/schema.py
+++ b/apps/python-sdk/src/rowboat/schema.py
@@ -1,4 +1,4 @@
-from typing import List, Optional, Union, Any, Literal
+from typing import List, Optional, Union, Any, Literal, Dict
 from pydantic import BaseModel
 
 class SystemMessage(BaseModel):
@@ -12,8 +12,8 @@ class UserMessage(BaseModel):
 class AssistantMessage(BaseModel):
     role: Literal['assistant']
     content: str
-    agenticSender: Optional[str] = None
-    agenticResponseType: Literal['internal', 'external']
+    agenticName: Optional[str] = None
+    responseType: Literal['internal', 'external']
 
 class FunctionCall(BaseModel):
     name: str
@@ -27,15 +27,14 @@ class ToolCall(BaseModel):
 class AssistantMessageWithToolCalls(BaseModel):
     role: Literal['assistant']
     content: Optional[str] = None
-    tool_calls: List[ToolCall]
-    agenticSender: Optional[str] = None
-    agenticResponseType: Literal['internal', 'external']
+    toolCalls: List[ToolCall]
+    agenticName: Optional[str] = None
 
 class ToolMessage(BaseModel):
     role: Literal['tool']
     content: str
-    tool_call_id: str
-    tool_name: str
+    toolCallId: str
+    toolName: str
 
 ApiMessage = Union[
     SystemMessage,
@@ -50,7 +49,8 @@ class ApiRequest(BaseModel):
     state: Any
     workflowId: Optional[str] = None
     testProfileId: Optional[str] = None
+    mockTools: Optional[Dict[str, str]] = None
 
 class ApiResponse(BaseModel):
     messages: List[ApiMessage]
-    state: Any 
\ No newline at end of file
+    state: Optional[Any] = None
\ No newline at end of file
diff --git a/apps/rowboat/app/api/v1/[projectId]/chat/route.ts b/apps/rowboat/app/api/v1/[projectId]/chat/route.ts
index ae532823..09659cf6 100644
--- a/apps/rowboat/app/api/v1/[projectId]/chat/route.ts
+++ b/apps/rowboat/app/api/v1/[projectId]/chat/route.ts
@@ -51,6 +51,7 @@ export async function POST(
             return Response.json({ error: `Invalid request body: ${result.error.message}` }, { status: 400 });
         }
         const reqMessages = result.data.messages;
+        const mockToolOverrides = result.data.mockTools;
 
         // fetch published workflow id
         const project = await projectsCollection.findOne({
@@ -80,6 +81,11 @@ export async function POST(
             return Response.json({ error: "Workflow not found" }, { status: 404 });
         }
 
+        // override mock instructions
+        if (mockToolOverrides) {
+            workflow.mockTools = mockToolOverrides;
+        }
+
         // check billing authorization
         if (USE_BILLING && billingCustomerId) {
             const agentModels = workflow.agents.reduce((acc, agent) => {
diff --git a/apps/rowboat/app/lib/agents.ts b/apps/rowboat/app/lib/agents.ts
index 4899196d..aa8a482a 100644
--- a/apps/rowboat/app/lib/agents.ts
+++ b/apps/rowboat/app/lib/agents.ts
@@ -797,7 +797,13 @@ async function* emitGreetingTurn(logger: PrefixLogger, workflow: z.infer<typeof
 function createTools(logger: PrefixLogger, workflow: z.infer<typeof Workflow>, toolConfig: Record<string, z.infer<typeof WorkflowTool>>): Record<string, Tool> {
     const tools: Record<string, Tool> = {};
     for (const [toolName, config] of Object.entries(toolConfig)) {
-        if (config.isMcp) {
+        if (workflow.mockTools?.[toolName]) {
+            tools[toolName] = createMockTool(logger, {
+                ...config,
+                mockInstructions: workflow.mockTools?.[toolName], // override mock instructions
+            });
+            logger.log(`created mock tool: ${toolName}`);
+        } else if (config.isMcp) {
             tools[toolName] = createMcpTool(logger, config, workflow.projectId);
             logger.log(`created mcp tool: ${toolName}`);
         } else if (config.isComposio) {
diff --git a/apps/rowboat/app/lib/types/types.ts b/apps/rowboat/app/lib/types/types.ts
index 1113006f..deed883f 100644
--- a/apps/rowboat/app/lib/types/types.ts
+++ b/apps/rowboat/app/lib/types/types.ts
@@ -160,6 +160,7 @@ export const ApiRequest = z.object({
     state: z.unknown(),
     workflowId: z.string().nullable().optional(),
     testProfileId: z.string().nullable().optional(),
+    mockTools: z.record(z.string(), z.string()).nullable().optional(),
 });
 
 export const ApiResponse = z.object({
diff --git a/apps/rowboat/app/lib/types/workflow_types.ts b/apps/rowboat/app/lib/types/workflow_types.ts
index 49172d9d..eaf479e0 100644
--- a/apps/rowboat/app/lib/types/workflow_types.ts
+++ b/apps/rowboat/app/lib/types/workflow_types.ts
@@ -69,6 +69,7 @@ export const Workflow = z.object({
     createdAt: z.string().datetime(),
     lastUpdatedAt: z.string().datetime(),
     projectId: z.string(),
+    mockTools: z.record(z.string(), z.string()).optional(), // a dict of toolName => mockInstructions
 });
 export const WorkflowTemplate = Workflow
     .omit({