add native Gemini provider support via hermesllm transforms

2026-04-25 00:36:34 +02:00 · 2026-03-12 12:27:38 +00:00 · 2026-03-12 12:27:38 +00:00 · 053108b96c
commit 053108b96c
parent 5400b0a2fa
16 changed files with 2416 additions and 10 deletions
--- a/crates/brightstaff/src/handlers/router_chat.rs
+++ b/crates/brightstaff/src/handlers/router_chat.rs
@ -53,7 +53,9 @@ pub async fn router_chat_get_upstream_model(
            ProviderRequestType::MessagesRequest(_)
            | ProviderRequestType::BedrockConverse(_)
            | ProviderRequestType::BedrockConverseStream(_)
-            | ProviderRequestType::ResponsesAPIRequest(_),
+            | ProviderRequestType::ResponsesAPIRequest(_)
            | ProviderRequestType::GeminiGenerateContent(_)
            | ProviderRequestType::GeminiStreamGenerateContent(_),
        ) => {
            warn!("unexpected: got non-ChatCompletions request after converting to OpenAI format");
            return Err(RoutingError::internal_error(
--- a/crates/hermesllm/src/apis/gemini.rs
+++ b/crates/hermesllm/src/apis/gemini.rs
@ -0,0 +1,744 @@
 use serde::{Deserialize, Serialize};
 use serde_json::Value;
 use serde_with::skip_serializing_none;
 use std::collections::HashMap;
 use super::ApiDefinition;
 use crate::providers::request::{ProviderRequest, ProviderRequestError};
 use crate::providers::response::TokenUsage;
 use crate::providers::streaming_response::ProviderStreamResponse;
 use crate::transforms::lib::ExtractText;
 use crate::GENERATE_CONTENT_PATH_SUFFIX;
 // ============================================================================
 // GEMINI GENERATE CONTENT API ENUMERATION
 // ============================================================================
 /// Enum for all supported Gemini GenerateContent APIs
 #[derive(Debug, Clone, PartialEq, Eq, Serialize, Deserialize)]
 pub enum GeminiApi {
    GenerateContent,
    StreamGenerateContent,
 }
 impl ApiDefinition for GeminiApi {
    fn endpoint(&self) -> &'static str {
        match self {
            GeminiApi::GenerateContent => ":generateContent",
            GeminiApi::StreamGenerateContent => ":streamGenerateContent",
        }
    }
    fn from_endpoint(endpoint: &str) -> Option<Self> {
        if endpoint.ends_with(":streamGenerateContent") {
            Some(GeminiApi::StreamGenerateContent)
        } else if endpoint.ends_with(GENERATE_CONTENT_PATH_SUFFIX) {
            Some(GeminiApi::GenerateContent)
        } else {
            None
        }
    }
    fn supports_streaming(&self) -> bool {
        match self {
            GeminiApi::GenerateContent => false,
            GeminiApi::StreamGenerateContent => true,
        }
    }
    fn supports_tools(&self) -> bool {
        true
    }
    fn supports_vision(&self) -> bool {
        true
    }
    fn all_variants() -> Vec<Self> {
        vec![GeminiApi::GenerateContent, GeminiApi::StreamGenerateContent]
    }
 }
 // ============================================================================
 // REQUEST TYPES
 // ============================================================================
 #[skip_serializing_none]
 #[derive(Debug, Clone, Serialize, Deserialize, Default)]
 #[serde(rename_all = "camelCase")]
 pub struct GenerateContentRequest {
    /// Internal model field — not part of Gemini wire format (model is in the URL).
    /// Populated during parsing and used for routing.
    #[serde(skip_serializing, default)]
    pub model: String,
    pub contents: Vec<Content>,
    pub generation_config: Option<GenerationConfig>,
    pub tools: Option<Vec<Tool>>,
    pub tool_config: Option<ToolConfig>,
    pub safety_settings: Option<Vec<SafetySetting>>,
    pub system_instruction: Option<Content>,
    pub cached_content: Option<String>,
    #[serde(skip_serializing)]
    pub metadata: Option<HashMap<String, Value>>,
 }
 #[skip_serializing_none]
 #[derive(Debug, Clone, Serialize, Deserialize)]
 #[serde(rename_all = "camelCase")]
 pub struct Content {
    pub role: Option<String>,
    pub parts: Vec<Part>,
 }
 #[skip_serializing_none]
 #[derive(Debug, Clone, Serialize, Deserialize)]
 #[serde(rename_all = "camelCase")]
 pub struct Part {
    pub text: Option<String>,
    pub inline_data: Option<InlineData>,
    pub function_call: Option<FunctionCall>,
    pub function_response: Option<FunctionResponse>,
 }
 #[derive(Debug, Clone, Serialize, Deserialize)]
 #[serde(rename_all = "camelCase")]
 pub struct InlineData {
    pub mime_type: String,
    pub data: String,
 }
 #[derive(Debug, Clone, Serialize, Deserialize)]
 #[serde(rename_all = "camelCase")]
 pub struct FunctionCall {
    pub name: String,
    pub args: Value,
 }
 #[derive(Debug, Clone, Serialize, Deserialize)]
 #[serde(rename_all = "camelCase")]
 pub struct FunctionResponse {
    pub name: String,
    pub response: Value,
 }
 #[skip_serializing_none]
 #[derive(Debug, Clone, Serialize, Deserialize, Default)]
 #[serde(rename_all = "camelCase")]
 pub struct GenerationConfig {
    pub temperature: Option<f32>,
    pub top_p: Option<f32>,
    pub top_k: Option<u32>,
    pub max_output_tokens: Option<u32>,
    pub stop_sequences: Option<Vec<String>>,
    pub response_mime_type: Option<String>,
    pub candidate_count: Option<u32>,
    pub presence_penalty: Option<f32>,
    pub frequency_penalty: Option<f32>,
 }
 #[skip_serializing_none]
 #[derive(Debug, Clone, Serialize, Deserialize)]
 #[serde(rename_all = "camelCase")]
 pub struct Tool {
    pub function_declarations: Option<Vec<FunctionDeclaration>>,
    pub code_execution: Option<Value>,
 }
 #[skip_serializing_none]
 #[derive(Debug, Clone, Serialize, Deserialize)]
 #[serde(rename_all = "camelCase")]
 pub struct FunctionDeclaration {
    pub name: String,
    pub description: Option<String>,
    pub parameters: Option<Value>,
 }
 #[derive(Debug, Clone, Serialize, Deserialize)]
 #[serde(rename_all = "camelCase")]
 pub struct ToolConfig {
    pub function_calling_config: FunctionCallingConfig,
 }
 #[derive(Debug, Clone, Serialize, Deserialize)]
 #[serde(rename_all = "camelCase")]
 pub struct FunctionCallingConfig {
    pub mode: String,
 }
 #[derive(Debug, Clone, Serialize, Deserialize)]
 #[serde(rename_all = "camelCase")]
 pub struct SafetySetting {
    pub category: String,
    pub threshold: String,
 }
 // ============================================================================
 // RESPONSE TYPES
 // ============================================================================
 #[skip_serializing_none]
 #[derive(Debug, Clone, Serialize, Deserialize, Default)]
 #[serde(rename_all = "camelCase")]
 pub struct GenerateContentResponse {
    pub candidates: Option<Vec<Candidate>>,
    pub usage_metadata: Option<UsageMetadata>,
    pub prompt_feedback: Option<PromptFeedback>,
    pub model_version: Option<String>,
 }
 #[skip_serializing_none]
 #[derive(Debug, Clone, Serialize, Deserialize)]
 #[serde(rename_all = "camelCase")]
 pub struct Candidate {
    pub content: Option<Content>,
    pub finish_reason: Option<String>,
    pub safety_ratings: Option<Vec<SafetyRating>>,
 }
 #[skip_serializing_none]
 #[derive(Debug, Clone, Serialize, Deserialize, Default)]
 #[serde(rename_all = "camelCase")]
 pub struct UsageMetadata {
    pub prompt_token_count: Option<u32>,
    pub candidates_token_count: Option<u32>,
    pub total_token_count: Option<u32>,
 }
 impl TokenUsage for UsageMetadata {
    fn completion_tokens(&self) -> usize {
        self.candidates_token_count.unwrap_or(0) as usize
    }
    fn prompt_tokens(&self) -> usize {
        self.prompt_token_count.unwrap_or(0) as usize
    }
    fn total_tokens(&self) -> usize {
        self.total_token_count.unwrap_or(0) as usize
    }
 }
 #[skip_serializing_none]
 #[derive(Debug, Clone, Serialize, Deserialize)]
 #[serde(rename_all = "camelCase")]
 pub struct PromptFeedback {
    pub block_reason: Option<String>,
    pub safety_ratings: Option<Vec<SafetyRating>>,
 }
 #[skip_serializing_none]
 #[derive(Debug, Clone, Serialize, Deserialize)]
 #[serde(rename_all = "camelCase")]
 pub struct SafetyRating {
    pub category: String,
    pub probability: String,
    pub blocked: Option<bool>,
 }
 // ============================================================================
 // PROVIDER REQUEST TRAIT IMPLEMENTATION
 // ============================================================================
 impl ProviderRequest for GenerateContentRequest {
    fn model(&self) -> &str {
        &self.model
    }
    fn set_model(&mut self, model: String) {
        self.model = model;
    }
    fn is_streaming(&self) -> bool {
        // Gemini uses URL-based streaming, not a field in the request body
        false
    }
    fn extract_messages_text(&self) -> String {
        let mut parts_text = Vec::new();
        for content in &self.contents {
            for part in &content.parts {
                if let Some(text) = &part.text {
                    parts_text.push(text.clone());
                }
            }
        }
        if let Some(system) = &self.system_instruction {
            for part in &system.parts {
                if let Some(text) = &part.text {
                    parts_text.push(text.clone());
                }
            }
        }
        parts_text.join(" ")
    }
    fn get_recent_user_message(&self) -> Option<String> {
        self.contents
            .iter()
            .rev()
            .find(|c| c.role.as_deref() == Some("user"))
            .and_then(|c| {
                c.parts
                    .iter()
                    .filter_map(|p| p.text.clone())
                    .collect::<Vec<_>>()
                    .first()
                    .cloned()
            })
    }
    fn get_tool_names(&self) -> Option<Vec<String>> {
        self.tools.as_ref().map(|tools| {
            tools
                .iter()
                .filter_map(|t| t.function_declarations.as_ref())
                .flatten()
                .map(|f| f.name.clone())
                .collect()
        })
    }
    fn to_bytes(&self) -> Result<Vec<u8>, ProviderRequestError> {
        serde_json::to_vec(self).map_err(|e| ProviderRequestError {
            message: format!("Failed to serialize GenerateContentRequest: {}", e),
            source: Some(Box::new(e)),
        })
    }
    fn metadata(&self) -> &Option<HashMap<String, Value>> {
        &self.metadata
    }
    fn remove_metadata_key(&mut self, key: &str) -> bool {
        if let Some(ref mut metadata) = self.metadata {
            metadata.remove(key).is_some()
        } else {
            false
        }
    }
    fn get_temperature(&self) -> Option<f32> {
        self.generation_config
            .as_ref()
            .and_then(|gc| gc.temperature)
    }
    fn get_messages(&self) -> Vec<crate::apis::openai::Message> {
        use crate::apis::openai::{Message, MessageContent, Role};
        let mut messages = Vec::new();
        // Convert system instruction
        if let Some(system) = &self.system_instruction {
            let text = system
                .parts
                .iter()
                .filter_map(|p| p.text.clone())
                .collect::<Vec<_>>()
                .join("");
            if !text.is_empty() {
                messages.push(Message {
                    role: Role::System,
                    content: Some(MessageContent::Text(text)),
                    name: None,
                    tool_calls: None,
                    tool_call_id: None,
                });
            }
        }
        // Convert contents
        for content in &self.contents {
            let role = match content.role.as_deref() {
                Some("model") => Role::Assistant,
                _ => Role::User,
            };
            let text = content
                .parts
                .iter()
                .filter_map(|p| p.text.clone())
                .collect::<Vec<_>>()
                .join("");
            messages.push(Message {
                role,
                content: Some(MessageContent::Text(text)),
                name: None,
                tool_calls: None,
                tool_call_id: None,
            });
        }
        messages
    }
    fn set_messages(&mut self, messages: &[crate::apis::openai::Message]) {
        use crate::apis::openai::Role;
        self.contents.clear();
        self.system_instruction = None;
        for msg in messages {
            let text = msg.content.extract_text();
            match msg.role {
                Role::System => {
                    self.system_instruction = Some(Content {
                        role: Some("user".to_string()),
                        parts: vec![Part {
                            text: Some(text),
                            inline_data: None,
                            function_call: None,
                            function_response: None,
                        }],
                    });
                }
                Role::User => {
                    self.contents.push(Content {
                        role: Some("user".to_string()),
                        parts: vec![Part {
                            text: Some(text),
                            inline_data: None,
                            function_call: None,
                            function_response: None,
                        }],
                    });
                }
                Role::Assistant => {
                    self.contents.push(Content {
                        role: Some("model".to_string()),
                        parts: vec![Part {
                            text: Some(text),
                            inline_data: None,
                            function_call: None,
                            function_response: None,
                        }],
                    });
                }
                Role::Tool => {
                    self.contents.push(Content {
                        role: Some("user".to_string()),
                        parts: vec![Part {
                            text: Some(text),
                            inline_data: None,
                            function_call: None,
                            function_response: None,
                        }],
                    });
                }
            }
        }
    }
 }
 // ============================================================================
 // PROVIDER STREAM RESPONSE TRAIT IMPLEMENTATION
 // ============================================================================
 impl ProviderStreamResponse for GenerateContentResponse {
    fn content_delta(&self) -> Option<&str> {
        self.candidates
            .as_ref()
            .and_then(|candidates| candidates.first())
            .and_then(|candidate| candidate.content.as_ref())
            .and_then(|content| content.parts.first())
            .and_then(|part| part.text.as_deref())
    }
    fn is_final(&self) -> bool {
        self.candidates
            .as_ref()
            .and_then(|candidates| candidates.first())
            .and_then(|candidate| candidate.finish_reason.as_deref())
            .map(|reason| reason == "STOP" || reason == "MAX_TOKENS" || reason == "SAFETY")
            .unwrap_or(false)
    }
    fn role(&self) -> Option<&str> {
        self.candidates
            .as_ref()
            .and_then(|candidates| candidates.first())
            .and_then(|candidate| candidate.content.as_ref())
            .and_then(|content| content.role.as_deref())
    }
    fn event_type(&self) -> Option<&str> {
        None // Gemini doesn't use SSE event types
    }
 }
 // ============================================================================
 // SERDE PARSING
 // ============================================================================
 impl TryFrom<&[u8]> for GenerateContentRequest {
    type Error = serde_json::Error;
    fn try_from(bytes: &[u8]) -> Result<Self, Self::Error> {
        serde_json::from_slice(bytes)
    }
 }
 impl TryFrom<&[u8]> for GenerateContentResponse {
    type Error = serde_json::Error;
    fn try_from(bytes: &[u8]) -> Result<Self, Self::Error> {
        serde_json::from_slice(bytes)
    }
 }
 // ============================================================================
 // TESTS
 // ============================================================================
 #[cfg(test)]
 mod tests {
    use super::*;
    use serde_json::json;
    #[test]
    fn test_gemini_api_from_endpoint() {
        assert_eq!(
            GeminiApi::from_endpoint("/v1beta/models/gemini-pro:generateContent"),
            Some(GeminiApi::GenerateContent)
        );
        assert_eq!(
            GeminiApi::from_endpoint("/v1beta/models/gemini-pro:streamGenerateContent"),
            Some(GeminiApi::StreamGenerateContent)
        );
        assert_eq!(GeminiApi::from_endpoint("/v1/chat/completions"), None);
    }
    #[test]
    fn test_generate_content_request_serde() {
        let json_str = json!({
            "contents": [{
                "role": "user",
                "parts": [{"text": "Hello"}]
            }],
            "generationConfig": {
                "temperature": 0.7,
                "maxOutputTokens": 1024
            }
        });
        let req: GenerateContentRequest = serde_json::from_value(json_str).unwrap();
        assert_eq!(req.contents.len(), 1);
        assert_eq!(req.contents[0].role, Some("user".to_string()));
        assert_eq!(
            req.generation_config.as_ref().unwrap().temperature,
            Some(0.7)
        );
        assert_eq!(
            req.generation_config.as_ref().unwrap().max_output_tokens,
            Some(1024)
        );
        // Roundtrip
        let bytes = serde_json::to_vec(&req).unwrap();
        let req2: GenerateContentRequest = serde_json::from_slice(&bytes).unwrap();
        assert_eq!(req2.contents.len(), 1);
    }
    #[test]
    fn test_generate_content_response_serde() {
        let json_str = json!({
            "candidates": [{
                "content": {
                    "role": "model",
                    "parts": [{"text": "Hello! How can I help?"}]
                },
                "finishReason": "STOP"
            }],
            "usageMetadata": {
                "promptTokenCount": 5,
                "candidatesTokenCount": 7,
                "totalTokenCount": 12
            }
        });
        let resp: GenerateContentResponse = serde_json::from_value(json_str).unwrap();
        assert!(resp.candidates.is_some());
        let candidates = resp.candidates.as_ref().unwrap();
        assert_eq!(candidates.len(), 1);
        assert_eq!(candidates[0].finish_reason.as_deref(), Some("STOP"));
        assert_eq!(
            resp.usage_metadata.as_ref().unwrap().prompt_token_count,
            Some(5)
        );
    }
    #[test]
    fn test_generate_content_request_with_tools() {
        let json_str = json!({
            "contents": [{
                "role": "user",
                "parts": [{"text": "What's the weather?"}]
            }],
            "tools": [{
                "functionDeclarations": [{
                    "name": "get_weather",
                    "description": "Get weather info",
                    "parameters": {
                        "type": "object",
                        "properties": {
                            "location": {"type": "string"}
                        }
                    }
                }]
            }],
            "toolConfig": {
                "functionCallingConfig": {
                    "mode": "AUTO"
                }
            }
        });
        let req: GenerateContentRequest = serde_json::from_value(json_str).unwrap();
        assert!(req.tools.is_some());
        let tools = req.tools.as_ref().unwrap();
        assert_eq!(tools.len(), 1);
        let decls = tools[0].function_declarations.as_ref().unwrap();
        assert_eq!(decls[0].name, "get_weather");
        assert_eq!(
            req.tool_config
                .as_ref()
                .unwrap()
                .function_calling_config
                .mode,
            "AUTO"
        );
    }
    #[test]
    fn test_generate_content_response_with_function_call() {
        let json_str = json!({
            "candidates": [{
                "content": {
                    "role": "model",
                    "parts": [{
                        "functionCall": {
                            "name": "get_weather",
                            "args": {"location": "NYC"}
                        }
                    }]
                },
                "finishReason": "STOP"
            }]
        });
        let resp: GenerateContentResponse = serde_json::from_value(json_str).unwrap();
        let candidates = resp.candidates.as_ref().unwrap();
        let parts = &candidates[0].content.as_ref().unwrap().parts;
        assert!(parts[0].function_call.is_some());
        assert_eq!(parts[0].function_call.as_ref().unwrap().name, "get_weather");
    }
    #[test]
    fn test_stream_response_content_delta() {
        let resp = GenerateContentResponse {
            candidates: Some(vec![Candidate {
                content: Some(Content {
                    role: Some("model".to_string()),
                    parts: vec![Part {
                        text: Some("Hello".to_string()),
                        inline_data: None,
                        function_call: None,
                        function_response: None,
                    }],
                }),
                finish_reason: None,
                safety_ratings: None,
            }]),
            usage_metadata: None,
            prompt_feedback: None,
            model_version: None,
        };
        assert_eq!(resp.content_delta(), Some("Hello"));
        assert!(!resp.is_final());
    }
    #[test]
    fn test_stream_response_is_final() {
        let resp = GenerateContentResponse {
            candidates: Some(vec![Candidate {
                content: Some(Content {
                    role: Some("model".to_string()),
                    parts: vec![Part {
                        text: Some("Done".to_string()),
                        inline_data: None,
                        function_call: None,
                        function_response: None,
                    }],
                }),
                finish_reason: Some("STOP".to_string()),
                safety_ratings: None,
            }]),
            usage_metadata: None,
            prompt_feedback: None,
            model_version: None,
        };
        assert!(resp.is_final());
    }
    #[test]
    fn test_provider_request_extract_text() {
        let req = GenerateContentRequest {
            model: "gemini-pro".to_string(),
            contents: vec![Content {
                role: Some("user".to_string()),
                parts: vec![Part {
                    text: Some("Hello world".to_string()),
                    inline_data: None,
                    function_call: None,
                    function_response: None,
                }],
            }],
            system_instruction: Some(Content {
                role: Some("user".to_string()),
                parts: vec![Part {
                    text: Some("Be helpful".to_string()),
                    inline_data: None,
                    function_call: None,
                    function_response: None,
                }],
            }),
            ..Default::default()
        };
        let text = req.extract_messages_text();
        assert!(text.contains("Hello world"));
        assert!(text.contains("Be helpful"));
    }
    #[test]
    fn test_provider_request_get_tool_names() {
        let req = GenerateContentRequest {
            model: "gemini-pro".to_string(),
            contents: vec![],
            tools: Some(vec![Tool {
                function_declarations: Some(vec![
                    FunctionDeclaration {
                        name: "func_a".to_string(),
                        description: None,
                        parameters: None,
                    },
                    FunctionDeclaration {
                        name: "func_b".to_string(),
                        description: None,
                        parameters: None,
                    },
                ]),
                code_execution: None,
            }]),
            ..Default::default()
        };
        let names = req.get_tool_names().unwrap();
        assert_eq!(names, vec!["func_a", "func_b"]);
    }
 }
--- a/crates/hermesllm/src/apis/mod.rs
+++ b/crates/hermesllm/src/apis/mod.rs
@ -1,5 +1,6 @@
 pub mod amazon_bedrock;
 pub mod anthropic;
 pub mod gemini;
 pub mod openai;
 pub mod openai_responses;
 pub mod streaming_shapes;
@ -10,6 +11,7 @@ pub use amazon_bedrock::{
    Message as BedrockMessage, Tool as BedrockTool, ToolChoice as BedrockToolChoice,
 };
 pub use anthropic::{AnthropicApi, MessagesRequest, MessagesResponse, MessagesStreamEvent};
 pub use gemini::{GeminiApi, GenerateContentRequest, GenerateContentResponse};
 pub use openai::{
    ChatCompletionsRequest, ChatCompletionsResponse, ChatCompletionsStreamResponse, OpenAIApi,
 };
--- a/crates/hermesllm/src/clients/endpoints.rs
+++ b/crates/hermesllm/src/clients/endpoints.rs
@ -1,4 +1,4 @@
-use crate::apis::{AmazonBedrockApi, AnthropicApi, ApiDefinition, OpenAIApi};
+use crate::apis::{AmazonBedrockApi, AnthropicApi, ApiDefinition, GeminiApi, OpenAIApi};
 use crate::ProviderId;
 use std::fmt;
@ -8,6 +8,7 @@ pub enum SupportedAPIsFromClient {
    OpenAIChatCompletions(OpenAIApi),
    AnthropicMessagesAPI(AnthropicApi),
    OpenAIResponsesAPI(OpenAIApi),
    GeminiGenerateContentAPI(GeminiApi),
 }
 #[derive(Debug, Clone, PartialEq)]
@ -17,6 +18,8 @@ pub enum SupportedUpstreamAPIs {
    AmazonBedrockConverse(AmazonBedrockApi),
    AmazonBedrockConverseStream(AmazonBedrockApi),
    OpenAIResponsesAPI(OpenAIApi),
    GeminiGenerateContent(GeminiApi),
    GeminiStreamGenerateContent(GeminiApi),
 }
 impl fmt::Display for SupportedAPIsFromClient {
@ -31,6 +34,9 @@ impl fmt::Display for SupportedAPIsFromClient {
            SupportedAPIsFromClient::OpenAIResponsesAPI(api) => {
                write!(f, "OpenAI Responses ({})", api.endpoint())
            }
            SupportedAPIsFromClient::GeminiGenerateContentAPI(api) => {
                write!(f, "Gemini ({})", api.endpoint())
            }
        }
    }
 }
@ -53,6 +59,12 @@ impl fmt::Display for SupportedUpstreamAPIs {
            SupportedUpstreamAPIs::OpenAIResponsesAPI(api) => {
                write!(f, "OpenAI Responses ({})", api.endpoint())
            }
            SupportedUpstreamAPIs::GeminiGenerateContent(api) => {
                write!(f, "Gemini ({})", api.endpoint())
            }
            SupportedUpstreamAPIs::GeminiStreamGenerateContent(api) => {
                write!(f, "Gemini Stream ({})", api.endpoint())
            }
        }
    }
 }
@ -60,6 +72,13 @@ impl fmt::Display for SupportedUpstreamAPIs {
 impl SupportedAPIsFromClient {
    /// Create a SupportedApi from an endpoint path
    pub fn from_endpoint(endpoint: &str) -> Option<Self> {
        // Check Gemini first since it uses suffix matching (`:generateContent`)
        if let Some(gemini_api) = GeminiApi::from_endpoint(endpoint) {
            return Some(SupportedAPIsFromClient::GeminiGenerateContentAPI(
                gemini_api,
            ));
        }
        if let Some(openai_api) = OpenAIApi::from_endpoint(endpoint) {
            // Check if this is the Responses API endpoint
            if openai_api == OpenAIApi::Responses {
@ -82,6 +101,7 @@ impl SupportedAPIsFromClient {
            SupportedAPIsFromClient::OpenAIChatCompletions(api) => api.endpoint(),
            SupportedAPIsFromClient::AnthropicMessagesAPI(api) => api.endpoint(),
            SupportedAPIsFromClient::OpenAIResponsesAPI(api) => api.endpoint(),
            SupportedAPIsFromClient::GeminiGenerateContentAPI(api) => api.endpoint(),
        }
    }
@ -145,7 +165,18 @@ impl SupportedAPIsFromClient {
                }
                ProviderId::Gemini => {
                    if request_path.starts_with("/v1/") {
-                        build_endpoint("/v1beta/openai", endpoint_suffix)
+                        // Use native Gemini endpoint
                        if !is_streaming {
                            build_endpoint(
                                "/v1beta",
                                &format!("/models/{}:generateContent", model_id),
                            )
                        } else {
                            build_endpoint(
                                "/v1beta",
                                &format!("/models/{}:streamGenerateContent?alt=sse", model_id),
                            )
                        }
                    } else {
                        build_endpoint("/v1", endpoint_suffix)
                    }
@ -178,6 +209,20 @@ impl SupportedAPIsFromClient {
                            build_endpoint("/v1", "/chat/completions")
                        }
                    }
                    ProviderId::Gemini => {
                        // Translate Anthropic → Gemini native
                        if !is_streaming {
                            build_endpoint(
                                "/v1beta",
                                &format!("/models/{}:generateContent", model_id),
                            )
                        } else {
                            build_endpoint(
                                "/v1beta",
                                &format!("/models/{}:streamGenerateContent?alt=sse", model_id),
                            )
                        }
                    }
                    _ => build_endpoint("/v1", "/chat/completions"),
                }
            }
@ -186,6 +231,20 @@ impl SupportedAPIsFromClient {
                match provider_id {
                    // Providers that support /v1/responses natively
                    ProviderId::OpenAI | ProviderId::XAI => route_by_provider("/responses"),
                    ProviderId::Gemini => {
                        // Translate Responses → Gemini native
                        if !is_streaming {
                            build_endpoint(
                                "/v1beta",
                                &format!("/models/{}:generateContent", model_id),
                            )
                        } else {
                            build_endpoint(
                                "/v1beta",
                                &format!("/models/{}:streamGenerateContent?alt=sse", model_id),
                            )
                        }
                    }
                    // All other providers: translate to /chat/completions
                    _ => route_by_provider("/chat/completions"),
                }
@ -194,6 +253,33 @@ impl SupportedAPIsFromClient {
                // For Chat Completions API, use the standard chat/completions path
                route_by_provider("/chat/completions")
            }
            SupportedAPIsFromClient::GeminiGenerateContentAPI(_) => {
                match provider_id {
                    ProviderId::Gemini => {
                        // Native Gemini endpoint
                        if !is_streaming {
                            build_endpoint(
                                "/v1beta",
                                &format!("/models/{}:generateContent", model_id),
                            )
                        } else {
                            build_endpoint(
                                "/v1beta",
                                &format!("/models/{}:streamGenerateContent?alt=sse", model_id),
                            )
                        }
                    }
                    ProviderId::Anthropic => build_endpoint("/v1", "/messages"),
                    ProviderId::AmazonBedrock => {
                        if !is_streaming {
                            build_endpoint("", &format!("/model/{}/converse", model_id))
                        } else {
                            build_endpoint("", &format!("/model/{}/converse-stream", model_id))
                        }
                    }
                    _ => build_endpoint("/v1", "/chat/completions"),
                }
            }
        }
    }
 }
@ -201,6 +287,18 @@ impl SupportedAPIsFromClient {
 impl SupportedUpstreamAPIs {
    /// Create a SupportedUpstreamApi from an endpoint path
    pub fn from_endpoint(endpoint: &str) -> Option<Self> {
        // Check Gemini first since it uses suffix matching
        if let Some(gemini_api) = GeminiApi::from_endpoint(endpoint) {
            return match gemini_api {
                GeminiApi::GenerateContent => {
                    Some(SupportedUpstreamAPIs::GeminiGenerateContent(gemini_api))
                }
                GeminiApi::StreamGenerateContent => Some(
                    SupportedUpstreamAPIs::GeminiStreamGenerateContent(gemini_api),
                ),
            };
        }
        if let Some(openai_api) = OpenAIApi::from_endpoint(endpoint) {
            // Check if this is the Responses API endpoint
            if openai_api == OpenAIApi::Responses {
@ -396,7 +494,7 @@ mod tests {
            "/openai/deployments/gpt-4/chat/completions?api-version=2025-01-01-preview"
        );
-        // Test Gemini provider
+        // Test Gemini provider (uses native Gemini API with transforms)
        assert_eq!(
            api.target_endpoint_for_provider(
                &ProviderId::Gemini,
@ -405,7 +503,7 @@ mod tests {
                false,
                None
            ),
-            "/v1beta/openai/chat/completions"
+            "/v1beta/models/gemini-pro:generateContent"
        );
    }
--- a/crates/hermesllm/src/lib.rs
+++ b/crates/hermesllm/src/lib.rs
@ -20,6 +20,7 @@ pub use providers::streaming_response::{ProviderStreamResponse, ProviderStreamRe
 pub const CHAT_COMPLETIONS_PATH: &str = "/v1/chat/completions";
 pub const OPENAI_RESPONSES_API_PATH: &str = "/v1/responses";
 pub const MESSAGES_PATH: &str = "/v1/messages";
 pub const GENERATE_CONTENT_PATH_SUFFIX: &str = ":generateContent";
 #[cfg(test)]
 mod tests {
--- a/crates/hermesllm/src/providers/id.rs
+++ b/crates/hermesllm/src/providers/id.rs
@ -1,4 +1,4 @@
-use crate::apis::{AmazonBedrockApi, AnthropicApi, OpenAIApi};
+use crate::apis::{AmazonBedrockApi, AnthropicApi, GeminiApi, OpenAIApi};
 use crate::clients::endpoints::{SupportedAPIsFromClient, SupportedUpstreamAPIs};
 use serde::Deserialize;
 use std::collections::HashMap;
@ -116,7 +116,68 @@ impl ProviderId {
        is_streaming: bool,
    ) -> SupportedUpstreamAPIs {
        match (self, client_api) {
            // ============================================================================
            // Gemini provider — use native Gemini APIs
            // ============================================================================
            (ProviderId::Gemini, SupportedAPIsFromClient::GeminiGenerateContentAPI(_)) => {
                if is_streaming {
                    SupportedUpstreamAPIs::GeminiStreamGenerateContent(
                        GeminiApi::StreamGenerateContent,
                    )
                } else {
                    SupportedUpstreamAPIs::GeminiGenerateContent(GeminiApi::GenerateContent)
                }
            }
            (ProviderId::Gemini, SupportedAPIsFromClient::OpenAIChatCompletions(_)) => {
                if is_streaming {
                    SupportedUpstreamAPIs::GeminiStreamGenerateContent(
                        GeminiApi::StreamGenerateContent,
                    )
                } else {
                    SupportedUpstreamAPIs::GeminiGenerateContent(GeminiApi::GenerateContent)
                }
            }
            (ProviderId::Gemini, SupportedAPIsFromClient::AnthropicMessagesAPI(_)) => {
                if is_streaming {
                    SupportedUpstreamAPIs::GeminiStreamGenerateContent(
                        GeminiApi::StreamGenerateContent,
                    )
                } else {
                    SupportedUpstreamAPIs::GeminiGenerateContent(GeminiApi::GenerateContent)
                }
            }
            (ProviderId::Gemini, SupportedAPIsFromClient::OpenAIResponsesAPI(_)) => {
                if is_streaming {
                    SupportedUpstreamAPIs::GeminiStreamGenerateContent(
                        GeminiApi::StreamGenerateContent,
                    )
                } else {
                    SupportedUpstreamAPIs::GeminiGenerateContent(GeminiApi::GenerateContent)
                }
            }
            // ============================================================================
            // Non-Gemini providers receiving Gemini-format requests
            // ============================================================================
            (ProviderId::Anthropic, SupportedAPIsFromClient::GeminiGenerateContentAPI(_)) => {
                SupportedUpstreamAPIs::AnthropicMessagesAPI(AnthropicApi::Messages)
            }
            (ProviderId::AmazonBedrock, SupportedAPIsFromClient::GeminiGenerateContentAPI(_)) => {
                if is_streaming {
                    SupportedUpstreamAPIs::AmazonBedrockConverseStream(
                        AmazonBedrockApi::ConverseStream,
                    )
                } else {
                    SupportedUpstreamAPIs::AmazonBedrockConverse(AmazonBedrockApi::Converse)
                }
            }
            (_, SupportedAPIsFromClient::GeminiGenerateContentAPI(_)) => {
                SupportedUpstreamAPIs::OpenAIChatCompletions(OpenAIApi::ChatCompletions)
            }
            // ============================================================================
            // Claude/Anthropic providers natively support Anthropic APIs
            // ============================================================================
            (ProviderId::Anthropic, SupportedAPIsFromClient::AnthropicMessagesAPI(_)) => {
                SupportedUpstreamAPIs::AnthropicMessagesAPI(AnthropicApi::Messages)
            }
@ -136,7 +197,6 @@ impl ProviderId {
                | ProviderId::Mistral
                | ProviderId::Deepseek
                | ProviderId::Arch
                | ProviderId::Gemini
                | ProviderId::GitHub
                | ProviderId::AzureOpenAI
                | ProviderId::XAI
@ -154,7 +214,6 @@ impl ProviderId {
                | ProviderId::Mistral
                | ProviderId::Deepseek
                | ProviderId::Arch
                | ProviderId::Gemini
                | ProviderId::GitHub
                | ProviderId::AzureOpenAI
                | ProviderId::XAI
--- a/crates/hermesllm/src/providers/request.rs
+++ b/crates/hermesllm/src/providers/request.rs
@ -1,5 +1,7 @@
 use crate::apis::anthropic::MessagesRequest;
 use crate::apis::gemini::GenerateContentRequest;
 use crate::apis::openai::ChatCompletionsRequest;
 use crate::apis::ApiDefinition;
 use crate::apis::amazon_bedrock::{ConverseRequest, ConverseStreamRequest};
 use crate::apis::openai_responses::ResponsesAPIRequest;
@ -19,7 +21,8 @@ pub enum ProviderRequestType {
    BedrockConverse(ConverseRequest),
    BedrockConverseStream(ConverseStreamRequest),
    ResponsesAPIRequest(ResponsesAPIRequest),
-    //add more request types here
+    GeminiGenerateContent(GenerateContentRequest),
    GeminiStreamGenerateContent(GenerateContentRequest),
 }
 pub trait ProviderRequest: Send + Sync {
    /// Extract the model name from the request
@ -69,6 +72,9 @@ impl ProviderRequestType {
            Self::BedrockConverse(r) => r.set_messages(messages),
            Self::BedrockConverseStream(r) => r.set_messages(messages),
            Self::ResponsesAPIRequest(r) => r.set_messages(messages),
            Self::GeminiGenerateContent(r) | Self::GeminiStreamGenerateContent(r) => {
                r.set_messages(messages)
            }
        }
    }
@ -100,6 +106,7 @@ impl ProviderRequest for ProviderRequestType {
            Self::BedrockConverse(r) => r.model(),
            Self::BedrockConverseStream(r) => r.model(),
            Self::ResponsesAPIRequest(r) => r.model(),
            Self::GeminiGenerateContent(r) | Self::GeminiStreamGenerateContent(r) => r.model(),
        }
    }
@ -110,6 +117,9 @@ impl ProviderRequest for ProviderRequestType {
            Self::BedrockConverse(r) => r.set_model(model),
            Self::BedrockConverseStream(r) => r.set_model(model),
            Self::ResponsesAPIRequest(r) => r.set_model(model),
            Self::GeminiGenerateContent(r) | Self::GeminiStreamGenerateContent(r) => {
                r.set_model(model)
            }
        }
    }
@ -120,6 +130,8 @@ impl ProviderRequest for ProviderRequestType {
            Self::BedrockConverse(_) => false,
            Self::BedrockConverseStream(_) => true,
            Self::ResponsesAPIRequest(r) => r.is_streaming(),
            Self::GeminiGenerateContent(_) => false,
            Self::GeminiStreamGenerateContent(_) => true,
        }
    }
@ -130,6 +142,9 @@ impl ProviderRequest for ProviderRequestType {
            Self::BedrockConverse(r) => r.extract_messages_text(),
            Self::BedrockConverseStream(r) => r.extract_messages_text(),
            Self::ResponsesAPIRequest(r) => r.extract_messages_text(),
            Self::GeminiGenerateContent(r) | Self::GeminiStreamGenerateContent(r) => {
                r.extract_messages_text()
            }
        }
    }
@ -140,6 +155,9 @@ impl ProviderRequest for ProviderRequestType {
            Self::BedrockConverse(r) => r.get_recent_user_message(),
            Self::BedrockConverseStream(r) => r.get_recent_user_message(),
            Self::ResponsesAPIRequest(r) => r.get_recent_user_message(),
            Self::GeminiGenerateContent(r) | Self::GeminiStreamGenerateContent(r) => {
                r.get_recent_user_message()
            }
        }
    }
@ -150,6 +168,9 @@ impl ProviderRequest for ProviderRequestType {
            Self::BedrockConverse(r) => r.get_tool_names(),
            Self::BedrockConverseStream(r) => r.get_tool_names(),
            Self::ResponsesAPIRequest(r) => r.get_tool_names(),
            Self::GeminiGenerateContent(r) | Self::GeminiStreamGenerateContent(r) => {
                r.get_tool_names()
            }
        }
    }
@ -160,6 +181,7 @@ impl ProviderRequest for ProviderRequestType {
            Self::BedrockConverse(r) => r.to_bytes(),
            Self::BedrockConverseStream(r) => r.to_bytes(),
            Self::ResponsesAPIRequest(r) => r.to_bytes(),
            Self::GeminiGenerateContent(r) | Self::GeminiStreamGenerateContent(r) => r.to_bytes(),
        }
    }
@ -170,6 +192,7 @@ impl ProviderRequest for ProviderRequestType {
            Self::BedrockConverse(r) => r.metadata(),
            Self::BedrockConverseStream(r) => r.metadata(),
            Self::ResponsesAPIRequest(r) => r.metadata(),
            Self::GeminiGenerateContent(r) | Self::GeminiStreamGenerateContent(r) => r.metadata(),
        }
    }
@ -180,6 +203,9 @@ impl ProviderRequest for ProviderRequestType {
            Self::BedrockConverse(r) => r.remove_metadata_key(key),
            Self::BedrockConverseStream(r) => r.remove_metadata_key(key),
            Self::ResponsesAPIRequest(r) => r.remove_metadata_key(key),
            Self::GeminiGenerateContent(r) | Self::GeminiStreamGenerateContent(r) => {
                r.remove_metadata_key(key)
            }
        }
    }
@ -190,6 +216,9 @@ impl ProviderRequest for ProviderRequestType {
            Self::BedrockConverse(r) => r.get_temperature(),
            Self::BedrockConverseStream(r) => r.get_temperature(),
            Self::ResponsesAPIRequest(r) => r.get_temperature(),
            Self::GeminiGenerateContent(r) | Self::GeminiStreamGenerateContent(r) => {
                r.get_temperature()
            }
        }
    }
@ -200,6 +229,9 @@ impl ProviderRequest for ProviderRequestType {
            Self::BedrockConverse(r) => r.get_messages(),
            Self::BedrockConverseStream(r) => r.get_messages(),
            Self::ResponsesAPIRequest(r) => r.get_messages(),
            Self::GeminiGenerateContent(r) | Self::GeminiStreamGenerateContent(r) => {
                r.get_messages()
            }
        }
    }
@ -210,6 +242,9 @@ impl ProviderRequest for ProviderRequestType {
            Self::BedrockConverse(r) => r.set_messages(messages),
            Self::BedrockConverseStream(r) => r.set_messages(messages),
            Self::ResponsesAPIRequest(r) => r.set_messages(messages),
            Self::GeminiGenerateContent(r) | Self::GeminiStreamGenerateContent(r) => {
                r.set_messages(messages)
            }
        }
    }
 }
@ -245,6 +280,18 @@ impl TryFrom<(&[u8], &SupportedAPIsFromClient)> for ProviderRequestType {
                    responses_apirequest,
                ))
            }
            SupportedAPIsFromClient::GeminiGenerateContentAPI(gemini_api) => {
                let gemini_request: GenerateContentRequest =
                    GenerateContentRequest::try_from(bytes)
                        .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
                if gemini_api.supports_streaming() {
                    Ok(ProviderRequestType::GeminiStreamGenerateContent(
                        gemini_request,
                    ))
                } else {
                    Ok(ProviderRequestType::GeminiGenerateContent(gemini_request))
                }
            }
        }
    }
 }
@ -309,6 +356,37 @@ impl TryFrom<(ProviderRequestType, &SupportedUpstreamAPIs)> for ProviderRequestT
                    source: None,
                })
            }
            // ChatCompletions -> Gemini
            (
                ProviderRequestType::ChatCompletionsRequest(chat_req),
                SupportedUpstreamAPIs::GeminiGenerateContent(_),
            ) => {
                let gemini_req = GenerateContentRequest::try_from(chat_req).map_err(|e| {
                    ProviderRequestError {
                        message: format!(
                            "Failed to convert ChatCompletionsRequest to GenerateContentRequest: {}",
                            e
                        ),
                        source: Some(Box::new(e)),
                    }
                })?;
                Ok(ProviderRequestType::GeminiGenerateContent(gemini_req))
            }
            (
                ProviderRequestType::ChatCompletionsRequest(chat_req),
                SupportedUpstreamAPIs::GeminiStreamGenerateContent(_),
            ) => {
                let gemini_req = GenerateContentRequest::try_from(chat_req).map_err(|e| {
                    ProviderRequestError {
                        message: format!(
                            "Failed to convert ChatCompletionsRequest to GenerateContentRequest (stream): {}",
                            e
                        ),
                        source: Some(Box::new(e)),
                    }
                })?;
                Ok(ProviderRequestType::GeminiStreamGenerateContent(gemini_req))
            }
            // ============================================================================
            // MessagesRequest conversions
@ -370,6 +448,37 @@ impl TryFrom<(ProviderRequestType, &SupportedUpstreamAPIs)> for ProviderRequestT
                    source: None,
                })
            }
            // Messages -> Gemini (chain: Anthropic -> OpenAI -> Gemini)
            (
                ProviderRequestType::MessagesRequest(messages_req),
                SupportedUpstreamAPIs::GeminiGenerateContent(_),
            ) => {
                let gemini_req = GenerateContentRequest::try_from(messages_req).map_err(|e| {
                    ProviderRequestError {
                        message: format!(
                            "Failed to convert MessagesRequest to GenerateContentRequest: {}",
                            e
                        ),
                        source: Some(Box::new(e)),
                    }
                })?;
                Ok(ProviderRequestType::GeminiGenerateContent(gemini_req))
            }
            (
                ProviderRequestType::MessagesRequest(messages_req),
                SupportedUpstreamAPIs::GeminiStreamGenerateContent(_),
            ) => {
                let gemini_req = GenerateContentRequest::try_from(messages_req).map_err(|e| {
                    ProviderRequestError {
                        message: format!(
                            "Failed to convert MessagesRequest to GenerateContentRequest (stream): {}",
                            e
                        ),
                        source: Some(Box::new(e)),
                    }
                })?;
                Ok(ProviderRequestType::GeminiStreamGenerateContent(gemini_req))
            }
            // ============================================================================
            // ResponsesAPIRequest conversions (only converts TO other formats)
@ -480,6 +589,171 @@ impl TryFrom<(ProviderRequestType, &SupportedUpstreamAPIs)> for ProviderRequestT
                Ok(ProviderRequestType::BedrockConverseStream(bedrock_req))
            }
            // ResponsesAPI -> Gemini (via ChatCompletions)
            (
                ProviderRequestType::ResponsesAPIRequest(responses_req),
                SupportedUpstreamAPIs::GeminiGenerateContent(_),
            ) => {
                let chat_req = ChatCompletionsRequest::try_from(responses_req).map_err(|e| {
                    ProviderRequestError {
                        message: format!(
                            "Failed to convert ResponsesAPIRequest to ChatCompletionsRequest: {}",
                            e
                        ),
                        source: Some(Box::new(e)),
                    }
                })?;
                let gemini_req = GenerateContentRequest::try_from(chat_req).map_err(|e| {
                    ProviderRequestError {
                        message: format!(
                            "Failed to convert ChatCompletionsRequest to GenerateContentRequest: {}",
                            e
                        ),
                        source: Some(Box::new(e)),
                    }
                })?;
                Ok(ProviderRequestType::GeminiGenerateContent(gemini_req))
            }
            (
                ProviderRequestType::ResponsesAPIRequest(responses_req),
                SupportedUpstreamAPIs::GeminiStreamGenerateContent(_),
            ) => {
                let chat_req = ChatCompletionsRequest::try_from(responses_req).map_err(|e| {
                    ProviderRequestError {
                        message: format!(
                            "Failed to convert ResponsesAPIRequest to ChatCompletionsRequest: {}",
                            e
                        ),
                        source: Some(Box::new(e)),
                    }
                })?;
                let gemini_req = GenerateContentRequest::try_from(chat_req).map_err(|e| {
                    ProviderRequestError {
                        message: format!(
                            "Failed to convert ChatCompletionsRequest to GenerateContentRequest (stream): {}",
                            e
                        ),
                        source: Some(Box::new(e)),
                    }
                })?;
                Ok(ProviderRequestType::GeminiStreamGenerateContent(gemini_req))
            }
            // ============================================================================
            // GeminiGenerateContent conversions (client sends Gemini format)
            // ============================================================================
            (
                ProviderRequestType::GeminiGenerateContent(gemini_req),
                SupportedUpstreamAPIs::GeminiGenerateContent(_),
            ) => Ok(ProviderRequestType::GeminiGenerateContent(gemini_req)),
            (
                ProviderRequestType::GeminiStreamGenerateContent(gemini_req),
                SupportedUpstreamAPIs::GeminiStreamGenerateContent(_),
            ) => Ok(ProviderRequestType::GeminiStreamGenerateContent(gemini_req)),
            // Cross-streaming mode: non-streaming -> streaming and vice versa
            (
                ProviderRequestType::GeminiGenerateContent(gemini_req),
                SupportedUpstreamAPIs::GeminiStreamGenerateContent(_),
            ) => Ok(ProviderRequestType::GeminiStreamGenerateContent(gemini_req)),
            (
                ProviderRequestType::GeminiStreamGenerateContent(gemini_req),
                SupportedUpstreamAPIs::GeminiGenerateContent(_),
            ) => Ok(ProviderRequestType::GeminiGenerateContent(gemini_req)),
            (
                ProviderRequestType::GeminiGenerateContent(gemini_req)
                | ProviderRequestType::GeminiStreamGenerateContent(gemini_req),
                SupportedUpstreamAPIs::OpenAIChatCompletions(_),
            ) => {
                let chat_req = ChatCompletionsRequest::try_from(gemini_req).map_err(|e| {
                    ProviderRequestError {
                        message: format!(
                            "Failed to convert GenerateContentRequest to ChatCompletionsRequest: {}",
                            e
                        ),
                        source: Some(Box::new(e)),
                    }
                })?;
                Ok(ProviderRequestType::ChatCompletionsRequest(chat_req))
            }
            (
                ProviderRequestType::GeminiGenerateContent(gemini_req)
                | ProviderRequestType::GeminiStreamGenerateContent(gemini_req),
                SupportedUpstreamAPIs::AnthropicMessagesAPI(_),
            ) => {
                let messages_req = MessagesRequest::try_from(gemini_req).map_err(|e| {
                    ProviderRequestError {
                        message: format!(
                            "Failed to convert GenerateContentRequest to MessagesRequest: {}",
                            e
                        ),
                        source: Some(Box::new(e)),
                    }
                })?;
                Ok(ProviderRequestType::MessagesRequest(messages_req))
            }
            (
                ProviderRequestType::GeminiGenerateContent(gemini_req)
                | ProviderRequestType::GeminiStreamGenerateContent(gemini_req),
                SupportedUpstreamAPIs::AmazonBedrockConverse(_),
            ) => {
                // Chain: Gemini -> OpenAI -> Bedrock
                let chat_req = ChatCompletionsRequest::try_from(gemini_req).map_err(|e| {
                    ProviderRequestError {
                        message: format!(
                            "Failed to convert GenerateContentRequest to ChatCompletionsRequest: {}",
                            e
                        ),
                        source: Some(Box::new(e)),
                    }
                })?;
                let bedrock_req = ConverseRequest::try_from(chat_req).map_err(|e| {
                    ProviderRequestError {
                        message: format!(
                            "Failed to convert ChatCompletionsRequest to ConverseRequest: {}",
                            e
                        ),
                        source: Some(Box::new(e)),
                    }
                })?;
                Ok(ProviderRequestType::BedrockConverse(bedrock_req))
            }
            (
                ProviderRequestType::GeminiGenerateContent(gemini_req)
                | ProviderRequestType::GeminiStreamGenerateContent(gemini_req),
                SupportedUpstreamAPIs::AmazonBedrockConverseStream(_),
            ) => {
                // Chain: Gemini -> OpenAI -> Bedrock Stream
                let chat_req = ChatCompletionsRequest::try_from(gemini_req).map_err(|e| {
                    ProviderRequestError {
                        message: format!(
                            "Failed to convert GenerateContentRequest to ChatCompletionsRequest: {}",
                            e
                        ),
                        source: Some(Box::new(e)),
                    }
                })?;
                let bedrock_req = ConverseStreamRequest::try_from(chat_req).map_err(|e| {
                    ProviderRequestError {
                        message: format!(
                            "Failed to convert ChatCompletionsRequest to ConverseStreamRequest: {}",
                            e
                        ),
                        source: Some(Box::new(e)),
                    }
                })?;
                Ok(ProviderRequestType::BedrockConverseStream(bedrock_req))
            }
            (
                ProviderRequestType::GeminiGenerateContent(_)
                | ProviderRequestType::GeminiStreamGenerateContent(_),
                SupportedUpstreamAPIs::OpenAIResponsesAPI(_),
            ) => {
                Err(ProviderRequestError {
                    message: "Conversion from GenerateContentRequest to ResponsesAPIRequest is not supported.".to_string(),
                    source: None,
                })
            }
            // ============================================================================
            // Amazon Bedrock conversions (not supported as client API)
            // ============================================================================
--- a/crates/hermesllm/src/providers/response.rs
+++ b/crates/hermesllm/src/providers/response.rs
@ -1,5 +1,6 @@
 use crate::apis::amazon_bedrock::ConverseResponse;
 use crate::apis::anthropic::MessagesResponse;
 use crate::apis::gemini::GenerateContentResponse;
 use crate::apis::openai::ChatCompletionsResponse;
 use crate::apis::openai_responses::ResponsesAPIResponse;
 use crate::clients::endpoints::SupportedAPIsFromClient;
@ -16,6 +17,7 @@ pub enum ProviderResponseType {
    ChatCompletionsResponse(ChatCompletionsResponse),
    MessagesResponse(MessagesResponse),
    ResponsesAPIResponse(Box<ResponsesAPIResponse>),
    GenerateContentResponse(GenerateContentResponse),
 }
 /// Trait for token usage information
@ -44,6 +46,9 @@ impl ProviderResponse for ProviderResponseType {
            ProviderResponseType::ResponsesAPIResponse(resp) => {
                resp.usage.as_ref().map(|u| u as &dyn TokenUsage)
            }
            ProviderResponseType::GenerateContentResponse(resp) => {
                resp.usage_metadata.as_ref().map(|u| u as &dyn TokenUsage)
            }
        }
    }
@ -58,6 +63,15 @@ impl ProviderResponse for ProviderResponseType {
                    u.total_tokens as usize,
                )
            }),
            ProviderResponseType::GenerateContentResponse(resp) => {
                resp.usage_metadata.as_ref().map(|u| {
                    (
                        u.prompt_token_count.unwrap_or(0) as usize,
                        u.candidates_token_count.unwrap_or(0) as usize,
                        u.total_token_count.unwrap_or(0) as usize,
                    )
                })
            }
        }
    }
 }
@ -238,6 +252,140 @@ impl TryFrom<(&[u8], &SupportedAPIsFromClient, &ProviderId)> for ProviderRespons
                    response_api,
                )))
            }
            // ============================================================================
            // Gemini upstream transformations
            // ============================================================================
            (
                SupportedUpstreamAPIs::GeminiGenerateContent(_),
                SupportedAPIsFromClient::GeminiGenerateContentAPI(_),
            ) => {
                // Passthrough: Gemini upstream -> Gemini client
                let resp: GenerateContentResponse = serde_json::from_slice(bytes)
                    .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
                Ok(ProviderResponseType::GenerateContentResponse(resp))
            }
            (
                SupportedUpstreamAPIs::GeminiGenerateContent(_),
                SupportedAPIsFromClient::OpenAIChatCompletions(_),
            ) => {
                // Gemini upstream -> OpenAI client
                let gemini_resp: GenerateContentResponse = serde_json::from_slice(bytes)
                    .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
                let chat_resp: ChatCompletionsResponse = gemini_resp.try_into().map_err(|e| {
                    std::io::Error::new(
                        std::io::ErrorKind::InvalidData,
                        format!("Transformation error: {}", e),
                    )
                })?;
                Ok(ProviderResponseType::ChatCompletionsResponse(chat_resp))
            }
            (
                SupportedUpstreamAPIs::GeminiGenerateContent(_),
                SupportedAPIsFromClient::AnthropicMessagesAPI(_),
            ) => {
                // Chain: Gemini -> OpenAI -> Anthropic
                let gemini_resp: GenerateContentResponse = serde_json::from_slice(bytes)
                    .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
                let chat_resp: ChatCompletionsResponse = gemini_resp.try_into().map_err(|e| {
                    std::io::Error::new(
                        std::io::ErrorKind::InvalidData,
                        format!("Transformation error: {}", e),
                    )
                })?;
                let messages_resp: MessagesResponse = chat_resp.try_into().map_err(|e| {
                    std::io::Error::new(
                        std::io::ErrorKind::InvalidData,
                        format!("Transformation error: {}", e),
                    )
                })?;
                Ok(ProviderResponseType::MessagesResponse(messages_resp))
            }
            (
                SupportedUpstreamAPIs::GeminiGenerateContent(_),
                SupportedAPIsFromClient::OpenAIResponsesAPI(_),
            ) => {
                // Chain: Gemini -> OpenAI -> ResponsesAPI
                let gemini_resp: GenerateContentResponse = serde_json::from_slice(bytes)
                    .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
                let chat_resp: ChatCompletionsResponse = gemini_resp.try_into().map_err(|e| {
                    std::io::Error::new(
                        std::io::ErrorKind::InvalidData,
                        format!("Transformation error: {}", e),
                    )
                })?;
                let responses_resp: ResponsesAPIResponse = chat_resp.try_into().map_err(|e| {
                    std::io::Error::new(
                        std::io::ErrorKind::InvalidData,
                        format!("Transformation error: {}", e),
                    )
                })?;
                Ok(ProviderResponseType::ResponsesAPIResponse(Box::new(
                    responses_resp,
                )))
            }
            // ============================================================================
            // Non-Gemini upstream -> Gemini client
            // ============================================================================
            (
                SupportedUpstreamAPIs::OpenAIChatCompletions(_),
                SupportedAPIsFromClient::GeminiGenerateContentAPI(_),
            ) => {
                // OpenAI upstream -> Gemini client
                let openai_resp: ChatCompletionsResponse = ChatCompletionsResponse::try_from(bytes)
                    .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
                let gemini_resp: GenerateContentResponse = openai_resp.try_into().map_err(|e| {
                    std::io::Error::new(
                        std::io::ErrorKind::InvalidData,
                        format!("Transformation error: {}", e),
                    )
                })?;
                Ok(ProviderResponseType::GenerateContentResponse(gemini_resp))
            }
            (
                SupportedUpstreamAPIs::AnthropicMessagesAPI(_),
                SupportedAPIsFromClient::GeminiGenerateContentAPI(_),
            ) => {
                // Chain: Anthropic -> OpenAI -> Gemini
                let anthropic_resp: MessagesResponse = serde_json::from_slice(bytes)
                    .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
                let chat_resp: ChatCompletionsResponse =
                    anthropic_resp.try_into().map_err(|e| {
                        std::io::Error::new(
                            std::io::ErrorKind::InvalidData,
                            format!("Transformation error: {}", e),
                        )
                    })?;
                let gemini_resp: GenerateContentResponse = chat_resp.try_into().map_err(|e| {
                    std::io::Error::new(
                        std::io::ErrorKind::InvalidData,
                        format!("Transformation error: {}", e),
                    )
                })?;
                Ok(ProviderResponseType::GenerateContentResponse(gemini_resp))
            }
            (
                SupportedUpstreamAPIs::AmazonBedrockConverse(_),
                SupportedAPIsFromClient::GeminiGenerateContentAPI(_),
            ) => {
                // Chain: Bedrock -> OpenAI -> Gemini
                let bedrock_resp: ConverseResponse = serde_json::from_slice(bytes)
                    .map_err(|e| std::io::Error::new(std::io::ErrorKind::InvalidData, e))?;
                let chat_resp: ChatCompletionsResponse = bedrock_resp.try_into().map_err(|e| {
                    std::io::Error::new(
                        std::io::ErrorKind::InvalidData,
                        format!("Transformation error: {}", e),
                    )
                })?;
                let gemini_resp: GenerateContentResponse = chat_resp.try_into().map_err(|e| {
                    std::io::Error::new(
                        std::io::ErrorKind::InvalidData,
                        format!("Transformation error: {}", e),
                    )
                })?;
                Ok(ProviderResponseType::GenerateContentResponse(gemini_resp))
            }
            _ => Err(std::io::Error::new(
                std::io::ErrorKind::InvalidData,
                "Unsupported API combination for response transformation",
--- a/crates/hermesllm/src/providers/streaming_response.rs
+++ b/crates/hermesllm/src/providers/streaming_response.rs
@ -83,6 +83,11 @@ impl TryFrom<(&SupportedAPIsFromClient, &SupportedUpstreamAPIs)> for SseStreamBu
            SupportedAPIsFromClient::OpenAIResponsesAPI(_) => {
                Ok(SseStreamBuffer::OpenAIResponses(Box::default()))
            }
            SupportedAPIsFromClient::GeminiGenerateContentAPI(_) => {
                // Gemini client with a different upstream - use passthrough
                // since Gemini streaming uses SSE and doesn't need special buffering
                Ok(SseStreamBuffer::Passthrough(PassthroughStreamBuffer::new()))
            }
        }
    }
 }
--- a/crates/hermesllm/src/transforms/mod.rs
+++ b/crates/hermesllm/src/transforms/mod.rs
@ -15,6 +15,7 @@ pub mod response_streaming;
 // Re-export commonly used items for convenience
 pub use lib::*;
 #[allow(ambiguous_glob_reexports)]
 pub use request::*;
 pub use response::*;
 pub use response_streaming::*;
--- a/crates/hermesllm/src/transforms/request/from_gemini.rs
+++ b/crates/hermesllm/src/transforms/request/from_gemini.rs
@ -0,0 +1,327 @@
 use crate::apis::gemini::GenerateContentRequest;
 use crate::apis::openai::{
    ChatCompletionsRequest, Function, FunctionCall as OpenAIFunctionCall, Message, MessageContent,
    Role, Tool, ToolCall as OpenAIToolCall, ToolChoice, ToolChoiceType,
 };
 use crate::apis::anthropic::MessagesRequest;
 use crate::clients::TransformError;
 // ============================================================================
 // Gemini GenerateContent -> OpenAI ChatCompletions
 // ============================================================================
 impl TryFrom<GenerateContentRequest> for ChatCompletionsRequest {
    type Error = TransformError;
    fn try_from(req: GenerateContentRequest) -> Result<Self, Self::Error> {
        let mut messages: Vec<Message> = Vec::new();
        // Convert system instruction
        if let Some(system) = &req.system_instruction {
            let text = system
                .parts
                .iter()
                .filter_map(|p| p.text.clone())
                .collect::<Vec<_>>()
                .join("");
            if !text.is_empty() {
                messages.push(Message {
                    role: Role::System,
                    content: Some(MessageContent::Text(text)),
                    name: None,
                    tool_calls: None,
                    tool_call_id: None,
                });
            }
        }
        // Convert contents
        for content in &req.contents {
            let role = match content.role.as_deref() {
                Some("model") => Role::Assistant,
                _ => Role::User,
            };
            // Check if this content has function_call parts (assistant with tool calls)
            let has_function_calls = content.parts.iter().any(|p| p.function_call.is_some());
            let has_function_responses =
                content.parts.iter().any(|p| p.function_response.is_some());
            if has_function_calls {
                // Convert to assistant message with tool_calls
                let mut tool_calls = Vec::new();
                let mut text_parts = Vec::new();
                for (i, part) in content.parts.iter().enumerate() {
                    if let Some(fc) = &part.function_call {
                        tool_calls.push(OpenAIToolCall {
                            id: format!("call_{}", i),
                            call_type: "function".to_string(),
                            function: OpenAIFunctionCall {
                                name: fc.name.clone(),
                                arguments: serde_json::to_string(&fc.args).unwrap_or_default(),
                            },
                        });
                    } else if let Some(text) = &part.text {
                        text_parts.push(text.clone());
                    }
                }
                let content_text = if text_parts.is_empty() {
                    None
                } else {
                    Some(MessageContent::Text(text_parts.join("")))
                };
                messages.push(Message {
                    role: Role::Assistant,
                    content: content_text,
                    name: None,
                    tool_calls: if tool_calls.is_empty() {
                        None
                    } else {
                        Some(tool_calls)
                    },
                    tool_call_id: None,
                });
            } else if has_function_responses {
                // Convert each function_response to a tool message
                for part in &content.parts {
                    if let Some(fr) = &part.function_response {
                        let result_text = serde_json::to_string(&fr.response).unwrap_or_default();
                        messages.push(Message {
                            role: Role::Tool,
                            content: Some(MessageContent::Text(result_text)),
                            name: None,
                            tool_calls: None,
                            tool_call_id: Some(fr.name.clone()),
                        });
                    }
                }
            } else {
                // Regular text message
                let text = content
                    .parts
                    .iter()
                    .filter_map(|p| p.text.clone())
                    .collect::<Vec<_>>()
                    .join("");
                messages.push(Message {
                    role,
                    content: Some(MessageContent::Text(text)),
                    name: None,
                    tool_calls: None,
                    tool_call_id: None,
                });
            }
        }
        // Convert generation config
        let (temperature, top_p, max_tokens, stop, presence_penalty, frequency_penalty) =
            if let Some(gc) = &req.generation_config {
                (
                    gc.temperature,
                    gc.top_p,
                    gc.max_output_tokens,
                    gc.stop_sequences.clone(),
                    gc.presence_penalty,
                    gc.frequency_penalty,
                )
            } else {
                (None, None, None, None, None, None)
            };
        // Convert tools
        let tools = req.tools.and_then(|gemini_tools| {
            let openai_tools: Vec<Tool> = gemini_tools
                .iter()
                .filter_map(|t| t.function_declarations.as_ref())
                .flatten()
                .map(|fd| Tool {
                    tool_type: "function".to_string(),
                    function: Function {
                        name: fd.name.clone(),
                        description: fd.description.clone(),
                        parameters: fd.parameters.clone().unwrap_or_default(),
                        strict: None,
                    },
                })
                .collect();
            if openai_tools.is_empty() {
                None
            } else {
                Some(openai_tools)
            }
        });
        // Convert tool_config
        let tool_choice =
            req.tool_config
                .and_then(|tc| match tc.function_calling_config.mode.as_str() {
                    "AUTO" => Some(ToolChoice::Type(ToolChoiceType::Auto)),
                    "NONE" => Some(ToolChoice::Type(ToolChoiceType::None)),
                    "ANY" => Some(ToolChoice::Type(ToolChoiceType::Required)),
                    _ => None,
                });
        Ok(ChatCompletionsRequest {
            model: req.model,
            messages,
            temperature,
            top_p,
            max_completion_tokens: max_tokens,
            stop,
            tools,
            tool_choice,
            presence_penalty,
            frequency_penalty,
            metadata: req.metadata,
            ..Default::default()
        })
    }
 }
 // ============================================================================
 // Gemini GenerateContent -> Anthropic Messages (via OpenAI)
 // ============================================================================
 impl TryFrom<GenerateContentRequest> for MessagesRequest {
    type Error = TransformError;
    fn try_from(req: GenerateContentRequest) -> Result<Self, Self::Error> {
        // Chain: Gemini -> OpenAI -> Anthropic
        let chat_req = ChatCompletionsRequest::try_from(req)?;
        MessagesRequest::try_from(chat_req)
    }
 }
 // ============================================================================
 // TESTS
 // ============================================================================
 #[cfg(test)]
 mod tests {
    use super::*;
    use crate::apis::gemini::{Content, FunctionCall, Part};
    use serde_json::json;
    #[test]
    fn test_gemini_to_openai_basic() {
        let req = GenerateContentRequest {
            model: "gemini-pro".to_string(),
            contents: vec![
                Content {
                    role: Some("user".to_string()),
                    parts: vec![Part {
                        text: Some("Hello".to_string()),
                        inline_data: None,
                        function_call: None,
                        function_response: None,
                    }],
                },
                Content {
                    role: Some("model".to_string()),
                    parts: vec![Part {
                        text: Some("Hi there!".to_string()),
                        inline_data: None,
                        function_call: None,
                        function_response: None,
                    }],
                },
            ],
            system_instruction: Some(Content {
                role: Some("user".to_string()),
                parts: vec![Part {
                    text: Some("Be helpful".to_string()),
                    inline_data: None,
                    function_call: None,
                    function_response: None,
                }],
            }),
            generation_config: Some(crate::apis::gemini::GenerationConfig {
                temperature: Some(0.5),
                max_output_tokens: Some(512),
                ..Default::default()
            }),
            ..Default::default()
        };
        let openai_req = ChatCompletionsRequest::try_from(req).unwrap();
        // System + user + assistant = 3 messages
        assert_eq!(openai_req.messages.len(), 3);
        assert_eq!(openai_req.messages[0].role, Role::System);
        assert_eq!(openai_req.messages[1].role, Role::User);
        assert_eq!(openai_req.messages[2].role, Role::Assistant);
        assert_eq!(openai_req.temperature, Some(0.5));
        assert_eq!(openai_req.max_completion_tokens, Some(512));
    }
    #[test]
    fn test_gemini_to_openai_with_function_calls() {
        let req = GenerateContentRequest {
            model: "gemini-pro".to_string(),
            contents: vec![
                Content {
                    role: Some("user".to_string()),
                    parts: vec![Part {
                        text: Some("Weather?".to_string()),
                        inline_data: None,
                        function_call: None,
                        function_response: None,
                    }],
                },
                Content {
                    role: Some("model".to_string()),
                    parts: vec![Part {
                        text: None,
                        inline_data: None,
                        function_call: Some(FunctionCall {
                            name: "get_weather".to_string(),
                            args: json!({"location": "NYC"}),
                        }),
                        function_response: None,
                    }],
                },
            ],
            ..Default::default()
        };
        let openai_req = ChatCompletionsRequest::try_from(req).unwrap();
        assert_eq!(openai_req.messages.len(), 2);
        assert!(openai_req.messages[1].tool_calls.is_some());
        let tc = openai_req.messages[1].tool_calls.as_ref().unwrap();
        assert_eq!(tc[0].function.name, "get_weather");
    }
    #[test]
    fn test_gemini_to_openai_tool_config() {
        let req = GenerateContentRequest {
            model: "gemini-pro".to_string(),
            contents: vec![Content {
                role: Some("user".to_string()),
                parts: vec![Part {
                    text: Some("test".to_string()),
                    inline_data: None,
                    function_call: None,
                    function_response: None,
                }],
            }],
            tool_config: Some(crate::apis::gemini::ToolConfig {
                function_calling_config: crate::apis::gemini::FunctionCallingConfig {
                    mode: "ANY".to_string(),
                },
            }),
            ..Default::default()
        };
        let openai_req = ChatCompletionsRequest::try_from(req).unwrap();
        assert!(openai_req.tool_choice.is_some());
        assert_eq!(
            openai_req.tool_choice.as_ref().unwrap(),
            &ToolChoice::Type(ToolChoiceType::Required)
        );
    }
 }
--- a/crates/hermesllm/src/transforms/request/mod.rs
+++ b/crates/hermesllm/src/transforms/request/mod.rs
@ -1,4 +1,6 @@
 //! Request transformation modules
 pub mod from_anthropic;
 pub mod from_gemini;
 pub mod from_openai;
 pub mod to_gemini;
--- a/crates/hermesllm/src/transforms/request/to_gemini.rs
+++ b/crates/hermesllm/src/transforms/request/to_gemini.rs
@ -0,0 +1,323 @@
 use crate::apis::gemini::{
    Content, FunctionCall, FunctionCallingConfig, FunctionDeclaration, FunctionResponse,
    GenerateContentRequest, GenerationConfig, Part, Tool, ToolConfig,
 };
 use crate::apis::openai::{ChatCompletionsRequest, Role, ToolChoice, ToolChoiceType};
 use crate::apis::anthropic::MessagesRequest;
 use crate::clients::TransformError;
 use crate::transforms::lib::ExtractText;
 // ============================================================================
 // OpenAI ChatCompletions -> Gemini GenerateContent
 // ============================================================================
 impl TryFrom<ChatCompletionsRequest> for GenerateContentRequest {
    type Error = TransformError;
    fn try_from(req: ChatCompletionsRequest) -> Result<Self, Self::Error> {
        let mut contents: Vec<Content> = Vec::new();
        let mut system_instruction: Option<Content> = None;
        for msg in &req.messages {
            match msg.role {
                Role::System => {
                    let text = msg.content.extract_text();
                    system_instruction = Some(Content {
                        role: Some("user".to_string()),
                        parts: vec![Part {
                            text: Some(text),
                            inline_data: None,
                            function_call: None,
                            function_response: None,
                        }],
                    });
                }
                Role::User => {
                    let text = msg.content.extract_text();
                    contents.push(Content {
                        role: Some("user".to_string()),
                        parts: vec![Part {
                            text: Some(text),
                            inline_data: None,
                            function_call: None,
                            function_response: None,
                        }],
                    });
                }
                Role::Assistant => {
                    let mut parts = Vec::new();
                    // Check for tool calls
                    if let Some(tool_calls) = &msg.tool_calls {
                        for tc in tool_calls {
                            let args: serde_json::Value =
                                serde_json::from_str(&tc.function.arguments).unwrap_or_default();
                            parts.push(Part {
                                text: None,
                                inline_data: None,
                                function_call: Some(FunctionCall {
                                    name: tc.function.name.clone(),
                                    args,
                                }),
                                function_response: None,
                            });
                        }
                    }
                    // Also include text content if present
                    let text = msg.content.extract_text();
                    if !text.is_empty() {
                        parts.push(Part {
                            text: Some(text),
                            inline_data: None,
                            function_call: None,
                            function_response: None,
                        });
                    }
                    if !parts.is_empty() {
                        contents.push(Content {
                            role: Some("model".to_string()),
                            parts,
                        });
                    }
                }
                Role::Tool => {
                    let text = msg.content.extract_text();
                    let tool_call_id = msg.tool_call_id.clone().unwrap_or_default();
                    let response_value = serde_json::from_str(&text)
                        .unwrap_or_else(|_| serde_json::json!({"result": text}));
                    contents.push(Content {
                        role: Some("user".to_string()),
                        parts: vec![Part {
                            text: None,
                            inline_data: None,
                            function_call: None,
                            function_response: Some(FunctionResponse {
                                name: tool_call_id,
                                response: response_value,
                            }),
                        }],
                    });
                }
            }
        }
        // Convert generation config
        let generation_config = {
            let gc = GenerationConfig {
                temperature: req.temperature,
                top_p: req.top_p,
                top_k: None,
                max_output_tokens: req.max_completion_tokens.or(req.max_tokens),
                stop_sequences: req.stop,
                response_mime_type: None,
                candidate_count: None,
                presence_penalty: req.presence_penalty,
                frequency_penalty: req.frequency_penalty,
            };
            // Only include if any field is set
            if gc.temperature.is_some()
                || gc.top_p.is_some()
                || gc.max_output_tokens.is_some()
                || gc.stop_sequences.is_some()
                || gc.presence_penalty.is_some()
                || gc.frequency_penalty.is_some()
            {
                Some(gc)
            } else {
                None
            }
        };
        // Convert tools
        let tools = req.tools.map(|openai_tools| {
            let declarations: Vec<FunctionDeclaration> = openai_tools
                .iter()
                .map(|t| FunctionDeclaration {
                    name: t.function.name.clone(),
                    description: t.function.description.clone(),
                    parameters: Some(t.function.parameters.clone()),
                })
                .collect();
            vec![Tool {
                function_declarations: Some(declarations),
                code_execution: None,
            }]
        });
        // Convert tool_choice
        let tool_config = req.tool_choice.and_then(|tc| {
            let mode = match tc {
                ToolChoice::Type(t) => match t {
                    ToolChoiceType::Auto => Some("AUTO".to_string()),
                    ToolChoiceType::None => Some("NONE".to_string()),
                    ToolChoiceType::Required => Some("ANY".to_string()),
                },
                ToolChoice::Function { .. } => Some("AUTO".to_string()),
            };
            mode.map(|m| ToolConfig {
                function_calling_config: FunctionCallingConfig { mode: m },
            })
        });
        Ok(GenerateContentRequest {
            model: req.model,
            contents,
            generation_config,
            tools,
            tool_config,
            safety_settings: None,
            system_instruction,
            cached_content: None,
            metadata: req.metadata,
        })
    }
 }
 // ============================================================================
 // Anthropic Messages -> Gemini GenerateContent (via OpenAI)
 // ============================================================================
 impl TryFrom<MessagesRequest> for GenerateContentRequest {
    type Error = TransformError;
    fn try_from(req: MessagesRequest) -> Result<Self, Self::Error> {
        // Chain: Anthropic -> OpenAI -> Gemini
        let chat_req = ChatCompletionsRequest::try_from(req)?;
        GenerateContentRequest::try_from(chat_req)
    }
 }
 // ============================================================================
 // TESTS
 // ============================================================================
 #[cfg(test)]
 mod tests {
    use super::*;
    use serde_json::json;
    #[test]
    fn test_openai_to_gemini_basic() {
        let req: ChatCompletionsRequest = serde_json::from_value(json!({
            "model": "gemini-pro",
            "messages": [
                {"role": "system", "content": "You are helpful"},
                {"role": "user", "content": "Hello"},
                {"role": "assistant", "content": "Hi there!"},
                {"role": "user", "content": "How are you?"}
            ],
            "temperature": 0.7,
            "max_tokens": 1024
        }))
        .unwrap();
        let gemini_req = GenerateContentRequest::try_from(req).unwrap();
        // System should be in system_instruction
        assert!(gemini_req.system_instruction.is_some());
        let sys = gemini_req.system_instruction.as_ref().unwrap();
        assert_eq!(sys.parts[0].text.as_deref(), Some("You are helpful"));
        // 3 content messages (user, model, user)
        assert_eq!(gemini_req.contents.len(), 3);
        assert_eq!(gemini_req.contents[0].role.as_deref(), Some("user"));
        assert_eq!(gemini_req.contents[1].role.as_deref(), Some("model"));
        assert_eq!(gemini_req.contents[2].role.as_deref(), Some("user"));
        // Generation config
        assert_eq!(
            gemini_req.generation_config.as_ref().unwrap().temperature,
            Some(0.7)
        );
        assert_eq!(
            gemini_req
                .generation_config
                .as_ref()
                .unwrap()
                .max_output_tokens,
            Some(1024)
        );
    }
    #[test]
    fn test_openai_to_gemini_with_tools() {
        let req: ChatCompletionsRequest = serde_json::from_value(json!({
            "model": "gemini-pro",
            "messages": [
                {"role": "user", "content": "What's the weather?"}
            ],
            "tools": [{
                "type": "function",
                "function": {
                    "name": "get_weather",
                    "description": "Get weather",
                    "parameters": {"type": "object", "properties": {"location": {"type": "string"}}}
                }
            }],
            "tool_choice": "auto"
        }))
        .unwrap();
        let gemini_req = GenerateContentRequest::try_from(req).unwrap();
        assert!(gemini_req.tools.is_some());
        let tools = gemini_req.tools.as_ref().unwrap();
        assert_eq!(tools.len(), 1);
        let decls = tools[0].function_declarations.as_ref().unwrap();
        assert_eq!(decls[0].name, "get_weather");
        assert!(gemini_req.tool_config.is_some());
        assert_eq!(
            gemini_req
                .tool_config
                .as_ref()
                .unwrap()
                .function_calling_config
                .mode,
            "AUTO"
        );
    }
    #[test]
    fn test_openai_to_gemini_with_tool_calls() {
        let req: ChatCompletionsRequest = serde_json::from_value(json!({
            "model": "gemini-pro",
            "messages": [
                {"role": "user", "content": "What's the weather?"},
                {
                    "role": "assistant",
                    "tool_calls": [{
                        "id": "call_123",
                        "type": "function",
                        "function": {
                            "name": "get_weather",
                            "arguments": "{\"location\": \"NYC\"}"
                        }
                    }]
                },
                {
                    "role": "tool",
                    "tool_call_id": "call_123",
                    "content": "Sunny, 72F"
                }
            ]
        }))
        .unwrap();
        let gemini_req = GenerateContentRequest::try_from(req).unwrap();
        assert_eq!(gemini_req.contents.len(), 3);
        // Assistant with function_call
        let model_content = &gemini_req.contents[1];
        assert_eq!(model_content.role.as_deref(), Some("model"));
        assert!(model_content.parts[0].function_call.is_some());
        // Tool response
        let tool_content = &gemini_req.contents[2];
        assert_eq!(tool_content.role.as_deref(), Some("user"));
        assert!(tool_content.parts[0].function_response.is_some());
    }
 }
--- a/crates/hermesllm/src/transforms/response/from_gemini.rs
+++ b/crates/hermesllm/src/transforms/response/from_gemini.rs
@ -0,0 +1,417 @@
 use crate::apis::anthropic::MessagesResponse;
 use crate::apis::gemini::GenerateContentResponse;
 use crate::apis::openai::{
    ChatCompletionsResponse, ChatCompletionsStreamResponse, Choice, FinishReason,
    FunctionCall as OpenAIFunctionCall, MessageDelta, ResponseMessage, Role, StreamChoice,
    ToolCall as OpenAIToolCall, Usage,
 };
 use crate::clients::TransformError;
 // ============================================================================
 // Gemini GenerateContentResponse -> OpenAI ChatCompletionsResponse
 // ============================================================================
 fn map_finish_reason(gemini_reason: Option<&str>) -> Option<FinishReason> {
    gemini_reason.map(|r| match r {
        "STOP" => FinishReason::Stop,
        "MAX_TOKENS" => FinishReason::Length,
        "SAFETY" | "RECITATION" => FinishReason::ContentFilter,
        _ => FinishReason::Stop,
    })
 }
 impl TryFrom<GenerateContentResponse> for ChatCompletionsResponse {
    type Error = TransformError;
    fn try_from(resp: GenerateContentResponse) -> Result<Self, Self::Error> {
        let candidates = resp.candidates.unwrap_or_default();
        let candidate = candidates.first();
        let mut content_text = String::new();
        let mut tool_calls: Vec<OpenAIToolCall> = Vec::new();
        if let Some(candidate) = candidate {
            if let Some(ref content) = candidate.content {
                for (i, part) in content.parts.iter().enumerate() {
                    if let Some(ref text) = part.text {
                        content_text.push_str(text);
                    }
                    if let Some(ref fc) = part.function_call {
                        tool_calls.push(OpenAIToolCall {
                            id: format!("call_{}", i),
                            call_type: "function".to_string(),
                            function: OpenAIFunctionCall {
                                name: fc.name.clone(),
                                arguments: serde_json::to_string(&fc.args).unwrap_or_default(),
                            },
                        });
                    }
                }
            }
        }
        let finish_reason = candidate
            .and_then(|c| map_finish_reason(c.finish_reason.as_deref()))
            .unwrap_or(FinishReason::Stop);
        let message_content = if content_text.is_empty() {
            None
        } else {
            Some(content_text)
        };
        let tool_calls_opt = if tool_calls.is_empty() {
            None
        } else {
            Some(tool_calls)
        };
        let choice = Choice {
            index: 0,
            message: ResponseMessage {
                role: Role::Assistant,
                content: message_content,
                tool_calls: tool_calls_opt,
                refusal: None,
                annotations: None,
                audio: None,
                function_call: None,
            },
            finish_reason: Some(finish_reason),
            logprobs: None,
        };
        let usage = resp
            .usage_metadata
            .map(|um| Usage {
                prompt_tokens: um.prompt_token_count.unwrap_or(0),
                completion_tokens: um.candidates_token_count.unwrap_or(0),
                total_tokens: um.total_token_count.unwrap_or(0),
                prompt_tokens_details: None,
                completion_tokens_details: None,
            })
            .unwrap_or_default();
        Ok(ChatCompletionsResponse {
            id: format!(
                "chatcmpl-gemini-{}",
                std::time::SystemTime::now()
                    .duration_since(std::time::UNIX_EPOCH)
                    .unwrap_or_default()
                    .as_millis()
            ),
            object: Some("chat.completion".to_string()),
            created: std::time::SystemTime::now()
                .duration_since(std::time::UNIX_EPOCH)
                .unwrap_or_default()
                .as_secs(),
            model: resp.model_version.unwrap_or_else(|| "gemini".to_string()),
            choices: vec![choice],
            usage,
            system_fingerprint: None,
            service_tier: None,
            metadata: None,
        })
    }
 }
 // ============================================================================
 // Gemini GenerateContentResponse -> Anthropic MessagesResponse (via OpenAI)
 // ============================================================================
 impl TryFrom<GenerateContentResponse> for MessagesResponse {
    type Error = TransformError;
    fn try_from(resp: GenerateContentResponse) -> Result<Self, Self::Error> {
        // Chain: Gemini -> OpenAI -> Anthropic
        let chat_resp = ChatCompletionsResponse::try_from(resp)?;
        MessagesResponse::try_from(chat_resp)
    }
 }
 // ============================================================================
 // Gemini GenerateContentResponse -> OpenAI ChatCompletionsStreamResponse
 // ============================================================================
 impl TryFrom<GenerateContentResponse> for ChatCompletionsStreamResponse {
    type Error = TransformError;
    fn try_from(resp: GenerateContentResponse) -> Result<Self, Self::Error> {
        let candidates = resp.candidates.unwrap_or_default();
        let candidate = candidates.first();
        let mut delta_content: Option<String> = None;
        if let Some(candidate) = candidate {
            if let Some(ref content) = candidate.content {
                let mut text_parts = Vec::new();
                for part in content.parts.iter() {
                    if let Some(ref text) = part.text {
                        text_parts.push(text.clone());
                    }
                }
                if !text_parts.is_empty() {
                    delta_content = Some(text_parts.join(""));
                }
            }
        }
        let finish_reason = candidate.and_then(|c| map_finish_reason(c.finish_reason.as_deref()));
        let role = candidate
            .and_then(|c| c.content.as_ref())
            .and_then(|c| c.role.as_deref())
            .map(|r| match r {
                "model" => Role::Assistant,
                _ => Role::User,
            });
        Ok(ChatCompletionsStreamResponse {
            id: format!(
                "chatcmpl-gemini-{}",
                std::time::SystemTime::now()
                    .duration_since(std::time::UNIX_EPOCH)
                    .unwrap_or_default()
                    .as_millis()
            ),
            object: Some("chat.completion.chunk".to_string()),
            created: std::time::SystemTime::now()
                .duration_since(std::time::UNIX_EPOCH)
                .unwrap_or_default()
                .as_secs(),
            model: resp.model_version.unwrap_or_else(|| "gemini".to_string()),
            choices: vec![StreamChoice {
                index: 0,
                delta: MessageDelta {
                    role,
                    content: delta_content,
                    tool_calls: None,
                    refusal: None,
                    function_call: None,
                },
                finish_reason,
                logprobs: None,
            }],
            usage: None,
            system_fingerprint: None,
            service_tier: None,
        })
    }
 }
 // ============================================================================
 // REVERSE: OpenAI ChatCompletionsResponse -> Gemini GenerateContentResponse
 // ============================================================================
 impl TryFrom<ChatCompletionsResponse> for GenerateContentResponse {
    type Error = TransformError;
    fn try_from(resp: ChatCompletionsResponse) -> Result<Self, Self::Error> {
        use crate::apis::gemini::{Candidate, Content, FunctionCall, Part, UsageMetadata};
        let candidates = if let Some(choice) = resp.choices.first() {
            let mut parts = Vec::new();
            // Text content
            if let Some(ref content) = choice.message.content {
                if !content.is_empty() {
                    parts.push(Part {
                        text: Some(content.clone()),
                        inline_data: None,
                        function_call: None,
                        function_response: None,
                    });
                }
            }
            // Tool calls
            if let Some(ref tool_calls) = choice.message.tool_calls {
                for tc in tool_calls {
                    let args: serde_json::Value =
                        serde_json::from_str(&tc.function.arguments).unwrap_or_default();
                    parts.push(Part {
                        text: None,
                        inline_data: None,
                        function_call: Some(FunctionCall {
                            name: tc.function.name.clone(),
                            args,
                        }),
                        function_response: None,
                    });
                }
            }
            if parts.is_empty() {
                parts.push(Part {
                    text: Some(String::new()),
                    inline_data: None,
                    function_call: None,
                    function_response: None,
                });
            }
            let finish_reason = choice.finish_reason.as_ref().map(|fr| match fr {
                FinishReason::Stop => "STOP".to_string(),
                FinishReason::Length => "MAX_TOKENS".to_string(),
                FinishReason::ContentFilter => "SAFETY".to_string(),
                FinishReason::ToolCalls => "STOP".to_string(),
                FinishReason::FunctionCall => "STOP".to_string(),
            });
            vec![Candidate {
                content: Some(Content {
                    role: Some("model".to_string()),
                    parts,
                }),
                finish_reason,
                safety_ratings: None,
            }]
        } else {
            vec![]
        };
        let usage_metadata = Some(UsageMetadata {
            prompt_token_count: Some(resp.usage.prompt_tokens),
            candidates_token_count: Some(resp.usage.completion_tokens),
            total_token_count: Some(resp.usage.total_tokens),
        });
        Ok(GenerateContentResponse {
            candidates: Some(candidates),
            usage_metadata,
            prompt_feedback: None,
            model_version: Some(resp.model),
        })
    }
 }
 // ============================================================================
 // TESTS
 // ============================================================================
 #[cfg(test)]
 mod tests {
    use super::*;
    use serde_json::json;
    #[test]
    fn test_gemini_to_openai_response() {
        let resp: GenerateContentResponse = serde_json::from_value(json!({
            "candidates": [{
                "content": {
                    "role": "model",
                    "parts": [{"text": "Hello! How can I help?"}]
                },
                "finishReason": "STOP"
            }],
            "usageMetadata": {
                "promptTokenCount": 5,
                "candidatesTokenCount": 7,
                "totalTokenCount": 12
            },
            "modelVersion": "gemini-2.0-flash"
        }))
        .unwrap();
        let openai_resp = ChatCompletionsResponse::try_from(resp).unwrap();
        assert_eq!(openai_resp.choices.len(), 1);
        let msg = &openai_resp.choices[0].message;
        assert_eq!(msg.content.as_deref(), Some("Hello! How can I help?"));
        assert_eq!(
            openai_resp.choices[0].finish_reason,
            Some(FinishReason::Stop)
        );
        assert_eq!(openai_resp.usage.prompt_tokens, 5);
        assert_eq!(openai_resp.usage.completion_tokens, 7);
    }
    #[test]
    fn test_gemini_to_openai_stream_response() {
        let resp: GenerateContentResponse = serde_json::from_value(json!({
            "candidates": [{
                "content": {
                    "role": "model",
                    "parts": [{"text": "Hello"}]
                }
            }]
        }))
        .unwrap();
        let stream_resp = ChatCompletionsStreamResponse::try_from(resp).unwrap();
        assert_eq!(stream_resp.choices.len(), 1);
        assert_eq!(
            stream_resp.choices[0].delta.content,
            Some("Hello".to_string())
        );
        assert_eq!(stream_resp.choices[0].delta.role, Some(Role::Assistant));
    }
    #[test]
    fn test_gemini_to_openai_with_function_call() {
        let resp: GenerateContentResponse = serde_json::from_value(json!({
            "candidates": [{
                "content": {
                    "role": "model",
                    "parts": [{
                        "functionCall": {
                            "name": "get_weather",
                            "args": {"location": "NYC"}
                        }
                    }]
                },
                "finishReason": "STOP"
            }]
        }))
        .unwrap();
        let openai_resp = ChatCompletionsResponse::try_from(resp).unwrap();
        let msg = &openai_resp.choices[0].message;
        assert!(msg.tool_calls.is_some());
        let tc = msg.tool_calls.as_ref().unwrap();
        assert_eq!(tc[0].function.name, "get_weather");
    }
    #[test]
    fn test_openai_to_gemini_response() {
        let resp: ChatCompletionsResponse = serde_json::from_value(json!({
            "id": "chatcmpl-123",
            "object": "chat.completion",
            "created": 1234567890,
            "model": "gpt-4",
            "choices": [{
                "index": 0,
                "message": {"role": "assistant", "content": "Hello!"},
                "finish_reason": "stop"
            }],
            "usage": {"prompt_tokens": 5, "completion_tokens": 7, "total_tokens": 12}
        }))
        .unwrap();
        let gemini_resp = GenerateContentResponse::try_from(resp).unwrap();
        let candidates = gemini_resp.candidates.as_ref().unwrap();
        assert_eq!(candidates.len(), 1);
        let parts = &candidates[0].content.as_ref().unwrap().parts;
        assert_eq!(parts[0].text.as_deref(), Some("Hello!"));
        assert_eq!(candidates[0].finish_reason.as_deref(), Some("STOP"));
    }
    #[test]
    fn test_finish_reason_mapping() {
        assert_eq!(map_finish_reason(Some("STOP")), Some(FinishReason::Stop));
        assert_eq!(
            map_finish_reason(Some("MAX_TOKENS")),
            Some(FinishReason::Length)
        );
        assert_eq!(
            map_finish_reason(Some("SAFETY")),
            Some(FinishReason::ContentFilter)
        );
        assert_eq!(
            map_finish_reason(Some("RECITATION")),
            Some(FinishReason::ContentFilter)
        );
        assert_eq!(map_finish_reason(None), None);
    }
 }
--- a/crates/hermesllm/src/transforms/response/mod.rs
+++ b/crates/hermesllm/src/transforms/response/mod.rs
@ -1,4 +1,5 @@
 //! Response transformation modules
 pub mod from_gemini;
 pub mod output_to_input;
 pub mod to_anthropic;
 pub mod to_openai;
--- a/crates/llm_gateway/src/stream_context.rs
+++ b/crates/llm_gateway/src/stream_context.rs
@ -217,7 +217,9 @@ impl StreamContext {
                SupportedUpstreamAPIs::OpenAIChatCompletions(_)
                | SupportedUpstreamAPIs::AmazonBedrockConverse(_)
                | SupportedUpstreamAPIs::AmazonBedrockConverseStream(_)
-                | SupportedUpstreamAPIs::OpenAIResponsesAPI(_),
+                | SupportedUpstreamAPIs::OpenAIResponsesAPI(_)
                | SupportedUpstreamAPIs::GeminiGenerateContent(_)
                | SupportedUpstreamAPIs::GeminiStreamGenerateContent(_),
            )
            | None => {
                // OpenAI and default: use Authorization Bearer token