trustgraph/tests/integration/test_dynamic_llm_parameters.py

"""
Integration tests for Dynamic LLM Parameters
Testing end-to-end flow of runtime parameter changes in LLM processors
"""

import pytest
from unittest.mock import AsyncMock, MagicMock, patch
from openai.types.chat import ChatCompletion, ChatCompletionMessage
from openai.types.chat.chat_completion import Choice
from openai.types.completion_usage import CompletionUsage

from trustgraph.model.text_completion.openai.llm import Processor as OpenAIProcessor
from trustgraph.base import LlmResult


@pytest.mark.integration
class TestDynamicLlmParameters:
    """Integration tests for dynamic parameter configuration"""

    @pytest.fixture
    def mock_openai_client(self):
        """Mock OpenAI client that returns realistic responses"""
        client = MagicMock()

        # Default mock response
        usage = CompletionUsage(prompt_tokens=25, completion_tokens=15, total_tokens=40)
        message = ChatCompletionMessage(role="assistant", content="Dynamic parameter test response")
        choice = Choice(index=0, message=message, finish_reason="stop")

        completion = ChatCompletion(
            id="chatcmpl-test-dynamic",
            choices=[choice],
            created=1234567890,
            model="gpt-4",  # Will be overridden based on test
            object="chat.completion",
            usage=usage
        )

        client.chat.completions.create.return_value = completion
        return client

    @pytest.fixture
    def base_processor_config(self):
        """Base configuration for test processors"""
        return {
            "api_key": "test-api-key",
            "url": "https://api.openai.com/v1",
            "temperature": 0.0,  # Default temperature
            "max_output": 1024,
        }

    @patch('trustgraph.model.text_completion.openai.llm.OpenAI')
    @patch('trustgraph.base.async_processor.AsyncProcessor.__init__')
    @patch('trustgraph.base.llm_service.LlmService.__init__')
    async def test_runtime_temperature_override(self, mock_llm_init, mock_async_init,
                                               mock_openai_class, mock_openai_client, base_processor_config):
        """Test that temperature can be overridden at runtime"""
        # Arrange
        mock_openai_class.return_value = mock_openai_client
        mock_async_init.return_value = None
        mock_llm_init.return_value = None

        config = base_processor_config | {
            "model": "gpt-3.5-turbo",
            "concurrency": 1,
            "taskgroup": AsyncMock(),
            "id": "test-processor"
        }

        processor = OpenAIProcessor(**config)

        # Act - Call with different temperature than configured default (0.0)
        result = await processor.generate_content(
            "System prompt",
            "User prompt",
            model=None,  # Use default model
            temperature=0.9  # Override temperature
        )

        # Assert
        assert isinstance(result, LlmResult)
        assert result.text == "Dynamic parameter test response"

        # Verify the OpenAI API was called with the overridden temperature
        mock_openai_client.chat.completions.create.assert_called_once()
        call_args = mock_openai_client.chat.completions.create.call_args

        assert call_args.kwargs['temperature'] == 0.9  # Should use runtime parameter
        assert call_args.kwargs['model'] == "gpt-3.5-turbo"  # Should use processor default

    @patch('trustgraph.model.text_completion.openai.llm.OpenAI')
    @patch('trustgraph.base.async_processor.AsyncProcessor.__init__')
    @patch('trustgraph.base.llm_service.LlmService.__init__')
    async def test_runtime_model_override(self, mock_llm_init, mock_async_init,
                                         mock_openai_class, mock_openai_client, base_processor_config):
        """Test that model can be overridden at runtime"""
        # Arrange
        mock_openai_class.return_value = mock_openai_client
        mock_async_init.return_value = None
        mock_llm_init.return_value = None

        config = base_processor_config | {
            "model": "gpt-3.5-turbo",  # Default model
            "concurrency": 1,
            "taskgroup": AsyncMock(),
            "id": "test-processor"
        }

        processor = OpenAIProcessor(**config)

        # Act - Call with different model than configured default
        result = await processor.generate_content(
            "System prompt",
            "User prompt",
            model="gpt-4",        # Override model
            temperature=None      # Use default temperature
        )

        # Assert
        assert isinstance(result, LlmResult)

        # Verify the OpenAI API was called with the overridden model
        mock_openai_client.chat.completions.create.assert_called_once()
        call_args = mock_openai_client.chat.completions.create.call_args

        assert call_args.kwargs['model'] == "gpt-4"        # Should use runtime parameter
        assert call_args.kwargs['temperature'] == 0.0      # Should use processor default

    @patch('trustgraph.model.text_completion.openai.llm.OpenAI')
    @patch('trustgraph.base.async_processor.AsyncProcessor.__init__')
    @patch('trustgraph.base.llm_service.LlmService.__init__')
    async def test_both_parameters_override(self, mock_llm_init, mock_async_init,
                                           mock_openai_class, mock_openai_client, base_processor_config):
        """Test that both model and temperature can be overridden simultaneously"""
        # Arrange
        mock_openai_class.return_value = mock_openai_client
        mock_async_init.return_value = None
        mock_llm_init.return_value = None

        config = base_processor_config | {
            "model": "gpt-3.5-turbo",  # Default model
            "concurrency": 1,
            "taskgroup": AsyncMock(),
            "id": "test-processor"
        }

        processor = OpenAIProcessor(**config)

        # Act - Override both parameters
        result = await processor.generate_content(
            "System prompt",
            "User prompt",
            model="gpt-4",        # Override model
            temperature=0.5       # Override temperature
        )

        # Assert
        assert isinstance(result, LlmResult)

        # Verify both parameters were overridden
        mock_openai_client.chat.completions.create.assert_called_once()
        call_args = mock_openai_client.chat.completions.create.call_args

        assert call_args.kwargs['model'] == "gpt-4"        # Should use runtime parameter
        assert call_args.kwargs['temperature'] == 0.5      # Should use runtime parameter

    @patch('trustgraph.model.text_completion.openai.llm.OpenAI')
    @patch('trustgraph.base.async_processor.AsyncProcessor.__init__')
    @patch('trustgraph.base.llm_service.LlmService.__init__')
    async def test_fallback_to_defaults_when_no_override(self, mock_llm_init, mock_async_init,
                                                        mock_openai_class, mock_openai_client, base_processor_config):
        """Test that processor falls back to configured defaults when no parameters are provided"""
        # Arrange
        mock_openai_class.return_value = mock_openai_client
        mock_async_init.return_value = None
        mock_llm_init.return_value = None

        config = base_processor_config | {
            "model": "gpt-3.5-turbo",  # Default model
            "temperature": 0.2,        # Default temperature
            "concurrency": 1,
            "taskgroup": AsyncMock(),
            "id": "test-processor"
        }

        processor = OpenAIProcessor(**config)

        # Act - Call with no parameter overrides
        result = await processor.generate_content(
            "System prompt",
            "User prompt",
            model=None,       # Use default
            temperature=None  # Use default
        )

        # Assert
        assert isinstance(result, LlmResult)

        # Verify defaults were used
        mock_openai_client.chat.completions.create.assert_called_once()
        call_args = mock_openai_client.chat.completions.create.call_args

        assert call_args.kwargs['model'] == "gpt-3.5-turbo"  # Should use processor default
        assert call_args.kwargs['temperature'] == 0.2        # Should use processor default

    @patch('trustgraph.model.text_completion.openai.llm.OpenAI')
    @patch('trustgraph.base.async_processor.AsyncProcessor.__init__')
    @patch('trustgraph.base.llm_service.LlmService.__init__')
    async def test_multiple_concurrent_calls_different_parameters(self, mock_llm_init, mock_async_init,
                                                                 mock_openai_class, mock_openai_client, base_processor_config):
        """Test multiple concurrent calls with different parameters don't interfere"""
        # Arrange
        mock_openai_class.return_value = mock_openai_client
        mock_async_init.return_value = None
        mock_llm_init.return_value = None

        config = base_processor_config | {
            "model": "gpt-3.5-turbo",
            "concurrency": 1,
            "taskgroup": AsyncMock(),
            "id": "test-processor"
        }

        processor = OpenAIProcessor(**config)

        # Reset the mock to track multiple calls
        mock_openai_client.reset_mock()

        # Act - Make multiple calls with different parameters concurrently
        import asyncio
        tasks = [
            processor.generate_content("System 1", "Prompt 1", model="gpt-3.5-turbo", temperature=0.1),
            processor.generate_content("System 2", "Prompt 2", model="gpt-4", temperature=0.8),
            processor.generate_content("System 3", "Prompt 3", model="gpt-3.5-turbo", temperature=0.5)
        ]

        results = await asyncio.gather(*tasks)

        # Assert
        assert len(results) == 3
        for result in results:
            assert isinstance(result, LlmResult)

        # Verify all calls were made with correct parameters
        assert mock_openai_client.chat.completions.create.call_count == 3

        # Get all call arguments
        call_args_list = mock_openai_client.chat.completions.create.call_args_list

        # Verify each call had the expected parameters
        expected_params = [
            ("gpt-3.5-turbo", 0.1),
            ("gpt-4", 0.8),
            ("gpt-3.5-turbo", 0.5)
        ]

        for i, (expected_model, expected_temp) in enumerate(expected_params):
            call_kwargs = call_args_list[i].kwargs
            assert call_kwargs['model'] == expected_model
            assert call_kwargs['temperature'] == expected_temp

    async def test_parameter_boundary_values(self, mock_openai_client, base_processor_config):
        """Test parameter boundary values (edge cases)"""
        # This would test extreme values like temperature=0.0, temperature=2.0, etc.
        # Implementation depends on specific validation requirements
        pass

    async def test_invalid_parameter_types_handling(self, mock_openai_client, base_processor_config):
        """Test handling of invalid parameter types"""
        # This would test what happens with invalid temperature values, non-existent models, etc.
        # Implementation depends on error handling requirements
        pass


if __name__ == '__main__':
    pytest.main([__file__])
release/v1.4 -> master (#548) 2025-10-06 17:54:26 +01:00			`"""`
			`Integration tests for Dynamic LLM Parameters`
			`Testing end-to-end flow of runtime parameter changes in LLM processors`
			`"""`

			`import pytest`
			`from unittest.mock import AsyncMock, MagicMock, patch`
			`from openai.types.chat import ChatCompletion, ChatCompletionMessage`
			`from openai.types.chat.chat_completion import Choice`
			`from openai.types.completion_usage import CompletionUsage`

			`from trustgraph.model.text_completion.openai.llm import Processor as OpenAIProcessor`
			`from trustgraph.base import LlmResult`


			`@pytest.mark.integration`
			`class TestDynamicLlmParameters:`
			`"""Integration tests for dynamic parameter configuration"""`

			`@pytest.fixture`
			`def mock_openai_client(self):`
			`"""Mock OpenAI client that returns realistic responses"""`
			`client = MagicMock()`

			`# Default mock response`
			`usage = CompletionUsage(prompt_tokens=25, completion_tokens=15, total_tokens=40)`
			`message = ChatCompletionMessage(role="assistant", content="Dynamic parameter test response")`
			`choice = Choice(index=0, message=message, finish_reason="stop")`

			`completion = ChatCompletion(`
			`id="chatcmpl-test-dynamic",`
			`choices=[choice],`
			`created=1234567890,`
			`model="gpt-4", # Will be overridden based on test`
			`object="chat.completion",`
			`usage=usage`
			`)`

			`client.chat.completions.create.return_value = completion`
			`return client`

			`@pytest.fixture`
			`def base_processor_config(self):`
			`"""Base configuration for test processors"""`
			`return {`
			`"api_key": "test-api-key",`
			`"url": "https://api.openai.com/v1",`
			`"temperature": 0.0, # Default temperature`
			`"max_output": 1024,`
			`}`

			`@patch('trustgraph.model.text_completion.openai.llm.OpenAI')`
			`@patch('trustgraph.base.async_processor.AsyncProcessor.__init__')`
			`@patch('trustgraph.base.llm_service.LlmService.__init__')`
			`async def test_runtime_temperature_override(self, mock_llm_init, mock_async_init,`
			`mock_openai_class, mock_openai_client, base_processor_config):`
			`"""Test that temperature can be overridden at runtime"""`
			`# Arrange`
			`mock_openai_class.return_value = mock_openai_client`
			`mock_async_init.return_value = None`
			`mock_llm_init.return_value = None`

			`config = base_processor_config \| {`
			`"model": "gpt-3.5-turbo",`
			`"concurrency": 1,`
			`"taskgroup": AsyncMock(),`
			`"id": "test-processor"`
			`}`

			`processor = OpenAIProcessor(**config)`

			`# Act - Call with different temperature than configured default (0.0)`
			`result = await processor.generate_content(`
			`"System prompt",`
			`"User prompt",`
			`model=None, # Use default model`
			`temperature=0.9 # Override temperature`
			`)`

			`# Assert`
			`assert isinstance(result, LlmResult)`
			`assert result.text == "Dynamic parameter test response"`

			`# Verify the OpenAI API was called with the overridden temperature`
			`mock_openai_client.chat.completions.create.assert_called_once()`
			`call_args = mock_openai_client.chat.completions.create.call_args`

			`assert call_args.kwargs['temperature'] == 0.9 # Should use runtime parameter`
			`assert call_args.kwargs['model'] == "gpt-3.5-turbo" # Should use processor default`

			`@patch('trustgraph.model.text_completion.openai.llm.OpenAI')`
			`@patch('trustgraph.base.async_processor.AsyncProcessor.__init__')`
			`@patch('trustgraph.base.llm_service.LlmService.__init__')`
			`async def test_runtime_model_override(self, mock_llm_init, mock_async_init,`
			`mock_openai_class, mock_openai_client, base_processor_config):`
			`"""Test that model can be overridden at runtime"""`
			`# Arrange`
			`mock_openai_class.return_value = mock_openai_client`
			`mock_async_init.return_value = None`
			`mock_llm_init.return_value = None`

			`config = base_processor_config \| {`
			`"model": "gpt-3.5-turbo", # Default model`
			`"concurrency": 1,`
			`"taskgroup": AsyncMock(),`
			`"id": "test-processor"`
			`}`

			`processor = OpenAIProcessor(**config)`

			`# Act - Call with different model than configured default`
			`result = await processor.generate_content(`
			`"System prompt",`
			`"User prompt",`
			`model="gpt-4", # Override model`
			`temperature=None # Use default temperature`
			`)`

			`# Assert`
			`assert isinstance(result, LlmResult)`

			`# Verify the OpenAI API was called with the overridden model`
			`mock_openai_client.chat.completions.create.assert_called_once()`
			`call_args = mock_openai_client.chat.completions.create.call_args`

			`assert call_args.kwargs['model'] == "gpt-4" # Should use runtime parameter`
			`assert call_args.kwargs['temperature'] == 0.0 # Should use processor default`

			`@patch('trustgraph.model.text_completion.openai.llm.OpenAI')`
			`@patch('trustgraph.base.async_processor.AsyncProcessor.__init__')`
			`@patch('trustgraph.base.llm_service.LlmService.__init__')`
			`async def test_both_parameters_override(self, mock_llm_init, mock_async_init,`
			`mock_openai_class, mock_openai_client, base_processor_config):`
			`"""Test that both model and temperature can be overridden simultaneously"""`
			`# Arrange`
			`mock_openai_class.return_value = mock_openai_client`
			`mock_async_init.return_value = None`
			`mock_llm_init.return_value = None`

			`config = base_processor_config \| {`
			`"model": "gpt-3.5-turbo", # Default model`
			`"concurrency": 1,`
			`"taskgroup": AsyncMock(),`
			`"id": "test-processor"`
			`}`

			`processor = OpenAIProcessor(**config)`

			`# Act - Override both parameters`
			`result = await processor.generate_content(`
			`"System prompt",`
			`"User prompt",`
			`model="gpt-4", # Override model`
			`temperature=0.5 # Override temperature`
			`)`

			`# Assert`
			`assert isinstance(result, LlmResult)`

			`# Verify both parameters were overridden`
			`mock_openai_client.chat.completions.create.assert_called_once()`
			`call_args = mock_openai_client.chat.completions.create.call_args`

			`assert call_args.kwargs['model'] == "gpt-4" # Should use runtime parameter`
			`assert call_args.kwargs['temperature'] == 0.5 # Should use runtime parameter`

			`@patch('trustgraph.model.text_completion.openai.llm.OpenAI')`
			`@patch('trustgraph.base.async_processor.AsyncProcessor.__init__')`
			`@patch('trustgraph.base.llm_service.LlmService.__init__')`
			`async def test_fallback_to_defaults_when_no_override(self, mock_llm_init, mock_async_init,`
			`mock_openai_class, mock_openai_client, base_processor_config):`
			`"""Test that processor falls back to configured defaults when no parameters are provided"""`
			`# Arrange`
			`mock_openai_class.return_value = mock_openai_client`
			`mock_async_init.return_value = None`
			`mock_llm_init.return_value = None`

			`config = base_processor_config \| {`
			`"model": "gpt-3.5-turbo", # Default model`
			`"temperature": 0.2, # Default temperature`
			`"concurrency": 1,`
			`"taskgroup": AsyncMock(),`
			`"id": "test-processor"`
			`}`

			`processor = OpenAIProcessor(**config)`

			`# Act - Call with no parameter overrides`
			`result = await processor.generate_content(`
			`"System prompt",`
			`"User prompt",`
			`model=None, # Use default`
			`temperature=None # Use default`
			`)`

			`# Assert`
			`assert isinstance(result, LlmResult)`

			`# Verify defaults were used`
			`mock_openai_client.chat.completions.create.assert_called_once()`
			`call_args = mock_openai_client.chat.completions.create.call_args`

			`assert call_args.kwargs['model'] == "gpt-3.5-turbo" # Should use processor default`
			`assert call_args.kwargs['temperature'] == 0.2 # Should use processor default`

			`@patch('trustgraph.model.text_completion.openai.llm.OpenAI')`
			`@patch('trustgraph.base.async_processor.AsyncProcessor.__init__')`
			`@patch('trustgraph.base.llm_service.LlmService.__init__')`
			`async def test_multiple_concurrent_calls_different_parameters(self, mock_llm_init, mock_async_init,`
			`mock_openai_class, mock_openai_client, base_processor_config):`
			`"""Test multiple concurrent calls with different parameters don't interfere"""`
			`# Arrange`
			`mock_openai_class.return_value = mock_openai_client`
			`mock_async_init.return_value = None`
			`mock_llm_init.return_value = None`

			`config = base_processor_config \| {`
			`"model": "gpt-3.5-turbo",`
			`"concurrency": 1,`
			`"taskgroup": AsyncMock(),`
			`"id": "test-processor"`
			`}`

			`processor = OpenAIProcessor(**config)`

			`# Reset the mock to track multiple calls`
			`mock_openai_client.reset_mock()`

			`# Act - Make multiple calls with different parameters concurrently`
			`import asyncio`
			`tasks = [`
			`processor.generate_content("System 1", "Prompt 1", model="gpt-3.5-turbo", temperature=0.1),`
			`processor.generate_content("System 2", "Prompt 2", model="gpt-4", temperature=0.8),`
			`processor.generate_content("System 3", "Prompt 3", model="gpt-3.5-turbo", temperature=0.5)`
			`]`

			`results = await asyncio.gather(*tasks)`

			`# Assert`
			`assert len(results) == 3`
			`for result in results:`
			`assert isinstance(result, LlmResult)`

			`# Verify all calls were made with correct parameters`
			`assert mock_openai_client.chat.completions.create.call_count == 3`

			`# Get all call arguments`
			`call_args_list = mock_openai_client.chat.completions.create.call_args_list`

			`# Verify each call had the expected parameters`
			`expected_params = [`
			`("gpt-3.5-turbo", 0.1),`
			`("gpt-4", 0.8),`
			`("gpt-3.5-turbo", 0.5)`
			`]`

			`for i, (expected_model, expected_temp) in enumerate(expected_params):`
			`call_kwargs = call_args_list[i].kwargs`
			`assert call_kwargs['model'] == expected_model`
			`assert call_kwargs['temperature'] == expected_temp`

			`async def test_parameter_boundary_values(self, mock_openai_client, base_processor_config):`
			`"""Test parameter boundary values (edge cases)"""`
			`# This would test extreme values like temperature=0.0, temperature=2.0, etc.`
			`# Implementation depends on specific validation requirements`
			`pass`

			`async def test_invalid_parameter_types_handling(self, mock_openai_client, base_processor_config):`
			`"""Test handling of invalid parameter types"""`
			`# This would test what happens with invalid temperature values, non-existent models, etc.`
			`# Implementation depends on error handling requirements`
			`pass`


			`if __name__ == '__main__':`
			`pytest.main([__file__])`