More LLM param test coverage (#535)

* More LLM tests * Fixing tests
2026-06-29 16:39:37 +02:00 · 2025-09-26 01:00:30 +01:00 · 2025-09-26 01:00:30 +01:00 · 43cfcb18a0
commit 43cfcb18a0
parent b0a3716b0e
18 changed files with 3563 additions and 0 deletions
--- a/tests/integration/test_dynamic_llm_parameters.py
+++ b/tests/integration/test_dynamic_llm_parameters.py
@ -0,0 +1,276 @@
+"""
+Integration tests for Dynamic LLM Parameters
+Testing end-to-end flow of runtime parameter changes in LLM processors
+"""
+
+import pytest
+from unittest.mock import AsyncMock, MagicMock, patch
+from openai.types.chat import ChatCompletion, ChatCompletionMessage
+from openai.types.chat.chat_completion import Choice
+from openai.types.completion_usage import CompletionUsage
+
+from trustgraph.model.text_completion.openai.llm import Processor as OpenAIProcessor
+from trustgraph.base import LlmResult
+
+
+@pytest.mark.integration
+class TestDynamicLlmParameters:
+    """Integration tests for dynamic parameter configuration"""
+
+    @pytest.fixture
+    def mock_openai_client(self):
+        """Mock OpenAI client that returns realistic responses"""
+        client = MagicMock()
+
+        # Default mock response
+        usage = CompletionUsage(prompt_tokens=25, completion_tokens=15, total_tokens=40)
+        message = ChatCompletionMessage(role="assistant", content="Dynamic parameter test response")
+        choice = Choice(index=0, message=message, finish_reason="stop")
+
+        completion = ChatCompletion(
+            id="chatcmpl-test-dynamic",
+            choices=[choice],
+            created=1234567890,
+            model="gpt-4",  # Will be overridden based on test
+            object="chat.completion",
+            usage=usage
+        )
+
+        client.chat.completions.create.return_value = completion
+        return client
+
+    @pytest.fixture
+    def base_processor_config(self):
+        """Base configuration for test processors"""
+        return {
+            "api_key": "test-api-key",
+            "url": "https://api.openai.com/v1",
+            "temperature": 0.0,  # Default temperature
+            "max_output": 1024,
+        }
+
+    @patch('trustgraph.model.text_completion.openai.llm.OpenAI')
+    @patch('trustgraph.base.async_processor.AsyncProcessor.__init__')
+    @patch('trustgraph.base.llm_service.LlmService.__init__')
+    async def test_runtime_temperature_override(self, mock_llm_init, mock_async_init,
+                                               mock_openai_class, mock_openai_client, base_processor_config):
+        """Test that temperature can be overridden at runtime"""
+        # Arrange
+        mock_openai_class.return_value = mock_openai_client
+        mock_async_init.return_value = None
+        mock_llm_init.return_value = None
+
+        config = base_processor_config | {
+            "model": "gpt-3.5-turbo",
+            "concurrency": 1,
+            "taskgroup": AsyncMock(),
+            "id": "test-processor"
+        }
+
+        processor = OpenAIProcessor(**config)
+
+        # Act - Call with different temperature than configured default (0.0)
+        result = await processor.generate_content(
+            "System prompt",
+            "User prompt",
+            model=None,  # Use default model
+            temperature=0.9  # Override temperature
+        )
+
+        # Assert
+        assert isinstance(result, LlmResult)
+        assert result.text == "Dynamic parameter test response"
+
+        # Verify the OpenAI API was called with the overridden temperature
+        mock_openai_client.chat.completions.create.assert_called_once()
+        call_args = mock_openai_client.chat.completions.create.call_args
+
+        assert call_args.kwargs['temperature'] == 0.9  # Should use runtime parameter
+        assert call_args.kwargs['model'] == "gpt-3.5-turbo"  # Should use processor default
+
+    @patch('trustgraph.model.text_completion.openai.llm.OpenAI')
+    @patch('trustgraph.base.async_processor.AsyncProcessor.__init__')
+    @patch('trustgraph.base.llm_service.LlmService.__init__')
+    async def test_runtime_model_override(self, mock_llm_init, mock_async_init,
+                                         mock_openai_class, mock_openai_client, base_processor_config):
+        """Test that model can be overridden at runtime"""
+        # Arrange
+        mock_openai_class.return_value = mock_openai_client
+        mock_async_init.return_value = None
+        mock_llm_init.return_value = None
+
+        config = base_processor_config | {
+            "model": "gpt-3.5-turbo",  # Default model
+            "concurrency": 1,
+            "taskgroup": AsyncMock(),
+            "id": "test-processor"
+        }
+
+        processor = OpenAIProcessor(**config)
+
+        # Act - Call with different model than configured default
+        result = await processor.generate_content(
+            "System prompt",
+            "User prompt",
+            model="gpt-4",        # Override model
+            temperature=None      # Use default temperature
+        )
+
+        # Assert
+        assert isinstance(result, LlmResult)
+
+        # Verify the OpenAI API was called with the overridden model
+        mock_openai_client.chat.completions.create.assert_called_once()
+        call_args = mock_openai_client.chat.completions.create.call_args
+
+        assert call_args.kwargs['model'] == "gpt-4"        # Should use runtime parameter
+        assert call_args.kwargs['temperature'] == 0.0      # Should use processor default
+
+    @patch('trustgraph.model.text_completion.openai.llm.OpenAI')
+    @patch('trustgraph.base.async_processor.AsyncProcessor.__init__')
+    @patch('trustgraph.base.llm_service.LlmService.__init__')
+    async def test_both_parameters_override(self, mock_llm_init, mock_async_init,
+                                           mock_openai_class, mock_openai_client, base_processor_config):
+        """Test that both model and temperature can be overridden simultaneously"""
+        # Arrange
+        mock_openai_class.return_value = mock_openai_client
+        mock_async_init.return_value = None
+        mock_llm_init.return_value = None
+
+        config = base_processor_config | {
+            "model": "gpt-3.5-turbo",  # Default model
+            "concurrency": 1,
+            "taskgroup": AsyncMock(),
+            "id": "test-processor"
+        }
+
+        processor = OpenAIProcessor(**config)
+
+        # Act - Override both parameters
+        result = await processor.generate_content(
+            "System prompt",
+            "User prompt",
+            model="gpt-4",        # Override model
+            temperature=0.5       # Override temperature
+        )
+
+        # Assert
+        assert isinstance(result, LlmResult)
+
+        # Verify both parameters were overridden
+        mock_openai_client.chat.completions.create.assert_called_once()
+        call_args = mock_openai_client.chat.completions.create.call_args
+
+        assert call_args.kwargs['model'] == "gpt-4"        # Should use runtime parameter
+        assert call_args.kwargs['temperature'] == 0.5      # Should use runtime parameter
+
+    @patch('trustgraph.model.text_completion.openai.llm.OpenAI')
+    @patch('trustgraph.base.async_processor.AsyncProcessor.__init__')
+    @patch('trustgraph.base.llm_service.LlmService.__init__')
+    async def test_fallback_to_defaults_when_no_override(self, mock_llm_init, mock_async_init,
+                                                        mock_openai_class, mock_openai_client, base_processor_config):
+        """Test that processor falls back to configured defaults when no parameters are provided"""
+        # Arrange
+        mock_openai_class.return_value = mock_openai_client
+        mock_async_init.return_value = None
+        mock_llm_init.return_value = None
+
+        config = base_processor_config | {
+            "model": "gpt-3.5-turbo",  # Default model
+            "temperature": 0.2,        # Default temperature
+            "concurrency": 1,
+            "taskgroup": AsyncMock(),
+            "id": "test-processor"
+        }
+
+        processor = OpenAIProcessor(**config)
+
+        # Act - Call with no parameter overrides
+        result = await processor.generate_content(
+            "System prompt",
+            "User prompt",
+            model=None,       # Use default
+            temperature=None  # Use default
+        )
+
+        # Assert
+        assert isinstance(result, LlmResult)
+
+        # Verify defaults were used
+        mock_openai_client.chat.completions.create.assert_called_once()
+        call_args = mock_openai_client.chat.completions.create.call_args
+
+        assert call_args.kwargs['model'] == "gpt-3.5-turbo"  # Should use processor default
+        assert call_args.kwargs['temperature'] == 0.2        # Should use processor default
+
+    @patch('trustgraph.model.text_completion.openai.llm.OpenAI')
+    @patch('trustgraph.base.async_processor.AsyncProcessor.__init__')
+    @patch('trustgraph.base.llm_service.LlmService.__init__')
+    async def test_multiple_concurrent_calls_different_parameters(self, mock_llm_init, mock_async_init,
+                                                                 mock_openai_class, mock_openai_client, base_processor_config):
+        """Test multiple concurrent calls with different parameters don't interfere"""
+        # Arrange
+        mock_openai_class.return_value = mock_openai_client
+        mock_async_init.return_value = None
+        mock_llm_init.return_value = None
+
+        config = base_processor_config | {
+            "model": "gpt-3.5-turbo",
+            "concurrency": 1,
+            "taskgroup": AsyncMock(),
+            "id": "test-processor"
+        }
+
+        processor = OpenAIProcessor(**config)
+
+        # Reset the mock to track multiple calls
+        mock_openai_client.reset_mock()
+
+        # Act - Make multiple calls with different parameters concurrently
+        import asyncio
+        tasks = [
+            processor.generate_content("System 1", "Prompt 1", model="gpt-3.5-turbo", temperature=0.1),
+            processor.generate_content("System 2", "Prompt 2", model="gpt-4", temperature=0.8),
+            processor.generate_content("System 3", "Prompt 3", model="gpt-3.5-turbo", temperature=0.5)
+        ]
+
+        results = await asyncio.gather(*tasks)
+
+        # Assert
+        assert len(results) == 3
+        for result in results:
+            assert isinstance(result, LlmResult)
+
+        # Verify all calls were made with correct parameters
+        assert mock_openai_client.chat.completions.create.call_count == 3
+
+        # Get all call arguments
+        call_args_list = mock_openai_client.chat.completions.create.call_args_list
+
+        # Verify each call had the expected parameters
+        expected_params = [
+            ("gpt-3.5-turbo", 0.1),
+            ("gpt-4", 0.8),
+            ("gpt-3.5-turbo", 0.5)
+        ]
+
+        for i, (expected_model, expected_temp) in enumerate(expected_params):
+            call_kwargs = call_args_list[i].kwargs
+            assert call_kwargs['model'] == expected_model
+            assert call_kwargs['temperature'] == expected_temp
+
+    async def test_parameter_boundary_values(self, mock_openai_client, base_processor_config):
+        """Test parameter boundary values (edge cases)"""
+        # This would test extreme values like temperature=0.0, temperature=2.0, etc.
+        # Implementation depends on specific validation requirements
+        pass
+
+    async def test_invalid_parameter_types_handling(self, mock_openai_client, base_processor_config):
+        """Test handling of invalid parameter types"""
+        # This would test what happens with invalid temperature values, non-existent models, etc.
+        # Implementation depends on error handling requirements
+        pass
+
+
+if __name__ == '__main__':
+    pytest.main([__file__])