add support for jaeger tracing (#229)

2026-07-05 15:52:12 +02:00 · 2024-11-07 22:11:00 -06:00 · 2024-11-07 22:11:00 -06:00 · a72bb804eb
commit a72bb804eb
parent fb67788be0
64 changed files with 5032 additions and 1112 deletions
--- a/arch/envoy.template.yaml
+++ b/arch/envoy.template.yaml
@ -25,7 +25,7 @@ static_resources:
                        envoy_grpc:
                          cluster_name: opentelemetry_collector
                        timeout: 0.250s
-                      service_name: arch
+                      service_name: arch_gateway
                  random_sampling:
                    value: {{ arch_tracing.random_sampling }}
                {% endif %}
@ -49,8 +49,67 @@ static_resources:
                            prefix: "/"
                          route:
                            auto_host_rewrite: true
-                            cluster: arch_llm_listener
+                            cluster: arch_prompt_gateway_listener
                            timeout: 60s
+                http_filters:
+                  - name: envoy.filters.http.router
+                    typed_config:
+                      "@type": type.googleapis.com/envoy.extensions.filters.http.router.v3.Router
+
+    - name: arch_prompt_gateway_listener
+      address:
+        socket_address:
+          address: 0.0.0.0
+          port_value: 10001
+      traffic_direction: INBOUND
+      filter_chains:
+        - filters:
+            - name: envoy.filters.network.http_connection_manager
+              typed_config:
+                "@type": type.googleapis.com/envoy.extensions.filters.network.http_connection_manager.v3.HttpConnectionManager
+                {% if "random_sampling" in arch_tracing and arch_tracing["random_sampling"] > 0 %}
+                generate_request_id: true
+                tracing:
+                  provider:
+                    name: envoy.tracers.opentelemetry
+                    typed_config:
+                      "@type": type.googleapis.com/envoy.config.trace.v3.OpenTelemetryConfig
+                      grpc_service:
+                        envoy_grpc:
+                          cluster_name: opentelemetry_collector
+                        timeout: 0.250s
+                      service_name: prompt_processor
+                  random_sampling:
+                    value: {{ arch_tracing.random_sampling }}
+                {% endif %}
+                stat_prefix: arch_prompt_gateway_listener
+                codec_type: AUTO
+                scheme_header_transformation:
+                  scheme_to_overwrite: https
+                access_log:
+                - name: envoy.access_loggers.file
+                  typed_config:
+                    "@type": type.googleapis.com/envoy.extensions.access_loggers.file.v3.FileAccessLog
+                    path: "/var/log/access_ingress_prompt.log"
+                route_config:
+                  name: local_routes
+                  virtual_hosts:
+                    - name: local_service
+                      domains:
+                        - "*"
+                      routes:
+                      {% for provider in arch_llm_providers %}
+                        - match:
+                            prefix: "/"
+                            headers:
+                              - name: "x-arch-llm-provider"
+                                string_match:
+                                  exact: {{ provider.name }}
+                          route:
+                            auto_host_rewrite: true
+                            cluster: {{ provider.provider }}
+                            timeout: 60s
+                      {% endfor %}
                http_filters:
                  - name: envoy.filters.http.compressor
                    typed_config:
@ -78,6 +137,23 @@ static_resources:
                            code:
                              local:
                                filename: "/etc/envoy/proxy-wasm-plugins/prompt_gateway.wasm"
+                  - name: envoy.filters.http.wasm
+                    typed_config:
+                      "@type": type.googleapis.com/udpa.type.v1.TypedStruct
+                      type_url: type.googleapis.com/envoy.extensions.filters.http.wasm.v3.Wasm
+                      value:
+                        config:
+                          name: "http_config"
+                          root_id: llm_gateway
+                          configuration:
+                            "@type": "type.googleapis.com/google.protobuf.StringValue"
+                            value: |
+                                {{ arch_llm_config | indent(32) }}
+                          vm_config:
+                            runtime: "envoy.wasm.runtime.v8"
+                            code:
+                              local:
+                                filename: "/etc/envoy/proxy-wasm-plugins/llm_gateway.wasm"
                  - name: envoy.filters.http.decompressor
                    typed_config:
                      "@type": type.googleapis.com/envoy.extensions.filters.http.decompressor.v3.Decompressor
@ -115,7 +191,7 @@ static_resources:
                        envoy_grpc:
                          cluster_name: opentelemetry_collector
                        timeout: 0.250s
-                      service_name: arch
+                      service_name: prompt_processor
                  random_sampling:
                    value: {{ arch_tracing.random_sampling }}
                {% endif %}
@ -187,7 +263,7 @@ static_resources:
                        envoy_grpc:
                          cluster_name: opentelemetry_collector
                        timeout: 0.250s
-                      service_name: arch
+                      service_name: llm_gateway
                  random_sampling:
                    value: {{ arch_tracing.random_sampling }}
                {% endif %}
@ -387,21 +463,21 @@ static_resources:
                      port_value: 11000
                  hostname: arch_internal

-    - name: arch_llm_listener
+    - name: arch_prompt_gateway_listener
      connect_timeout: 5s
      type: LOGICAL_DNS
      dns_lookup_family: V4_ONLY
      lb_policy: ROUND_ROBIN
      load_assignment:
-        cluster_name: arch_llm_listener
+        cluster_name: arch_prompt_gateway_listener
        endpoints:
          - lb_endpoints:
              - endpoint:
                  address:
                    socket_address:
                      address: 0.0.0.0
-                      port_value: 12000
-                  hostname: arch_llm_listener
+                      port_value: 10001
+                  hostname: arch_prompt_gateway_listener

 {% if "random_sampling" in arch_tracing and arch_tracing["random_sampling"] > 0 %}
    - name: opentelemetry_collector