plano/skills/rules/observe-tracing.md at 743d074184af534e39011ac1bd2c940590046fbe

apunkt/plano

Fork 0

mirror of https://github.com/katanemo/plano.git synced 2026-04-25 00:36:34 +02:00

Musa 743d074184

CI / pre-commit (push) Waiting to run

Details

CI / plano-tools-tests (push) Waiting to run

Details

CI / native-smoke-test (push) Waiting to run

Details

CI / docker-build (push) Waiting to run

Details

CI / validate-config (push) Waiting to run

Details

CI / security-scan (push) Blocked by required conditions

Details

CI / test-prompt-gateway (push) Blocked by required conditions

Details

CI / test-model-alias-routing (push) Blocked by required conditions

Details

CI / test-responses-api-with-state (push) Blocked by required conditions

Details

CI / e2e-plano-tests (3.10) (push) Blocked by required conditions

Details

CI / e2e-plano-tests (3.11) (push) Blocked by required conditions

Details

CI / e2e-plano-tests (3.12) (push) Blocked by required conditions

Details

CI / e2e-plano-tests (3.13) (push) Blocked by required conditions

Details

CI / e2e-plano-tests (3.14) (push) Blocked by required conditions

Details

CI / e2e-demo-preference (push) Blocked by required conditions

Details

CI / e2e-demo-currency (push) Blocked by required conditions

Details

Publish docker image (latest) / build-arm64 (push) Waiting to run

Details

Publish docker image (latest) / build-amd64 (push) Waiting to run

Details

Publish docker image (latest) / create-manifest (push) Blocked by required conditions

Details

Build and Deploy Documentation / build (push) Waiting to run

Details

add Plano agent skills framework and rule set (#797 )

* feat: add initial documentation for Plano Agent Skills

* feat: readme with examples

* feat: add detailed skills documentation and examples for Plano

---------

Co-authored-by: Adil Hafeez <adil.hafeez@gmail.com>

2026-04-16 13:16:51 -07:00

2.5 KiB

Raw Blame History

title	impact	impactDescription	tags
Enable Tracing with Appropriate Sampling for Your Environment	HIGH	Without tracing enabled, debugging routing decisions, latency issues, and model selection is guesswork — traces are the primary observability primitive in Plano	observability, tracing, opentelemetry, otel, debugging

Enable Tracing with Appropriate Sampling for Your Environment

Plano emits OpenTelemetry (OTEL) traces for every request, capturing routing decisions, LLM provider selection, filter chain execution, and response latency. Traces are the best tool for understanding why a request was routed to a particular model and debugging unexpected behavior.

Incorrect (no tracing configured — flying blind in production):

version: v0.3.0

listeners:
  - type: model
    name: model_listener
    port: 12000

model_providers:
  - model: openai/gpt-4o
    access_key: $OPENAI_API_KEY
    default: true

# No tracing block — no visibility into routing, latency, or errors

Correct (tracing enabled with environment-appropriate sampling):

version: v0.3.0

listeners:
  - type: model
    name: model_listener
    port: 12000

model_providers:
  - model: openai/gpt-4o
    access_key: $OPENAI_API_KEY
    default: true

tracing:
  random_sampling: 100              # 100% for development/debugging
  trace_arch_internal: true         # Include Plano's internal routing spans

Production configuration (sampled to control volume):

tracing:
  random_sampling: 10               # Sample 10% of requests in production
  trace_arch_internal: false        # Skip internal spans to reduce noise
  span_attributes:
    header_prefixes:
      - x-katanemo-               # Match all x-katanemo-* headers
    static:
      environment: production
      service.name: my-plano-service
      version: "1.0.0"

With x-katanemo- configured, Plano maps headers to attributes by stripping the prefix and converting hyphens to dots:

x-katanemo-user-id -> user.id
x-katanemo-session-id -> session.id
x-katanemo-request-id -> request.id

Starting the trace collector:

# Start Plano with built-in OTEL collector
planoai up config.yaml --with-tracing

Sampling rates: 100% for dev/staging, 5–20% for high-traffic production, 100% for low-traffic production. trace_arch_internal: true adds spans showing which routing preference matched — essential for debugging preference configuration.

Reference: https://github.com/katanemo/archgw

2.5 KiB Raw Blame History Unescape Escape

Enable Tracing with Appropriate Sampling for Your Environment

2.5 KiB

Raw Blame History