plano

apunkt/plano

Fork 0

mirror of https://github.com/katanemo/plano.git synced 2026-04-25 08:46:24 +02:00

Commit graph

Author	SHA1	Message	Date
Adil Hafeez	a7903d9271	add model_aliases to digitalocean_pricing, use model_id as key, warn on missing data at request time	2026-03-27 17:32:15 -07:00
Adil Hafeez	bd7afd911e	add DigitalOcean pricing, startup validation, and demo update - MetricsSource::DigitalOceanPricing variant: fetch public DO Gen-AI pricing, normalize as lowercase(creator)/model_id, cost = input + output per million - cost_metrics endpoint format updated to { "model": { "input_per_million": X, "output_per_million": Y } } - Startup errors: prefer:cheapest requires cost source, prefer:fastest requires prometheus - Startup warning: models with no pricing/latency data ranked last - One-per-type enforcement: digitalocean_pricing; error if cost_metrics + digitalocean_pricing both configured - cost_snapshot() / latency_snapshot() on ModelMetricsService for startup checks - Demo config updated to v0.4.0 top-level routing_preferences with cheapest + fastest policies - docker-compose.yaml + prometheus.yaml + metrics_server.py for demo latency metrics - Schema and docs updated	2026-03-27 16:54:37 -07:00
Adil Hafeez	76b1f37052	redesign model_metrics_sources, drop legacy per-provider routing, return ranked model list	2026-03-27 12:37:38 -07:00

Author

SHA1

Message

Date

Adil Hafeez

a7903d9271

add model_aliases to digitalocean_pricing, use model_id as key, warn on missing data at request time

2026-03-27 17:32:15 -07:00

Adil Hafeez

bd7afd911e

add DigitalOcean pricing, startup validation, and demo update

- MetricsSource::DigitalOceanPricing variant: fetch public DO Gen-AI pricing, normalize as lowercase(creator)/model_id, cost = input + output per million
- cost_metrics endpoint format updated to { "model": { "input_per_million": X, "output_per_million": Y } }
- Startup errors: prefer:cheapest requires cost source, prefer:fastest requires prometheus
- Startup warning: models with no pricing/latency data ranked last
- One-per-type enforcement: digitalocean_pricing; error if cost_metrics + digitalocean_pricing both configured
- cost_snapshot() / latency_snapshot() on ModelMetricsService for startup checks
- Demo config updated to v0.4.0 top-level routing_preferences with cheapest + fastest policies
- docker-compose.yaml + prometheus.yaml + metrics_server.py for demo latency metrics
- Schema and docs updated

2026-03-27 16:54:37 -07:00

Adil Hafeez

76b1f37052

redesign model_metrics_sources, drop legacy per-provider routing, return ranked model list

2026-03-27 12:37:38 -07:00

3 commits