System status

Live · refresh 60 s

All systems operational

Alle Kernkomponenten und Inference-Provider antworten innerhalb der SLO-Ziele.

as of 21 May 2026, 19:33:55 UTCRefreshing every 60 s

Components

Live-Status pro Service mit 90-Tage-Uptime-Historie. Hover über einen Tag für Details.

≥ 99 %95–99 %< 95 %

Core platform

Gateway API

OpenAI-kompatibler Router — /v1/chat/completions, /v1/models

Operational

99.95%

90-day uptime

Dashboard

Web-App, Docs, Marketing — clevermation.com & Self-Service

Operational

99.42%

90-day uptime

Authentication

better-auth Sessions, OAuth-Login, API-Key-Issuance

Operational

99.59%

90-day uptime

EU inference providers

Scaleway

fr-par · Default-Hop · Mistral, Qwen, Llama, Gemma

Operational

99.81%

90-day uptime

Tensorix

de-fra · Premium-Hop · Frontier-Reasoning auf H200

Operational

100.00%

90-day uptime

Incident history

Letzte 30 Tage. Vollständige Post-mortems verlinken wir, sobald veröffentlicht.

3 resolved · 0 ongoing
Minor28 Apr 2026, 13:14 UTCResolved12 min

Scaleway · elevated latency on Mistral endpoints

affected · scaleway

What happened

Zwischen 13:14 und 13:26 CEST haben wir erhöhte P99-Latenzen (>4 s) auf Scaleways Mistral-Inferenz-Pool in fr-par-1 beobachtet. Routing hat automatisch auf den Sekundär-Pool fr-par-2 umgeschwenkt, einzelne Requests sahen Timeouts.

Resolution

Scaleway hat einen überlasteten GPU-Knoten ausgetauscht. Wir haben den Failover-Threshold von 5 s auf 3,5 s gesenkt, damit künftig schneller umgeschwenkt wird.

Minor19 Apr 2026, 08:02 UTCResolved4 min

Gateway · brief 502 spike during deploy

affected · gateway

What happened

Während eines Rolling-Deploys haben wir kurzzeitig 502er auf ~1,8 % der Requests gesehen, weil ein Pod nicht sauber drainiert wurde.

Resolution

preStop-Hook von 5 s auf 20 s erhöht, Readiness-Probe auf den /admin/health-Endpoint umgestellt. Seither saubere Deploys.

Major03 Apr 2026, 22:41 UTCResolved41 min

Tensorix · partial outage in de-fra-1

affected · tensorix

What happened

Tensorix hatte einen Hardware-Ausfall in de-fra-1 (H200-Cluster B). Premium-Reasoning-Modelle waren ~41 Minuten unavailable.

Resolution

Smart-Routing hat alle Tensorix-Requests an Scaleway-Pendants weitergereicht, soweit ein Mapping existierte. Modelle ohne Pendant haben einen sauberen 503 mit Retry-After zurückgegeben.

Stay in the loop

Bekomme Incident-Updates per Mail oder RSS — bevor dein Kunde sie merkt.

Subscribe-Flow ist kurz vor Launch. Bis dahin gerne via Slack-Channel oder Mail.

RSS feed (coming soon)