All models
Qwen

Qwen

Qwen3 Embedding 8B

qwen/qwen3-embedding

operationalZDRembeddings

01·01

Overview

Modell-Beschreibung und Capability-Matrix.

About this model

Embedding-Modell von Qwen (8B Parameter).

Capabilities matrix

streaming
tools
json
vision
reasoning
embedding

02·02

Providers

1 EU-Provider mit Region, ZDR-Status und Preisen pro Million Tokens.

ProviderProvider Model IDRegionZDRInput €/MOutput €/MPriority
Scalewayqwen3-embedding-8bfr-par-1 ZDR€0.08100

03·03

Performance

Throughput, TTFT, E2E-Latency und Tool-Error-Rate — pro Provider, p50 über 24h.

Best Throughput

Scaleway187 tok/s

Lowest Latency

Scaleway1.85s

Scaleway

fr-par-1

Throughput

187tok/s

p50 · 24h
TTFT

262ms

p50 · 24h
E2E Latency

1.85s

p50 · 24h
Tool Err Rate

0.25%

last 7d

Note · Real metrics ship in Phase 4 once we log per-request TTFT + TPS into requests table aggregations.

04·04

Pricing

Pro Provider — relative Preisvisualisierung gegen den teuersten Anbieter dieses Modells.

Scaleway

ZDR
Input · per 1M tokens€0.08
Output · per 1M tokens
Regionfr-par-1

05·05

Uptime

30-Tage-Heatmap pro Provider, aggregierte Verfügbarkeit und Incident-Historie.

Aggregated uptime

100.00%

Last 30 days · all providers combined

≥ 99 %95–99 %< 95 %

Scaleway

fr-par-1ZDR

100.00%

last 30 days

Recent incidents · last 30 days

Minor17 Apr 2026, 08:00 UTCScaleway12 min

Elevated latency on inference pool

Erhöhte P99-Latenz auf einem GPU-Pool. Routing hat automatisch auf den Sekundär-Pool umgeschwenkt.

06·06

API

Drop-in OpenAI-kompatibler Endpoint. Tausche nur die baseURL — der Rest bleibt.

use-qwen3-embedding.ts
curl https://cleverouter.eu/v1/chat/completions \
  -H "Authorization: Bearer $CLEVERROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3-embedding",
    "messages": [
      { "role": "user", "content": "Hallo aus der EU." }
    ]
  }'