Verfügbare Modelle
Wir bieten aktuell die nachfolgenden Modelle an, die sich im Laufe der Zeit ändern oder erweitern können. Diese werden beschrieben und modellspezifische Parameter aufgeführt.
| Modellname | Typ | Modalitäten | Context (Tokens) | Lizenz |
|---|---|---|---|---|
| gpt-oss-120b | Chat + Reasoning | Text, Tool-Calling | 131.072 | Apache 2.0 |
| Ministral-3-14B-Instruct-2512 | Chat + Vision | Text, Bild, Tool-Calling | 262.144 | Apache 2.0 |
| Devstral-Small-2-24B-Instruct-2512 | Chat | Text, Bild, Tool-Calling | 262.144 | Apache 2.0 |
| Qwen3-Embedding-8B | Embedding | Text → Vektor | 32.768 | Apache 2.0 |
| whisper-large-v3-turbo | Speech-to-Text | Audio → Text | n/a (Audio-basiert) | MIT |
Modellauswahl
- Beginne mit
Ministral-3-14B-Instruct-2512für breite, skalierbare, kostenbewusste Chat- und einfache multimodale Workflows (Text + Bild). - Wechsle zu
Devstral-Small-2-24B-Instruct-2512für anspruchsvolle, nuancierte, geschäftskritische Aufgaben, bei denen höchste Antwortqualität, agentische Workflows und Bildverständnis entscheidend sind. - Verwende
gpt-oss-120bfür komplexe textbasierte Workloads und fortgeschrittene Automatisierungen, die eine hohe Präzision und umfangreiches Wissen erfordern. - Wähle
Qwen3-Embedding-8Bfür alle Anwendungsfälle mit Suche, Empfehlung, Clustering oder Knowledge-Graph-Aufbau. - Setze
whisper-large-v3-turbofür alle Transkriptions- oder Sprachbefehl-Anforderungen ein.
Auf den nachfolgenden Seiten erhältst du weitere Informationen zu diesen Modellen:
Ministral-3-14B-Instruct-2512
Detaillierte Informationen zu Ministral-3-14B-Instruct-2512
Devstral-Small-2-24B-Instruct-2512
Detaillierte Informationen zu Devstral-Small-2-24B-Instruct-2512
Qwen3-Embedding-8B
Detaillierte Informationen zu Qwen3-Embedding-8B
gpt-oss-120b
Detaillierte Informationen zu gpt-oss-120b
Whisper-Large-V3-Turbo
Detaillierte Informationen zu Whisper-Large-V3-Turbo