Verfügbare Modelle
Wir bieten aktuell die nachfolgenden Modelle an, die sich im Laufe der Zeit ändern oder erweitern können. Diese werden beschrieben und modellspezifische Parameter aufgeführt.
| Modellname | Typ | Modalitäten | Context (Tokens) | Lizenz |
|---|---|---|---|---|
| gpt-oss-120b | Chat + Reasoning | Text, Tool-Calling | 131.072 | Apache 2.0 |
| Qwen3.5-0.8B | Chat + Reasoning | Text, Tool-Calling | 262.144 | Apache 2.0 |
| Ministral-3-14B-Instruct-2512 | Chat + Vision | Text, Bild, Tool-Calling | 262.144 | Apache 2.0 |
| Mistral-Medium-3.5-128B | Chat + Vision | Text, Bild, Tool-Calling | 256.000 | Apache 2.0 |
| Qwen3.5-122B-A10B-FP8 | Chat + Reasoning + Vision | Text, Bild, Tool-Calling | 245.760 | Apache 2.0 |
| Qwen3.6-35B-A3B-FP8 | Chat + Reasoning + Vision | Text, Bild, Tool-Calling | 256.000 | Apache 2.0 |
| GLM-OCR | Dokument OCR | PDF, DOCX, PPTX, XLSX, HTML, SVG, Bild → Text | 131.072 | MIT |
| Qwen3-Embedding-8B | Embedding | Text → Vektor | 32.768 | Apache 2.0 |
| Qwen3-VL-Reranker-2B | Reranking | Text, Bild → Score | 32.768 | Apache 2.0 |
| whisper-large-v3-turbo | Speech-to-Text | Audio → Text | n/a (Audio-basiert) | MIT |
Modellauswahl
- Für komplexe textzentrierte Workloads und fortgeschrittene Automatisierungen, bei denen hohe Präzision und umfangreiches Wissen erforderlich sind
verwendegpt-oss-120b. - Für hochdurchsatz- und kostensensitive Aufgaben ohne Vision-Bedarf, etwa einfache Frage-Antwort-Szenarien, Routing, Klassifizierung und Batch-Verarbeitung
verwendeQwen3.5-0.8B. - Für komplexe Reasoning-, mehrsprachige oder Vision-Aufgaben, bei denen ein großes Frontier-Modell erforderlich ist
verwendeMistral-Medium-3.5-128B. - Für generelle, skalierbare und kostenbewusste Chat- sowie einfache multimodale Workflows (Text + Bild)
verwendeMinistral-3-14B-Instruct-2512. - Für umfangreiche Reasoning- und Vision-Aufgaben, bei denen hohe Modellkapazität erforderlich ist
verwendeQwen3.5-122B-A10B-FP8. - Für Workloads, die lange Kontextfenster mit Reasoning- und Vision-Unterstützung bei niedrigeren Kosten erfordern
verwendeQwen3.6-35B-A3B-FP8. - Spezialanwendungen
- Für das Extrahieren von Text aus PDF-, DOCX-, PPTX-, XLSX-, HTML- und Bilddokumenten, einschließlich gescannter Rechnungen, Verträge und Formulare
verwendeGLM-OCR - Für alle Anwendungsfälle mit Suche, Empfehlung, Clustering oder dem Aufbau von Knowledge Graphen
verwendeQwen3-Embedding-8B - Für alle Transkriptions- oder Sprachbefehl-Anforderungen
verwendewhisper-large-v3-turbo - Für eine verbesserte Präzision beim RAG-Retrieval durch einen zweiten Reranking-Schritt nach der Vektorsuche
verwendeQwen3-VL-Reranker-2B
- Für das Extrahieren von Text aus PDF-, DOCX-, PPTX-, XLSX-, HTML- und Bilddokumenten, einschließlich gescannter Rechnungen, Verträge und Formulare
Für weitere Details und zusätzliche Hinweise wirf einen Blick in die Beispiele und Anleitungen.
Auf den nachfolgenden Seiten erhältst du weitere Informationen zu diesen Modellen:
Ministral-3-14B-Instruct-2512
Detaillierte Informationen zu Ministral-3-14B-Instruct-2512
Qwen3-Embedding-8B
Detaillierte Informationen zu Qwen3-Embedding-8B
gpt-oss-120b
Detaillierte Informationen zu gpt-oss-120b
Whisper-Large-V3-Turbo
Detaillierte Informationen zu Whisper-Large-V3-Turbo
Qwen3.5-122B-A10B-FP8
Detaillierte Informationen zu Qwen3.5-122B-A10B-FP8
Qwen3.6-35B-A3B-FP8
Detaillierte Informationen zu Qwen3.6-35B-A3B-FP8
GLM-OCR
Detaillierte Informationen zu GLM-OCR
Qwen3.5-0.8B
Detaillierte Informationen zu Qwen3.5-0.8B
Qwen3-VL-Reranker-2B
Detaillierte Informationen zu Qwen3-VL-Reranker-2B
Mistral-Medium-3.5-128B
Detaillierte Informationen zu Mistral-Medium-3.5-128B