Zum Hauptinhalt springen

Verfügbare Modelle

Wir bieten aktuell die nachfolgenden Modelle an, die sich im Laufe der Zeit ändern oder erweitern können. Diese werden beschrieben und modellspezifische Parameter aufgeführt.

ModellnameTypModalitätenContext (Tokens)Lizenz
gpt-oss-120bChat + ReasoningText, Tool-Calling131.072Apache 2.0
Qwen3.5-0.8BChat + ReasoningText, Tool-Calling262.144Apache 2.0
Ministral-3-14B-Instruct-2512Chat + VisionText, Bild, Tool-Calling262.144Apache 2.0
Mistral-Medium-3.5-128BChat + VisionText, Bild, Tool-Calling256.000Apache 2.0
Qwen3.5-122B-A10B-FP8Chat + Reasoning + VisionText, Bild, Tool-Calling245.760Apache 2.0
Qwen3.6-35B-A3B-FP8Chat + Reasoning + VisionText, Bild, Tool-Calling256.000Apache 2.0
GLM-OCRDokument OCRPDF, DOCX, PPTX, XLSX, HTML, SVG, Bild → Text131.072MIT
Qwen3-Embedding-8BEmbeddingText → Vektor32.768Apache 2.0
Qwen3-VL-Reranker-2BRerankingText, Bild → Score32.768Apache 2.0
whisper-large-v3-turboSpeech-to-TextAudio → Textn/a (Audio-basiert)MIT

Modellauswahl

  • Für komplexe textzentrierte Workloads und fortgeschrittene Automatisierungen, bei denen hohe Präzision und umfangreiches Wissen erforderlich sind
    verwende gpt-oss-120b.
  • Für hochdurchsatz- und kostensensitive Aufgaben ohne Vision-Bedarf, etwa einfache Frage-Antwort-Szenarien, Routing, Klassifizierung und Batch-Verarbeitung
    verwende Qwen3.5-0.8B.
  • Für komplexe Reasoning-, mehrsprachige oder Vision-Aufgaben, bei denen ein großes Frontier-Modell erforderlich ist
    verwende Mistral-Medium-3.5-128B.
  • Für generelle, skalierbare und kostenbewusste Chat- sowie einfache multimodale Workflows (Text + Bild)
    verwende Ministral-3-14B-Instruct-2512.
  • Für umfangreiche Reasoning- und Vision-Aufgaben, bei denen hohe Modellkapazität erforderlich ist
    verwende Qwen3.5-122B-A10B-FP8.
  • Für Workloads, die lange Kontextfenster mit Reasoning- und Vision-Unterstützung bei niedrigeren Kosten erfordern
    verwende Qwen3.6-35B-A3B-FP8.
  • Spezialanwendungen
    • Für das Extrahieren von Text aus PDF-, DOCX-, PPTX-, XLSX-, HTML- und Bilddokumenten, einschließlich gescannter Rechnungen, Verträge und Formulare
      verwende GLM-OCR
    • Für alle Anwendungsfälle mit Suche, Empfehlung, Clustering oder dem Aufbau von Knowledge Graphen
      verwende Qwen3-Embedding-8B
    • Für alle Transkriptions- oder Sprachbefehl-Anforderungen
      verwende whisper-large-v3-turbo
    • Für eine verbesserte Präzision beim RAG-Retrieval durch einen zweiten Reranking-Schritt nach der Vektorsuche
      verwende Qwen3-VL-Reranker-2B

Für weitere Details und zusätzliche Hinweise wirf einen Blick in die Beispiele und Anleitungen.

Auf den nachfolgenden Seiten erhältst du weitere Informationen zu diesen Modellen: