Zum Hauptinhalt springen

Qwen3.6-35B-A3B-FP8

Beschreibung

„Qwen3.6-35B-A3B-FP8" ist ein Mixture-of-Experts-Sprachmodell (MoE) von Alibaba mit 35 Milliarden Gesamtparametern, von denen jeweils ca. 3 Milliarden pro Forward-Pass aktiv sind. Es ist für effiziente, qualitativ hochwertige Chat- und agentische Workflows mit Reasoning- und Vision-Fähigkeiten ausgelegt und eignet sich für die Analyse langer Dokumente und ausgedehnte Mehrturngespräche.

Geeignet für und unterstützt:

  • Textgenerierung innerhalb einer Chat-Completion (Text zu Text)
  • Tool-Calling für agentische Workflows
  • Bildverständnis (Vision)
  • Thinking / Reasoning für schrittweises Problemlösen
  • Verarbeitung langer Dokumente und erweiterter Kontexte

Folgende Limitierungen gelten:

  • Maximale Context-Länge: 262.144 Token
  • Der Thinking-Modus benötigt mindestens 128.000 Token verbleibenden Context, um korrekt zu funktionieren

Thinking-Modus ist standardmäßig aktiviert. Um ihn zu deaktivieren, übergib "enable_thinking": false in den Extra-Body-Parametern deiner API-Anfrage.

Empfohlene Inferenzparameter

Das Modell hat je nach Anwendungsfall unterschiedliche empfohlene Einstellungen. Greedy-Decoding (temperature 0) sollte vermieden werden – es kann zu Leistungseinbußen und endlosen Wiederholungen führen.

Thinking-Modus (Standard)

Allgemeine Aufgaben:

ParameterWert
temperature1.0
top_p0.95
top_k20
presence_penalty1.5

Präzise Coding-Aufgaben / Webentwicklung:

ParameterWert
temperature0.6
top_p0.95
top_k20
presence_penalty0.0

Non-Thinking-Modus (enable_thinking: false)

Allgemeine Aufgaben:

ParameterWert
temperature0.7
top_p0.8
top_k20
presence_penalty1.5

Reasoning / Mathematik / komplexe Problemlösung:

ParameterWert
temperature1.0
top_p1.0
top_k40
presence_penalty2.0

Ausgabelänge

Setze max_tokens entsprechend der Aufgabenkomplexität, um Kosten und Latenz zu steuern:

AufgabentypEmpfohlenes max_tokens
Standardanfragen32.768
Komplexe Aufgaben (Mathematik, Programmierwettbewerbe)81.920

Tipps für spezifische Aufgaben

Mathematikaufgaben

Für beste Ergebnisse bei mathematischen Aufgaben füge folgende Anweisung an deinen Prompt an:

Please reason step by step, and put your final answer within \boxed{}.

Multiple-Choice-Fragen

Für konsistente, parsierbare Ausgaben bei Multiple-Choice-Aufgaben füge Folgendes an deinen Prompt an:

Please show your choice in the 'answer' field with only the choice letter, e.g., 'answer': 'C'.

Nutzungsbedingungen und Lizenzhinweise

Es gelten die allgemeinen Nutzungsbedingungen. Das Modell wird von Alibaba unter der Apache 2.0-Lizenz angeboten, eine Weiternutzung der generierten Inhalte unterliegt keiner zusätzlichen Restriktion.