Zum Hauptinhalt springen

Mistral-Medium-3.5-128B

Beschreibung

„Mistral-Medium-3.5-128B" ist ein Frontier-Sprachmodell von Mistral AI mit 128 Milliarden Parametern. Es unterstützt Text und Tool-Calling über ein Kontextfenster von 256.000 Token und nutzt EAGLE-spekulatives Decoding für schnelle Inferenz.

Geeignet für und unterstützt:

  • Textgenerierung innerhalb einer Chat-Completion (Text zu Text)
  • Tool-Calling für agentische Workflows
  • Langkontext-Dokumentenanalyse und Zusammenfassung
  • Mehrsprachige Aufgaben – starke Abdeckung europäischer Sprachen

Folgende Einschränkungen gelten:

  • Maximale Kontextlänge: 256.000 Token
  • Keine Audio-Unterstützung

API-Nutzung

Chat

from openai import OpenAI

client = OpenAI(
base_url="https://llm.aihosting.mittwald.de/v1",
api_key="sk-dein-api-key",
)

response = client.chat.completions.create(
model="Mistral-Medium-3.5-128B",
messages=[{"role": "user", "content": "Erkläre den Unterschied zwischen TCP und UDP."}],
temperature=0.7,
top_p=0.9,
max_tokens=1024,
)

print(response.choices[0].message.content)

Tool-Calling (Funktionsaufrufe)

from openai import OpenAI

client = OpenAI(base_url="https://llm.aihosting.mittwald.de/v1")

tools = [{
"type": "function",
"function": {
"name": "get_weather",
"description": "Aktuelles Wetter für eine Stadt abrufen",
"parameters": {
"type": "object",
"properties": {"city": {"type": "string"}},
"required": ["city"],
},
},
}]

response = client.chat.completions.create(
model="Mistral-Medium-3.5-128B",
messages=[{"role": "user", "content": "Wie ist das Wetter in Paris?"}],
tools=tools,
tool_choice="auto",
temperature=0.2,
)

if response.choices[0].message.tool_calls:
call = response.choices[0].message.tool_calls[0]
print(f"Funktion: {call.function.name}")
print(f"Argumente: {call.function.arguments}")

Empfohlene Inferenzparameter

Allgemeiner Chat

ParameterWert
temperature0.7
top_p1.0
max_tokens1024–8192 je nach Aufgabe

Tool-Calling / strukturierte Ausgabe

ParameterWert
temperature0.0–0.3
top_p1.0

Nutzungsbedingungen und Lizenzhinweise

Es gelten die allgemeinen Nutzungsbedingungen. Das Modell wird von Mistral AI unter der Apache 2.0-Lizenz bereitgestellt. Die Weiternutzung der generierten Inhalte unterliegt keinen zusätzlichen Einschränkungen.