Mistral-Medium-3.5-128B
Beschreibung
„Mistral-Medium-3.5-128B" ist ein Frontier-Sprachmodell von Mistral AI mit 128 Milliarden Parametern. Es unterstützt Text und Tool-Calling über ein Kontextfenster von 256.000 Token und nutzt EAGLE-spekulatives Decoding für schnelle Inferenz.
Geeignet für und unterstützt:
- Textgenerierung innerhalb einer Chat-Completion (Text zu Text)
- Tool-Calling für agentische Workflows
- Langkontext-Dokumentenanalyse und Zusammenfassung
- Mehrsprachige Aufgaben – starke Abdeckung europäischer Sprachen
Folgende Einschränkungen gelten:
- Maximale Kontextlänge: 256.000 Token
- Keine Audio-Unterstützung
API-Nutzung
Chat
- Python
- JavaScript
from openai import OpenAI
client = OpenAI(
base_url="https://llm.aihosting.mittwald.de/v1",
api_key="sk-dein-api-key",
)
response = client.chat.completions.create(
model="Mistral-Medium-3.5-128B",
messages=[{"role": "user", "content": "Erkläre den Unterschied zwischen TCP und UDP."}],
temperature=0.7,
top_p=0.9,
max_tokens=1024,
)
print(response.choices[0].message.content)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://llm.aihosting.mittwald.de/v1",
apiKey: "sk-dein-api-key",
});
const response = await client.chat.completions.create({
model: "Mistral-Medium-3.5-128B",
messages: [{ role: "user", content: "Erkläre den Unterschied zwischen TCP und UDP." }],
temperature: 0.7,
top_p: 0.9,
max_tokens: 1024,
});
console.log(response.choices[0].message.content);
Tool-Calling (Funktionsaufrufe)
from openai import OpenAI
client = OpenAI(base_url="https://llm.aihosting.mittwald.de/v1")
tools = [{
"type": "function",
"function": {
"name": "get_weather",
"description": "Aktuelles Wetter für eine Stadt abrufen",
"parameters": {
"type": "object",
"properties": {"city": {"type": "string"}},
"required": ["city"],
},
},
}]
response = client.chat.completions.create(
model="Mistral-Medium-3.5-128B",
messages=[{"role": "user", "content": "Wie ist das Wetter in Paris?"}],
tools=tools,
tool_choice="auto",
temperature=0.2,
)
if response.choices[0].message.tool_calls:
call = response.choices[0].message.tool_calls[0]
print(f"Funktion: {call.function.name}")
print(f"Argumente: {call.function.arguments}")
Empfohlene Inferenzparameter
Allgemeiner Chat
| Parameter | Wert |
|---|---|
temperature | 0.7 |
top_p | 1.0 |
max_tokens | 1024–8192 je nach Aufgabe |
Tool-Calling / strukturierte Ausgabe
| Parameter | Wert |
|---|---|
temperature | 0.0–0.3 |
top_p | 1.0 |
Nutzungsbedingungen und Lizenzhinweise
Es gelten die allgemeinen Nutzungsbedingungen. Das Modell wird von Mistral AI unter der Apache 2.0-Lizenz bereitgestellt. Die Weiternutzung der generierten Inhalte unterliegt keinen zusätzlichen Einschränkungen.