Zum Hauptinhalt springen

Erste Schritte mit Dedicated AI Hosting

Nach unserem Setup bekommst du:

  • API Base URL - deinen dedizierten HTTPS-Endpunkt, z. B. https://dein-unternehmen.llm.aihosting.mittwald.de
  • API-Key - ein Bearer-Token zur Authentifizierung deiner Requests

Halte deinen API-Key vertraulich. Speichere ihn in einer Umgebungsvariablen oder einem Secrets-Manager — trage ihn nie direkt im Quellcode ein oder committe ihn in ein Repository. Falls ein Key kompromittiert wird, melde dich bei uns für eine Rotation.

Verfügbare Modelle prüfen

user@local $ curl https://dein-unternehmen.llm.aihosting.mittwald.de/v1/models \
-H "Authorization: Bearer YOUR_API_KEY"

Verwende eine der zurückgegebenen Modell-IDs als YOUR_MODEL_ID.

Erste Anfrage senden

user@local $ curl https://dein-unternehmen.llm.aihosting.mittwald.de/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "YOUR_MODEL_ID",
"messages": [
{"role": "user", "content": "Erkläre Retrieval-Augmented Generation in zwei Sätzen."}
]
}'

Streaming-Antworten

Mit "stream": true empfängst du Tokens direkt beim Generieren, anstatt auf die vollständige Antwort zu warten.

user@local $ curl https://dein-unternehmen.llm.aihosting.mittwald.de/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "YOUR_MODEL_ID",
"stream": true,
"messages": [
{"role": "user", "content": "Erkläre Retrieval-Augmented Generation in zwei Sätzen."}
]
}'

Request-Parameter

Parameterempfehlungen können modellspezifisch sein. Starte mit den SDK-Defaults und tune dann gemäß Modellverhalten und Use Case.

Drop-in-Replacement

Da der Endpunkt OpenAI-kompatibel ist, kannst du ihn als Drop-in-Replacement in Frameworks mit eigener Base-URL nutzen. Eine vollständige Übersicht der unterstützten Endpunkte und Parameter — einschließlich Tool Calling und strukturierter Ausgaben — findest du unter OpenAI-API-Kompatibilität.

Mehrere API-Keys verwalten

Wenn du getrennte Keys pro App/Team, Nutzungsstatistiken oder per-Key-Rate-Limits brauchst, nutze LiteLLM als Self-Hosted-Proxy.