Abweichungen und Limitierungen

Abweichungen zur OpenAI-API

Obwohl unsere API kompatibel zur OpenAI-API ist, gibt es einige Einschränkungen:

Nur ausgewählte Endpunkte sind implementiert (siehe Liste)
Einige Parameter wie n, logprobs, functions (je nach Modell) sind nicht verfügbar
Vision-Input erfolgt derzeit nur über Base64, nicht über URLs
Der Parameter response_format akzeptiert ausschließlich den Wert "text". Die OpenAI-Variante {"type": "json_object"} wird nicht unterstützt und stillschweigend ignoriert. Um zuverlässig JSON-Ausgaben zu erhalten, formuliere die Anforderung direkt im System-Prompt oder in der Nutzernachricht (z. B. „Antworte ausschließlich mit einem validen JSON-Objekt.").

Limitierungen

Alle Anfragen unterliegen einem RateLimit, um eine faire und gleichmäßige Nutzung und Verfügbarkeit der Modelle für alle Nutzer zu gewährleisten. Die geltenden Limits richten sich nach dem gebuchten Tarif. Die jeweiligen Werte sind den Preisinformationen zu entnehmen.

Alle Modelle unterliegen zudem modellspezifischen Limitierungen. Diese umfassen immer die erlaubte Context-Länge gemessen an der Anzahl an übermittelten Tokens. Bei Vision-fähigen Modellen zur Verarbeitung von Bildern können je Anfrage und somit im gesamten übermittelten Context nur eine limitierte Anzahl an Bildern übertragen werden. Dies betrifft somit alle in der gesamten Chat-Historie einer Anfrage übermittelten Bilder.

Anfrage-Timeout

Jede Anfrage darf maximal 1.800 Sekunden (30 Minuten) dauern. Anfragen, die diesen Zeitraum überschreiten, werden abgebrochen und liefern einen 408 Request Timeout-Fehler zurück. Bei umfangreichen Aufgaben wie der FAQ-Generierung mit großen Eingaben empfiehlt es sich, die Arbeit in kleinere, unabhängige Anfragen aufzuteilen.

Ausgabe-Token-Limit

Es gibt kein künstliches Limit für Output-Tokens unterhalb des Kontextfensters des jeweiligen Modells. Der Parameter max_tokens kann auf jeden Wert bis zur vollen Kontextlänge des Modells abzüglich der gesendeten Eingabe-Tokens gesetzt werden. Die maximale Kontextlänge jedes Modells ist auf der jeweiligen Modellseite aufgeführt.

System-Prompt-Unterstützung

Alle Chat-Modelle unterstützen den Nachrichtentyp role: "system". Ein System-Prompt kann als erstes Element im messages-Array mit "role": "system" übergeben werden.

Gegenwärtig besteht keine Möglichkeit, Bilder zu generieren. Eine entsprechende API-Route existiert dementsprechend nicht.

Abweichungen zur OpenAI-API​

Limitierungen​

Anfrage-Timeout​

Ausgabe-Token-Limit​

System-Prompt-Unterstützung​

Abweichungen zur OpenAI-API

Limitierungen

Anfrage-Timeout

Ausgabe-Token-Limit

System-Prompt-Unterstützung