Zum Hauptinhalt springen

Qwen3-Embedding-8B

Beschreibung

Das Qwen3-Embedding-Modell von Alibaba ist für das Erstellen von Embeddings konzipiert, die für ein RAG-System (Retrieval augmented generation) unverzichtbar sind. Mit diesem Modell ist keine Chat-Interaktion möglich. Es wird benötigt, um Dokumente und Texte in einzelne Vektoren umzuwandeln, die von der anwendenden Applikation in einer Vektordatenbank gespeichert werden und damit eine semantische Suche ermöglichen. Die Stärke dieses Modells liegt in seiner Unterstützung von über 100 Sprachen bei gleichzeitig hoher Performance.

Folgende Limitierungen gelten:

  • Maximale Context-Länge: 32.768 Token
  • Embedding Dimension: 4.096
  • dimensions-Parameter zur dynamischen Projizierung auf eine geringere Dimension wird nicht unterstützt

Es wird empfohlen, Embeddings für Suchanfragen mit folgendem Template zu formatieren:

Instruct: {task_description}
Query: {query}

Hierbei sollte {query} die individuelle Suchanfrage in einem Satz abbilden und {task_description} die Aufgabe beschreiben, beispielsweise:

task = 'Given a web search query, retrieve relevant passages that answer the query'
query = 'Explain gravity'

Nutzungsbedingungen und Lizenzhinweise

Es gelten die allgemeinen Nutzungsbedinungen. Das Modell wird von Alibaba unter der Apache 2.0-Lizenz angeboten, eine Weiternutzung der generierten Inhalte unterliegt keiner zusätzlichen Restriktion.