Azure OpenAI in Microsoft Foundry Models REST API-Referenz (Classic)

Zurzeit wird folgendes angezeigt:Foundry (klassische) Portalversion - Wechseln zur Version für das neue Foundry-Portal

Note

Links in diesem Artikel können Inhalte in der neuen Microsoft Foundry-Dokumentation anstelle der jetzt angezeigten Foundry-Dokumentation (klassisch) öffnen.

In diesem Artikel werden die Datenebenen-Datenebenen-Ableitungs-REST-API-Vorgänge für Azure OpenAI in der 2024-10-21 GA-Version dokumentiert. Informationen zu Chatabschlussen, Einbettungen, Fertigstellungen und allen anderen Vorgängen finden Sie in der offiziellen Azure OpenAI REST-API-Referenz.

API-Spezifikationen

Die Verwaltung und Interaktion mit Azure OpenAI-Modellen und -Ressourcen ist auf drei Haupt-API-Oberflächen verteilt:

  • Steuerebene
  • Datenebene – Autoring
  • Datenebene – Schlussfolgerung

Jede API-Oberfläche/Spezifikation kapselt einen anderen Satz von Azure OpenAI-Funktionen. Jede API hat ihren eigenen einzigartigen Satz von Vorschau- und stabilen/allgemein verfügbaren (GA) API-Releases. Preview-Veröffentlichungen folgen derzeit meist einem monatlichen Rhythmus.

Important

Es gibt jetzt eine neue Vorschau-Inferenz-API. Erfahren Sie mehr in unserem API-Lebenszyklus-Leitfaden.

API Neueste Vorschau-Veröffentlichung Neueste GA-Veröffentlichung Specifications Beschreibung
Steuerungsebene 2025-07-01-preview 2025-06-01 Spezifikationsdateien Die Control Plane API wird für Operationen wie Ressourcenerstellung, Modellbereitstellung und andere Aufgaben des höheren Ressourcenmanagements verwendet. Die Kontrollebene regelt außerdem, was mit Funktionen wie Azure Resource Manager, Bicep, Terraform und Azure CLI möglich ist.
Datenebene v1 preview v1 Spezifikationsdateien Die Data Plane API steuert Inferenz- und Autorenoperationen.

Authentifizierung

Azure OpenAI bietet zwei Methoden zur Authentifizierung an. Du kannst entweder API-Schlüssel oder Microsoft Entra ID verwenden.

  • API-Schlüssel-Authentifizierung: Für diese Art der Authentifizierung müssen alle API-Anfragen den API-Schlüssel im api-key HTTP-Header enthalten. Der Quickstart bietet Anleitungen, wie man mit dieser Art der Authentifizierung Anrufe tätigt.

  • Microsoft Entra ID Authentifizierung: Sie können einen API-Aufruf mit einem Microsoft Entra-Token authentifizieren. Authentifizierungstoken sind in einer Anfrage als Header Authorization enthalten. Der bereitgestellte Token muss zum Beispiel von Bearervorangestellt werden, zum Beispiel Bearer YOUR_AUTH_TOKEN. Sie können unseren Anleitungsleitfaden zum Thema Authentifizierung mit Microsoft Entra ID lesen.

REST-API-Versionierung

Die Service-APIs werden mit dem Abfrageparameter api-version versioniert. Alle Versionen folgen der YYYY-MM-DD Datumsstruktur. Beispiel:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Inferenz der Datenebene

Der Rest dieses Artikels behandelt die Bild- und Audiovorgänge in der GA-Version der Azure OpenAI-Datenebenen-Ableitungsspezifikation. 2024-10-21

Informationen zu den Vorschaubild- und Audiovorgängen finden Sie in der Vorschaubild- und Audio-REST-API-Referenz.

Transkriptionen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

Transkribiert Audio in die Eingabesprache.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja string
url
Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID path Ja string Deployment-ID des Sprach-zu-Text-Modells.

Informationen zu unterstützten Modellen finden Sie unter [/azure/ai-foundry/openai/concepts/models#audio-models].
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Name Erforderlich Typ Beschreibung
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Typ: mehrteilige Formulardaten (multipart/form-data)

Name Typ Beschreibung Erforderlich Vorgabe
Datei string Das Audiodatei-Objekt, das transkribiert werden soll. Ja
Eingabeaufforderung string Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte mit der Audiosprache übereinstimmen. No
Antwortformat audioResponseFormat Definiert das Format der Ausgabe. No
Temperatur number Die Probentemperatur liegt zwischen 0 und 1. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Setzt es auf 0, verwendet das Modell die logaritmische Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht sind. No 0
language string Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1-Format verbessert Genauigkeit und Latenz. No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json audioResponse oder audioVerboseResponse
Textdatei/Klartext string Transkribierter Text im Ausgabeformat (wenn response_format eines von Text, vtt oder srt war).

Beispiele

Example

Erhält transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

Antworten: Statuscode: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Erhält transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Antworten: Statuscode: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Übersetzungen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

Transkribiert und übersetzt Eingabeaudio in englischen Text.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja string
url
Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID path Ja string Deployment-ID des Whisper-Modells, das eingesetzt wurde.

Informationen zu unterstützten Modellen finden Sie unter [/azure/ai-foundry/openai/concepts/models#audio-models].
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Name Erforderlich Typ Beschreibung
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Typ: mehrteilige Formulardaten (multipart/form-data)

Name Typ Beschreibung Erforderlich Vorgabe
Datei string Die Audiodatei zum Übersetzen. Ja
Eingabeaufforderung string Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte auf Englisch sein. No
Antwortformat audioResponseFormat Definiert das Format der Ausgabe. No
Temperatur number Die Probentemperatur liegt zwischen 0 und 1. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Setzt es auf 0, verwendet das Modell die logaritmische Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht sind. No 0

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json audioResponse oder audioVerboseResponse
Textdatei/Klartext string Transkribierter Text im Ausgabeformat (wenn response_format eines von Text, vtt oder srt war).

Beispiele

Example

Erhält englischsprachigen transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Antworten: Statuscode: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Erhält englischsprachigen transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Antworten: Statuscode: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Bildgenerierung

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21

Erzeugt eine Charge von Bildern aus einer Textunterschrift in einer gegebenen Dall-e-Modell-Bereitstellung

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja string
url
Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID path Ja string Deployment-ID des dall-e-Modells, das implementiert wurde.
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Name Erforderlich Typ Beschreibung
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
Eingabeaufforderung string Eine Textbeschreibung des gewünschten Bildes. Die maximale Länge beträgt 4.000 Zeichen. Ja
n Ganzzahl Die Anzahl der zu erzeugenden Bilder. No 1
size imageSize Die Größe der generierten Bilder. No 1024 x 1024
Antwortformat imagesResponseFormat Das Format, in dem die generierten Bilder zurückgegeben werden. No url
user string Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen. No
Qualität imageQuality Die Qualität des erzeugten Bildes. No Standard
Stil imageStyle Der Stil der generierten Bilder. No vivid

Antworten

Statuscode: 200

Beschreibung: Ok

Inhaltstyp Typ Beschreibung
application/json generateImagesResponse

Statuscode: Standard

Beschreibung: Ein Fehler ist aufgetreten.

Inhaltstyp Typ Beschreibung
application/json dalleErrorResponse

Beispiele

Example

Erstellt Bilder mit einem Prompt.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Antworten: Statuscode: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Komponenten

Die schemadefinitionen, die von Chats, Abschlussen, Einbettungen und anderen Textvorgängen verwendet werden, finden Sie in der referenz Azure OpenAI REST API. Die folgenden Schemas unterstützen die Bild- und Audiovorgänge auf dieser Seite.

innerErrorCode

Fehlercodes für das innere Fehlerobjekt.

Beschreibung: Fehlercodes für das innere Fehlerobjekt.

Typ: Zeichenfolge

Standard:

Enum-Name: InnerErrorCode

Enumerationswerte:

Wert Beschreibung
ResponsibleAIPolicyViolation Der Prompt verstieß gegen eine oder weitere Inhaltsfilterregeln.

dalleErrorResponse

Name Typ Beschreibung Erforderlich Vorgabe
Fehler dalleError No

dalleError

Name Typ Beschreibung Erforderlich Vorgabe
param string No
type string No
innerer Fehler dalleInnerError Innerer Fehler mit zusätzlichen Details. No

dalleInnerError

Innerer Fehler mit zusätzlichen Details.

Name Typ Beschreibung Erforderlich Vorgabe
code innerErrorCode Fehlercodes für das innere Fehlerobjekt. No
Content-Filtern-Egebnisse dalleFilterResults Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundenblockliste, falls sie gefiltert wurde und deren ID. No
überarbeitete_Aufforderung string Der Prompt, mit dem das Bild generiert wurde, falls es eine Überarbeitung des Prompts gab. No

contentFilterSeverityResult

Name Typ Beschreibung Erforderlich Vorgabe
gefiltert Boolescher Wert Ja
severity string No

Ergebnis der Inhaltserkennungsfilterung

Name Typ Beschreibung Erforderlich Vorgabe
gefiltert Boolescher Wert Ja
erkannt Boolescher Wert No

dalleFilterResults

Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundenblockliste, falls sie gefiltert wurde und deren ID.

Name Typ Beschreibung Erforderlich Vorgabe
Sexuelle Inhaltsfilter-Schweregrad-Ergebnis No
Gewalt Inhaltsfilter-Schweregrad-Ergebnis No
hate Inhaltsfilter-Schweregrad-Ergebnis No
Selbstverletzung Inhaltsfilter-Schweregrad-Ergebnis No
Profanität Ergebnis des Inhaltsfilters erkannt No
Jailbreak Ergebnis des Inhaltsfilters erkannt No

Audio-Antwort

Übersetzungs- oder Transkriptionsantwort, wenn response_format json war

Name Typ Beschreibung Erforderlich Vorgabe
Text string Übersetzter oder transkribierter Text. Ja

audioVerboseResponse

Übersetzungs- oder Transkriptionsantwort, wenn response_format verbose_json

Name Typ Beschreibung Erforderlich Vorgabe
Text string Übersetzter oder transkribierter Text. Ja
Aufgabe string Art von Audioaufgabe. No
language string Language. No
Dauer number Dauer. No
Segmente array No

audioResponseFormat

Definiert das Format der Ausgabe.

Beschreibung: Definiert das Format der Ausgabe.

Typ: Zeichenfolge

Standard:

Enumerationswerte:

  • Json
  • Text
  • srt
  • verbose_json
  • vtt

imageQuality

Die Qualität des erzeugten Bildes.

Beschreibung: Die Qualität des erzeugten Bildes.

Typ: Zeichenfolge

Standard: Standard

Enum-Name: Qualität

Enumerationswerte:

Wert Beschreibung
Standard Standardqualität erzeugt Bilder mit Standardqualität.
hd HD-Qualität erzeugt Bilder mit feineren Details und größerer Konsistenz im gesamten Bild.

imagesResponseFormat

Das Format, in dem die generierten Bilder zurückgegeben werden.

Beschreibung: Das Format, in dem die generierten Bilder zurückgegeben werden.

Typ: Zeichenfolge

Standard: URL

Enum-Name: ImagesResponseFormat

Enumerationswerte:

Wert Beschreibung
url Die URL, die temporären Zugriff zum Download der generierten Bilder bietet.
b64_json Die erzeugten Bilder werden als base64-kodierte Zeichenkette zurückgegeben.

imageSize

Die Größe der generierten Bilder.

Beschreibung: Die Größe der generierten Bilder.

Typ: Zeichenfolge

Standard: 1024x1024

Enum-Name: Größe

Enumerationswerte:

Wert Beschreibung
1792x1024 Die gewünschte Bildgröße beträgt 1792x1024 Pixel.
1024 x 1792 Die gewünschte Bildgröße beträgt 1024x1792 Pixel.
1024 x 1024 Die gewünschte Bildgröße beträgt 1024x1024 Pixel.

imageStyle

Der Stil der generierten Bilder.

Beschreibung: Der Stil der generierten Bilder.

Typ: Zeichenfolge

Standard: lebendig

Enum-Name: Stil

Enumerationswerte:

Wert Beschreibung
vivid Vivid schafft Bilder, die hyperrealistisch und dramatisch sind.
natural Natürlich erzeugt Bilder, die natürlicher und weniger hyperrealistisch sind.

generateImagesResponse

Name Typ Beschreibung Erforderlich Vorgabe
erstellt Ganzzahl Der Unix-Zeitstempel, als die Operation erstellt wurde. Ja
data array Die Ergebnisdaten der Operation, falls erfolgreich Ja

Nächste Schritte

Erfahren Sie mehr über Modelle und Feinabstimmungen mit der REST-API. Erfahren Sie mehr über die zugrundeliegenden Modelle, die Azure OpenAI antreiben.