Azure OpenAI in Microsoft Foundry Models REST API-Referenz (Classic)

Zurzeit wird folgendes angezeigt:Foundry (klassische) Portalversion - Wechseln zur Version für das neue Foundry-Portal

Note

Links in diesem Artikel können Inhalte in der neuen Microsoft Foundry-Dokumentation anstelle der jetzt angezeigten Foundry-Dokumentation (klassisch) öffnen.

In diesem Artikel werden die Datenebenen-Datenebenen-Ableitungs-REST-API-Vorgänge für Azure OpenAI in der 2024-10-21 GA-Version dokumentiert. Informationen zu Chatabschlussen, Einbettungen, Fertigstellungen und allen anderen Vorgängen finden Sie in der offiziellen Azure OpenAI REST-API-Referenz.

API-Spezifikationen

Die Verwaltung und Interaktion mit Azure OpenAI-Modellen und -Ressourcen ist auf drei Haupt-API-Oberflächen verteilt:

Steuerebene
Datenebene – Autoring
Datenebene – Schlussfolgerung

Jede API-Oberfläche/Spezifikation kapselt einen anderen Satz von Azure OpenAI-Funktionen. Jede API hat ihren eigenen einzigartigen Satz von Vorschau- und stabilen/allgemein verfügbaren (GA) API-Releases. Preview-Veröffentlichungen folgen derzeit meist einem monatlichen Rhythmus.

Important

Es gibt jetzt eine neue Vorschau-Inferenz-API. Erfahren Sie mehr in unserem API-Lebenszyklus-Leitfaden.

API	Neueste Vorschau-Veröffentlichung	Neueste GA-Veröffentlichung	Specifications	Beschreibung
Steuerungsebene	`2025-07-01-preview`	`2025-06-01`	Spezifikationsdateien	Die Control Plane API wird für Operationen wie Ressourcenerstellung, Modellbereitstellung und andere Aufgaben des höheren Ressourcenmanagements verwendet. Die Kontrollebene regelt außerdem, was mit Funktionen wie Azure Resource Manager, Bicep, Terraform und Azure CLI möglich ist.
Datenebene	`v1 preview`	`v1`	Spezifikationsdateien	Die Data Plane API steuert Inferenz- und Autorenoperationen.

Authentifizierung

Azure OpenAI bietet zwei Methoden zur Authentifizierung an. Du kannst entweder API-Schlüssel oder Microsoft Entra ID verwenden.

API-Schlüssel-Authentifizierung: Für diese Art der Authentifizierung müssen alle API-Anfragen den API-Schlüssel im api-key HTTP-Header enthalten. Der Quickstart bietet Anleitungen, wie man mit dieser Art der Authentifizierung Anrufe tätigt.
Microsoft Entra ID Authentifizierung: Sie können einen API-Aufruf mit einem Microsoft Entra-Token authentifizieren. Authentifizierungstoken sind in einer Anfrage als Header Authorization enthalten. Der bereitgestellte Token muss zum Beispiel von Bearervorangestellt werden, zum Beispiel Bearer YOUR_AUTH_TOKEN. Sie können unseren Anleitungsleitfaden zum Thema Authentifizierung mit Microsoft Entra ID lesen.

REST-API-Versionierung

Die Service-APIs werden mit dem Abfrageparameter api-version versioniert. Alle Versionen folgen der YYYY-MM-DD Datumsstruktur. Beispiel:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Inferenz der Datenebene

Der Rest dieses Artikels behandelt die Bild- und Audiovorgänge in der GA-Version der Azure OpenAI-Datenebenen-Ableitungsspezifikation. 2024-10-21

Informationen zu den Vorschaubild- und Audiovorgängen finden Sie in der Vorschaubild- und Audio-REST-API-Referenz.

Transkriptionen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

Transkribiert Audio in die Eingabesprache.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	string url	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID	path	Ja	string	Deployment-ID des Sprach-zu-Text-Modells. Informationen zu unterstützten Modellen finden Sie unter [/azure/ai-foundry/openai/concepts/models#audio-models].
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Name	Erforderlich	Typ	Beschreibung
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Typ: mehrteilige Formulardaten (multipart/form-data)

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Datei	string	Das Audiodatei-Objekt, das transkribiert werden soll.	Ja
Eingabeaufforderung	string	Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte mit der Audiosprache übereinstimmen.	No
Antwortformat	audioResponseFormat	Definiert das Format der Ausgabe.	No
Temperatur	number	Die Probentemperatur liegt zwischen 0 und 1. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Setzt es auf 0, verwendet das Modell die logaritmische Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht sind.	No	0
language	string	Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1-Format verbessert Genauigkeit und Latenz.	No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	audioResponse oder audioVerboseResponse
Textdatei/Klartext	string	Transkribierter Text im Ausgabeformat (wenn response_format eines von Text, vtt oder srt war).

Beispiele

Example

Erhält transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

Antworten: Statuscode: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Erhält transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Antworten: Statuscode: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Übersetzungen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

Transkribiert und übersetzt Eingabeaudio in englischen Text.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	string url	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID	path	Ja	string	Deployment-ID des Whisper-Modells, das eingesetzt wurde. Informationen zu unterstützten Modellen finden Sie unter [/azure/ai-foundry/openai/concepts/models#audio-models].
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Name	Erforderlich	Typ	Beschreibung
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Typ: mehrteilige Formulardaten (multipart/form-data)

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Datei	string	Die Audiodatei zum Übersetzen.	Ja
Eingabeaufforderung	string	Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte auf Englisch sein.	No
Antwortformat	audioResponseFormat	Definiert das Format der Ausgabe.	No
Temperatur	number	Die Probentemperatur liegt zwischen 0 und 1. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Setzt es auf 0, verwendet das Modell die logaritmische Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht sind.	No	0

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	audioResponse oder audioVerboseResponse
Textdatei/Klartext	string	Transkribierter Text im Ausgabeformat (wenn response_format eines von Text, vtt oder srt war).

Beispiele

Example

Erhält englischsprachigen transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Antworten: Statuscode: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Erhält englischsprachigen transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Antworten: Statuscode: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Bildgenerierung

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21

Erzeugt eine Charge von Bildern aus einer Textunterschrift in einer gegebenen Dall-e-Modell-Bereitstellung

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	string url	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID	path	Ja	string	Deployment-ID des dall-e-Modells, das implementiert wurde.
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Name	Erforderlich	Typ	Beschreibung
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Eingabeaufforderung	string	Eine Textbeschreibung des gewünschten Bildes. Die maximale Länge beträgt 4.000 Zeichen.	Ja
n	Ganzzahl	Die Anzahl der zu erzeugenden Bilder.	No	1
size	imageSize	Die Größe der generierten Bilder.	No	1024 x 1024
Antwortformat	imagesResponseFormat	Das Format, in dem die generierten Bilder zurückgegeben werden.	No	url
user	string	Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen.	No
Qualität	imageQuality	Die Qualität des erzeugten Bildes.	No	Standard
Stil	imageStyle	Der Stil der generierten Bilder.	No	vivid

Antworten

Statuscode: 200

Beschreibung: Ok

Inhaltstyp	Typ	Beschreibung
application/json	generateImagesResponse

Statuscode: Standard

Beschreibung: Ein Fehler ist aufgetreten.

Inhaltstyp	Typ	Beschreibung
application/json	dalleErrorResponse

Beispiele

Example

Erstellt Bilder mit einem Prompt.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Antworten: Statuscode: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Komponenten

Die schemadefinitionen, die von Chats, Abschlussen, Einbettungen und anderen Textvorgängen verwendet werden, finden Sie in der referenz Azure OpenAI REST API. Die folgenden Schemas unterstützen die Bild- und Audiovorgänge auf dieser Seite.

innerErrorCode

Fehlercodes für das innere Fehlerobjekt.

Beschreibung: Fehlercodes für das innere Fehlerobjekt.

Typ: Zeichenfolge

Standard:

Enum-Name: InnerErrorCode

Enumerationswerte:

Wert	Beschreibung
ResponsibleAIPolicyViolation	Der Prompt verstieß gegen eine oder weitere Inhaltsfilterregeln.

dalleErrorResponse

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Fehler	dalleError		No

dalleError

Name	Typ	Beschreibung	Erforderlich
param	string		No
type	string		No
innerer Fehler	dalleInnerError	Innerer Fehler mit zusätzlichen Details.	No

dalleInnerError

Innerer Fehler mit zusätzlichen Details.

Name	Typ	Beschreibung	Erforderlich
code	innerErrorCode	Fehlercodes für das innere Fehlerobjekt.	No
Content-Filtern-Egebnisse	dalleFilterResults	Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundenblockliste, falls sie gefiltert wurde und deren ID.	No
überarbeitete_Aufforderung	string	Der Prompt, mit dem das Bild generiert wurde, falls es eine Überarbeitung des Prompts gab.	No

contentFilterSeverityResult

Name	Typ	Beschreibung	Erforderlich	Vorgabe
gefiltert	Boolescher Wert		Ja
severity	string		No

Ergebnis der Inhaltserkennungsfilterung

Name	Typ	Beschreibung	Erforderlich	Vorgabe
gefiltert	Boolescher Wert		Ja
erkannt	Boolescher Wert		No

dalleFilterResults

Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundenblockliste, falls sie gefiltert wurde und deren ID.

Name	Typ	Erforderlich
Sexuelle	Inhaltsfilter-Schweregrad-Ergebnis	No
Gewalt	Inhaltsfilter-Schweregrad-Ergebnis	No
hate	Inhaltsfilter-Schweregrad-Ergebnis	No
Selbstverletzung	Inhaltsfilter-Schweregrad-Ergebnis	No
Profanität	Ergebnis des Inhaltsfilters erkannt	No
Jailbreak	Ergebnis des Inhaltsfilters erkannt	No

Audio-Antwort

Übersetzungs- oder Transkriptionsantwort, wenn response_format json war

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Text	string	Übersetzter oder transkribierter Text.	Ja

audioVerboseResponse

Übersetzungs- oder Transkriptionsantwort, wenn response_format verbose_json

Name	Typ	Beschreibung	Erforderlich
Text	string	Übersetzter oder transkribierter Text.	Ja
Aufgabe	string	Art von Audioaufgabe.	No
language	string	Language.	No
Dauer	number	Dauer.	No
Segmente	array		No

audioResponseFormat

Definiert das Format der Ausgabe.

Beschreibung: Definiert das Format der Ausgabe.

Typ: Zeichenfolge

Standard:

Enumerationswerte:

Json
Text
srt
verbose_json
vtt

imageQuality

Die Qualität des erzeugten Bildes.

Beschreibung: Die Qualität des erzeugten Bildes.

Typ: Zeichenfolge

Standard: Standard

Enum-Name: Qualität

Enumerationswerte:

Wert	Beschreibung
Standard	Standardqualität erzeugt Bilder mit Standardqualität.
hd	HD-Qualität erzeugt Bilder mit feineren Details und größerer Konsistenz im gesamten Bild.

imagesResponseFormat

Das Format, in dem die generierten Bilder zurückgegeben werden.

Beschreibung: Das Format, in dem die generierten Bilder zurückgegeben werden.

Typ: Zeichenfolge

Standard: URL

Enum-Name: ImagesResponseFormat

Enumerationswerte:

Wert	Beschreibung
url	Die URL, die temporären Zugriff zum Download der generierten Bilder bietet.
b64_json	Die erzeugten Bilder werden als base64-kodierte Zeichenkette zurückgegeben.

imageSize

Die Größe der generierten Bilder.

Beschreibung: Die Größe der generierten Bilder.

Typ: Zeichenfolge

Standard: 1024x1024

Enum-Name: Größe

Enumerationswerte:

Wert	Beschreibung
1792x1024	Die gewünschte Bildgröße beträgt 1792x1024 Pixel.
1024 x 1792	Die gewünschte Bildgröße beträgt 1024x1792 Pixel.
1024 x 1024	Die gewünschte Bildgröße beträgt 1024x1024 Pixel.

imageStyle

Der Stil der generierten Bilder.

Beschreibung: Der Stil der generierten Bilder.

Typ: Zeichenfolge

Standard: lebendig

Enum-Name: Stil

Enumerationswerte:

Wert	Beschreibung
vivid	Vivid schafft Bilder, die hyperrealistisch und dramatisch sind.
natural	Natürlich erzeugt Bilder, die natürlicher und weniger hyperrealistisch sind.

generateImagesResponse

Name	Typ	Beschreibung	Erforderlich	Vorgabe
erstellt	Ganzzahl	Der Unix-Zeitstempel, als die Operation erstellt wurde.	Ja
data	array	Die Ergebnisdaten der Operation, falls erfolgreich	Ja

Nächste Schritte

Erfahren Sie mehr über Modelle und Feinabstimmungen mit der REST-API. Erfahren Sie mehr über die zugrundeliegenden Modelle, die Azure OpenAI antreiben.

Feedback

War diese Seite hilfreich?

Last updated on 2026-06-24

Azure OpenAI in Microsoft Foundry Models REST API-Referenz (Classic)

API-Spezifikationen

Authentifizierung

REST-API-Versionierung

Inferenz der Datenebene

Transkriptionen – Erstellen

URI-Parameter

Anfrage-Kopf

Anforderungstext

Antworten

Beispiele

Example

Example

Übersetzungen – Erstellen

URI-Parameter

Anfrage-Kopf

Anforderungstext

Antworten

Beispiele

Example

Example

Bildgenerierung

URI-Parameter

Anfrage-Kopf

Anforderungstext

Antworten

Beispiele

Example

Komponenten

innerErrorCode

dalleErrorResponse

dalleError

dalleInnerError

contentFilterSeverityResult

Ergebnis der Inhaltserkennungsfilterung

dalleFilterResults

Audio-Antwort

audioVerboseResponse

audioResponseFormat

imageQuality

imagesResponseFormat

imageSize

imageStyle

generateImagesResponse

Nächste Schritte

Feedback

Zusätzliche Ressourcen