Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Zurzeit wird folgendes angezeigt:Foundry (klassische) Portalversion - Wechseln zur Version für das neue Foundry-Portal
Note
Links in diesem Artikel können Inhalte in der neuen Microsoft Foundry-Dokumentation anstelle der jetzt angezeigten Foundry-Dokumentation (klassisch) öffnen.
In diesem Artikel werden die Datenebenen-Datenebenen-Ableitungs-REST-API-Vorgänge für Azure OpenAI in der 2024-10-21 GA-Version dokumentiert. Informationen zu Chatabschlussen, Einbettungen, Fertigstellungen und allen anderen Vorgängen finden Sie in der offiziellen Azure OpenAI REST-API-Referenz.
API-Spezifikationen
Die Verwaltung und Interaktion mit Azure OpenAI-Modellen und -Ressourcen ist auf drei Haupt-API-Oberflächen verteilt:
- Steuerebene
- Datenebene – Autoring
- Datenebene – Schlussfolgerung
Jede API-Oberfläche/Spezifikation kapselt einen anderen Satz von Azure OpenAI-Funktionen. Jede API hat ihren eigenen einzigartigen Satz von Vorschau- und stabilen/allgemein verfügbaren (GA) API-Releases. Preview-Veröffentlichungen folgen derzeit meist einem monatlichen Rhythmus.
Important
Es gibt jetzt eine neue Vorschau-Inferenz-API. Erfahren Sie mehr in unserem API-Lebenszyklus-Leitfaden.
| API | Neueste Vorschau-Veröffentlichung | Neueste GA-Veröffentlichung | Specifications | Beschreibung |
|---|---|---|---|---|
| Steuerungsebene | 2025-07-01-preview |
2025-06-01 |
Spezifikationsdateien | Die Control Plane API wird für Operationen wie Ressourcenerstellung, Modellbereitstellung und andere Aufgaben des höheren Ressourcenmanagements verwendet. Die Kontrollebene regelt außerdem, was mit Funktionen wie Azure Resource Manager, Bicep, Terraform und Azure CLI möglich ist. |
| Datenebene | v1 preview |
v1 |
Spezifikationsdateien | Die Data Plane API steuert Inferenz- und Autorenoperationen. |
Authentifizierung
Azure OpenAI bietet zwei Methoden zur Authentifizierung an. Du kannst entweder API-Schlüssel oder Microsoft Entra ID verwenden.
API-Schlüssel-Authentifizierung: Für diese Art der Authentifizierung müssen alle API-Anfragen den API-Schlüssel im
api-keyHTTP-Header enthalten. Der Quickstart bietet Anleitungen, wie man mit dieser Art der Authentifizierung Anrufe tätigt.Microsoft Entra ID Authentifizierung: Sie können einen API-Aufruf mit einem Microsoft Entra-Token authentifizieren. Authentifizierungstoken sind in einer Anfrage als Header
Authorizationenthalten. Der bereitgestellte Token muss zum Beispiel vonBearervorangestellt werden, zum BeispielBearer YOUR_AUTH_TOKEN. Sie können unseren Anleitungsleitfaden zum Thema Authentifizierung mit Microsoft Entra ID lesen.
REST-API-Versionierung
Die Service-APIs werden mit dem Abfrageparameter api-version versioniert. Alle Versionen folgen der YYYY-MM-DD Datumsstruktur. Beispiel:
POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01
Inferenz der Datenebene
Der Rest dieses Artikels behandelt die Bild- und Audiovorgänge in der GA-Version der Azure OpenAI-Datenebenen-Ableitungsspezifikation. 2024-10-21
Informationen zu den Vorschaubild- und Audiovorgängen finden Sie in der Vorschaubild- und Audio-REST-API-Referenz.
Transkriptionen – Erstellen
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21
Transkribiert Audio in die Eingabesprache.
URI-Parameter
| Name | In | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
| endpoint | path | Ja | string url |
Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com |
| Bereitstellungs-ID | path | Ja | string | Deployment-ID des Sprach-zu-Text-Modells. Informationen zu unterstützten Modellen finden Sie unter [/azure/ai-foundry/openai/concepts/models#audio-models]. |
| API-Version | Anfrage | Ja | string | API-Version |
Anfrage-Kopf
| Name | Erforderlich | Typ | Beschreibung |
|---|---|---|---|
| API-Schlüssel | Richtig | string | Stellen Sie hier den Azure OpenAI API-Schlüssel bereit |
Anforderungstext
Content-Typ: mehrteilige Formulardaten (multipart/form-data)
| Name | Typ | Beschreibung | Erforderlich | Vorgabe |
|---|---|---|---|---|
| Datei | string | Das Audiodatei-Objekt, das transkribiert werden soll. | Ja | |
| Eingabeaufforderung | string | Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte mit der Audiosprache übereinstimmen. | No | |
| Antwortformat | audioResponseFormat | Definiert das Format der Ausgabe. | No | |
| Temperatur | number | Die Probentemperatur liegt zwischen 0 und 1. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Setzt es auf 0, verwendet das Modell die logaritmische Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht sind. | No | 0 |
| language | string | Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1-Format verbessert Genauigkeit und Latenz. | No |
Antworten
Statuscode: 200
Beschreibung: OK
| Inhaltstyp | Typ | Beschreibung |
|---|---|---|
| application/json | audioResponse oder audioVerboseResponse | |
| Textdatei/Klartext | string | Transkribierter Text im Ausgabeformat (wenn response_format eines von Text, vtt oder srt war). |
Beispiele
Example
Erhält transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21
Antworten: Statuscode: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Example
Erhält transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Antworten: Statuscode: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Übersetzungen – Erstellen
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21
Transkribiert und übersetzt Eingabeaudio in englischen Text.
URI-Parameter
| Name | In | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
| endpoint | path | Ja | string url |
Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com |
| Bereitstellungs-ID | path | Ja | string | Deployment-ID des Whisper-Modells, das eingesetzt wurde. Informationen zu unterstützten Modellen finden Sie unter [/azure/ai-foundry/openai/concepts/models#audio-models]. |
| API-Version | Anfrage | Ja | string | API-Version |
Anfrage-Kopf
| Name | Erforderlich | Typ | Beschreibung |
|---|---|---|---|
| API-Schlüssel | Richtig | string | Stellen Sie hier den Azure OpenAI API-Schlüssel bereit |
Anforderungstext
Content-Typ: mehrteilige Formulardaten (multipart/form-data)
| Name | Typ | Beschreibung | Erforderlich | Vorgabe |
|---|---|---|---|---|
| Datei | string | Die Audiodatei zum Übersetzen. | Ja | |
| Eingabeaufforderung | string | Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte auf Englisch sein. | No | |
| Antwortformat | audioResponseFormat | Definiert das Format der Ausgabe. | No | |
| Temperatur | number | Die Probentemperatur liegt zwischen 0 und 1. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Setzt es auf 0, verwendet das Modell die logaritmische Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht sind. | No | 0 |
Antworten
Statuscode: 200
Beschreibung: OK
| Inhaltstyp | Typ | Beschreibung |
|---|---|---|
| application/json | audioResponse oder audioVerboseResponse | |
| Textdatei/Klartext | string | Transkribierter Text im Ausgabeformat (wenn response_format eines von Text, vtt oder srt war). |
Beispiele
Example
Erhält englischsprachigen transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Antworten: Statuscode: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Example
Erhält englischsprachigen transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Antworten: Statuscode: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Bildgenerierung
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21
Erzeugt eine Charge von Bildern aus einer Textunterschrift in einer gegebenen Dall-e-Modell-Bereitstellung
URI-Parameter
| Name | In | Erforderlich | Typ | Beschreibung |
|---|---|---|---|---|
| endpoint | path | Ja | string url |
Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com |
| Bereitstellungs-ID | path | Ja | string | Deployment-ID des dall-e-Modells, das implementiert wurde. |
| API-Version | Anfrage | Ja | string | API-Version |
Anfrage-Kopf
| Name | Erforderlich | Typ | Beschreibung |
|---|---|---|---|
| API-Schlüssel | Richtig | string | Stellen Sie hier den Azure OpenAI API-Schlüssel bereit |
Anforderungstext
Content-Type: application/json
| Name | Typ | Beschreibung | Erforderlich | Vorgabe |
|---|---|---|---|---|
| Eingabeaufforderung | string | Eine Textbeschreibung des gewünschten Bildes. Die maximale Länge beträgt 4.000 Zeichen. | Ja | |
| n | Ganzzahl | Die Anzahl der zu erzeugenden Bilder. | No | 1 |
| size | imageSize | Die Größe der generierten Bilder. | No | 1024 x 1024 |
| Antwortformat | imagesResponseFormat | Das Format, in dem die generierten Bilder zurückgegeben werden. | No | url |
| user | string | Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen. | No | |
| Qualität | imageQuality | Die Qualität des erzeugten Bildes. | No | Standard |
| Stil | imageStyle | Der Stil der generierten Bilder. | No | vivid |
Antworten
Statuscode: 200
Beschreibung: Ok
| Inhaltstyp | Typ | Beschreibung |
|---|---|---|
| application/json | generateImagesResponse |
Statuscode: Standard
Beschreibung: Ein Fehler ist aufgetreten.
| Inhaltstyp | Typ | Beschreibung |
|---|---|---|
| application/json | dalleErrorResponse |
Beispiele
Example
Erstellt Bilder mit einem Prompt.
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21
{
"prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
"n": 1,
"style": "natural",
"quality": "standard"
}
Antworten: Statuscode: 200
{
"body": {
"created": 1698342300,
"data": [
{
"revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
"prompt_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
},
"profanity": {
"detected": false,
"filtered": false
}
},
"url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
"content_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
}
}
}
]
}
}
Komponenten
Die schemadefinitionen, die von Chats, Abschlussen, Einbettungen und anderen Textvorgängen verwendet werden, finden Sie in der referenz Azure OpenAI REST API. Die folgenden Schemas unterstützen die Bild- und Audiovorgänge auf dieser Seite.
innerErrorCode
Fehlercodes für das innere Fehlerobjekt.
Beschreibung: Fehlercodes für das innere Fehlerobjekt.
Typ: Zeichenfolge
Standard:
Enum-Name: InnerErrorCode
Enumerationswerte:
| Wert | Beschreibung |
|---|---|
| ResponsibleAIPolicyViolation | Der Prompt verstieß gegen eine oder weitere Inhaltsfilterregeln. |
dalleErrorResponse
| Name | Typ | Beschreibung | Erforderlich | Vorgabe |
|---|---|---|---|---|
| Fehler | dalleError | No |
dalleError
| Name | Typ | Beschreibung | Erforderlich | Vorgabe |
|---|---|---|---|---|
| param | string | No | ||
| type | string | No | ||
| innerer Fehler | dalleInnerError | Innerer Fehler mit zusätzlichen Details. | No |
dalleInnerError
Innerer Fehler mit zusätzlichen Details.
| Name | Typ | Beschreibung | Erforderlich | Vorgabe |
|---|---|---|---|---|
| code | innerErrorCode | Fehlercodes für das innere Fehlerobjekt. | No | |
| Content-Filtern-Egebnisse | dalleFilterResults | Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundenblockliste, falls sie gefiltert wurde und deren ID. | No | |
| überarbeitete_Aufforderung | string | Der Prompt, mit dem das Bild generiert wurde, falls es eine Überarbeitung des Prompts gab. | No |
contentFilterSeverityResult
| Name | Typ | Beschreibung | Erforderlich | Vorgabe |
|---|---|---|---|---|
| gefiltert | Boolescher Wert | Ja | ||
| severity | string | No |
Ergebnis der Inhaltserkennungsfilterung
| Name | Typ | Beschreibung | Erforderlich | Vorgabe |
|---|---|---|---|---|
| gefiltert | Boolescher Wert | Ja | ||
| erkannt | Boolescher Wert | No |
dalleFilterResults
Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundenblockliste, falls sie gefiltert wurde und deren ID.
| Name | Typ | Beschreibung | Erforderlich | Vorgabe |
|---|---|---|---|---|
| Sexuelle | Inhaltsfilter-Schweregrad-Ergebnis | No | ||
| Gewalt | Inhaltsfilter-Schweregrad-Ergebnis | No | ||
| hate | Inhaltsfilter-Schweregrad-Ergebnis | No | ||
| Selbstverletzung | Inhaltsfilter-Schweregrad-Ergebnis | No | ||
| Profanität | Ergebnis des Inhaltsfilters erkannt | No | ||
| Jailbreak | Ergebnis des Inhaltsfilters erkannt | No |
Audio-Antwort
Übersetzungs- oder Transkriptionsantwort, wenn response_format json war
| Name | Typ | Beschreibung | Erforderlich | Vorgabe |
|---|---|---|---|---|
| Text | string | Übersetzter oder transkribierter Text. | Ja |
audioVerboseResponse
Übersetzungs- oder Transkriptionsantwort, wenn response_format verbose_json
| Name | Typ | Beschreibung | Erforderlich | Vorgabe |
|---|---|---|---|---|
| Text | string | Übersetzter oder transkribierter Text. | Ja | |
| Aufgabe | string | Art von Audioaufgabe. | No | |
| language | string | Language. | No | |
| Dauer | number | Dauer. | No | |
| Segmente | array | No |
audioResponseFormat
Definiert das Format der Ausgabe.
Beschreibung: Definiert das Format der Ausgabe.
Typ: Zeichenfolge
Standard:
Enumerationswerte:
- Json
- Text
- srt
- verbose_json
- vtt
imageQuality
Die Qualität des erzeugten Bildes.
Beschreibung: Die Qualität des erzeugten Bildes.
Typ: Zeichenfolge
Standard: Standard
Enum-Name: Qualität
Enumerationswerte:
| Wert | Beschreibung |
|---|---|
| Standard | Standardqualität erzeugt Bilder mit Standardqualität. |
| hd | HD-Qualität erzeugt Bilder mit feineren Details und größerer Konsistenz im gesamten Bild. |
imagesResponseFormat
Das Format, in dem die generierten Bilder zurückgegeben werden.
Beschreibung: Das Format, in dem die generierten Bilder zurückgegeben werden.
Typ: Zeichenfolge
Standard: URL
Enum-Name: ImagesResponseFormat
Enumerationswerte:
| Wert | Beschreibung |
|---|---|
| url | Die URL, die temporären Zugriff zum Download der generierten Bilder bietet. |
| b64_json | Die erzeugten Bilder werden als base64-kodierte Zeichenkette zurückgegeben. |
imageSize
Die Größe der generierten Bilder.
Beschreibung: Die Größe der generierten Bilder.
Typ: Zeichenfolge
Standard: 1024x1024
Enum-Name: Größe
Enumerationswerte:
| Wert | Beschreibung |
|---|---|
| 1792x1024 | Die gewünschte Bildgröße beträgt 1792x1024 Pixel. |
| 1024 x 1792 | Die gewünschte Bildgröße beträgt 1024x1792 Pixel. |
| 1024 x 1024 | Die gewünschte Bildgröße beträgt 1024x1024 Pixel. |
imageStyle
Der Stil der generierten Bilder.
Beschreibung: Der Stil der generierten Bilder.
Typ: Zeichenfolge
Standard: lebendig
Enum-Name: Stil
Enumerationswerte:
| Wert | Beschreibung |
|---|---|
| vivid | Vivid schafft Bilder, die hyperrealistisch und dramatisch sind. |
| natural | Natürlich erzeugt Bilder, die natürlicher und weniger hyperrealistisch sind. |
generateImagesResponse
| Name | Typ | Beschreibung | Erforderlich | Vorgabe |
|---|---|---|---|---|
| erstellt | Ganzzahl | Der Unix-Zeitstempel, als die Operation erstellt wurde. | Ja | |
| data | array | Die Ergebnisdaten der Operation, falls erfolgreich | Ja |
Nächste Schritte
Erfahren Sie mehr über Modelle und Feinabstimmungen mit der REST-API. Erfahren Sie mehr über die zugrundeliegenden Modelle, die Azure OpenAI antreiben.