ToolCallAccuracyEvaluator Klasse
Definition
Wichtig
Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.
Eine IEvaluator Bewertung der Effektivität eines KI-Systems bei der Verwendung der bereitgestellten Tools.
public ref class ToolCallAccuracyEvaluator sealed : Microsoft::Extensions::AI::Evaluation::IEvaluator
[System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")]
public sealed class ToolCallAccuracyEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
public sealed class ToolCallAccuracyEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
[<System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")>]
type ToolCallAccuracyEvaluator = class
interface IEvaluator
type ToolCallAccuracyEvaluator = class
interface IEvaluator
Public NotInheritable Class ToolCallAccuracyEvaluator
Implements IEvaluator
- Vererbung
-
ToolCallAccuracyEvaluator
- Attribute
- Implementiert
Hinweise
ToolCallAccuracyEvaluator misst, wie genau ein KI-System Tools verwendet, indem Toolaufrufe (d. h. s) untersucht werden, FunctionCallContentdie in der bereitgestellten Antwort vorhanden sind, um die Relevanz dieser Toolaufrufe für die Unterhaltung zu bewerten, die Parameterkorrektur für diese Toolaufrufe in Bezug auf die über diese Tools bereitgestellten ToolDefinitionsDefinitionen und die Genauigkeit der Parameterwertextraktion aus der angegebenen Unterhaltung.
Beachten Sie, dass derzeit nur die Auswertung von Aufrufen von Tools unterstützt wird, ToolCallAccuracyEvaluator die als AIFunctionDeclarations definiert sind. Alle anderen AITool Definitionen, die über ToolDefinitions sie bereitgestellt werden, werden ignoriert.
ToolCallAccuracyEvaluator gibt einen BooleanMetric Wert zurück, der eine Bewertung für "Toolaufrufgenauigkeit" enthält. Die Bewertung ist false , wenn der Toolaufruf irrelevant ist oder Informationen enthält, die nicht in der Unterhaltung vorhanden sind und true ob der Toolaufruf mit ordnungsgemäß extrahierten Parametern aus der Unterhaltung relevant ist.
Hinweis:ToolCallAccuracyEvaluator ist ein KI-basierter Evaluator, der ein KI-Modell verwendet, um seine Auswertung durchzuführen. Während die Aufforderung, dass dieser Evaluierungsauswerter verwendet, modellagnostisch ist, kann die Leistung dieser Eingabeaufforderung (und der resultierenden Auswertung) je nach verwendetem Modell variieren und kann besonders schlecht sein, wenn ein kleineres/lokales Modell verwendet wird.
Die Eingabeaufforderung, die verwendet wird, ToolCallAccuracyEvaluator wurde auf die folgenden Modelle getestet (und darauf abgestimmt), dass sie gut funktionieren. Daher ist die Verwendung dieses Evaluators mit einem Modell aus der folgenden Liste wahrscheinlich die besten Ergebnisse. (Das zu verwendende Modell kann über ChatClient.)
GPT-4o
Konstruktoren
| Name | Beschreibung |
|---|---|
| ToolCallAccuracyEvaluator() |
Eine IEvaluator Bewertung der Effektivität eines KI-Systems bei der Verwendung der bereitgestellten Tools. |
Eigenschaften
| Name | Beschreibung |
|---|---|
| EvaluationMetricNames |
Ruft die Names der EvaluationMetricvon diesem IEvaluatorerzeugten s ab. |
| ToolCallAccuracyMetricName |
Ruft die Name der BooleanMetric zurückgegeben von ToolCallAccuracyEvaluator. |
Methoden
| Name | Beschreibung |
|---|---|
| EvaluateAsync(IEnumerable<ChatMessage>, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken) |
Wertet den angegebenen |