RelevanceEvaluator Klasse

Definition

Eine IEvaluator , die die "Relevanz" einer Antwort auswertet, die von einem KI-Modell erzeugt wird.

public ref class RelevanceEvaluator sealed : Microsoft::Extensions::AI::Evaluation::IEvaluator
public sealed class RelevanceEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
type RelevanceEvaluator = class
    interface IEvaluator
Public NotInheritable Class RelevanceEvaluator
Implements IEvaluator
Vererbung
RelevanceEvaluator
Implementiert

Hinweise

RelevanceEvaluator misst die Leistung eines KI-Systems beim Verständnis der Eingabe und beim Generieren kontextbezogener Antworten. Es wird ein NumericMetric Wert zurückgegeben, der eine Bewertung für "Relevanz" enthält. Die Punktzahl ist eine Zahl zwischen 1 und 5, wobei 1 eine schlechte Bewertung angibt, und 5, die eine hervorragende Bewertung anzeigt.

Hohe Relevanzbewertungen bedeuten das Verständnis des KI-Systems über die Eingabe und ihre Fähigkeit, kohärente und kontextbezogene Ergebnisse zu erzeugen. Umgekehrt deuten niedrige Relevanzbewertungen darauf hin, dass generierte Antworten möglicherweise außerhalb des Themas stehen, im Kontext fehlen oder nicht ausreichend für die Adressierung der vom Benutzer vorgesehenen Abfragen sind.

Hinweis:RelevanceEvaluator ist ein KI-basierter Evaluator, der ein KI-Modell verwendet, um seine Auswertung durchzuführen. Während die Aufforderung, dass dieser Evaluierungsauswerter verwendet, modellagnostisch ist, kann die Leistung dieser Eingabeaufforderung (und der resultierenden Auswertung) je nach verwendetem Modell variieren und kann besonders schlecht sein, wenn ein kleineres/lokales Modell verwendet wird.

Die Eingabeaufforderung, die verwendet wird, RelevanceEvaluator wurde auf die folgenden Modelle getestet (und darauf abgestimmt), dass sie gut funktionieren. Daher ist die Verwendung dieses Evaluators mit einem Modell aus der folgenden Liste wahrscheinlich die besten Ergebnisse. (Das zu verwendende Modell kann über ChatClient.)

GPT-4o

Konstruktoren

Name Beschreibung
RelevanceEvaluator()

Eine IEvaluator , die die "Relevanz" einer Antwort auswertet, die von einem KI-Modell erzeugt wird.

Eigenschaften

Name Beschreibung
EvaluationMetricNames

Ruft die Names der EvaluationMetricvon diesem IEvaluatorerzeugten s ab.

RelevanceMetricName

Ruft die Name der NumericMetric zurückgegeben von RelevanceEvaluator.

Methoden

Name Beschreibung
EvaluateAsync(IEnumerable<ChatMessage>, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Wertet den angegebenen modelResponse Wert aus und gibt ein enthaltenes oder EvaluationResultmehrere EvaluationMetric s zurück.

Erweiterungsmethoden

Name Beschreibung
EvaluateAsync(IEvaluator, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Wertet den angegebenen modelResponse Wert aus und gibt ein enthaltenes oder EvaluationResultmehrere EvaluationMetric s zurück.

EvaluateAsync(IEvaluator, ChatMessage, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Wertet den angegebenen modelResponse Wert aus und gibt ein enthaltenes oder EvaluationResultmehrere EvaluationMetric s zurück.

EvaluateAsync(IEvaluator, ChatMessage, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Wertet den angegebenen modelResponse Wert aus und gibt ein enthaltenes oder EvaluationResultmehrere EvaluationMetric s zurück.

EvaluateAsync(IEvaluator, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Wertet den angegebenen modelResponse Wert aus und gibt ein enthaltenes oder EvaluationResultmehrere EvaluationMetric s zurück.

EvaluateAsync(IEvaluator, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Wertet den angegebenen modelResponse Wert aus und gibt ein enthaltenes oder EvaluationResultmehrere EvaluationMetric s zurück.

EvaluateAsync(IEvaluator, String, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Wertet den angegebenen modelResponse Wert aus und gibt ein enthaltenes oder EvaluationResultmehrere EvaluationMetric s zurück.

Gilt für: