Indexes - Analyze

Viene illustrato il modo in cui un analizzatore suddivide il testo in token.

POST {endpoint}/indexes('{indexName}')/search.analyze?api-version=2026-04-01

Parametri dell'URI

Nome In Necessario Tipo Descrizione
endpoint
path True

string (uri)

URL dell'endpoint del servizio di ricerca.

indexName
path True

string

Nome dell'indice.

api-version
query True

string

minLength: 1

Versione dell'API da usare per questa operazione.

Intestazione della richiesta

Nome Necessario Tipo Descrizione
Accept

Accept

L'intestazione Accetta.

x-ms-client-request-id

string (uuid)

Identificatore di stringa opaco, univoco a livello globale e generato dal client per la richiesta.

Corpo della richiesta

Nome Necessario Tipo Descrizione
text True

string

Testo da suddividere in token.

analyzer

LexicalAnalyzerName

Nome dell'analizzatore da usare per interrompere il testo specificato. Se questo parametro non è specificato, è necessario specificare invece un tokenizer. I parametri del tokenizer e dell'analizzatore si escludono a vicenda.

charFilters

CharFilterName[]

Elenco facoltativo di filtri di caratteri da utilizzare quando si interrompe il testo specificato. Questo parametro può essere impostato solo quando si usa il parametro tokenizer.

normalizer

LexicalNormalizerName

Nome del normalizzatore da utilizzare per normalizzare il testo specificato.

tokenFilters

TokenFilterName[]

Elenco facoltativo di filtri di token da usare quando si interrompe il testo specificato. Questo parametro può essere impostato solo quando si usa il parametro tokenizer.

tokenizer

LexicalTokenizerName

Nome del tokenizer da usare per interrompere il testo specificato. Se questo parametro non è specificato, è necessario specificare invece un analizzatore. I parametri del tokenizer e dell'analizzatore si escludono a vicenda.

Risposte

Nome Tipo Descrizione
200 OK

AnalyzeResult

La richiesta ha avuto esito positivo.

Other Status Codes

ErrorResponse

Risposta di errore imprevista.

Sicurezza

api-key

Tipo: apiKey
In: header

OAuth2Auth

Tipo: oauth2
Flow: implicit
URL di autorizzazione: https://login.microsoftonline.com/common/oauth2/v2.0/authorize

Ambiti

Nome Descrizione
https://search.azure.com/.default

Esempio

SearchServiceIndexAnalyze

Esempio di richiesta

POST https://exampleservice.search.windows.net/indexes('example-index')/search.analyze?api-version=2026-04-01


{
  "text": "Text to analyze",
  "analyzer": "ar.lucene"
}

Risposta di esempio

{
  "tokens": [
    {
      "token": "text",
      "startOffset": 0,
      "endOffset": 4,
      "position": 0
    },
    {
      "token": "to",
      "startOffset": 5,
      "endOffset": 7,
      "position": 1
    },
    {
      "token": "analyze",
      "startOffset": 8,
      "endOffset": 15,
      "position": 2
    }
  ]
}

Definizioni

Nome Descrizione
Accept

L'intestazione Accetta.

AnalyzedTokenInfo

Informazioni su un token restituito da un analizzatore.

AnalyzeRequest

Specifica alcuni componenti di testo e analisi usati per suddividere il testo in token.

AnalyzeResult

Risultato del test di un analizzatore sul testo.

CharFilterName

Definisce i nomi di tutti i filtri carattere supportati dal motore di ricerca.

ErrorAdditionalInfo

Informazioni aggiuntive sull'errore di gestione delle risorse.

ErrorDetail

Dettagli dell'errore.

ErrorResponse

Risposta di errore comune per tutte le API di Azure Resource Manager per restituire i dettagli dell'errore per le operazioni non riuscite. Questo segue anche il formato di risposta di errore OData.

LexicalAnalyzerName

Definisce i nomi di tutti gli analizzatori di testo supportati dal motore di ricerca.

LexicalNormalizerName

Definisce i nomi di tutti i normalizzatori di testo supportati dal motore di ricerca.

LexicalTokenizerName

Definisce i nomi di tutti i tokenizzatori supportati dal motore di ricerca.

TokenFilterName

Definisce i nomi di tutti i filtri token supportati dal motore di ricerca.

Accept

L'intestazione Accetta.

Valore Descrizione
application/json;odata.metadata=minimal

AnalyzedTokenInfo

Informazioni su un token restituito da un analizzatore.

Nome Tipo Descrizione
endOffset

integer (int32)

Indice dell'ultimo carattere del token nel testo di input.

position

integer (int32)

Posizione del token nel testo di input rispetto ad altri token. Il primo token nel testo di input ha la posizione 0, il successivo ha la posizione 1 e così via. A seconda dell'analizzatore usato, alcuni token potrebbero avere la stessa posizione, ad esempio se sono sinonimi l'uno dell'altro.

startOffset

integer (int32)

Indice del primo carattere del token nel testo di input.

token

string

Token restituito dall'analizzatore.

AnalyzeRequest

Specifica alcuni componenti di testo e analisi usati per suddividere il testo in token.

Nome Tipo Descrizione
analyzer

LexicalAnalyzerName

Nome dell'analizzatore da usare per interrompere il testo specificato. Se questo parametro non è specificato, è necessario specificare invece un tokenizer. I parametri del tokenizer e dell'analizzatore si escludono a vicenda.

charFilters

CharFilterName[]

Elenco facoltativo di filtri di caratteri da utilizzare quando si interrompe il testo specificato. Questo parametro può essere impostato solo quando si usa il parametro tokenizer.

normalizer

LexicalNormalizerName

Nome del normalizzatore da utilizzare per normalizzare il testo specificato.

text

string

Testo da suddividere in token.

tokenFilters

TokenFilterName[]

Elenco facoltativo di filtri di token da usare quando si interrompe il testo specificato. Questo parametro può essere impostato solo quando si usa il parametro tokenizer.

tokenizer

LexicalTokenizerName

Nome del tokenizer da usare per interrompere il testo specificato. Se questo parametro non è specificato, è necessario specificare invece un analizzatore. I parametri del tokenizer e dell'analizzatore si escludono a vicenda.

AnalyzeResult

Risultato del test di un analizzatore sul testo.

Nome Tipo Descrizione
tokens

AnalyzedTokenInfo[]

Elenco dei token restituiti dall'analizzatore specificato nella richiesta.

CharFilterName

Definisce i nomi di tutti i filtri carattere supportati dal motore di ricerca.

Valore Descrizione
html_strip

Filtro di caratteri che tenta di rimuovere i costrutti HTML. Fare riferimento a https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

ErrorAdditionalInfo

Informazioni aggiuntive sull'errore di gestione delle risorse.

Nome Tipo Descrizione
info

Informazioni aggiuntive.

type

string

Tipo di informazioni aggiuntive.

ErrorDetail

Dettagli dell'errore.

Nome Tipo Descrizione
additionalInfo

ErrorAdditionalInfo[]

Informazioni aggiuntive sull'errore.

code

string

Codice di errore.

details

ErrorDetail[]

Dettagli dell'errore.

message

string

Messaggio di errore.

target

string

Destinazione dell'errore.

ErrorResponse

Risposta di errore comune per tutte le API di Azure Resource Manager per restituire i dettagli dell'errore per le operazioni non riuscite. Questo segue anche il formato di risposta di errore OData.

Nome Tipo Descrizione
error

ErrorDetail

Oggetto error.

LexicalAnalyzerName

Definisce i nomi di tutti gli analizzatori di testo supportati dal motore di ricerca.

Valore Descrizione
ar.microsoft

Analizzatore Microsoft per l'arabo.

ar.lucene

Analizzatore di lucene per l'arabo.

hy.lucene

Analizzatore di lucene per l'armeno.

bn.microsoft

Analizzatore Microsoft per il bangla.

eu.lucene

Analizzatore di lucene per basco.

bg.microsoft

Analizzatore Microsoft per bulgaro.

bg.lucene

Analizzatore di lucene per bulgaro.

ca.microsoft

Analizzatore Microsoft per catalano.

ca.lucene

Analizzatore di lucene per catalano.

zh-Hans.microsoft

Analizzatore Microsoft per cinese (semplificato).

zh-Hans.lucene

Analizzatore di lucene per il cinese (semplificato).

zh-Hant.microsoft

Analizzatore Microsoft per cinese (tradizionale).

zh-Hant.lucene

Analizzatore di lucene per cinese (tradizionale).

hr.microsoft

Analizzatore Microsoft per croato.

cs.microsoft

Analizzatore Microsoft per ceco.

cs.lucene

Analizzatore di lucene per il ceco.

da.microsoft

Analizzatore Microsoft per danese.

da.lucene

Analizzatore di lucene per danese.

nl.microsoft

Analizzatore Microsoft per olandese.

nl.lucene

Analizzatore di lucene per l'olandese.

en.microsoft

Analizzatore Microsoft per inglese.

en.lucene

Analizzatore di lucene per l'inglese.

et.microsoft

Analizzatore Microsoft per l'estone.

fi.microsoft

Analizzatore Microsoft per finlandese.

fi.lucene

Analizzatore di lucene per il finlandese.

fr.microsoft

Analizzatore Microsoft per il francese.

fr.lucene

Analizzatore di lucene per il francese.

gl.lucene

Analizzatore di lucene per il galiziano.

de.microsoft

Analizzatore Microsoft per il tedesco.

de.lucene

Analizzatore di lucene per il tedesco.

el.microsoft

Analizzatore Microsoft per il greco.

el.lucene

Analizzatore di lucene per greco.

gu.microsoft

Analizzatore Microsoft per il gujarati.

he.microsoft

Analizzatore Microsoft per l'ebraico.

hi.microsoft

Analizzatore Microsoft per l'hindi.

hi.lucene

Analizzatore di lucene per hindi.

hu.microsoft

Analizzatore Microsoft per ungherese.

hu.lucene

Analizzatore di lucene per l'ungherese.

is.microsoft

Analizzatore Microsoft per islandese.

id.microsoft

Analizzatore Microsoft per l'Indonesiano (Bahasa).

id.lucene

Analizzatore di lucene per indonesiano.

ga.lucene

Analizzatore di lucene per l'irlandese.

it.microsoft

Analizzatore Microsoft per l'italiano.

it.lucene

Analizzatore di lucene per l'italiano.

ja.microsoft

Analizzatore Microsoft per giapponese.

ja.lucene

Analizzatore di lucene per il giapponese.

kn.microsoft

Analizzatore Microsoft per il Kannada.

ko.microsoft

Analizzatore Microsoft per coreano.

ko.lucene

Analizzatore di lucene per coreano.

lv.microsoft

Analizzatore Microsoft per lettone.

lv.lucene

Analizzatore di lucene per il lettone.

lt.microsoft

Analizzatore Microsoft per lituano.

ml.microsoft

Analizzatore Microsoft per il malayalam.

ms.microsoft

Analizzatore Microsoft per il malese (latino).

mr.microsoft

Analizzatore Microsoft per il marathi.

nb.microsoft

Microsoft analyzer for Norwegian (Bokmål).

no.lucene

Analizzatore di lucene per norvegese.

fa.lucene

Analizzatore di lucene per persiano.

pl.microsoft

Analizzatore Microsoft per polacco.

pl.lucene

Analizzatore di lucene per polacco.

pt-BR.microsoft

Analizzatore Microsoft per portoghese (Brasile).

pt-BR.lucene

Analizzatore di lucene per il portoghese (Brasile).

pt-PT.microsoft

Analizzatore Microsoft per portoghese (Portogallo).

pt-PT.lucene

Analizzatore di lucene per il portoghese (Portogallo).

pa.microsoft

Analizzatore Microsoft per il punjabi.

ro.microsoft

Analizzatore Microsoft per rumeno.

ro.lucene

Analizzatore di lucene per rumeno.

ru.microsoft

Analizzatore Microsoft per russo.

ru.lucene

Analizzatore di lucene per il russo.

sr-cyrillic.microsoft

Analizzatore Microsoft per serbo (cirillico).

sr-latin.microsoft

Analizzatore Microsoft per serbo (latino).

sk.microsoft

Analizzatore Microsoft per lo slovacco.

sl.microsoft

Analizzatore Microsoft per sloveno.

es.microsoft

Analizzatore Microsoft per spagnolo.

es.lucene

Analizzatore Lucene per lo spagnolo.

sv.microsoft

Analizzatore Microsoft per lo svedese.

sv.lucene

Analizzatore di lucene per lo svedese.

ta.microsoft

Analizzatore Microsoft per il tamil.

te.microsoft

Analizzatore Microsoft per il telugu.

th.microsoft

Analizzatore Microsoft per thailandese.

th.lucene

Analizzatore di lucene per Thai.

tr.microsoft

Analizzatore Microsoft per il turco.

tr.lucene

Analizzatore di lucene per il turco.

uk.microsoft

Analizzatore Microsoft per l'ucraino.

ur.microsoft

Analizzatore Microsoft per l'urdu.

vi.microsoft

Analizzatore Microsoft per il vietnamita.

standard.lucene

Analizzatore di lucene standard.

standardasciifolding.lucene

Analizzatore ASCII Folding Lucene standard. Fare riferimento a https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers

keyword

Considera l'intero contenuto di un campo come token singolo. Ciò è utile per i dati, ad esempio i codici postali, gli ID e alcuni nomi di prodotto. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html

pattern

Separa in modo flessibile il testo in termini tramite un modello di espressione regolare. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html

simple

Divide il testo in corrispondenza di elementi diversi da lettere e converte questi ultimi in minuscolo. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html

stop

Divide il testo in corrispondenza di lettere non; Applica i filtri di token minuscoli e non significative. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html

whitespace

Analizzatore che usa il tokenizzatore whitespace. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html

LexicalNormalizerName

Definisce i nomi di tutti i normalizzatori di testo supportati dal motore di ricerca.

Valore Descrizione
asciifolding

Converte caratteri Unicode alfabetici, numerici e simbolici che non si trovano nei primi 127 caratteri ASCII (blocco Unicode "Latino di base") nei rispettivi equivalenti ASCII, se tali equivalenti esistono. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

elision

Rimuove le elisioni. Ad esempio, "l'avion" (il piano) verrà convertito in "avion" (piano). Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

lowercase

Normalizza il testo del token in minuscolo. Fare riferimento a https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html

standard

Normalizzatore standard, costituito da lettere minuscole e asciifolding. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

uppercase

Normalizza il testo del token in maiuscolo. Fare riferimento a https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

LexicalTokenizerName

Definisce i nomi di tutti i tokenizzatori supportati dal motore di ricerca.

Valore Descrizione
classic

Tokenizzatore basato su grammatica adatto per l'elaborazione della maggior parte dei documenti in lingua europea. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html

edgeNGram

Tokenzza l'input da un bordo in n-grammi delle dimensioni specificate. Fare riferimento a https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html

keyword_v2

Genera l'intero input come token singolo. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html

letter

Divide il testo in corrispondenza di elementi diversi da lettere. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html

lowercase

Divide il testo in corrispondenza di elementi diversi da lettere e converte questi ultimi in minuscolo. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html

microsoft_language_tokenizer

Divide il testo usando le regole specifiche della lingua.

microsoft_language_stemming_tokenizer

Divide il testo usando le regole specifiche del linguaggio e riduce le parole alle forme di base

nGram

Tokenzza l'input in n-grammi delle dimensioni specificate. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html

path_hierarchy_v2

Tokenizer per gerarchie simili a percorsi. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html

pattern

Tokenizer che usa criteri regex corrispondenti per costruire token distinti. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html

standard_v2

Analizzatore Lucene standard; Composto dal tokenizer standard, dal filtro minuscolo e dal filtro di arresto. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html

uax_url_email

Suddivide in token gli URL e gli indirizzi di posta elettronica come un unico token. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html

whitespace

Divide il testo in corrispondenza degli spazi vuoti. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

TokenFilterName

Definisce i nomi di tutti i filtri token supportati dal motore di ricerca.

Valore Descrizione
arabic_normalization

Filtro di token che applica il normalizzatore per la lingua araba per normalizzare l'ortografia. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html

apostrophe

Rimuove tutti i caratteri dopo un apostrofo (incluso l'apostrofo stesso). Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html

asciifolding

Converte caratteri Unicode alfabetici, numerici e simbolici che non si trovano nei primi 127 caratteri ASCII (blocco Unicode "Latino di base") nei rispettivi equivalenti ASCII, se tali equivalenti esistono. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

cjk_bigram

Forma bigrams dei termini CJK generati dal tokenizer standard. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html

cjk_width

Normalizza le differenze di larghezza per le lingue CJK. Piega varianti ASCII a piena larghezza nell'equivalente latino di base, e le varianti Katakana a mezza larghezza nell'equivalente Kana. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html

classic

Rimuove i possessivi inglesi e i punti dagli acronimi. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html

common_grams

Costruisce digrammi per i termini frequenti durante l'indicizzazione. Anche i termini singoli continuano a essere indicizzati, con i digrammi sovrapposti. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html

edgeNGram_v2

Genera n-grammi delle dimensioni specificate a partire dalla parte anteriore o posteriore di un token di input. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html

elision

Rimuove le elisioni. Ad esempio, "l'avion" (il piano) verrà convertito in "avion" (piano). Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

german_normalization

Normalizza i caratteri tedeschi in base all'euristica dell'algoritmo snowball German2. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html

hindi_normalization

Normalizza il testo in hindi per rimuovere alcune differenze nelle varianti di ortografia. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html

indic_normalization

Normalizza la rappresentazione Unicode del testo nelle lingue indiane. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html

keyword_repeat

Genera ogni token in ingresso due volte, una volta come parola chiave e una volta come parola chiave non. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html

kstem

Filtro kstem ad alte prestazioni per l'inglese. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html

length

Rimuove le parole troppo lunghe o troppo corte. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html

limit

Limita il numero di token durante l'indicizzazione. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html

lowercase

Normalizza il testo del token in minuscolo. Fare riferimento a https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html

nGram_v2

Genera n-grammi delle dimensioni specificate. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html

persian_normalization

Applica la normalizzazione della lingua persiana. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html

phonetic

Crea i token per le corrispondenze fonetiche. Fare riferimento a https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html

porter_stem

Usa l'algoritmo stemming Porter per trasformare il flusso di token. Fare riferimento a http://tartarus.org/~martin/PorterStemmer

reverse

Inverte la stringa del token. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

scandinavian_normalization

Normalizza l'uso dei caratteri scandinavi intercambiabili. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html

scandinavian_folding

Piega i caratteri scandinavi Ã¥ã... äæÃ"Æ->a e öÖà ̧à ̃-o>. Inoltre discrimina l'uso di vocali doppie aa, ae, ao, oe e oo, lasciando solo il primo. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html

shingle

Crea combinazioni di token come token singolo. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html

snowball

Filtro che deriva le parole usando uno stemmer generato da Snowball. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html

sorani_normalization

Normalizza la rappresentazione Unicode del testo Sorani. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html

stemmer

Filtro di stemming specifico della lingua. Fare riferimento a https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters

stopwords

Rimuove le parole non significative da un flusso di token. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html

trim

Elimina lo spazio vuoto iniziale e finale dai token. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html

truncate

Tronca i termini a una lunghezza specifica. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html

unique

Filtra i token con lo stesso testo del token precedente. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html

uppercase

Normalizza il testo del token alle maiuscole. Fare riferimento a https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

word_delimiter

Suddivide le parole in sottoparole ed esegue trasformazioni facoltative sui gruppi di sottoparole.