Indexes - Analyze
Viene illustrato il modo in cui un analizzatore suddivide il testo in token.
POST {endpoint}/indexes('{indexName}')/search.analyze?api-version=2026-04-01
Parametri dell'URI
| Nome | In | Necessario | Tipo | Descrizione |
|---|---|---|---|---|
|
endpoint
|
path | True |
string (uri) |
URL dell'endpoint del servizio di ricerca. |
|
index
|
path | True |
string |
Nome dell'indice. |
|
api-version
|
query | True |
string minLength: 1 |
Versione dell'API da usare per questa operazione. |
Intestazione della richiesta
| Nome | Necessario | Tipo | Descrizione |
|---|---|---|---|
| Accept |
L'intestazione Accetta. |
||
| x-ms-client-request-id |
string (uuid) |
Identificatore di stringa opaco, univoco a livello globale e generato dal client per la richiesta. |
Corpo della richiesta
| Nome | Necessario | Tipo | Descrizione |
|---|---|---|---|
| text | True |
string |
Testo da suddividere in token. |
| analyzer |
Nome dell'analizzatore da usare per interrompere il testo specificato. Se questo parametro non è specificato, è necessario specificare invece un tokenizer. I parametri del tokenizer e dell'analizzatore si escludono a vicenda. |
||
| charFilters |
Elenco facoltativo di filtri di caratteri da utilizzare quando si interrompe il testo specificato. Questo parametro può essere impostato solo quando si usa il parametro tokenizer. |
||
| normalizer |
Nome del normalizzatore da utilizzare per normalizzare il testo specificato. |
||
| tokenFilters |
Elenco facoltativo di filtri di token da usare quando si interrompe il testo specificato. Questo parametro può essere impostato solo quando si usa il parametro tokenizer. |
||
| tokenizer |
Nome del tokenizer da usare per interrompere il testo specificato. Se questo parametro non è specificato, è necessario specificare invece un analizzatore. I parametri del tokenizer e dell'analizzatore si escludono a vicenda. |
Risposte
| Nome | Tipo | Descrizione |
|---|---|---|
| 200 OK |
La richiesta ha avuto esito positivo. |
|
| Other Status Codes |
Risposta di errore imprevista. |
Sicurezza
api-key
Tipo:
apiKey
In:
header
OAuth2Auth
Tipo:
oauth2
Flow:
implicit
URL di autorizzazione:
https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Ambiti
| Nome | Descrizione |
|---|---|
| https://search.azure.com/.default |
Esempio
SearchServiceIndexAnalyze
Esempio di richiesta
POST https://exampleservice.search.windows.net/indexes('example-index')/search.analyze?api-version=2026-04-01
{
"text": "Text to analyze",
"analyzer": "ar.lucene"
}
Risposta di esempio
{
"tokens": [
{
"token": "text",
"startOffset": 0,
"endOffset": 4,
"position": 0
},
{
"token": "to",
"startOffset": 5,
"endOffset": 7,
"position": 1
},
{
"token": "analyze",
"startOffset": 8,
"endOffset": 15,
"position": 2
}
]
}
Definizioni
| Nome | Descrizione |
|---|---|
| Accept |
L'intestazione Accetta. |
|
Analyzed |
Informazioni su un token restituito da un analizzatore. |
|
Analyze |
Specifica alcuni componenti di testo e analisi usati per suddividere il testo in token. |
|
Analyze |
Risultato del test di un analizzatore sul testo. |
|
Char |
Definisce i nomi di tutti i filtri carattere supportati dal motore di ricerca. |
|
Error |
Informazioni aggiuntive sull'errore di gestione delle risorse. |
|
Error |
Dettagli dell'errore. |
|
Error |
Risposta di errore comune per tutte le API di Azure Resource Manager per restituire i dettagli dell'errore per le operazioni non riuscite. Questo segue anche il formato di risposta di errore OData. |
|
Lexical |
Definisce i nomi di tutti gli analizzatori di testo supportati dal motore di ricerca. |
|
Lexical |
Definisce i nomi di tutti i normalizzatori di testo supportati dal motore di ricerca. |
|
Lexical |
Definisce i nomi di tutti i tokenizzatori supportati dal motore di ricerca. |
|
Token |
Definisce i nomi di tutti i filtri token supportati dal motore di ricerca. |
Accept
L'intestazione Accetta.
| Valore | Descrizione |
|---|---|
| application/json;odata.metadata=minimal |
AnalyzedTokenInfo
Informazioni su un token restituito da un analizzatore.
| Nome | Tipo | Descrizione |
|---|---|---|
| endOffset |
integer (int32) |
Indice dell'ultimo carattere del token nel testo di input. |
| position |
integer (int32) |
Posizione del token nel testo di input rispetto ad altri token. Il primo token nel testo di input ha la posizione 0, il successivo ha la posizione 1 e così via. A seconda dell'analizzatore usato, alcuni token potrebbero avere la stessa posizione, ad esempio se sono sinonimi l'uno dell'altro. |
| startOffset |
integer (int32) |
Indice del primo carattere del token nel testo di input. |
| token |
string |
Token restituito dall'analizzatore. |
AnalyzeRequest
Specifica alcuni componenti di testo e analisi usati per suddividere il testo in token.
| Nome | Tipo | Descrizione |
|---|---|---|
| analyzer |
Nome dell'analizzatore da usare per interrompere il testo specificato. Se questo parametro non è specificato, è necessario specificare invece un tokenizer. I parametri del tokenizer e dell'analizzatore si escludono a vicenda. |
|
| charFilters |
Elenco facoltativo di filtri di caratteri da utilizzare quando si interrompe il testo specificato. Questo parametro può essere impostato solo quando si usa il parametro tokenizer. |
|
| normalizer |
Nome del normalizzatore da utilizzare per normalizzare il testo specificato. |
|
| text |
string |
Testo da suddividere in token. |
| tokenFilters |
Elenco facoltativo di filtri di token da usare quando si interrompe il testo specificato. Questo parametro può essere impostato solo quando si usa il parametro tokenizer. |
|
| tokenizer |
Nome del tokenizer da usare per interrompere il testo specificato. Se questo parametro non è specificato, è necessario specificare invece un analizzatore. I parametri del tokenizer e dell'analizzatore si escludono a vicenda. |
AnalyzeResult
Risultato del test di un analizzatore sul testo.
| Nome | Tipo | Descrizione |
|---|---|---|
| tokens |
Elenco dei token restituiti dall'analizzatore specificato nella richiesta. |
CharFilterName
Definisce i nomi di tutti i filtri carattere supportati dal motore di ricerca.
| Valore | Descrizione |
|---|---|
| html_strip |
Filtro di caratteri che tenta di rimuovere i costrutti HTML. Fare riferimento a https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html |
ErrorAdditionalInfo
Informazioni aggiuntive sull'errore di gestione delle risorse.
| Nome | Tipo | Descrizione |
|---|---|---|
| info |
Informazioni aggiuntive. |
|
| type |
string |
Tipo di informazioni aggiuntive. |
ErrorDetail
Dettagli dell'errore.
| Nome | Tipo | Descrizione |
|---|---|---|
| additionalInfo |
Informazioni aggiuntive sull'errore. |
|
| code |
string |
Codice di errore. |
| details |
Dettagli dell'errore. |
|
| message |
string |
Messaggio di errore. |
| target |
string |
Destinazione dell'errore. |
ErrorResponse
Risposta di errore comune per tutte le API di Azure Resource Manager per restituire i dettagli dell'errore per le operazioni non riuscite. Questo segue anche il formato di risposta di errore OData.
| Nome | Tipo | Descrizione |
|---|---|---|
| error |
Oggetto error. |
LexicalAnalyzerName
Definisce i nomi di tutti gli analizzatori di testo supportati dal motore di ricerca.
| Valore | Descrizione |
|---|---|
| ar.microsoft |
Analizzatore Microsoft per l'arabo. |
| ar.lucene |
Analizzatore di lucene per l'arabo. |
| hy.lucene |
Analizzatore di lucene per l'armeno. |
| bn.microsoft |
Analizzatore Microsoft per il bangla. |
| eu.lucene |
Analizzatore di lucene per basco. |
| bg.microsoft |
Analizzatore Microsoft per bulgaro. |
| bg.lucene |
Analizzatore di lucene per bulgaro. |
| ca.microsoft |
Analizzatore Microsoft per catalano. |
| ca.lucene |
Analizzatore di lucene per catalano. |
| zh-Hans.microsoft |
Analizzatore Microsoft per cinese (semplificato). |
| zh-Hans.lucene |
Analizzatore di lucene per il cinese (semplificato). |
| zh-Hant.microsoft |
Analizzatore Microsoft per cinese (tradizionale). |
| zh-Hant.lucene |
Analizzatore di lucene per cinese (tradizionale). |
| hr.microsoft |
Analizzatore Microsoft per croato. |
| cs.microsoft |
Analizzatore Microsoft per ceco. |
| cs.lucene |
Analizzatore di lucene per il ceco. |
| da.microsoft |
Analizzatore Microsoft per danese. |
| da.lucene |
Analizzatore di lucene per danese. |
| nl.microsoft |
Analizzatore Microsoft per olandese. |
| nl.lucene |
Analizzatore di lucene per l'olandese. |
| en.microsoft |
Analizzatore Microsoft per inglese. |
| en.lucene |
Analizzatore di lucene per l'inglese. |
| et.microsoft |
Analizzatore Microsoft per l'estone. |
| fi.microsoft |
Analizzatore Microsoft per finlandese. |
| fi.lucene |
Analizzatore di lucene per il finlandese. |
| fr.microsoft |
Analizzatore Microsoft per il francese. |
| fr.lucene |
Analizzatore di lucene per il francese. |
| gl.lucene |
Analizzatore di lucene per il galiziano. |
| de.microsoft |
Analizzatore Microsoft per il tedesco. |
| de.lucene |
Analizzatore di lucene per il tedesco. |
| el.microsoft |
Analizzatore Microsoft per il greco. |
| el.lucene |
Analizzatore di lucene per greco. |
| gu.microsoft |
Analizzatore Microsoft per il gujarati. |
| he.microsoft |
Analizzatore Microsoft per l'ebraico. |
| hi.microsoft |
Analizzatore Microsoft per l'hindi. |
| hi.lucene |
Analizzatore di lucene per hindi. |
| hu.microsoft |
Analizzatore Microsoft per ungherese. |
| hu.lucene |
Analizzatore di lucene per l'ungherese. |
| is.microsoft |
Analizzatore Microsoft per islandese. |
| id.microsoft |
Analizzatore Microsoft per l'Indonesiano (Bahasa). |
| id.lucene |
Analizzatore di lucene per indonesiano. |
| ga.lucene |
Analizzatore di lucene per l'irlandese. |
| it.microsoft |
Analizzatore Microsoft per l'italiano. |
| it.lucene |
Analizzatore di lucene per l'italiano. |
| ja.microsoft |
Analizzatore Microsoft per giapponese. |
| ja.lucene |
Analizzatore di lucene per il giapponese. |
| kn.microsoft |
Analizzatore Microsoft per il Kannada. |
| ko.microsoft |
Analizzatore Microsoft per coreano. |
| ko.lucene |
Analizzatore di lucene per coreano. |
| lv.microsoft |
Analizzatore Microsoft per lettone. |
| lv.lucene |
Analizzatore di lucene per il lettone. |
| lt.microsoft |
Analizzatore Microsoft per lituano. |
| ml.microsoft |
Analizzatore Microsoft per il malayalam. |
| ms.microsoft |
Analizzatore Microsoft per il malese (latino). |
| mr.microsoft |
Analizzatore Microsoft per il marathi. |
| nb.microsoft |
Microsoft analyzer for Norwegian (Bokmål). |
| no.lucene |
Analizzatore di lucene per norvegese. |
| fa.lucene |
Analizzatore di lucene per persiano. |
| pl.microsoft |
Analizzatore Microsoft per polacco. |
| pl.lucene |
Analizzatore di lucene per polacco. |
| pt-BR.microsoft |
Analizzatore Microsoft per portoghese (Brasile). |
| pt-BR.lucene |
Analizzatore di lucene per il portoghese (Brasile). |
| pt-PT.microsoft |
Analizzatore Microsoft per portoghese (Portogallo). |
| pt-PT.lucene |
Analizzatore di lucene per il portoghese (Portogallo). |
| pa.microsoft |
Analizzatore Microsoft per il punjabi. |
| ro.microsoft |
Analizzatore Microsoft per rumeno. |
| ro.lucene |
Analizzatore di lucene per rumeno. |
| ru.microsoft |
Analizzatore Microsoft per russo. |
| ru.lucene |
Analizzatore di lucene per il russo. |
| sr-cyrillic.microsoft |
Analizzatore Microsoft per serbo (cirillico). |
| sr-latin.microsoft |
Analizzatore Microsoft per serbo (latino). |
| sk.microsoft |
Analizzatore Microsoft per lo slovacco. |
| sl.microsoft |
Analizzatore Microsoft per sloveno. |
| es.microsoft |
Analizzatore Microsoft per spagnolo. |
| es.lucene |
Analizzatore Lucene per lo spagnolo. |
| sv.microsoft |
Analizzatore Microsoft per lo svedese. |
| sv.lucene |
Analizzatore di lucene per lo svedese. |
| ta.microsoft |
Analizzatore Microsoft per il tamil. |
| te.microsoft |
Analizzatore Microsoft per il telugu. |
| th.microsoft |
Analizzatore Microsoft per thailandese. |
| th.lucene |
Analizzatore di lucene per Thai. |
| tr.microsoft |
Analizzatore Microsoft per il turco. |
| tr.lucene |
Analizzatore di lucene per il turco. |
| uk.microsoft |
Analizzatore Microsoft per l'ucraino. |
| ur.microsoft |
Analizzatore Microsoft per l'urdu. |
| vi.microsoft |
Analizzatore Microsoft per il vietnamita. |
| standard.lucene |
Analizzatore di lucene standard. |
| standardasciifolding.lucene |
Analizzatore ASCII Folding Lucene standard. Fare riferimento a https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers |
| keyword |
Considera l'intero contenuto di un campo come token singolo. Ciò è utile per i dati, ad esempio i codici postali, gli ID e alcuni nomi di prodotto. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html |
| pattern |
Separa in modo flessibile il testo in termini tramite un modello di espressione regolare. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html |
| simple |
Divide il testo in corrispondenza di elementi diversi da lettere e converte questi ultimi in minuscolo. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html |
| stop |
Divide il testo in corrispondenza di lettere non; Applica i filtri di token minuscoli e non significative. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html |
| whitespace |
Analizzatore che usa il tokenizzatore whitespace. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html |
LexicalNormalizerName
Definisce i nomi di tutti i normalizzatori di testo supportati dal motore di ricerca.
| Valore | Descrizione |
|---|---|
| asciifolding |
Converte caratteri Unicode alfabetici, numerici e simbolici che non si trovano nei primi 127 caratteri ASCII (blocco Unicode "Latino di base") nei rispettivi equivalenti ASCII, se tali equivalenti esistono. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html |
| elision |
Rimuove le elisioni. Ad esempio, "l'avion" (il piano) verrà convertito in "avion" (piano). Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html |
| lowercase |
Normalizza il testo del token in minuscolo. Fare riferimento a https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html |
| standard |
Normalizzatore standard, costituito da lettere minuscole e asciifolding. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html |
| uppercase |
Normalizza il testo del token in maiuscolo. Fare riferimento a https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html |
LexicalTokenizerName
Definisce i nomi di tutti i tokenizzatori supportati dal motore di ricerca.
| Valore | Descrizione |
|---|---|
| classic |
Tokenizzatore basato su grammatica adatto per l'elaborazione della maggior parte dei documenti in lingua europea. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html |
| edgeNGram |
Tokenzza l'input da un bordo in n-grammi delle dimensioni specificate. Fare riferimento a https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html |
| keyword_v2 |
Genera l'intero input come token singolo. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html |
| letter |
Divide il testo in corrispondenza di elementi diversi da lettere. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html |
| lowercase |
Divide il testo in corrispondenza di elementi diversi da lettere e converte questi ultimi in minuscolo. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html |
| microsoft_language_tokenizer |
Divide il testo usando le regole specifiche della lingua. |
| microsoft_language_stemming_tokenizer |
Divide il testo usando le regole specifiche del linguaggio e riduce le parole alle forme di base |
| nGram |
Tokenzza l'input in n-grammi delle dimensioni specificate. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html |
| path_hierarchy_v2 |
Tokenizer per gerarchie simili a percorsi. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html |
| pattern |
Tokenizer che usa criteri regex corrispondenti per costruire token distinti. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html |
| standard_v2 |
Analizzatore Lucene standard; Composto dal tokenizer standard, dal filtro minuscolo e dal filtro di arresto. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html |
| uax_url_email |
Suddivide in token gli URL e gli indirizzi di posta elettronica come un unico token. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html |
| whitespace |
Divide il testo in corrispondenza degli spazi vuoti. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html |
TokenFilterName
Definisce i nomi di tutti i filtri token supportati dal motore di ricerca.
| Valore | Descrizione |
|---|---|
| arabic_normalization |
Filtro di token che applica il normalizzatore per la lingua araba per normalizzare l'ortografia. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html |
| apostrophe |
Rimuove tutti i caratteri dopo un apostrofo (incluso l'apostrofo stesso). Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html |
| asciifolding |
Converte caratteri Unicode alfabetici, numerici e simbolici che non si trovano nei primi 127 caratteri ASCII (blocco Unicode "Latino di base") nei rispettivi equivalenti ASCII, se tali equivalenti esistono. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html |
| cjk_bigram |
Forma bigrams dei termini CJK generati dal tokenizer standard. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html |
| cjk_width |
Normalizza le differenze di larghezza per le lingue CJK. Piega varianti ASCII a piena larghezza nell'equivalente latino di base, e le varianti Katakana a mezza larghezza nell'equivalente Kana. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html |
| classic |
Rimuove i possessivi inglesi e i punti dagli acronimi. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html |
| common_grams |
Costruisce digrammi per i termini frequenti durante l'indicizzazione. Anche i termini singoli continuano a essere indicizzati, con i digrammi sovrapposti. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html |
| edgeNGram_v2 |
Genera n-grammi delle dimensioni specificate a partire dalla parte anteriore o posteriore di un token di input. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html |
| elision |
Rimuove le elisioni. Ad esempio, "l'avion" (il piano) verrà convertito in "avion" (piano). Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html |
| german_normalization |
Normalizza i caratteri tedeschi in base all'euristica dell'algoritmo snowball German2. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html |
| hindi_normalization |
Normalizza il testo in hindi per rimuovere alcune differenze nelle varianti di ortografia. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html |
| indic_normalization |
Normalizza la rappresentazione Unicode del testo nelle lingue indiane. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html |
| keyword_repeat |
Genera ogni token in ingresso due volte, una volta come parola chiave e una volta come parola chiave non. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html |
| kstem |
Filtro kstem ad alte prestazioni per l'inglese. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html |
| length |
Rimuove le parole troppo lunghe o troppo corte. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html |
| limit |
Limita il numero di token durante l'indicizzazione. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html |
| lowercase |
Normalizza il testo del token in minuscolo. Fare riferimento a https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html |
| nGram_v2 |
Genera n-grammi delle dimensioni specificate. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html |
| persian_normalization |
Applica la normalizzazione della lingua persiana. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html |
| phonetic |
Crea i token per le corrispondenze fonetiche. Fare riferimento a https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html |
| porter_stem |
Usa l'algoritmo stemming Porter per trasformare il flusso di token. Fare riferimento a http://tartarus.org/~martin/PorterStemmer |
| reverse |
Inverte la stringa del token. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html |
| scandinavian_normalization |
Normalizza l'uso dei caratteri scandinavi intercambiabili. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html |
| scandinavian_folding |
Piega i caratteri scandinavi Ã¥ã... äæÃ"Æ->a e öÖà ̧à ̃-o>. Inoltre discrimina l'uso di vocali doppie aa, ae, ao, oe e oo, lasciando solo il primo. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html |
| shingle |
Crea combinazioni di token come token singolo. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html |
| snowball |
Filtro che deriva le parole usando uno stemmer generato da Snowball. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html |
| sorani_normalization |
Normalizza la rappresentazione Unicode del testo Sorani. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html |
| stemmer |
Filtro di stemming specifico della lingua. Fare riferimento a https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters |
| stopwords |
Rimuove le parole non significative da un flusso di token. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html |
| trim |
Elimina lo spazio vuoto iniziale e finale dai token. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html |
| truncate |
Tronca i termini a una lunghezza specifica. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html |
| unique |
Filtra i token con lo stesso testo del token precedente. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html |
| uppercase |
Normalizza il testo del token alle maiuscole. Fare riferimento a https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html |
| word_delimiter |
Suddivide le parole in sottoparole ed esegue trasformazioni facoltative sui gruppi di sottoparole. |