MicroStrategy ONE

Applica l'aggregazione e il filtraggio alle importazioni di dati Hadoop

Quando si importano dati da un Hadoop Distributed File System (HDFS) è possibile applicare varie funzioni di aggregazione e filtri ai dati durante l’importazione. Ciò consente di personalizzare la quantità di dati importati nella memoria.

Aggregazione

Il Aggregazione è disponibile nella finestra di dialogo Anteprima dati.

Per applicare una funzione di aggregazione ai dati:

  1. Fare clic su Aggregazione per aprire la finestra di dialogo Aggregazione.
  2. Fare clic con il pulsante destro del mouse e selezionare la funzione desiderata dal menu.
  3. Fare clic su Esegui SQL per visualizzare in anteprima i dati con l'aggregazione applicata.

    Per impostazione predefinita, l'aggregazione/funzione viene eseguita sulle prime 100.000 righe dell'intero dataset. Ciò influisce sulla precisione delle funzioni Somma, Massimo, Minimo, Media e Conteggio durante l'anteprima (le altre funzioni non sono interessate). I risultati dell'aggregazione vengono ricalcolati in base all'intero dataset durante la pubblicazione del cubo. Il hgos.aggregation.preview.rows valore proprietà in /conf/hgos-spark.properties può essere regolata su un numero specifico di righe o impostata su un valore pari a -1 per un numero di righe illimitato.

  4. Fare clic su OK per salvare le nuove definizioni dello schema con la funzione di aggregazione applicata.

    Se si tenta di eseguire il wrangling dei dati dopo l'applicazione dell'aggregazione o delle funzioni, il sistema ignora le modifiche.

Filtraggio

Hadoop Gateway supporta anche il filtraggio dell’importazione dei dati. Il filtraggio consente di importare dati limitati corrispondenti a una determinata condizione, invece dell’intero dataset.

Il Filtro è disponibile nel menu di scelta rapida e nella parte superiore della finestra di dialogo Aggregazione.

Funzioni supportate

Categoria Funzione Note
Di base   Il risultato potrebbe non essere corretto se il valore supera il valore minimo o massimo del tipo numerico. ad esempio, il valore intero compreso è compreso tra -2147483647 e 2147483647, il risultato sarà imprevisto se supera il limite.
Somma  
Media  
Minimo  
Massimo  
Conteggio  
Massimo  
Minimo  
Data e Ora   Se la funzione viene applicata al valore datetime, la parte temporale verrà troncata. ad esempio, applica AddDays on 2017/5/12 18:23:12, il valore sarà troncato a 2017/5/12 00:00:00
AddDays  
CurrentDate  
CurrentDateTime  
CurrentTime  
Data  
DayOfMonth  
DayOfWeek  
DayOfYear  
DaysBetween  
Ora  
MilliSecond  
Minuto  
Mese  
MonthEndDate  
MonthBetween  
MonthStartDate  
Trimestre  
Secondo  
Settimana  
Anno  
YearEndDate  
YearStartDate  
Matematica    
Abs  
Acos Quando il valore di input è infinito, il valore restituito sarà "-1.#IND" per indicare un valore non valido, perché il valore acos non è convergente.
Asin Quando il valore di input è infinito, il valore restituito sarà "-1.#IND" per indicare un valore non valido, perché il valore asin non è convergente.
Asinh  
Atan2  
Atanh  
Ceiling  
Combine  
Cos Quando il valore di input è infinito, il valore restituito sarà "-1.#IND" per indicare un valore non valido, perché il valore cos non è convergente.
Cosh  
Degrees  
Exp  
Factorial Se #0 > 20, viene restituito un valore null. Se #0 <= 20, viene restituito il valore intero corrispondente.
Floor  
Int  
Ln  
Log  
Log10  
Mod  
Moltiplica  
Potenza  
Quotient  
Radians  
Randbetween  
Round  
Round2  
Sin Quando il valore di input è infinito, il valore restituito sarà "-1.#IND" per indicare un valore non valido, perché il valore sin non è convergente.
Sinh  
Tan Quando il valore di input è infinito, il valore restituito sarà "-1.#IND" per indicare un valore non valido, perché il valore tan non è convergente.
Tanh  
Trunc  
Nullo/Zero    
NullTo/Zero  
ZeroToNull  
Corda    
Concat  
ConcatBank  
InitCap  
LeftStr  
Lunghezza  
Inferiore  
LTrim  
Posizione  
RightStr  
RTrim  
SubStr  
Iniziale  
Superiore  

Filtri supportati

Categoria Filtro
Di base In elenco
Non in elenco
Esattamente
Non esattamente
Confronto Maggiore di
Minore di
Maggiore di o uguale a
Minore di o uguale a
Tra
Non compreso tra
Modello Simile a
Non simile a
Contiene
Non contiene
Inizia con
Non inizia con
Finisce con
Non finisce con