MicroStrategy ONE
Applica aggregazione e filtri alle importazioni di dati Hadoop
Quando si importano dati da un Hadoop Distributed File System (HDFS) è possibile applicare varie funzioni di aggregazione e filtri ai dati durante l’importazione. Ciò consente di personalizzare la quantità di dati importati nella memoria.
Aggregazione
Il Aggregazione è disponibile nella finestra di dialogo Anteprima dati.
Per applicare una funzione di aggregazione ai dati:
- Fare clic su Aggregazione per aprire la finestra di dialogo Aggregazione.
- Fare clic con il pulsante destro del mouse e selezionare la funzione desiderata dal menu.
-
Fare clic su Esegui SQL per visualizzare un’anteprima dei dati con l’aggregazione applicata.
Per impostazione predefinita, l'aggregazione/funzione viene eseguita sulle prime 100.000 righe dell'intero dataset. Ciò influisce sulla precisione delle funzioni Somma, Massimo, Minimo, Media e Conteggio durante l'anteprima (le altre funzioni non sono interessate). I risultati dell'aggregazione vengono ricalcolati in base all'intero dataset durante la pubblicazione del cubo. Il/La
hgos.aggregation.preview.rowsvalore proprietà in/conf/hgos-spark.propertiesPuò essere regolata su un numero specifico di righe o impostata su un valore pari a -1 per un numero di righe illimitato. -
Fare clic su OK per salvare le nuove definizioni dello schema con l’aggregazione/funzione applicata.
Se si tenta di eseguire il wrangling dei dati dopo l'applicazione dell'aggregazione o delle funzioni, il sistema ignora le modifiche.
Filtraggio
Hadoop Gateway supporta anche il filtraggio dell’importazione dei dati. Il filtraggio consente di importare dati limitati corrispondenti a una determinata condizione, invece dell’intero dataset.
L'opzione Filtro è disponibile nel menu di scelta rapida e nella parte superiore della finestra di dialogo Aggregazione.
Funzioni supportate
| Categoria | Funzione | Note |
|---|---|---|
| Di base | Il risultato potrebbe essere errato se il valore supera il massimo o il minimo del tipo numerico. Ad esempio, l'intervallo del valore intero è compreso tra -2147483647 e 2147483647; il risultato sarà imprevisto se supera il limite. | |
| Somma | ||
| Media | ||
| Minimo | ||
| Massimo | ||
| Conteggio | ||
| Massimo | ||
| Minimo | ||
| Data/ora | Se la funzione viene applicata sul valore di data e ora, la parte dell'ora verrà troncata. Ad esempio, applicando AddDays su 2017/5/12 18:23:12, il valore verrà troncato in 2017/5/12 00:00:00 | |
| AddDays | ||
| CurrentDate | ||
| CurrentDateTime | ||
| CurrentTime | ||
| Data | ||
| DayOfMonth | ||
| DayOfWeek | ||
| DayOfYear | ||
| DaysBetween | ||
| Ora | ||
| MilliSecond | ||
| Minuto | ||
| Mese | ||
| MonthEndDate | ||
| MonthBetween | ||
| MonthStartDate | ||
| Trimestre | ||
| Secondo | ||
| Settimana | ||
| Anno | ||
| YearEndDate | ||
| YearStartDate | ||
| Funzioni matematiche | ||
| Abs | ||
| Acos | Quando il valore di input è infinito, il valore restituito sarà "-1.#IND" per indicare un valore non valido, perché il valore acos non è convergente. | |
| Asin | Quando il valore di input è infinito, il valore restituito sarà "-1.#IND" per indicare un valore non valido, perché il valore asin non è convergente. | |
| Asinh | ||
| Atan2 | ||
| Atanh | ||
| Ceiling | ||
| Combine | ||
| Cos | Quando il valore di input è infinito, il valore restituito sarà "-1.#IND" per indicare un valore non valido, perché il valore cos non è convergente. | |
| Cosh | ||
| Degrees | ||
| Exp | ||
| Factorial | Se #0 > 20, viene restituito un valore null. Se #0 <= 20, viene restituito il valore intero corrispondente. | |
| Floor | ||
| Int | ||
| Ln | ||
| Log | ||
| Log10 | ||
| Mod | ||
| Moltiplica | ||
| Potenza | ||
| Quotient | ||
| Radians | ||
| Randbetween | ||
| Round | ||
| Round2 | ||
| Sin | Quando il valore di input è infinito, il valore restituito sarà "-1.#IND" per indicare un valore non valido, perché il valore sin non è convergente. | |
| Sinh | ||
| Tan | Quando il valore di input è infinito, il valore restituito sarà "-1.#IND" per indicare un valore non valido, perché il valore tan non è convergente. | |
| Tanh | ||
| Trunc | ||
| Funzioni Null/Zero | ||
| NullTo/Zero | ||
| ZeroToNull | ||
| Stringa | ||
| Concat | ||
| ConcatBank | ||
| InitCap | ||
| LeftStr | ||
| Lunghezza | ||
| Inferiore | ||
| LTrim | ||
| Posizione | ||
| RightStr | ||
| RTrim | ||
| SubStr | ||
| Iniziale | ||
| Superiore |
Filtri supportati
| Categoria | Filtro |
|---|---|
| Di base | In elenco |
| Non in elenco | |
| Esattamente | |
| Non esattamente | |
| Confronto | Maggiore di |
| Minore di | |
| Maggiore di o uguale a | |
| Minore di o uguale a | |
| Tra | |
| Non compreso tra | |
| Motivo | Simile a |
| Non simile a | |
| Contiene | |
| Non contiene | |
| Inizia con | |
| Non inizia con | |
| Finisce con | |
| Non finisce con |
