Version 2021

Aplicar agregación y filtrado a importaciones de datos de Hadoop

Al importar datos desde un sistema de archivos distribuido de Hadoop (HDFS), se pueden aplicar varias funciones de agregación, así como filtros, en los datos durante la importación. Gracias a ello, se puede personalizar la cantidad de datos que se van a incorporar a la memoria.

Agregación

El Agregación está disponible en el cuadro de diálogo Vista preliminar de datos.

Para aplicar una función de agregación a los datos:

  1. Haga clic en Agregación para abrir el cuadro de diálogo Agregación.
  2. Haga clic con el botón derecho en un campo y seleccione la función que quiera del menú.
  3. Haga clic en Ejecutar SQL para obtener una vista preliminar de los datos con la agregación aplicada.

    De forma predeterminada, la agregación/función se ejecutará en las primeras 100.000 filas de todo el conjunto de datos. Por lo tanto, la precisión de las funciones Suma, Máx., Mín., Promedio y Cantidad se verá afectada durante la vista preliminar (cosa que no ocurrirá con otras funciones). Los resultados de la agregación se vuelven a calcular en el conjunto de datos entero al publicar el cubo. El hgos.aggregation.preview.rows valor de la propiedad en /conf/hgos-spark.properties se puede ajustar a un número específico de filas, o establecer en un valor de -1 para un número ilimitado de filas.

  4. Haga clic en Aceptar para guardar las nuevas definiciones de esquema con la agregación/función aplicada.

    Si intenta transformar datos después de aplicar la agregación o funciones, el sistema descartará los cambios realizados.

filtrar

En Hadoop Gateway las importaciones de datos también se pueden filtrar. El filtrado permite importar un conjunto de datos limitado que cumpla con una determinada condición, en vez del conjunto de datos entero.

La opción Filtro está disponible en el menú contextual y en la parte superior del cuadro de diálogo Agregación.

Funciones admitidas

Categoría Función Notas
Básico   El resultado puede ser incorrecto si el valor supera el tipo numérico mínimo o máximo. Por ejemplo, el intervalo de valores enteros es de -2147483647 a 2147483647. El resultado no será el esperado si supera el límite.
Suma  
Promedio  
Mínimo  
Máximo  
Recuento  
El más grande  
El más pequeño  
Fecha/hora   Si la función se aplica en un valor de fecha y hora, el fragmento de hora se truncará; así, por ejemplo, si se aplica AddDays a 2017/5/12 18:23:12, el valor se truncará y se mostrará como 2017/5/12 00:00:00
AddDays  
CurrentDate  
CurrentDateTime  
CurrentTime  
Fecha  
DayOfMonth  
DayOfWeek  
DayOfYear  
DaysBetween  
Hora  
MilliSecond  
Minuto  
Mes  
MonthEndDate  
MonthBetween  
MonthStartDate  
el trimestre  
Segundo  
Semana  
el año  
YearEndDate  
YearStartDate  
Math    
Abs  
Acos Cuando el valor de entrada es infinito, el valor de retorno será "-1.#IND" para indicar que no es válido, porque Acos no es convergente.
Asin Cuando el valor de entrada es infinito, el valor de retorno será "-1.#IND" para indicar que no es válido, porque Asin no es convergente.
Asinh  
Atan2  
Atanh  
Ceiling  
Combine  
Cos Cuando el valor de entrada es infinito, el valor de retorno será "-1.#IND" para indicar que no es válido, porque Cos no es convergente.
Cosh  
Degrees  
Exp  
Factorial Si #0 > 20, se devolverá un valor nulo. Si #0 <= 20, se devolverá el valor de entero correspondiente.
Floor  
Int  
Ln  
Registro  
Log10  
Mod  
Multiplicar  
Power  
Quotient  
Radians  
Randbetween  
Round  
Round2  
Sin Cuando el valor de entrada es infinito, el valor de retorno será "-1.#IND" para indicar que no es válido, porque Sin no es convergente.
Sinh  
Tan Cuando el valor de entrada es infinito, el valor de retorno será "-1.#IND" para indicar que no es válido, porque Tan no es convergente.
Tanh  
Trunc  
Funciones de valores nulos y ceros    
NullTo/Zero  
ZeroToNull  
Cadena    
Concat  
ConcatBank  
InitCap  
LeftStr  
Longitud  
Lower  
LTrim  
Posición  
RightStr  
RTrim  
SubStr  
Trim  
Upper  

Filtros admitidos

Categoría Filtro
Básico En la lista
No está en la lista
Exactamente
No exactamente
Comparación Mayor que
Menor que
Mayor o igual que
Menor o igual que
Entre
No entre
Trama Como
No como
Contiene
No contiene
Comienza con
No comienza con
Finaliza con
No finaliza con