Version 2021
Aggregation und Filterung auf Hadoop-Datenimporte anwenden
Wenn Sie Daten aus einem Hadoop Distributed File System (HDFS) importieren, können Sie während des Imports verschiedene Aggregationsfunktionen sowie Filter auf die Daten anwenden. Auf diese Weise können Sie den Umfang der Daten anpassen, die in den Speicher gelangen.
Aggregation
The Aggregation Die Option ist im Dialogfeld „Datenvorschau“ verfügbar.
So wenden Sie eine Aggregationsfunktion auf Ihre Daten an
- Klicken Sie auf Aggregation, um das Dialogfeld „Aggregation“ zu öffnen.
- Klicken Sie mit der rechten Maustaste auf ein Feld und wählen Sie die gewünschte Funktion im Menü aus.
-
Klicken Sie auf SQL ausführen, um eine Vorschau der Daten mit angewendeter Aggregation anzuzeigen.
Standardmäßig wird die Aggregationsfunktion für die obersten 100.000 Reihen des gesamten Datensatzes angewendet. Daher wird die genaue Angabe der Funktionen „Summe“, „Maximum“, „Minimum“, „Mittelwert“ und „Zählung“ während der Vorschau beeinflusst (andere Funktionen sind nicht betroffen). Aggregationsergebnisse werden bei der Veröffentlichung des Cubes für den gesamten Datensatz neu berechnet. The
hgos.aggregation.preview.rowsEigenschaftswert in/conf/hgos-spark.propertieskann an eine bestimmte Anzahl von Zeilen oder für eine unbegrenzte Anzahl von Zeilen auf einen Wert von -1 eingestellt werden. -
Klicken Sie auf OK, um die neuen Schemadefinitionen mit angewendeter Aggregationsfunktion zu speichern.
Wenn Sie versuchen, nach der Anwendung der Aggregationsfunktion den Datenumbau zu verwenden, werden Ihre Änderungen vom System verworfen.
Filterung
Hadoop Gateway unterstützt ebenfalls die Filterung von Datenimporten. Bei Anwendung von Filtern können Sie anstelle des gesamten Datensatzes begrenzte Daten importieren, die einer bestimmten Bedingung entsprechen.
Die Option Filter ist Kontextmenü verfügbar, ebenso wie oben im Dialogfeld „Aggregation“.
Unterstützte Funktionen
| Kategorie | Funktion | Hinweise |
|---|---|---|
| Einfach | Das Ergebnis ist möglicherweise falsch, wenn der Wert das Minimum oder das Maximum des numerischen Typs überschreitet. Beispielsweise liegt der Bereich für Ganzzahlen zwischen -2147483647 und 2147483647. Ein unerwartetes Ergebnis tritt auf, wenn das Ergebnis den Grenzwert überschreitet. | |
| Summe | ||
| Durchschnitt | ||
| Minimum | ||
| Maximum | ||
| Zählung | ||
| Größte | ||
| Least | ||
| Datetime | Wird die Funktion auf einen Datum-/Zeit-Wert angewendet, wird der Zeit-Bestandteil gekürzt. Wird beispielsweise die Funktion „AddDays“ auf „2017/5/12 18:23:12“ angewendet, wird der Wert zu „2017/5/12 00:00:00“ gekürzt. | |
| AddDays | ||
| CurrentDate | ||
| CurrentDateTime | ||
| CurrentTime | ||
| Datum | ||
| DayOfMonth | ||
| DayOfWeek | ||
| DayOfYear | ||
| DaysBetween | ||
| Stunde | ||
| MilliSecond | ||
| Minute | ||
| Monat | ||
| MonthEndDate | ||
| MonthBetween | ||
| MonthStartDate | ||
| Quartals | ||
| Sekunde | ||
| Woche | ||
| Jahres | ||
| YearEndDate | ||
| YearStartDate | ||
| Mathematisch | ||
| Abs | ||
| Acos | Wenn der Eingabewert unendlich ist, ist der zurückgegebene Wert „-1.#IND“. Damit wird ein ungültiger Wert angegeben, da Acos nicht konvergent ist. | |
| Asin | Wenn der Eingabewert unendlich ist, ist der zurückgegebene Wert „-1.#IND“. Damit wird ein ungültiger Wert angegeben, da Asin nicht konvergent ist. | |
| Asinh | ||
| Atan2 | ||
| Atanh | ||
| „Ceiling“ | ||
| Combine (Verbund) | ||
| Cos | Wenn der Eingabewert unendlich ist, ist der zurückgegebene Wert „-1.#IND“. Damit wird ein ungültiger Wert angegeben, da Cos nicht konvergent ist. | |
| Cosh | ||
| Degrees | ||
| Exp | ||
| Factorial | Wenn #0 > 20 wird Null zurückgegeben. Wenn #0 <= 20 wird der entsprechende Ganzzahlwert zurückgegeben. | |
| Floor | ||
| Int | ||
| Ln | ||
| Protokoll | ||
| Log10 | ||
| Mod | ||
| Multiply | ||
| Power | ||
| Quotient | ||
| Radians | ||
| Randbetween | ||
| Round | ||
| Round2 | ||
| Sin | Wenn der Eingabewert unendlich ist, ist der zurückgegebene Wert „-1.#IND“. Damit wird ein ungültiger Wert angegeben, da Sin nicht konvergent ist. | |
| Sinh | ||
| Tan | Wenn der Eingabewert unendlich ist, ist der zurückgegebene Wert „-1.#IND“. Damit wird ein ungültiger Wert angegeben, da Tan nicht konvergent ist. | |
| Tanh | ||
| Trunc | ||
| NULL/Null | ||
| NullTo/Zero | ||
| ZeroToNull | ||
| Zeichenkette | ||
| Concat | ||
| ConcatBank | ||
| InitCap | ||
| LeftStr | ||
| Länge | ||
| Lower | ||
| LTrim | ||
| Position | ||
| RightStr | ||
| RTrim | ||
| SubStr | ||
| Trim | ||
| Upper |
Unterstützte Filter
| Kategorie | Filter |
|---|---|
| Einfach | In der Liste enthalten |
| Nicht in der Liste enthalten | |
| Genau | |
| Nicht genau | |
| Vergleich | Größer |
| Kleiner als | |
| Größer oder gleich | |
| Kleiner oder gleich | |
| Zwischen | |
| Nicht zwischen | |
| Muster | Wie |
| Nicht wie | |
| Enthält | |
| Enthält nicht | |
| Beginnt mit | |
| Beginnt nicht mit | |
| Endet auf | |
| Endet nicht auf |
