Version 2021

Daten in Tabellen mit Joins in Google BigQuery kombinieren

Sie können die Daten in zwei Tabellen kombinieren, indem Sie einen Join zwischen den Tabellen erstellen.

Eine Tabelle enthält die Spalten „Ort“ und „Umsatz“. Eine zweite Tabelle enthält die Spalten „Ort“ und „Gewinn“. Setzen Sie die Daten in beiden Tabellen in Beziehung, indem Sie einen Join zwischen den Spalten „Ort“ erstellen.

Um Daten in drei oder mehr Tabellen zu kombinieren, erstellen Sie einen Join zwischen zwei der Tabellen, erstellen dann einen Join zwischen einer dieser zwei Tabellen und einer dritten Tabelle usw., bis alle Tabellen verbunden sind.

Die Syntax der JOIN-Klausel, die Sie schreiben, hängt von der Größe der Tabellen ab, die Sie verknüpfen. Vor der Erstellung eines Join ist es hilfreich zu wissen, ob die Tabellen mehr als 8 MB an komprimierten Daten enthalten, welches das Maximum von Google BigQuery für Tabellen ist, die über die standardmäßige JOIN-Klausel verknüpft sind. Suchtabellen enthalten normalerweise nicht mehr als 8 MB komprimierter Daten. Es ist wahrscheinlicher, dass Fakttabellen mehr als 8 MB komprimierte Daten enthalten.

So erstellen Sie einen Join, der Daten in zwei Tabellen kombiniert

  1. Sie können einen Join, der Daten in zwei Tabellen kombiniert, im Dialogfeld „Aus Tabellen importieren“ erstellen, während eine Abfrage erstellt wird, um Ihre Daten zu importieren.
  2. Enthält eine Tabelle mehr als 8 MB komprimierter Daten und die andere Tabelle nicht, ziehen Sie den Spaltennamen von der größeren Tabelle auf den entsprechenden Spaltennamen der kleineren Tabelle. Dadurch wird ein Inner-Join erstellt. Es wird eine Linie im Bereich „Abfragegenerator“ angezeigt, die den Join repräsentiert. Diese Linie verläuft von der ersten Spalte zur zweiten Spalte. Machen Sie weiter mit Schritt 6.
  3. Wenn beide Tabellen mehr als 8 MB komprimierte Daten enthalten oder beide Tabellen weniger als 8 MB komprimierte Daten enthalten, ziehen Sie den Spaltennamen aus einer Tabelle in die Spalte aus einer anderen Tabelle. Dadurch wird ein Inner-Join erstellt. Es wird eine Linie im Bereich „Abfragegenerator“ angezeigt, die den Join repräsentiert. Diese Linie verläuft von der ersten Spalte zur zweiten Spalte. Wenn die Tabellen, die Sie verknüpft haben, mehr als 8 MB komprimierte Daten enthalten, fahren Sie mit Schritt 8 fort. Fahren Sie anderenfalls mit Schritt 6 fort.
  4. Kennen Sie die Größe der Tabellen, die Sie verknüpfen, nicht, ziehen Sie den Spaltennamen von einer Tabelle auf den Namen der entsprechenden Spalte aus der zweiten Tabelle.
  5. Klicken Sie auf SQL ausführen, um zu testen, ob der Join gültig ist.

    Wird im Abschnitt „Beispielvorschau“ darunter eine Vorschau Ihrer Daten angezeigt, ist der Join gültig und wurde erfolgreich erstellt. Die zweite Tabelle, die Sie verknüpft haben, enthält weniger als 8 MB komprimierter Daten. Machen Sie weiter mit Schritt 6.

    Falls eine Fehlermeldung angezeigt wird, die angibt, JOIN die rechte Tabelle des Operators klein ist, ist die zweite Tabelle, die Sie Join ausführen, zu groß, um den Join zu erstellen. Klicken Sie auf den Join und wählen Sie Löschen. Erstellen Sie einen neuen Join, indem Sie den Spaltennamen aus der zweiten Tabelle auf den entsprechenden Spaltennamen in der ersten Tabelle ziehen. Klicken Sie auf SQL ausführen.

    Wird im Abschnitt „Beispielvorschau“ darunter eine Vorschau Ihrer Daten angezeigt, wurde der Join erfolgreich erstellt. Machen Sie weiter mit Schritt 6.

    Wird die Fehlermeldung ein zweites Mal angezeigt, enthalten beide Tabellen über 8 MB komprimierter Daten. Fahren Sie mit Schritt 8 fort, um die SQL-Abfrage für den Import Ihrer Daten zu bearbeiten.

  6. Nachdem Sie einen Join erstellt haben, können Sie den Typen ändern oder ihn löschen. Klicken Sie auf die Linie, die den Join darstellt.

    Google BigQuery unterstützt andere Join-Verfahren, wie einen Full-Outer-Join oder Right-Outer-Join, nicht. Zusätzlich verwendet Google BigQuery den Gleich-Operator (=), um Spalten zu vergleichen, und unterstützt keine anderen Operatoren.

  7. Wählen Sie Inner-Join aus, um nur Datensätze einzuschließen, in denen die verknüpften Spalten aus beiden Tabellen die Join-Bedingung erfüllen.

  8. Wählen Sie Left-Outer-Join (Standard), um alle Datensätze aus der Spalte in der ersten Tabelle und nur jene Datensätze aus der Spalte in der zweiten Tabelle einzuschließen, in der die Join-Bedingung erfüllt ist.
  9. Um den Join zu löschen, wählen Sie Löschen.
  10. Sie erstellen einen Join für Tabellen mit mehr als 8 MB komprimierten Daten. Sie müssen daher die Abfrage modifizieren. Fügen Sie zunächst zusätzliche Spalten hinzu, die Sie importieren möchten. Erstellen Sie etwaige Filter, Aggregationen oder Ausdrücke basierend auf den Spalten, die Sie exportieren.
  11. Klicken Sie auf SQL bearbeiten. Das SQL für den Import Ihrer Daten wird im Abschnitt „Abfragegenerator“ angezeigt.

  12. Nach dem Wort JOIN, Typ EACH.

  13. Fahren Sie mit dem Import Ihrer Daten fort oder passen Sie Ihre Abfrage weiter an.

Weitere Themen

Importieren Sie Daten aus einer Datenbank, Hadoop oder Google BigQuery, indem Sie eine SQL-Abfrage erstellen

Importieren von Daten aus einer Datenbank, aus Hadoop oder Google BigQuery durch Auswählen von Tabellen

Anpassen Ihrer Abfrage beim Importieren von Daten aus einer Datenbank, aus Hadoop oder Google BigQuery