Strategy ONE
Kombinieren Sie Daten in Tabellen mit Joins in Google BigQuery
Sie können die Daten in zwei Tabellen kombinieren, indem Sie einen Join zwischen den Tabellen erstellen.
Eine Tabelle enthält die Spalten „Stadt“ und „Umsatz“. Eine zweite Tabelle enthält die Spalten „Stadt“ und „Gewinn“. Verknüpfen Sie die Daten in beiden Tabellen, indem Sie einen Join zwischen den Stadtspalten erstellen.
Um Daten in drei oder mehr Tabellen zu kombinieren, erstellen Sie einen Join zwischen zwei Tabellen und dann einen Join zwischen einer dieser zwei Tabellen und einer dritten Tabelle usw., bis alle Tabellen verbunden sind.
Die Syntax der JOIN-Klausel, die Sie schreiben, hängen von der Größe der Tabellen ab, die Sie verbinden. Es ist hilfreich, vor dem Erstellen eines Joins zu wissen, ob die Tabellen mehr als 8 MB an komprimierten Daten enthalten. Dies ist das Maximum von Google BigQuery für Tabellen, die mit der standardmäßigen JOIN-Klausel verbunden sind. Suchtabellen enthalten in der Regel nicht mehr als 8 MB an komprimierten Daten. Fakttabellen enthalten mit größerer Wahrscheinlichkeit mehr als 8 MB komprimiertes Datum.
So erstellen Sie einen Join, der Daten in zwei Tabellen kombiniert
- Sie können im Dialogfeld „Aus Tabellen importieren“ einen Join erstellen, der Daten in zwei Tabellen kombiniert Erstellen einer Abfrage für den Import Ihrer Daten.
- Wenn eine Tabelle mehr als 8 MB an komprimierten Daten enthält und die andere nicht, ziehen Sie den Spaltennamen von der größeren Tabelle zum entsprechenden Spaltennamen in der kleineren Tabelle. Dadurch wird ein Inner-Join erstellt. Im Abschnitt „Abfrageerstellung“ wird eine Linie angezeigt, die den Join darstellt und von der ersten zur zweiten Spalte führt. Fahren Sie mit Schritt 6 fort.
- Wenn beide Tabellen mehr als 8 MB an komprimierten Daten enthalten oder beide Tabellen weniger als 8 MB an komprimierten Daten enthalten, ziehen Sie den Spaltennamen von einer Tabelle auf die Spalte aus einer anderen Tabelle. Dadurch wird ein Inner-Join erstellt. Im Bereich „Abfrageerstellung“ wird eine Linie angezeigt, die den Join darstellt und von der ersten Spalte zur zweiten führt. Wenn die von Ihnen verbundenen Tabellen mehr als 8 MB an komprimierten Daten enthalten, fahren Sie mit Schritt 8 fort. Fahren Sie anderenfalls mit Schritt 6 fort.
- Wenn Sie die Größe der Tabellen, die Sie verbinden, nicht kennen, ziehen Sie den Spaltennamen von einer Tabelle auf den Namen der entsprechenden Spalte in der zweiten Tabelle.
-
Klicken Sie SQL ausführen, um zu testen, ob der Join gültig ist.
Wenn eine Vorschau Ihrer Daten im Bereich „Beispielvorschau“ angezeigt wird, ist der Join gültig und wurde erfolgreich erstellt. Die zweite Tabelle, die Sie verbunden haben, enthält weniger als 8 MB an komprimierten Daten. Fahren Sie mit Schritt 6 fort.
Wenn ein Fehler angezeigt wird, der anzeigt, dass der
JOINDie rechte Tabelle des Operators ist kleiner, dann ist die zweite Tabelle, die Sie verbunden haben, zu groß, um den Join zu erstellen. Klicken Sie auf den Join und wählen Sie aus Löschen. Erstellen Sie einen neuen Join, indem Sie den Spaltennamen aus der zweiten Tabelle auf den entsprechenden Spaltennamen in der ersten Tabelle ziehen. Klicken Sie SQL ausführen.Wenn eine Vorschau Ihrer Daten im Bereich „Beispielvorschau“ angezeigt wird, wurde der Join erfolgreich erstellt. Fahren Sie mit Schritt 6 fort.
Wenn die Fehlermeldung ein zweites Mal angezeigt wird, enthalten beide Tabellen über 8 MB an komprimierten Daten. Fahren Sie mit Schritt 8 fort, um die SQL-Abfrage für den Import Ihrer Daten zu bearbeiten.
-
Nachdem Sie einen Join erstellt haben, können Sie seinen Typ ändern oder ihn löschen. Klicken Sie auf die Linie, die den Join darstellt.
Google BigQuery unterstützt keine anderen Join-Typen, z. B. einen Full-Outer-Join oder einen Left-Outer-Join. Darüber hinaus verwendet Google BigQuery den standardmäßigen Gleich (=)-Operator zum Vergleichen von Spalten und unterstützt keine anderen Operatoren.
-
Auswählen Inner-Join, um nur Datensätze einzuschließen, in denen die verbundenen Spalten aus beiden Tabellen die Join-Bedingung erfüllen.
- Auswählen Left-Outer-Join (Standardeinstellung), um alle Datensätze aus der Spalte in der ersten Tabelle und nur die Datensätze aus der Spalte in der zweiten Tabelle einzuschließen, in denen die Join-Bedingung erfüllt ist.
- Auswählen Löschen, um den Join zu löschen.
- Sie erstellen einen Join für Tabellen mit mehr als 8 MB an komprimierten Daten. Daher müssen Sie die Abfrage ändern. Fügen Sie zuvor alle weiteren Spalten hinzu, die Sie importieren möchten. Erstellen Sie Filter, Aggregationen oder Ausdrücke basierend auf den Spalten, die Sie exportieren.
-
Klicken Sie SQL bearbeiten. Das SQL für den Import Ihrer Daten wird im Bereich „Abfrageerstellung“ angezeigt.
-
Nach dem Wort
JOIN, TypEACH.
-
Fahren Sie mit dem Import Ihrer Daten fort oder Passen Sie Ihre Abfrage an.
Weitere Themen
Importieren Sie Daten aus einer Datenbank, Hatoop oder Google Big Query durch Auswahl von Tabellen
