Ein Power-Query-Quicky über die Funktion Spalten wählen und warum es besser ist, Spalten zu wählen als sie zu löschen.

Sie machen eine neue Auswertung...

…und laden via Power Query mit einer Abfrage Daten aus einer Datei oder einer Datenbank. Wir alle kennen die Tabellen mit 300, 400 oder 500 Spalten. Die meisten Spalten sind für die Datenanalyse irrelevant. Nehmen wir die Tabelle SalesOrderHeader aus der AdventureWorks-Datenbank. Sehr viele Spalten hat die Tabelle zwar nicht. Aber auch hier finden wir beispielsweise folgende Felder, die man für die Datenanalyse nicht benötigst:

  • rowguid: Ein eindeutiger Bezeichner für die Zeile.
  • modifiedDate: Zeitstempel, an dem der Datensatz zuletzt geändert wurde
  • Comment: Eine Bemerkung - solange wir den Inhalt nicht auswerten wollen, brauchen wir die Spalte nicht.

Spalte markieren + ENTF

Sie wissen sicherlich, dass unnötige Spalten im Datenmodell die Dateien sehr groß machen und die Performance beeinflussen. Bisher haben Sie die unnötigen Spalten markiert und gelöscht. Genau das müssen Sie sich abgewöhnen. Und die Spalten behalten? Nein

Änderungen in der Datenquelle

Warum ist das keine gute Idee? Stellen wir uns folgendes Szenario vor:

Sie erhalten jeden Monat eine Auswertung von einem Lieferanten oder Dienstleister. Immer als CSV-Datei. Die Datei enthielt schon immer viel Ballast, den niemand benötigt hat. Im nächsten Monat werden in der neuen Datei viele dieser unnötigen Spalten nicht mehr geliefert.

Auf Basis dieser Daten aktualisieren Sie jetzt Ihre Auswertung. Weil so war das Ziel: Jeden Monat auf Aktualisieren drücken und alles passt. Die Aktualisierung schlägt aber fehl. Weil Power Query versucht Spalten zu löschen, die nicht mehr da sind.

Mit anderen Worten: Das Datenmodell ist fehlerhaft, weil Spalten nicht mehr geliefert werden, die wir vorher gelöscht haben, weil wir diese nicht benötigt haben. Bisschen paradox, oder?

Wie man Spalten löscht

Denken Sie positiv: Welche Spalten will ich? Verwenden Sie nach Möglichkeit die Funktion Spalten auswählen:

Funktion Spalten wählen in Power Query

Mit dieser Funktion wählen Sie Spalten aus, die Sie weiterverwenden wollen. Alle anderen Spalten sind nach dieser Transformation nicht mehr enthalten. Eine Änderung hat dann folgende Auswirkungen:

  • unnötige Spalte umbenannt: Macht nichts. Da die Spalte nicht explizit gelöscht wird ist der Name nicht relevant
  • unnötige Spalte nicht vorhanden: Macht auch nichts. Wir greifen auf die Spalte nicht zu
  • neue nicht benötigte Spalte: Die Daten werden automatisch nicht importiert. Der Lieferant kann immer mehr Spalten liefern. Dein Datenmodell wird nicht größer dadurch

Wenn natürlich relevante Spalten umbenannt oder geändert werden, dann müssen Sie natürlich was ändern.