Python: Pandas: Zmiana kolejności kolumn w data frame

31-maj-2020

Kiedy pracujesz z danymi często startujesz od pewnego zbioru danych, do którego dodajesz kolejne i kolejne kolumny. Koniec końców część z tych kolumn nie jest już potrzebna, a część jest nie tam, gdzie wizualnie byś chciał. Jak zrobić z tym porządek?

Bardzo prosto! Wystarczy przepisać do nowego obiektu dataframe dane pobierane z oryginalnego data frame w określonej kolejności. Przy okazji jeśli coś jest już więcej niepotrzebne, to możesz to opuścić, a jeśli kolumn jest dużo, a ty chcesz po prostu ostatnią kolumnę wstawić na początek, to wystarczy po prostu korzystać z operatora slice podczas definiowania listy kolumn do skopiowania.

Zobacz, jak to się robi w oparciu o poniższy kod:

import pandas as pd

data = [ 
 [11,12,13,14],
 [21,22,23,24],
 [31,32,33,34],
 [41,42,43,44] 
 ]
df = pd.DataFrame( data = data, 
 columns=('one', 'two', 'three', 'four'))

df

df = df[['four','three','two','one']]

df

cols = df.columns.to_list()

df[cols[-1:] + cols[:-1]]

Komentarze są wyłączone

Autor: Rafał Kraik