W Pandas, seria danych to po prostu ciąg wartości. Wartość numer 2 to po prostu element prostego typu. Bardzo podobnie na pierwszy rzut oka wygląda jednokolumnowy DataFrame, ale… pewne różnice są:
numbers=[1, 2, 3, 4] letters=['A', 'B', 'C', 'D']
Tak powstaje seria danych – dla „zmyłki” indeksem jest kolumna numbers:
ds = pd.Series(data=letters, index=numbers) ds
oto wynik:
Out[45]: 1 A 2 B 3 C 4 D dtype: object
A tak wygląda to, jeśli utworzymy DataFrame, który ma jedną kolumnę i indeks zdefiniowany w oparciu o numbers:
df = pd.DataFrame(data=letters, index=numbers) df
wynik jest na pierwszy rzut oka podobny:
0 1 A 2 B 3 C 4 D
Duże różnice pojawią się jednak przy odwołaniu do konkretnej pozycji:
ds.loc[1] Out[47]: 'A'
a dla DataFrame:
df.loc[1] Out[48]: 0 A Name: 1, dtype: object