Kiedy pracujesz z dużymi danymi w Pycharm, chcesz zwykle zobaczyć, co w tych danych się znajduje. Najprościej to zrobić wyświetlając DataFrame na ekranie. Niestety, jeśli obiekt ma wiele kolumn to domyślnie zostanie wyświetlonych tylko kilka a między nimi pojawi się symbol trzech kropek mówiący o tym, że nie wszystko się zmieściło. Podobnie kiedy do wyświetlenia jest wiele wierszy, może pojawić się jeden wiersz wypełniony kropkami, informujący o tym, że python zdecydował się nie wyświetlać wszystkiego:
Co zrobić?
Metoda 1. Dodajesz kilka poleceń, które zmieniają opcje działania poleceń wyświetlających data frame:
– display.width – ile znaków może być w jednej linijce w czasie wyświetlania wiersza
– display.max_columns – ile kolumn ma być maksymalnie wyświetlanych
– jeśli to samo chciałbyś robić z obiektami numpy to jest do tego opcja linewidth
import pandas as pd import numpy as np pd.set_option('display.width', 300) pd.set_option('display.max_columns',10) np.set_printoptions(linewidth=300) data = pd.read_csv(r'C:\Examples\StackOverflowDeveloperSurvey.csv') print(data.head(100))
Nie znam opcji, która rozwiązuje problem dodatkowego wiersza z kropkami, kiedy do wyświetlenia jest dużo wierszy, ale znam sztuczkę. Nie należy wyświetlać data frame, ale raczej data frame skonwertowany do napisu metodą to_string(). Ta metoda zadziała zresztą też, kiedy chcesz wyświetlić wszystkie kolumny. Pamiętaj jednak o wpływie na wydajność skryptu w którym takich parametrów i sztuczek użyjesz
import pandas as pd import numpy as np data = pd.read_csv(r'C:\Examples\StackOverflowDeveloperSurvey.csv') # wyswietlanie wszystkiego print(data.head(100).to_string())
Metoda 2. Skorzystaj z graficznego viewera dostępnego podczas debugowania.
Ustaw break point i uruchom skrypt w trybie debug.
W okienku Variables odszukaj zmiennej odpowiadającej za obiekt DataFrame i w menu konteksowym wybierz View As DataFrame