Archiwum za miesiąc 2024-07

Python: TOP 10 skorelowanych kolumn

2024-07-07

W analizie danych zależy nam na wykryciu ukrytych relacji między różnymi cechami danych. Pomocne są w tym wykresy w rodzaju „heat-map” i wszystko ładnie, póki dane, które przetwarzamy są w miarę małe. A co jeśli mamy, dajmy na to 100 kolumn? Oczywiście znajdowanie najbardziej skorelowanych danych i wybieranie tych najbardziej skorelowanych da się zautomatyzować. Zobaczymy […]

By Rafał Kraik in SQL

Python: Pandas: melt na kolumnie z multi-indeksem

2024-07-02

Załóżmy, że dotarły do nas dane w takiej oto postaci: Mamy więc „sztuczny” indeks wierszy 'MF’ o wartościach 0,1,2,3,4 oraz kolumny, które są opisane muli-indeksem. Chcielibyśmy taką pivot-table czyli tabelę przestawną „odpivotować” i zobaczyć ją w tzw. długim formacie: Jeśli chcesz samodzilnie sobie takie dane wyczarować to użyj poniższego kodu: import pandas as pd import […]