Na początku wiele rzeczy wydaje się prostych, a z czasem kiedy je analizujemy dochodzimy do drugiego dnia. Potem do trzeciego, potem do czwartego… Im dalej tym bardziej zaawansowane narzędzia są potrzebne.
boxplot(weight ~ feed, data = chickwts, varwidth = TRUE, notch=TRUE, col='gray')
Co na tym wykresie widać?
- Każde pudełko ma pośrodku poziomą kreskę. Ta kreska to mediana (wartość środkowa)
- Górna krawędź pudełka i dolna krawędź wyznaczają końce środkowych kwartyli
- Wystające odcinki, zwane też wąsami i sięgają do wartości minimalnej i maksymalnej
- Osobne pudełko zostało wygenerowane dla każdej kategorii – tutaj rodzaju karmy
- Miara, którą prezentujemy to waga kurczaka
- Pudełka są wcięte w centralnej części. To wcięcie pozwala odnieść pozyskana informację o medianie dla próbki danych do całej populacji. Oczywiście po przebadaniu całej populacji może się okazać, że mediana się przesunie. Te wcięcia określają tzw. przedział ufności mediany, czyli gdzie i z jakim prawdopodobieństwem pojawi się mediana na wykresie dla całej populacji. Za obecność wcięcia odpowiada parametr notch=TRUE