Opracowanie:
Wariancja
Wariancja
Przed wprowadzeniem terminu wariancja, napiszę w skrócie czym jest statystyka.
W statystyce przeprowadza się badania statystyczne. Celem badań statystycznych jest zbadanie i przeanalizowanie pewnych cech na podstawie próby w przełożeniu na całe społeczeństwo. Zebranie wyników całej populacji jest praktycznie niemożliwe, ponieważ zabiera mnóstwo czasu oraz generuje ogromne koszty. Wyobraźmy sobie przeprowadzenie sondażu na temat ulubionego przedmiotu w szkole wśród wszystkich dzieci na świecie. Na pewno będzie trzeba dużo ludzi, którzy będą w to zaangażowani i będą przeprowadzać sondaż. O ile zbadanie społeczeństwa jednego państwa nie stanowi wielkiego problemu, o tyle przepytanie wszystkich ludzi na świecie jest już problemem. Dlatego jeżeli chcemy przeprowadzić badanie statystyczne wybieramy próbę, która będzie odpowiednio reprezentowała populację.
Po zebraniu danych następuje ich analiza.
Weźmy jako przykład 10 uczniów ze szkoły podstawowej z klas 4-6, którzy zostali wybrali losowo. Zostali zapytani o poszczególne oceny z przedmiotów. Uzyskano dużo danych, z których można wyciągnąć pewne wnioski. Do tego służą miary położenia oraz miary dyspersji. Podstawowymi oraz powszechnie znanymi miarami położenia są oczywiście średnie. Wyróżniamy średnią arytmetyczną, średnią harmoniczną, średnią ważoną, średnią geometryczną. Mniej znane, ale również popularne to dominanta oraz kwartyle.
Miary dyspersji są to tak zwane miary zmienności, zaliczamy do nich między innymi wariancję, odchylenie standardowe, rozstęp, odchylenie ćwiartkowe.
Po tym wstępie, który miał nakreślić zagadnienie statystyki i analizy badań statystycznych przybliżę czym więc jest tytułowa wariancja.
Wariancję oznaczamy symbolem σ2. Wariancja to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości od średniej arytmetycznej zbiorowości.
Wzory na wariancję:
Szereg szczegółowy:
Szereg punktowy
Szereg przedziałowy
Σ oznacza sumę
x to średnia arytmetyczna dla wszystkich wyników z populacji
xi to poszczególne wartości
ni to liczebność wariantów (w szeregu punktowym oraz przedziałowym)
n to liczebność populacji
k to środki klas w szeregu przedziałowym
Powyższe zapisy mogą brzmieć dosyć trudno, ale przedstawię teraz obliczanie wariancji na przykładach.
Przykład 1
W pewnej szkole podstawowej zapytano losowo wybraną grupę dzieci o oceny z matematyki. Ich oceny to: 2, 2, 2, 4, 5, 3. Obliczmy wariancję.
Najpierw należy obliczyć średnią arytmetyczną dla uzyskanych wyników.
Potrzebne będzie jeszcze n, czyli liczebność populacji. Liczebność to 6, ponieważ tyle ocen uzyskaliśmy.
Można w tym momencie zapytać do czego tak właściwie służy wariancja i co to oznacza. To bardzo trafne pytanie, ponieważ wszystko po coś liczymy, nie tylko dla samego faktu obliczenia. Z wariancji możemy wyznaczyć odchylenie standardowe. Jest to pierwiastek z wariancji.
Dzięki obliczeniu wariancji, a następnie odchylenia standardowego możemy zanotować typowy obszar zmienności.
3 – 0,7 < typ < 3 + 0,7
2,3 < typ < 3,7
Typowy obszar zmienności z definicji oznacza, że w tym obszarze mieści się 2/3 wyników. Możemy to sprawdzić. Wypiszmy oceny jeszcze raz:
2, 2, 2, 4, 5, 3.
W typowym obszarze mieszczą się 2, 2, 2, 3. Czyli 4 na 6 naszych wyników. .
Odpowiedź: Oceny z matematyki uczniów odchylają się o 0,7 od średniej arytmetycznej.
Przykład 2
Ten przykład będzie bardzo praktyczny.
Załóżmy, że mamy trzy firmy:
W firmie pierwszej jest 10 pracowników, każdy zarabia dokładnie 3000zł.
W drugiej firmie jest 9 pracowników, którzy zarabiają po 1000zł oraz kierownik, który zarabia 21000zł.
W trzeciej firmie również jest 9 pracowników. 3 z nich jest na stażu i zarabia 1000zł. 3 to początkujący pracownicy zarabiający 3000zł, a ostatnia trójka zarabia 5000zł.
Obliczmy średnią arytmetyczną dla każdej firmy:
W każdej firmie średnia arytmetyczna to 3000zł.
Obliczmy wariancję dla tych danych.
Pierwsza firma:
Druga firma:
Trzecia firma:
Poprzez znaną średnią arytmetyczną nie jest tak łatwo podjąć decyzję, która firma płaci najlepiej pracownikom. Oczywiście liczby są wymyślone na potrzeby zadania, w prawdziwym życiu mogłyby być bardziej odległe od siebie.
Przeanalizujmy teraz nasze wyniki.
Pierwsza firma:
Odchylenie standardowe oraz wariancja są równe 0, dlatego wiemy, że każdy pracownik zarabia 3000zł.
Druga firma:
Odchylenie standardowe wynosi 5727zł, dosyć dużo. Zapiszmy przedział zmienności.
3000-5727 < typ < 3000 + 5727
-2727 < typ < 8727
Przez jednego kierownika, który zarabia tak dużo, typowy obszar jest na minusie. Wtedy powinna zaświecić się czerwona lampka w głowie oraz ostrzeżenie przed taką firmą.
Trzecia firma:
3000-1632 < typ < 3000+1632
1368 < typ < 4632
2/3 pracowników zarabia pomiędzy 1368zł, a 4632zł.
Przykład 3
Dany jest szereg przedziałowy. Obliczymy wariancję.
Najlepiej moim zdaniem zrobić to za pomocą tabeli. Bardzo przydatna jest również znajomość arkuszu kalkulacyjnego typu Excel. W prosty sposób można zrobić formuły do obliczenia wszystkiego.
Liczba punktów xi