Opracowanie:
Rozkład normalny
Rozkład normalny
Rozkład normalny to najbardziej znany rozkład teoretyczny prawdopodobieństwa w statystyce, najczęściej używa się pojęcia rozkład Gaussa albo krzywa Gaussa. Wykres funkcji prawdopodobieństwa tego rozkładu jest krzywą dzwonowatą (ma kształt dzwonu).
Rozkład normalny można wytłumaczyć w najprostszy sposób sytuacją, w której większość przypadków znajduje się w pobliżu wyniku średniego. Natomiast im wynik bardziej odsunięty jest od krzywej, tym jest go mniej i występuje mniej takich przypadków.
Zwykle najwięcej jest przypadków przeciętnych, a najmniej skrajnych. Szukając analogii w życiu codziennym można przytoczyć, np. średni wiek życia ludzi w Polsce.
Jak się definiuje rozkład normalny? Najczęściej wykorzystuje się do tego celu funkcję gęstości, dystrybuantę, kumulanty, funkcję charakterystyczną, momenty oraz funkcję tworzącą kumulanty i momenty. Dla wszystkich poza funkcją gęstości i dystrybuantą, kumulanty rozkładu normalnego wynoszą zero.
Wzór na funkcję gęstości rozkładu normalnego
W celu wyznaczenia gęstości prawdopodobieństwa w rozkładzie normalnym dla danego wyniku trzeba podstawić do wzoru wartość oczekiwaną i odchylenie standardowe dla zmiennej i wskazany wynik.
,
gdzie:
x- wynik obserwacji
μ – wartość oczekiwana zmiennej
– odchylenie standardowe zmiennej
Parametry rozkładu N(µ,σ):
µ – Wartość oczekiwana, czyli średnia
σ2 – Wariancja, czyli odchylenie standardowe
Funkcja gęstości w rozkładzie normalnym
• jest symetryczna względem prostej x = µ
• w punkcie x = µ osiąga wartość maksymalną
• ramiona funkcji mają punkty przegięcia dla x = µ – σ oraz x = µ + σ
Kształt funkcji gęstości zależy od wartości parametrów: µ, σ :
– parametr µ wpływa na przesunięcie krzywej,
– parametr σ wpływa na wybrzuszenia krzywej.
Reguła 3 sigma
Jeżeli zmienna losowa ma rozkład normalny N(µ,σ) to:
– 68,3 % populacji mieści się w przedziale (µ – σ; µ + σ)
– 95,5 % populacji mieści się w przedziale (µ – 2σ; µ + 2σ)
– 99,7 % populacji mieści się w przedziale (µ – 3σ; µ + 3σ)
Najważniejsze własności rozkładu normalnego:
Rozkład normalny jest ciągły oraz symetryczny.
Największa gęstość prawdopodobieństwa jest dookoła wartości średniej, im dalej od niej tym gęstość jest niższa.
Parametry rozkładu normalnego interpretuje się następująco: µ jest modą krzywej gęstości oraz medianą i średnią arytmetyczną zmiennej.
Natomiast σ jest odchyleniem standardowym tej zmiennej, którego zwiększenie powoduje jedynie spłaszczenie centralnego wybrzuszenia wykresu oraz pogrubienie jego zakończeń.
Reguła 3 sigma
Przykład.
Przeanalizujmy wzrost kobiet w Polsce. Zgodnie z danymi z lipca 2016 roku roku średni wzrost kobiet wynosi 164.6 cm.
Większość obserwacji skupia się wokół tej wartości, co oznacza, iż większość kobiet ma wzrost między 140cm a 190cm. Oczywiście mogą zdarzyć się kobiety o wzroście poniżej 140cm lub powyżej 190cm, ale pojawiają się one stosunkowo rzadko. Żeby zweryfikować empirycznie ten stan można podczas spaceru dokonać obserwacji, jak często spotkamy poniżej 140cm lub powyżej 190cm.
Działania w rozkładzie normalnym
Dodawanie w rozkładzie normalnym
Jeżeli do rozkładu normalnego doda się liczbę (lub pomnoży przez liczbę) to uzyskany rozkład też będzie rozkładem normalnym:
X∼N(μ,σ) oraz a, b ∈ R oraz b > 0 , wówczas a+bX∼ N(a+b⋅μ,bσ)
Suma rozkładów normalnych jest rozkładem normalnym
Jeżeli , to
Średnia rozkładu normalnego jest rozkładem normalnym
Tak jak wspomniano na początku artykułu do definiowania rozkładu normalnego używa się także dystrybuanty. Sytuacja, w której wykorzystuje się dystrybuantę dotyczy nie pojedynczego zdarzenia, a grupy zdarzeń, np. czy podczas zakupów zapłacimy mniej niż 500zł, a nie dokładnie 500zł. Aby obliczyć takie prawdopodobieństwo wykorzystuje się dystrybuantę.
Definicja dystrybuanty: jest to funkcja, która jest równa prawdopodobieństwu tego, że dana zmienna losowa X będzie mniejsza od t i opisuje się ją wzorem
, gdzie
– to dystrybuanta rozkładu X w punkcie t
Jaki wykres przyjmuje dystrybuanta?
Wartość dystrybuanty w punkcie t równa się polu zaznaczonemu na zielono i wynosi .
Jaki właściwości posiada dystrybuanta?
Każda dystrybuanta wyróżnia się trzema cechami:
F to funkcja niemalejąca., czyli jeśli patrzymy w prawo na wykres wartość dystrybuanty nie będzie malała.
F to funkcja lewostronnie ciągła, gdyż P(x
Oznacza to, że sytuacja nie będzie miała miejsca, czyli zdarzenie nie zajdzie. Zaś największa wartość to 1, czyli zdarzenie zajdzie na 100%.
Ciekawostka na temat rozkładu normalnego
Badania nad właściwościami rozkładu normalnego prowadził niemiecki matematyk, fizyk, astronom, geodeta i wynalazca Carl Friedrich Gauss (1777-1855). Co ciekawe jego podobizna wraz z wykresem gęstości rozkładu normalnego znajdowała się na banknocie dziesięciu marek. Ten rodzaj waluty które funkcjonował w Niemczech przed wprowadzeniem Euro.