Opracowanie:
Rozkład normalny
Rozkład normalny
Rozkład normalny odgrywa ważną rolę w statystyce i jest jednym z najważniejszych rozkładów prawdopodobieństwa.
Występuje w przyrodzie, technice, czy ekonomii.
Przyjrzyjmy się teraz wzorowi opisującemu ten rozkład.
μ– oznacza wartość oczekiwaną rozkładu
σ- odchylenie standardowe
f(x)- funkcja gęstości prawdopodobieństwa
exp- funkcja wykładnicza, gdzie e to stała Eulera.
μ( mi) i σ(sigma) to parametry. μ może przyjąć dowolną wartość rzeczywistą, zaś σ musi być większa od 0.
Rozkład normalny nazywamy standardowym wówczas, gdy średnia μ=0 i wariancja σ2=1.
Wykres rozkładu normalnego nazywany jest krzywą Gaussa. Ma on kształt dzwonu.
Przykładem takiego wykresu dla wariancji σ2=1 oraz μ=2 prezentować się będzie w ten sposób:
Własności przydatne przy rysowaniu krzywej Gaussa
Po pierwsze, dziedziną funkcji jest zbiór liczb rzeczywistych.
Po drugie, funkcja przyjmuje tylko wartości dodatnie.
Po trzecie, granice funkcji w minus i plus nieskończoności są równe 0, z czego wynika iż oś x jest asymptotą wykresu f(x).
Po czwarte, monotoniczność funkcji rośnie od minus nieskończoności do μ, czyli dwóch, a maleje od dwóch do plus nieskończoności.
Ważne jest iż średnia wynosi 2 i to właśnie w niej funkcja przyjmuje maksymalną wartość.
Należy także wiedzieć iż funkcja ta jest symetryczna względem pionowej prostej przechodzącej przez średnią wynoszącą 2.
Prosta więc ma równanie x=2 i jest to oś symetrii.
Warto też wiedzieć iż funkcja osiąga maksimum w punkcie x = μ. Jeśli μ wynosi np. -3, to maksimum tej funkcji wynosi -3. Najpierw funkcja rośnie i osiąga swoje maksimum, a później maleje. Jeżeli wartości dla σ są takie same, to jednakowe będą kształty takich krzywych. O smukłości krzywych decyduje właśnie parametr σ.
Pamiętać należy też o tym iż gdy parametr σ przyjmuje mniejszą wartość od parametru μ, to wówczas krzywa będzie smuklejsza, zaś gdy parametr σ przyjmuje większą wartość od parametru μ, krzywa jest bowiem bardziej rozłożysta.
Krzywa ogranicza pole o wielkości 1.
Rozkład normalny, pomimo iż jest dość często stosowanym zjawiskiem, to jednak nie jest realizowany w praktyce.
Warto zapamiętać, że rozkład ten ma gęstość prawdopodobieństwa niezerową. W rzeczywistości natomiast zmienne są zawsze ograniczone.
Inteligencja, która jest mierzona testami inteligencji, uważa się za zmienną o rozkładzie normalnym. W praktyce jednak testy nie dają wyników ciągłych.
W przybliżeniu o rozkładzie normalnym może być także wzrost człowieka. Należy jednak wtedy założyć, że oczekiwaną wartością rozkładu będzie wartością np. 160cm, natomiast odchylenie standardowe musi być tak małe, aby taki przypadek ludzki o ujemnym wzroście, miał znikomo małe prawdopodobieństwo.
Przejdźmy teraz do natężenia źródła światła, które zmienia się w czasie. Założyć należy iż ma ono rozkład normalny i jest strumieniem fotonów, zgodnie z mechaniką kwantową.
Jeśli chodzi natomiast o błędy pomiaru, to częste powtarzanie tego samego pomiaru, daje wyniki rozrzucone wokół określonej wartości. Zakłada się, że pozostałe, mniejsze błędy, gdy wyeliminowane zostaną te większe, są rezultatem sumowania ze sobą dużej liczby niezależnych czynników, w efekcie czego otrzymujemy rozkład normalny.
Przykład zastosowania rozkładu normalnego odnośnie poziomu inteligencji.
Najwięcej osób jest o średnim poziomie inteligencji, IQ=100, natomiast dużo mniej osób na poziomie inteligencji równym IQ=80, lub IQ= 120, zaś jeszcze mniej o IQ=135, czy IQ=65.
Rozkład normalny, jak sama nazwa mówi, odnosi się do sytuacji normalności. Chodzi tutaj o przypadek, który jest w społeczeństwie najliczniej reprezentowany. Przypadki natomiast zaniżające średni poziom bądź zawyżające są dużo mniej liczne.
Tym mniejsza jest liczba obserwacji, im mniejsze jest odchylenie standardowe.
Rozkład normalny możemy nazwać najbardziej pożądanym rozkładem. Świadczy o tym fakt, że rozkład ten dokładnie opisuje losowe przypadki.
Kiedy obserwujemy czynniki losowe w naturze, np. u wybranych dwudziestu osób średni poziom inteligencji, to za pierwszym razem możemy otrzymać wynik 98, a za drugim razem np.110. Gdy natomiast powtórzymy takie badanie wielokrotnie, to mimo to, iż osoby do badania wybierane były losowo, średnia dla takich pomiarów wynosiłaby 100, oczywiście zakładając, że średni poziom IQ w całej populacji wynosi 100. Dodać należy, że rzadziej będą występowały pomiary o przeciętnym wyniku, niż pomiary skrajne. Sprawia to, że kiedy rozkłady zmiennych przez nas mierzonych zbliżone są do rozkładu normalnego, to można powiedzieć, że w przypadku tej próby nie występują anomalia, tylko nasze dane są „normalne”. Występuje także mało skrajnych obserwacji, a większa część obserwacji skupiona jest wokół średniej.
Istotnym jest zatem, aby rozkłady były zbliżone do normalnego, po to, żeby nie wyliczać wyników na niestandardowej próbie tych wyników, gdzie przeważałyby wyniki skrajne. Występowanie takich rozkładów anormalnych powoduje, że nie da się zastosować dla nich własności rozkładu normalnego , czego skutkiem będzie brak możliwości korzystania z licznych testów statystycznych, gdyż ich rezultaty zaburzone mogą być przez występowanie niestandardowego rozkładu wyników.