Opracowanie:
Statystyka
Statystyka
Statystyka to bardzo obszerny dział matematyki. W nim analizuje się różne dane, przedstawia się za pomocą wielu elementów, rysuje się wykresy itd. W tym opracowaniu po krótce dowiesz się najważniejszych rzeczy związanych z statystyką.
Po co prowadzi się statystyki?
Odpowiedź na te pytanie jest bardzo prosta. Dzięki statystykom zyskujemy ogólne oraz przydatne informacje na temat określonego zjawiska. Jeśli mamy przed pewną grupę ludzi/zwierząt/roślin możemy rozpocząć badanie statystyczne. Co ważne statystyka opisowa zaczyna się dopiero w momencie, w którym zaczynamy analizować dane.
Czym jest analiza danych?
Ogólnie rzecz ujmując, dzięki analizie danych, konkretne dane możemy przedstawić np. w postaci wykresów słupkowych, liniowych, tabel, wykresów kołowych itd. Ponadto sam opis danych czy też napisanie najprostszych wniosków to także część analizy danych.
Jak możemy przedstawić dane oraz wyniki?
Spróbujmy teraz pokazać różne rodzaje prezentacji danych. Najczęściej przy dużej ilości danych możemy spotkać się w wieloma tabeli, które będą przedstawiać dane. W stworzonych przeze mnie tabelach możesz zobaczyć jak można by przedstawić kwoty wydane przez dane osoby oraz jak można by przedstawić w postaci tabeli to, w które dni tygodnia występowała dana pogoda.
Innym sposobem będzie przedstawienie wyników przy pomocy wykresów miar statystycznych np. dzięki wykresie kurtozy.
Kolejnym sposobem jest pokazanie danych dzięki wykresom kołowym:
Oczywiście, możemy też przedstawić dane przy pomocy wielu innych programów komputerowych czy też za pomocą innych wykresów np. poprzez wykresy słupkowe:
Analiza przestrzenna
Generalnie rzecz ujmując wyróżniamy kilka rodzajów analiz. Pierwszą opisaną przeze mnie analizą będzie analiza przestrzenna. Dzięki niej możemy śmiało analizować dane, które zazwyczaj łączą się z przestrzenią, terenem i czasem. Analiza przestrzenna pozwala na analizę danych, które przyjmują właśnie formę wyżej wymienionych czynników. Te analizy najczęściej wykonują geografowie, czy też osoby związane z tą branżą. Ponadto warto wspomnieć, że te analizy nie tylko przydają się mieszkańcom miast, wsi, tubylcom, ale i przydają się naukowcom, uczniom, studentom, doktorom itd. Po każdorazowej analizie przestrzennej dostajemy tak zwane nowe informacje, które pozwalają nam spojrzeć na dane rzeczy pod nowym światłem. Zazwyczaj takie wyniki przedstawia się w sposób graficzny przystępny również zwykłym ludziom. Najczęściej spotykamy się z wykresami.
Analiza struktury
Drugą bardzo ważną analizę stanowi analiza struktury. Jak sama nazwa mówi, ta analiza daje nam dane, dzięki którym widzimy jak zbudowana jest struktura. Możemy dostrzec np. odstające wartości, możemy obliczyć średnie dane itd. Warto wspomnieć, że gdy podchodzimy do badania danej grupy czy też zbiorowości, to powinniśmy zwrócić szczególną uwagę, aby nasza zbiorowość była zróżnicowana. Gdy ta zbiorowość będzie jednolita, to wyniki badań mogą się okazać nie do końca prawdziwe. Dlatego tak ważne są różnice w zbiorowości. Scharakteryzować każdą grupę pod względem struktury pomagają nam poniżej opisane miary.
Czy mamy wiele sposobów na opis w statystyce opisowej?
Oczywiście, że tak. Każdy sposób opisu danych statystycznych nazywamy miarą. Wyróżniamy kilka rodzajów tych miar.
Najłatwiejsza do opisania miara, to miara położenia. Dzięki niej możliwy jest opis rozkładu danych wzdłuż osi liczbowej. Średnia arytmetyczna, dominanta, średnia harmoniczna to tylko niektóre z przykładów miar położenia.
Stosunkowo również prosta do opisania jest miara zróżnicowania. Dzięki niej mamy możliwość zauważyć jaka jest różnica (o ile ta różnica występuje) nowej wartości od wartości (standardowej). Odchylenie standardowe jak i współczynnik zmienności to najpopularniejsze miary zróżnicowania.
O asymetrii czy też braku asymetrii informuje nas miara asymetrii. Współczynnik skośności i współczynnik asymetrii to najczęstsze miary asymetrii.
Ostatnia opisywana przeze mnie miara będzie dotyczyć kurtozy oraz nierówności podziału, a sama miara jest nazywana miarą koncentracji. Kurtoza mówi nam o tym, jak bardzo dany wynik różni się od wyniku średniego. Przykłady kurtozy są pokazane poniżej.
Warto jednak troszkę bardziej skupić się na mierze koncentracji. Ją możemy podzielić na takie dwie grupy. Pierwszą stanowi kurtoza. Drugą zaś stanowi nierównomierny podział (mała część odstaje od dużej reszty).
Najpierw zajmijmy się kurtozą. Dzięki przeprowadzeniu badania z następnie zastosowaniu kurtozy możemy sprawdzić jak wartości są skupione przy danej średniej. Spójrzmy na wykres. Im jest „większy szczyt”, i tym samym największe wartości przy osi pionowej, oznacza to że mamy bardzo dużo tych danych. Im idziemy na boki od osi pionowej to zauważamy, że wraz z argumentami, wartości te są coraz niższe. Określenie kurtozy jest możliwe dzięki współczynnikowi kurtozy (K) oraz współczynnikowi ekscesu (K’).
Jeśli koncentrację traktujemy jako nierównomierność rozkładu, to aby zrozumieć to warto przeczytać poniższe zdanie. „Pośród pól i wsi wybudowana została luksusowa rezydencja.”. Jak widzimy ta rezydencja odstaje na tle spokojnej wsi. Tę sytuację możemy przedstawić na dwa sposoby. Możemy rozrysować to graficznie, w efekcie otrzymując jeden z przybliżonych grafik. To co przedstawia grafika to nic innego jak krzywa koncentracji Lorenza.
Jeśli jednak bardzo lubimy cyferki to możemy użyć metody analitycznej. Dzięki współczynnikowi koncentracji Giniego również bez problemu możemy określić naszą koncentrację. W związku z tym, że ten współczynnik przyjmuje wartości od 0 do 1, to całkowita koncentracja będzie wynosić 1, a całkowity brak koncentracji będzie oznaczony jako 0. Wartości z zakresu od 0 do 1 będą zatem informować nas o pośredniej słabej/średniej/mocnej itd. koncentracji.