Opracowanie:
Analiza danych

Analiza danych

Zweryfikowane

Analiza danych jest jedną z najważniejszych i najbardziej rozwijających się dziedzin matematyki, a także ogólnie nauki w ostatnich latach. Prawdopodobnie nie zdajemy sobie sprawy z tego, jakie ilości danych są produkowane każdego dnia na całym świecie – w 2022 roku są to sumy liczone w zettabajtach, czyli milionach petabajtów, czy też bilionach gigabajtów. Dane produkujemy cały czas – publikując treści w internecie, na przykład w social mediach, pisząc teksty lub wiadomości ze znajomymi, używając GPSa na telefonie aby znaleźć drogę, czy też wykonując płatność mobilną.

Gromadzenie i przetrzymywanie danych jest jednak dopiero pierwszym etapem całego procesu analizy danych. Głównym założeniem analizy danych jest, aby z ogromu otaczających nas informacji otrzymać sensowne i użyteczne wnioski. W tym celu należy najpierw dane przetworzyć. Pod tym pojęciem kryć może się usunięcie niepotrzebnych i zduplikowanych wyników, przetworzenie danych na jednolitą strukturę, przedstawienie ich w identycznej postaci, jednostce, oraz wybór tych danych, które chcemy następnie przeanalizować.

Następnie przetworzone już dane powinniśmy przedstawić w łatwej do zrozumienia postaci, najlepiej za pomocą wizualizacji danych. Jest to kolejna poddziedzina analizy danych, zajmująca się przedstawieniem informacji w sposób graficzny. Założeniem wizualizacji danych jest, aby przedstawione dane były łatwe do odczytania, i aby możliwe było wyciągnięcie wniosków, a także podjęcie decyzji biznesowych lub życiowych na ich podstawie.
Dane można zwizualizować za pomocą takich technik, jak:
·Histogramy
·Wykresy słupkowe
·Wykresy liniowe
·Diagramy kołowe
·Mapy drzewa

Na zakończenie, rozwiążmy podstawowe zadanie o podstawowych technikach analizy danych:

Zadanie 1.
W klasie siódmej jest 32 uczniów. Na sprawdzianie z matematyki 4 uczniów otrzymało ocenę celującą, 8 uczniów otrzymało ocenę bardzo dobrą, 12 uczniów otrzymało ocenę dobrą, i 8 uczniów otrzymało ocenę dostateczną. Nikt nie otrzymał oceny dopuszczającej ani niedostatecznej. Przedstaw wyniki uczniów na wykresie słupkowym oraz diagramie kołowym.

Rozwiązanie:
Aby narysować wykres słupkowy, musimy na osi x przedstawić możliwe wyniki (oceny), a na osi y liczbę uczniów, która otrzymała daną ocenę.

Aby narysować diagram kołowy, musimy obliczyć procent powierzchni koła, jakiemu odpowiada każda z ocen. W naszym zadaniu mamy 32 uczniów. Obliczmy częstotliwość, z którą występuje każda z otrzymanych przez nich ocen:
Ocena celująca – 4/32 = 1/8 = 12.5%
Ocena bardzo dobra – 8/32 = 1/4 = 25%
Ocena dobra – 12/32 = 3/8 = 37.5%
Ocena dostateczna – 8/32 = 1/4 = 25%
Przedstawmy te dane na diagramie kołowym:


Żaden z uczniów nie otrzymał oceny niedostatecznej ani dopuszczającej, tak więc możemy je umieścić na legendzie – jednak na wykresie nie umieszczamy odpowiedzi, które otrzymały 0%
Powyższe zadanie było bardzo podstawowym przykładem zastosowania analizy danych. Możemy jednak tych umiejętności użyć do analizy dużo bardziej skomplikowanych informacji, i naprawdę warto zgłębić swoją wiedzę w tej dziedzinie nauki.

Powyższe zadanie zostało zweryfikowane przez nauczyciela
To top