Opracowanie:
Analiza skupień

Analiza skupień

Zweryfikowane

Analiza skupień to pojęcie z zakresu uczenia maszynowego oraz eksploracji danych, pochodzące z szerszego pojęcia – klasyfikacji bezwzorcowej.
Jest to metoda tzw. klasyfikacji bez nadzoru – polega na porządkowaniu elementów we względnie jednorodne klasy. Podstawę grupowania w większości algorytmów stanowi podobieństwo pomiędzy elementami – ukazane za pomocą funkcji podobieństwa.
Poprzez grupowanie można także rozwiązać zagadnienia z zakresu odkrywania struktury w danych oraz dokonywanie uogólniania. Grupowanie polega na wyodrębnianiu poszczególnych grup, klas, podzbiorów, etc.

Możemy rozróżnić kilka funkcji dokonywania grupowań:
a. porównanie wielocechowych obiektów
b. zmniejszenie dużej liczby danych pierwotnych do kilku pierwszorzędnych podgrup, co ułatwi dalszą analizę
c. otrzymanie jednorodnych przedmiotów badania, pozwalających na rozróżnienie cech
d. odkrycie nieznanych wcześniej struktur danych
e. redukcja czasu analiz oraz wkładu pracy, czego skutkiem może być klasyfikacja obiektów typowych

Algorytmy analizy skupień możemy podzielić na kilka głównych kategorii:
metody hierarchiczne
procedury aglomeracyjne
procedury deglomeracyjne

grupa metod k-średnich
przypisanie punktów do najbliżej położonych centroidów
wybór centroidów skupień
iteracja algorytmu do osiągnięcia punktu zbieżności
wyliczenie nowych środków skupień

metody rozmytej analizy skupień, z najbardziej powszechną metodą c-średnich

Analizę skupień możemy stosować w kilku sytuacjach:
a. przy wstępnej analizie danych – wyodrębnienie jednorodnych grup podlegających dalszej analizie ekonometrycznej lub statystycznej
b. przy eksploracji danych – grupowanie stosowane m.in. do podziału klientów na podgrupy
c. przy segmentacji obrazu – podział obrazu na strefy homogeniczne względem jego właściwości takich jak tekstura czy kolor
d. przy wyszukiwaniu informacji – uproszczenie i uporządkowanie dostępu do informacji.

Powyższe zadanie zostało zweryfikowane przez nauczyciela
To top