Introduction

Fig II: toont voorbeeld waar schaalbaarheid kan leiden tot verkeerd resultaat

2) Clustering algoritme moet in staat zijn om te gaan met verschillende soorten attributen.

3) Clustering algoritme moet geclusterde gegevens met de willekeurige vorm kunnen vinden.

4) Clustering algoritme moet ongevoelig zijn voor ruis en uitschieters.

5) Interpretatievermogen en bruikbaarheid-verkregen resultaat moet interpreteerbaar en bruikbaar zijn, zodat maximale kennis over

de invoerparameters kan worden verkregen.,

6) Clustering algoritme moet kunnen omgaan met dataset van hoge dimensionaliteit.

Clusteringsalgoritmen kunnen in grote lijnen in twee categorieën worden ingedeeld:

1) unsupervised linear clustering algorithms and

2) Unsupervised non-linear clustering algorithms

I. Unsupervised linear clustering algorithm

k-means clustering algorithm Fuzzy c-means clustering algorithm Hiërarchical clustering algorithm Gaussian(EM) clustering algorithm Quality threshold clustering algorithm

II., Unsupervised non-linear clustering algorithm

MST based clustering algorithm kernel k-means clustering algorithm Density based clustering algorithm

Leave a Comment