rys. II: pokazanie przykładu, w którym skalowalność może prowadzić do błędnego wyniku
2) algorytm klastrowania musi być w stanie radzić sobie z różnymi typami atrybutów.
3) algorytm klastrowania musi być w stanie znaleźć dane klastrowe o dowolnym kształcie.
4) algorytm klastrowania musi być niewrażliwy na szum i wartości odstające.
5) interpretacja-zdolność i użyteczność-uzyskany wynik musi być interpretowalny i użyteczny, aby uzyskać maksymalną wiedzę na temat
parametrów wejściowych.,
6) algorytm klastrowania musi być w stanie poradzić sobie ze zbiorem danych o wysokiej wymiarowości.
algorytmy klastrowania można ogólnie podzielić na dwie kategorie:
1) nienadzorowane algorytmy klastrowania liniowego i
2) nienadzorowane nieliniowe algorytmy klastrowania
I. nienadzorowany algorytm klastrowania liniowego
k-oznacza algorytm klastrowania rozmyty c-oznacza algorytm klastrowania hierarchiczny algorytm klastrowania Gaussian(EM) algorytm klastrowania próg jakości algorytm klastrowania
II., Nienadzorowany nieliniowy algorytm klastrowania
MST based clustering algorithm kernel k-means clustering algorithm Density based clustering algorithm