Sağlam (Robust) Kümeleme Yöntemleri
Abstract
Bulanık c ortalamaya dayalı kümeleme algoritmaları sıfır kırılma noktasına sahiptir. Başka bir ifadeyle tek bir aykırı değer modeli tümüyle değiştirebilir. Veri kümesinde aykırı değer olduğunda bulanık c ortalamaya dayalı kümeleme tipi algoritmalar pratik değere sahip değildir. Bu nedenle aykırı değerden etkilenmeyen sağlam kümeleme yöntemleri önerilmiştir.
Bu çalışmada kümeleme analizlerinde yaygın olarak kullanılan katı c ortalamaya dayalı kümeleme ve bulanık c ortalamaya dayalı kümeleme yöntemleri ele alınmıştır. Veri kümesinde aykırı değer olması durumunda aykırı değerden etkilenmeyen gürültü kümeleme, olanaklı c ortalamaya dayalı kümeleme ve karma c ortalamaya dayalı kümeleme yöntemlerinin tanımları verilmiş ve karşılaştırılmıştır. Fuzzy c means algorithms have zero break point. In other words a single outlier can completely change the model. When data set has outlier, fuzzy c means type algorithms haven’t practical value. Therefore, robust clustering methods which are not affected by outlier have been suggested.
In this paper, hard c means clustering and fuzzy c-means clustering methods which are commonly used in clustering analysis are examined. Noise clustering, possibilistic c means clustering and mixed c means clustering methods which aren’t affected by outlier are defined and compared, when data set has outlier.
Source
Anadolu Üniversitesi Bilim ve Teknoloji Dergisi A - Uygulamalı Bilimler ve MühendislikCollections
- Cilt.07 Sayı.1 [24]