Kümeleme çözümlemesinde uygun kümeleme ölçütlerinin karşılaştırılması
Özet
Bu araştırmada, Kümeleme ölçütleri, g1a, g1b, g2, g3a, g3b, Wilk's lamda, Hotelling-Lawley iz istatistiği ve Kofenetik korelasyon katsayısı (rcs), çokdeğişkenli normal dağılımdan rasgele çekilmiş R10, R20, R30, R40 ve R50 grupları ile koşullu olarak çekilmiş K20, K30, K40, K50 ve K60 gruplarında test edildi. Bu gruplar 6 değişken ve farklı sayıda birim içeriyorlardı. Altı değişkene göre değerlerin Öklid uzaklıkları kullanılarak benzerlik matrisleri bulunduve küme sa- yısı 2 ile 5 arasında olacak şekilde aşamalı olmayan kümeleme yöntemi K-Ortalamalar yöntemi ile kümelendi ve Aşamalı kümeleme yöntemi olan Tek Bağlantı Kümeleme yöntemi ile bağlantılar belirlendi. Rasgele ve koşullu olarak belirlenen gruplarda küme istatistikleri ve ağaç gra- fikleri elde edildi. Oluşan kümelerin kümeleme kriterleri g1a, g1b, g2, g3a, g3b, rcs, her küme sayısına göre hesaplandı. Çokdeğişkenli varyans çözümle- mesi yapıldı ve kümenin türdeş bir kümemi değilmi olduğunu belirlemeye yarayan Wilk's lamda ve Hotelling-Lawley iz istatistikleri, F istatis- tikleri ve olasılıkları hesaplandı. Öteyandan 6 değişkenli her küme için doğru sınıflandırma olasılıkları Ayırma çözümlemesi ile hesaplan- dı. Kümeleme ölçütlerinin hesaplanmasında SPSS/PC+, SYSTAT, BMDP and MINITAB veri çözümlemesi paket programlarından yararlanıldı. g1a, g1b, g2, g2a, g3b, ölçütleri rasgele grupların kümelenme- sinde daha fazla küme sayısının uygun olduğunu gösterirken, Wilk's lamda ve Hotelling-Lawley iz istatistikleri uygun küme sayısını 3 ola- rak belirtmiştir. Gruplarda bir ya da daha fazla bağımsız birimin kümelenmesi arttığı zaman Tek bağlantı kümeleme yöntemi ve rcs ölçütü kümelenmenin uygun olmadığını belirtmektedir. Karşıt olarak gruplarda 3 ya da daha fazla birim içeren küme sayısı varsa, TBK ve rcs Wilk's lamda ve Ho- telling-Lawley iz istatistikleri ile aynı küme sayısını göstermiştir. İki farklı parametreli çokdeğişkenli normal dağılımdan türe- tilmiş olan koşullu gruplarda, g1a, g3a ve Tek bağlantı kümelemesi yöntemleri üç kümeyi uygun kümelenme olarak verirken, Wilk's lamda ve Hotelling-Lawley iz istatistikleri iki kümeyi önemli olarak vermiştir. Bu son iki istatistik, iki farklı dağılımdan çekilmiş birimleri, en- uygun kümelenme sayısı olarak 2 kümeye ayırmıştır.
Bağlantı
https://hdl.handle.net/11421/7594
Koleksiyonlar
- Tez Koleksiyonu [8]