E-Posta Trafiğinin Sıfır Değer Ağırlıklı Regresyon Yöntemleri Kullanılarak İncelenmesi
Abstract
Sayıma dayalı olarak elde edilen veriler beklenenden fazla sıfır değerine sahip olabilirler. Bu tip verilerin analizinde sıfır değerlerini dikkate alan regresyon yöntemlerinin kullanılması daha uygun olmaktadır. Beklenenden fazla sayıda sıfır değerine sahip bağımlı değişkenin modellenmesinde sıfır değer ağırlıklı Poisson (ZIP), sıfır değer ağırlıklı negatif binomial (ZINB), Poisson Hurdle (PH) veya negatif binomial Hurdle (NBH) regresyon yöntemlerinin kullanılması daha uygun yaklaşımlardır. Bu çalışmada, Yüzüncü Yıl Üniversitesi (YYÜ) e-posta sunucusundan personelin 2009 bahar eğitim öğretim döneminde yaptıkları e-posta trafiği incelenmiştir. Veri kümesinde beklenenden fazla sayıda sıfır (%78,9) değerlerin bulunmasından dolayı veri kümesine ZIP, ZINB, PH ve NBH regresyon yöntemleri uygulanmıştır. Gönderilen e-posta sayılarında hem sıfır yayılımı hem de aşırı yayılım olduğundan dolayı aşırı yayılımı ve sıfır yayılımını dikkate alan ZINB ve NBH regresyonlarının doğru sonuçlar gösterdikleri saptanmıştır. Uyum ölçütleri ve Voung istatistiklerine göre ZINB’in veri kümesini açıklayan en iyi model olduğu görülmüştür. Based on count data obtained with a value of zero may be greater than anticipated. These types of data sets should be used to analyze by regression methods taking into account zero values. Zero-Inflated Poisson (ZIP), Zero-Inflated negative binomial (ZINB), Poisson Hurdle (PH), negative binomial Hurdle (NBH) are more common approaches in modeling more zero value possessing dependent variables than expected. In the present study, the e-mail traffic of Yüzüncü Yıl University in 2009 spring semester was investigated. ZIP and ZINB, PH and NBH regression methods were applied on the data set because more zeros counting (78.9%) were found in data set than expected. ZINB and NBH regression considered zero dispersion and overdispersion were found to be more accurate results due to overdispersion and zero dispersion in sending e-mail. ZINB is determined to be best model according to Vuong statistics and information criteria.
Source
Anadolu Üniversitesi Bilim ve Teknoloji Dergisi A - Uygulamalı Bilimler ve MühendislikCollections
- Cilt.13 Sayı.1 [6]