Effects of binary similarity measures on collaborative filtering
Abstract
İnternet’in popülerliği arttıkça, İnternet üzerinden sanal satıcılar aracılığıyla alışveriş yapmak da artan bir ilgi görmektedir. Müşteriler kendilerine uygun ürünleri satın almak isterler. Diğer bir deyişle, beğenebilecekleri ürünleri seçmeye çalışmaktadırlar. Müşterilerine bu süreçte yardımcı olmak için birçok sanal şirket ortak filtreleme sistemlerinden yararlanmaktadır. Bu sistemler iki tür hizmet sunmaktadır. Bunlar tahmin ve en-iyi-N öneri üretmedir. Bu hizmetlerin kalitesi temel olarak ortak filtreleme algoritmalarının en benzer varlıkları belirlemede kullandığı benzerlik ölçütlerine dayanmaktadır. Ortak filtreleme işlemleri için derlenen veriler sayısal ya da ikili değerler içerebilir. Sayısal değerler için önerilen benzerlik ölçütlerini karşılaştırmak üzere birçok çalışma sunulmuştur. Ancak ikili değerler üzerinde işlem yapan birçok benzerlik ölçütü bulunmasına rağmen, bunların ortak filtreleme sistemlerinin doğruluğu ve performansı üzerindeki etkisi detaylı biçimde çalışılmamıştır. Bu tezde yedi adet ikili oy-tabanlı benzerlik ölçütünün, tahmin üretme ve en-iyi-N listeleri önerisi için hem doğruluk hem de çevrimiçi performans kriterleri bakımından değerlendirmesi yapılmıştır. Yediden daha fazla sayıda ölçüt bulunmasına rağmen, birçok veri madenciliği uygulamalarında sıkça kullanılanlar üzerine yoğunlaşılmıştır. Bu ölçütleri doğruluk ve verimlilik açısından karşılaştırabilmek için iki iyi bilinen gerçek veri seti üzerinde birçok deneyler yapıldı. Farklı benzerlik ölçütlerini, her defasında farklı en benzer kullanıcıların tercihlerinin dahil olduğu ortak filtreleme süreçlerini kullanarak tahminler ve en-iyi-N listeleri üretildi. Ayrıca farklı benzerlik ölçütleriyle, değişen kontrol parametrelerinin performansa olan etkisi araştırıldı. Deneysel sonuçlar doğruluk ve performans açısından analiz edildi.
Collections
- Tez Koleksiyonu [102]