Developing techniques for robustness of privacy-preserving distributed collaborative filtering
Abstract
Ortak filtreleme sistemlerinde başarıya ulaşabilmek için yeterli ve uygun veriye sahip olmak gerekir. Internet alışverişlerindeki kullanıcı tercihleri ve e-ticaret firmalarındaki çeşitlilikten dolayı, analiz için kullanılabilecek veri birçok farklı kaynağa dağılmış durumdadır. Nitelikli verinin azlığı, özellikle yeni kurulan firmalar için, öneri hizmetlerinin sağlanmasında önemli bir sorun teşkil eder. Bu sorunun çözümü için dağıtık veri üzerinde işbirliği yapılması, bu işbirliği esnasında da gizliliğin korunması önemli bir araştırma konusu haline gelmiştir. Dağıtık ortak filtreleme üzerine yapılmış birçok çalışma bulunmaktadır. Bu çalışmalar ile online sağlayıcıların gizlilik ilkelerini ihlal etmeden işbirliğinde bulunmaları sağlanmıştır. Fakat bu çalışmalar, ataklara karşı gürbüzlük açısından değerlendirilmemiştir. Sahte profil enjeksiyonu ile gizlilik koruyan, dağıtık ortak filtreleme algoritmalarının sonuçlarına müdahale edilebilirse, shilling ataklar işbirliğine engel oluşturabilir. Shilling ataklarına karşı sistemine güven duymayan bir online sağlayıcı, daha iyi öneri hizmeti sunabilme fırsatına karşın işbirliğinden kaçınabilir. Bu tezde, gizlilik koruyan dağıtık ortak filtreleme yöntemlerinin, gelişigüzel dağıtılmış veride shilling ataklara karşı gürbüzlüğü incelenmiştir. Gelişigüzel dağıtılmış veri üzerine uygulanabilecek yeni bir atak stratejisi belirlenmiş ve bu strateji daha önceki atak modellerinin dağıtık uyarlamalarının oluşturulmasında kullanılmıştır. Deneysel çalışmalar, öne sürülen strateji ile oluşturulan atakların tahmin edilen sonuçları değiştirmede etkili olduğunu, dolayısıyla da bu sistemlerin gizliliğe rağmen saldırılara açık olduğunu göstermiştir. Mevcut shilling atak tespit yöntemlerinin, gelişigüzel dağıtık veride uygulanamamasının nedenleri açıklanmıştır. Bu algoritmaları ataklardan korumak için, çok iyi bilinen sınıflandırma tabanlı bir tespit yönteminin dağıtık versiyonu öne sürülmüştür. Gerçek veri kullanılarak yapılan deneyler, öne sürülen yöntemin atak profillerini gizlilik kuralları çerçevesinde tespit edebildiğini göstermiştir. Ayrıca, dağıtık atakların tespiti için tarafların işbirliğinin gerekliliği deneysel analizlerle kanıtlanmıştır.
Collections
- Tez Koleksiyonu [14]