Advancing privacy and security in machine learning through homomorphic encryption and explainable AI
Tarih
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
The importance of data privacy in cloud-based Machine Learning is paramount, particularly in sectors such as healthcare and finance. Balancing robust privacy protection with high model accuracy remains a significant challenge. In this study, we propose a privacy-preserving framework utilizing ANNs on homomorphically encrypted data. To mitigate the computational complexity of non-linear activation functions (Sigmoid and Tanh), we developed lightweight, ANN-based estimators specifically designed for encrypted environments. Our experimental results demonstrate that these estimators significantly outperform traditional polynomial and piecewise linear methods, reducing MSE by up to 96% while improving accuracy and F1-scores. Our method achieved 97.70% accuracy and 0.9997 AUC on the MNIST dataset, validating its effectiveness. In real-world applications, we applied the approach to dyslexia detection using QEEG data, observing only minor performance degradation (2.66% accuracy, 3.86% AUC) compared to plaintext inference. Furthermore, a case study on the UCI Heart Disease dataset yielded 85.25% accuracy in encrypted inference, matching plaintext performance. Finally, we integrated the SHAP algorithm to ensure transparency for encrypted outputs. Our findings confirm that this approach successfully balances privacy, performance, and explainability, making it highly suitable for sensitive ML applications.
Bulut tabanlı makine öğrenimi çözümlerinde, özellikle sağlık ve finans gibi hassas alanlarda veri gizliliği kritik bir öneme sahiptir. Gizlilik koruması ile yüksek model başarımı arasında denge kurmak ise güncel bir zorluktur. Bu çalışmada, homomorfik şifreleme yöntemleriyle korunan veriler üzerinde çalışan, gizlilik odaklı bir Yapay Sinir Ağı (YSA) yaklaşımı öneriyoruz. Şifreli ortamlarda hesaplama maliyeti yüksek olan Sigmoid ve Tanh gibi doğrusal olmayan aktivasyon fonksiyonlarını verimli yönetmek amacıyla, hafif YSA tabanlı tahminciler geliştirdik. Elde edilen sonuçlar, önerdiğimiz tahmincilerin geleneksel polinom ve parçalı doğrusal yöntemlere göre üstün olduğunu; Ortalama Karesel Hatayı (MSE) %96 oranında azalttığını göstermektedir. MNIST veri kümesinde elde edilen %97,70 doğruluk ve 0,9997 AUC değerleri, yöntemin etkinliğini kanıtlamıştır. Gerçek dünya senaryolarında, QEEG verileriyle disleksi tespitinde düz metin çıkarımına kıyasla ihmal edilebilir performans kayıplarıyla (%2,66 doğruluk, %3,86 AUC) başarı sağlanmıştır. UCI Kalp Hastalığı veri kümesinde ise düz metin performansıyla eşdeğer %85,25 doğruluk elde edilmiştir. Ayrıca, şeffaflığı artırmak amacıyla şifreli çıkarımlara SHAP tabanlı açıklanabilirlik entegre edilmiştir. Bulgularımız, önerilen modelin gizlilik, yüksek performans ve açıklanabilirlik gereksinimlerini başarıyla dengelediğini ve hassas sektörler için güçlü bir çözüm sunduğunu ortaya koymaktadır.
Açıklama
Includes bibliographical references (leaves 111-124)
xiii, 129 leaves












