Comparative analysis of supervised, unsupervised, semi-supervised, and reinforcement learning methods for data loss prevention

Vural, Ahmet; Çeliktaş, Barış

Comparative analysis of supervised, unsupervised, semi-supervised, and reinforcement learning methods for data loss prevention

Dosyalar

Comparative_Analysis_of_Supervised_Unsupervised_Semi_Supervised_and_Reinforcement_Learning_Methods_for_Data_Loss_Prevention.pdf (462.4 KB)

Tarih

2023-05-24

Yazarlar

Vural, Ahmet

Çeliktaş, Barış

Yayıncı

BIDGE Publications

Erişim Hakkı

info:eu-repo/semantics/closedAccess

Özet

Veri Kaybını Önleme (DLP), veri kaybını, hassas verilerin güvenli olmayan veya uygun olmayan bir şekilde paylaşılmasını, transferini veya kullanılmasını engelleyen bir güvenlik çözümüdür. DLP ayrıca Genel Veri Koruma Yönetmeliği (GDPR) ve diğer düzenleyici gereklilikler gibi düzenlemelere uyum sağlamamıza yardımcı olmaktadır. DLP'nin temel amacı hassas verilerin sızmasını önlemek ve böylece veri sahiplerinin itibarlarını korumak, maliyetleri azaltmak ve iş sürekliliğini sağlamaktır. DLP, veri sızmasını engellemek veya önceden belirlenmiş veri sınıflandırma politikaları kullanarak olayları kaydetmek için bir dizi kural kullanan bir uygulamadır. Bu etiketler genellikle bir program tarafından tanımlanan bilgilere dayalı olarak oluşturmakta ve uygulamaktadır. Bu çalışmamız, DLP sistemlerinde denetimli, denetimsiz, yarı denetimli ve takviyeli öğrenme yöntemlerinin kullanımına odaklanmakta olup, veri sınıflandırması için makine öğrenme algoritmaları aracılığıyla verilerin işlenmesi ve kullanılmasıyla veri ihlallerini ve ihlallerini en aza indirmeyi amaçlamaktadır. Çalışmamızda, makine öğrenme yöntemlerinin yeteneklerine dayalı olarak en uygun seçenekler değerlendirilecektir. Çalışmanın bulguları, denetimli öğrenme yöntemlerinin karşılaştırmalı analizinin DLP için en etkili yaklaşım olduğunu önermektedir, ancak yarı denetimli ve güçlendirme öğrenme yöntemleri sınırlı etiketli veri olduğunda kullanışlı olabilmektedir. Çalışma ayrıca makine öğrenme algoritmaları kullanarak otomatik olarak DLP prensiplerinin oluşturulmasının faydalarını içermektedir. El ile hazırlanan sınıflandırmaların otomatikleştirilmesiyle, sistemin daha verimli olması ve yanlış pozitif değerlerin en aza indirilmesi beklenmektedir. Özetle, bu çalışma kullanıcıların veri işleme standartları veya alışkanlıklarını makine öğrenmeyle birleştirerek bu etiketlerin ve verilerin DLP kurallarında kullanılmasını mümkün kılmaktadır. El ile yapılan manuel sınıflandırma, makine öğrenme ile otomatikleştirilebilir, bu da daha iyi kontrollerin yapılmasına olanak sağlamaktadır. Makine öğrenme ve DLP aynı anda kullanıldığında, veri sınıflandırması hatalı olmadan gerçekleştirilecek ve yanlış pozitif alarm sayısı azalacaktır. Dosyaların yapısı ve içeriği kullanıcı alışkanlıklarına göre doğru bir şekilde belirlenecek, ilgili kuralların doğruluğu ve güvenilirliği sağlanacaktır. Kullanıcılar belirli algoritmalar aracılığıyla izlenecek, dosya içeriğinde en sık kullanılan veriler raporlanabilecek ve bunun şirket riski olarak kabul edilebilir olup olmadığı belirlenebilecektir. Sonuç olarak, kurum ve kuruluşlar, veri koruma politikalarını daha verimli ve kullanılabilir hale getirebilecek ve veri kaybı riskini azaltabilecek ve düzenlemelere tabi kişisel verileri kontrol altına alabilecektir.

Anahtar Kelimeler

Veri Kaybı Önleme (Data Loss Prevention), Denetimli Öğrenme (Supervised Learning), Denetimsiz Öğrenme (Unsupervised Learning), Yarı Denetimli Öğrenme (Semi-Supervised Learning), Takviyeli Öğrenme (Reinforcement Learning)

Kaynak

3th International Congress of Engineering and Natural Sciences Studies

Künye

Vural, A. & Çeliktaş, B. (2023). Comparative analysis of supervised, unsupervised, semi-supervised, and reinforcement learning methods for data loss prevention. Paper presented at the 3th International Congress of Engineering and Natural Sciences Studies, 312-326.

Bağlantı

https://hdl.handle.net/11729/7139
https://icenss.org/3-icenss/

Koleksiyon

Bildiri Koleksiyonu | Bilgisayar Mühendisliği Bölümü
Lisansüstü Eğitim Enstitüsü Diğer Yayınlar Koleksiyonu
Öğrenci Yayınları Bildiri Koleksiyonu

Detaylı Öğe Kaydı

Comparative analysis of supervised, unsupervised, semi-supervised, and reinforcement learning methods for data loss prevention

Dosyalar

Tarih

Yazarlar

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Erişim Hakkı

Araştırma projeleri

Organizasyon Birimleri

Dergi sayısı

Özet

Açıklama

Anahtar Kelimeler

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Bağlantı

Koleksiyon