A robust Gradient boosting model based on SMOTE and NEAR MISS methods for intrusion detection in imbalanced data sets

dc.contributor.advisorÇavdaroğlu Akkoç, Gülsüm Çiğdemen_US
dc.contributor.authorArık, Ahmet Okanen_US
dc.contributor.otherIşık Üniversitesi, Lisansüstü Eğitim Enstitüsü, Enformasyon Teknolojileri Yüksek Lisans Programıen_US
dc.departmentIşık Üniversitesi, Lisansüstü Eğitim Enstitüsü, Enformasyon Teknolojileri Yüksek Lisans Programıen_US
dc.descriptionText in English ; Abstract: English and Turkishen_US
dc.descriptionIncludes bibliographical references (leaves 29-32)en_US
dc.descriptionx, 34 leavesen_US
dc.description.abstractNovel technologies cause many security vulnerabilities and zero-day attack risks. Intrusion Detection Systems (IDS) are developed to protect computer networks from threats and attacks. Many challenging problems need to be solved in existing methods. The class imbalance problem is one of the most difficult problems of IDS, and it reduces the detection rate performance of the classifiers. The highest IDS detection rate in the literature is 96.54%. This thesis proposes a new model called ROGONG-IDS (Robust Gradient Boosting) based on Gradient Boosting. ROGONGIDS model uses Synthetic Minority Over-Sampling Technique (SMOTE) and Near Miss methods to handle class imbalance. Three different gradient boosting-based classification algorithms (GBM, LightGBM, XGBoost) were compared. The performance of the proposed model on multiclass classification has been verified in the UNSW-NB15 dataset. It reached the highest attack detection rate and F1 score in the literature with a 97.30% detection rate and 97.65% F1 score. ROGONG-IDS provides a robust, efficient solution for IDS built on datasets with the imbalanced class distribution. It outperforms state-of-the-art and traditional intrusion detection methods.en_US
dc.description.abstractYeni teknolojiler birçok güvenlik açığına ve sıfırıncı gün saldırı risklerine neden olmaktadır. Saldırı tespit sistemleri, bilgisayar ağlarını tehdit ve saldırılardan korumak için geliştirilmiştir. Mevcut yöntemlerde çözülmesi gereken birçok zorlu problem vardır. Sınıf dengesizliği problemi karşılaşılan en zorlayıcı problemlerden birisidir ve saldırı tespit sistemlerinde sınıflandırıcıların tespit oranını düşürmektedir. Literatürdeki en yüksek IDS saldırı tespit oranı 96.54%’tür. Bu tezde Gradyan Arttırma temelli ROGONG-IDS (Robust Gradient Boosting) olarak adlandırılan bir model sunulmaktadır. ROGONG-IDS modeli, sınıf dengesizliğini ele almak için Sentetik Azınlık Aşırı Örnekleme Tekniği (SMOTE) ve Near Miss metotlarını kullanmaktadır. Gradyan arttırma tabanlı üç farklı sınıflandırma algoritması (GBM, LightGBM, XGBoost) karşılaştırıldı. Önerilen modelin çok sınıflı sınıflandırma üzerindeki performansı, UNSW-NB15 veri seti üzerinde test edilmiştir. ROGONGIDS, 97.30% tespit oranı ve 97.65% F1 skoru ile literatürdeki en yüksek saldırı tespit oranı ve F1 skoruna erişti. ROGONG-IDS, dengesiz sınıf dağılımına sahip veri kümeleri üzerine kurulmak istenen saldırı tespit sistemleri için sağlam, verimli bir çözüm sunar. Önerilen bu modelin son teknoloji ve geleneksel yöntemler oluşturulmuş saldırı tespit sistemlerinden daha iyi performans sergilediği görülmüştür.en_US
dc.description.tableofcontentsDescription of UNSW-NB15 Dataseten_US
dc.description.tableofcontentsData Preprocessingen_US
dc.description.tableofcontentsHandling Imbalance Dataen_US
dc.description.tableofcontentsEvaluation Metricsen_US
dc.description.tableofcontentsHyper-parameter Optimizationen_US
dc.description.tableofcontentsMulticlass Classificationen_US
dc.identifier.citationArık, A. O. (2022). A robust Gradient boosting model based on SMOTE and NEAR MISS methods for intrusion detection in imbalanced data sets. İstanbul: Işık Üniversitesi Lisansüstü Eğitim Enstitüsü.en_US
dc.institutionauthorArık, Ahmet Okanen_US
dc.publisherIşık Üniversitesien_US
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
dc.subjectMachine learningen_US
dc.subjectCyber securityen_US
dc.subjectIntrusion detection systemen_US
dc.subjectImbalanced dataen_US
dc.subjectGradient boostingen_US
dc.subjectMakine öğrenmesien_US
dc.subjectSiber güvenliken_US
dc.subjectSaldırı tespit sistemien_US
dc.subjectDengesiz verien_US
dc.subjectGradyan arttırmaen_US
dc.subject.lccTK5105.59 .A75 2022
dc.subject.lcshComputer networks -- Security measures.en_US
dc.subject.lcshIntrusion detection systems (Computer security)en_US
dc.titleA robust Gradient boosting model based on SMOTE and NEAR MISS methods for intrusion detection in imbalanced data setsen_US
dc.title.alternativeSaldırı tespit sistemleri için dengesiz veri setlerinde SMOTE ve NEAR MISS mettotlarına dayalı güçlü Gradyan artırma Modelien_US
dc.typeMaster Thesisen_US


Orijinal paket
Listeleniyor 1 - 1 / 1
Küçük Resim
1.33 MB
Adobe Portable Document Format
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
1.44 KB
Item-specific license agreed upon to submission