Sarcasm detection in text using deep neural networks

dc.authorid0000-0002-9502-7817
dc.contributor.advisorDehkharghani, Rahimen_US
dc.contributor.authorGümüşçekiçci, Gizemen_US
dc.contributor.otherIşık Üniversitesi, Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Yüksek Lisans Programıen_US
dc.contributor.otherIşık University, School of Graduate Studies, Computer Science Engineering Master Programen_US
dc.date.accessioned2024-03-14T17:27:44Z
dc.date.available2024-03-14T17:27:44Z
dc.date.issued2024-02-25
dc.departmentIşık Üniversitesi, Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Yüksek Lisans Programıen_US
dc.departmentIşık University, School of Graduate Studies, Computer Science Engineering Master Programen_US
dc.descriptionText in English ; Abstract: English and Turkishen_US
dc.descriptionIncludes bibliographical references (leaves 54-56)en_US
dc.descriptionix, 57 leavesen_US
dc.description.abstractSarcasm is a form of irony which is generally used in expressing negative opinions. Sarcasm poses a linguistic challenge due to its figurative nature where intended meaning contradicts with literal interpretation. Sarcasm is widely used in our Daily lives and also upon many social platforms. Detecting sarcasm in written text is a challenging process that has captured the interest of many researchers. Hence, sarcasm has become a crucial task in the Natural Language Processing (NLP) field. This thesis study explores the concept of sarcasm, and its importance on existing sarcasm research. The automatic process of sarcasm detection involves dataset selection, preprocessing steps, and selecting proper approaches, including rule-based methods, Machine Learning (ML), Deep Learning (DL) and Transformer architectures. This study surveys previous research on sarcasm detection, specifically examining the dataset, methodology and performance. This thesis study attempts to automatically detect sarcasm by utilizing various ML, DL and transformer and hybrid neural network architectures on news headlines datasets. To overcome the dataset and performance limitations on existing approaches, we propose various methodologies to detect sarcastic text mostly focusing on DL, hybrid neural networks and transformer architectures. We combine appropriate architectures with several hand-crafted features and utilizing different word embedding models. To further extend the performance of our proposed methods and also enhance the existing news headlines dataset, we proposed several modifications. We contribute to the existing dataset by applying augmentation to increase the dataset size to help enhance the performance of the proposed models with overcoming dataset limitations. Our methodologies correctly identify sarcasm with 97.68% F1 score.en_US
dc.description.abstractAlaycılık, genellikle olumsuz görüşlerin ifade edilmesinde kullanılan bir ironi biçimidir. Alaycılık, amaçlanan anlamın gerçek yorumla çeliştiği mecazi doğası nedeniyle dilsel bir zorluk teşkil etmektedir. Alaycılık günlük yaşamımızda ve birçok sosyal platformda yaygın olarak kullanılmaktadır. Yazılı metinlerde alaycılığın tespit edilmesi birçok araştırmacının ilgisini çeken zorlu bir süreçtir. Dolayısıyla alaycılık, Doğal Dil İşleme (NLP) alanında çok önemli bir görev haline geldi. Bu tez çalışması alaycılık kavramını ve bu kavramın mevcut alaycılık araştırmaları üzerindeki önemini incelemektedir. Otomatik alaycılık algılama süreci, veri kümesi seçimini, ön işleme adımlarını ve kural tabanlı yöntemler, Makine Öğrenimi (ML), Derin Öğrenme (DL) ve Transformer mimarileri dahil olmak üzere uygun yaklaşımların seçilmesini içerir. Bu çalışma, özellikle veri kümesini, metodolojiyi ve performansı inceleyerek alaycılığın tespitine ilişkin önceki araştırmaları incelemektedir. Bu tez çalışması, haber başlıkları veri seti üzerinde çeşitli ML, DL ve transformatör ve hibrit sinir ağı mimarilerini kullanarak alaycılığı otomatik olarak tespit etmeye çalışmaktadır. Mevcut yaklaşımlardaki veri kümesi ve performans sınırlamalarının üstesinden gelmek için, çoğunlukla DL, hibrit sinir ağları ve transformatör mimarilerine odaklanan alaycı metinleri tespit etmek için çeşitli yöntemler öneriyoruz. Uygun mimarileri, farklı kelime temsil modellerini kullanarak çeşitli el yapımı özelliklerle birleştiriyoruz. Önerilen yöntemlerimizin performansını daha da genişletmek ve mevcut haber başlıkları veri setini geliştirmek için çeşitli değişiklikler önerdik. Önerilen modellerin performansının veri kümesi sınırlamalarının üstesinden gelmesine yardımcı olmak amacıyla veri kümesi boyutunu artırmak için büyütme uygulayarak mevcut veri kümesine katkıda bulunuyoruz. Metodolojilerimiz alaycılığı %97,68 F1 puanıyla doğru bir şekilde tespit edebiliyor.en_US
dc.description.tableofcontentsIntroduction to Sarcasmen_US
dc.description.tableofcontentsSarcasm in Social Platformsen_US
dc.description.tableofcontentsAspects of Sarcasmen_US
dc.description.tableofcontentsSarcasm Detectionen_US
dc.description.tableofcontentsSarcasm Detection Studies on the News Headlines Dataseten_US
dc.description.tableofcontentsSarcasm Detection Studies on Other Datasetsen_US
dc.description.tableofcontentsEXPLORATORY DATA ANALYSISen_US
dc.description.tableofcontentsPROPOSED METHODOLOGYen_US
dc.description.tableofcontentsDataset Preprocessingen_US
dc.description.tableofcontentsFeature Engineeringen_US
dc.description.tableofcontentsData Augmentationen_US
dc.description.tableofcontentsFramework of Proposed Methodologyen_US
dc.description.tableofcontentsWord Embeddingen_US
dc.description.tableofcontentsWord2Vecen_US
dc.description.tableofcontentsActivation Functionsen_US
dc.description.tableofcontentsReLUen_US
dc.description.tableofcontentsHyperbolic Tangent (Tanh)en_US
dc.description.tableofcontentsSigmoiden_US
dc.description.tableofcontentsLoss Functionsen_US
dc.description.tableofcontentsCallback Functionsen_US
dc.description.tableofcontentsEarly Stoppingen_US
dc.description.tableofcontentsReduce Learning Rateen_US
dc.description.tableofcontentsModel Checkpointen_US
dc.description.tableofcontentsClassification Modelsen_US
dc.description.tableofcontentsSVMen_US
dc.description.tableofcontentsDecision Treeen_US
dc.description.tableofcontentsRandom Foresten_US
dc.description.tableofcontentsConvolutional Neural Network (CNN)en_US
dc.description.tableofcontentsBidirectional Long Short-Term Memory (BiLSTM)en_US
dc.description.tableofcontentsBERT Transformeren_US
dc.description.tableofcontentsEXPERIMENTAL EVALUATIONen_US
dc.description.tableofcontentsQuantitative Resultsen_US
dc.description.tableofcontentsMachine Learning Modelsen_US
dc.description.tableofcontentsDeep Learning Modelsen_US
dc.description.tableofcontentsTransformer Modelsen_US
dc.description.tableofcontentsPre-processing stagesen_US
dc.description.tableofcontentsFeatures presented in (Jariwala, 2020)en_US
dc.description.tableofcontentsSummary of Sarcasm Detection Studies on the News Headlines Dataseten_US
dc.description.tableofcontentsSummary of Sarcasm Detection Studies on Other Datasetsen_US
dc.description.tableofcontentsSarcastic, non-sarcastic data exampleen_US
dc.description.tableofcontentsClass distributions in v1 dataseten_US
dc.description.tableofcontentsClass distributions in v2 dataseten_US
dc.description.tableofcontentsMost used methodologies and useful libraries for pre processing stagesen_US
dc.description.tableofcontentsPre processing applied to news headlines datasetsen_US
dc.description.tableofcontentsTextual Data Augmentation Exampleen_US
dc.description.tableofcontentsTop 15 Category Labelsen_US
dc.description.tableofcontentsDifferences of Binary cross entropy and Sparse categorical cross entropyen_US
dc.description.tableofcontentsResults for ML modelsen_US
dc.description.tableofcontentsResults for DL modelsen_US
dc.description.tableofcontentsResults for Transformer Modelsen_US
dc.description.tableofcontentsGoogle Scholar Search Resultsen_US
dc.description.tableofcontentsFrequency of Model Implementation in Sarcasm Detection Studiesen_US
dc.description.tableofcontentsExisting Sarcasm Datasets Used in Studiesen_US
dc.description.tableofcontentsSample Dataset version1 (v1)en_US
dc.description.tableofcontentsSample Dataset version2 (v2)en_US
dc.description.tableofcontentsCharacter length frequency distributions in headlinesen_US
dc.description.tableofcontentsWord length density in headlinesen_US
dc.description.tableofcontentsFrequency of the length of each headline in the dataseten_US
dc.description.tableofcontentsWord Cloud Representation of Non-sarcastic and Sarcastic Headlinesen_US
dc.description.tableofcontentsProposed Sarcasm Detection Classifier Frameworken_US
dc.description.tableofcontentsSentiment Polarity Label Pipelineen_US
dc.description.tableofcontentsNews Categorization Label Pipelineen_US
dc.description.tableofcontentsDataset v2 with handcrafted featuresen_US
dc.description.tableofcontentsCategory distribution of the news headlinesen_US
dc.description.tableofcontentsFramework of the Proposed Sarcasm Detectoren_US
dc.description.tableofcontentsReLU graphen_US
dc.description.tableofcontentsTanh graphen_US
dc.description.tableofcontentsSigmoid graphen_US
dc.description.tableofcontentsSVM Linear Separable and Not Linearly Separable Exampleen_US
dc.description.tableofcontentsTransformer Model Architectureen_US
dc.identifier.citationGümüşçekiçci, G. (2024). Sarcasm detection in text using deep neural networks. İstanbul: Işık Üniversitesi Lisansüstü Eğitim Enstitüsü.en_US
dc.identifier.urihttps://hdl.handle.net/11729/5920
dc.institutionauthorGümüşçekiçci, Gizemen_US
dc.institutionauthorid0000-0002-9502-7817
dc.language.isoenen_US
dc.publisherIşık Üniversitesien_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectSarcasmen_US
dc.subjectNews headlinesen_US
dc.subjectSarcasm classificationen_US
dc.subjectTransformersen_US
dc.subjectText augmentationen_US
dc.subjectAlaycılıken_US
dc.subjectHaber manşetlerien_US
dc.subjectAlaycılık sınıflandırmasıen_US
dc.subjectMetin arttırmaen_US
dc.subject.lccQA76.9.N38 G86 2024
dc.subject.lcshIrony in literature.en_US
dc.subject.lcshIrony -- Detection.en_US
dc.subject.lcshNatural language processing (Computer science).en_US
dc.subject.lcshText data mining.en_US
dc.titleSarcasm detection in text using deep neural networksen_US
dc.title.alternativeDerin sinir ağları kullanarak metin içinde alaycılık tespitien_US
dc.typeMaster Thesisen_US
dspace.entity.typePublication

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
Sarcasm_detection_in_text_using_deep_neural_networks.pdf
Boyut:
1.65 MB
Biçim:
Adobe Portable Document Format
Açıklama:
MasterThesis
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.44 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: