Big data storage and automated text summarization in Turkish text

dc.contributor.advisorYıldız, Olcay Taneren_US
dc.contributor.authorAysu, Erdinçen_US
dc.contributor.otherIşık Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Yüksek Lisans Programıen_US
dc.date.accessioned2018-11-22T23:10:40Z
dc.date.available2018-11-22T23:10:40Z
dc.date.issued2018-06-19
dc.departmentIşık Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Yüksek Lisans Programıen_US
dc.descriptionText in English ; Abstract: English and Turkishen_US
dc.descriptionIncludes bibliographical references (leaves 51-52)en_US
dc.descriptionx, 52 leavesen_US
dc.description.abstractThe subject of this study is storing the large datasets in accordance with Big Data ecosystem and to extract the summary sentences of a text in Turkish, apply the automatic text summarization process which is a subtopic of Natural language processing (NLP). For this purpose, Turkish news articles were collected and the study was carried out through these texts. For the performance test of the work done, 50 different news textiles were given to 20 different persons and 3 sentences which were considered important from each other were asked to be selected and their results were compared with each other. Then, the results from the people were compared with the results from this study. As a result of the test process, the summation performance of the work was measured approximately as thirty-six percentage.en_US
dc.description.abstractBu çalışmanın konusu, geniş çapta veriyi Dev Veri ekosistemine uygun bir şekilde saklamak ve bir Türkçe dokumanın özet cümlelerinin çıkarılması için doğal dil işleme (DDİ) alt konusu olan otomatik metin özetleme işlemini uygulamaktır. Bu amaçla Türkçe haber metinleri toplanmış ve çalışma bu metinler üzerinden yürütülmüştür. Yapılan çalışmanın performans testi için 20 farklı kişiye 50 farklı haber metni verilmiş ve her metnin içerisinden önemli gördükleri 3 cümlenin seçilmesi istenmiştir ve sonuçlar birbirleriyle karşılaştırılmıştır. Daha sonra kişilerden alınan sonuç ile bu çalışmadaki çıkan sonuç karşılaştırılmıştır. Test işleminin neticesinde çalışmanın özetleme performansı yaklaşık olarak yüzde otuz altı ölçülmüştür.en_US
dc.description.tableofcontentsA Brief Look to the Big Dataen_US
dc.description.tableofcontentsCharacteristics Of Big Dataen_US
dc.description.tableofcontentsVolumeen_US
dc.description.tableofcontentsVelocityen_US
dc.description.tableofcontentsVarietyen_US
dc.description.tableofcontentsBig Data Storage and Distributed Computing Systemen_US
dc.description.tableofcontentsDistributed Calculationen_US
dc.description.tableofcontentsRelation of Machine Learning with Big Dataen_US
dc.description.tableofcontentsComputing Poweren_US
dc.description.tableofcontentsIdeal Distributed Systemsen_US
dc.description.tableofcontentsScalabilityen_US
dc.description.tableofcontentsHadoopen_US
dc.description.tableofcontentsFile Compressionen_US
dc.description.tableofcontentsCodecsen_US
dc.description.tableofcontentsHadoop vs Relational Database Management Systemsen_US
dc.description.tableofcontentsHadoop Componentsen_US
dc.description.tableofcontentsHDFSen_US
dc.description.tableofcontentsArchitectureen_US
dc.description.tableofcontentsMap Reduceen_US
dc.description.tableofcontentsMap Reduce Algorithmen_US
dc.description.tableofcontentsYarnen_US
dc.description.tableofcontentsRelevant Hadoop Technologiesen_US
dc.description.tableofcontentsPigen_US
dc.description.tableofcontentsHiveen_US
dc.description.tableofcontentsMahouten_US
dc.description.tableofcontentsSparken_US
dc.description.tableofcontentsSummarizationen_US
dc.description.tableofcontentsExperimental Worken_US
dc.description.tableofcontentsSetupen_US
dc.description.tableofcontentsVirtual Machineen_US
dc.description.tableofcontentsDistributed Multi-Node Hadoop Clusteren_US
dc.description.tableofcontentsHadoop Setup and Adjustmenten_US
dc.description.tableofcontentsSSHen_US
dc.description.tableofcontentsHDFSen_US
dc.description.tableofcontentsDataseten_US
dc.description.tableofcontentsNews Articles Collectionen_US
dc.description.tableofcontentsHurriyet Search APIen_US
dc.description.tableofcontentsPreprocessing of Dataen_US
dc.description.tableofcontentsBatch Data Inputen_US
dc.description.tableofcontentsSummarization Methodologyen_US
dc.description.tableofcontentsMorphologic Analysisen_US
dc.description.tableofcontentsScoring Processen_US
dc.description.tableofcontentsSummarization Phaseen_US
dc.identifier.citationAysu, E. (2018). Big data storage and automated text summarization in Turkish text. İstanbul: Işık Üniversitesi Fen Bilimleri Enstitüsü.en_US
dc.identifier.urihttps://hdl.handle.net/11729/1385
dc.institutionauthorAysu, Erdinçen_US
dc.language.isoenen_US
dc.publisherIşık Üniversitesien_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectBig dataen_US
dc.subjectHadoopen_US
dc.subjectNLPen_US
dc.subjectSummarizationen_US
dc.subjectDev verien_US
dc.subjectDDİen_US
dc.subjectÖzetlemeen_US
dc.subject.lccQA76.9.B45 A97 2018
dc.subject.lcshBig data.en_US
dc.subject.lcshData mining.en_US
dc.subject.lcshInformation.en_US
dc.titleBig data storage and automated text summarization in Turkish texten_US
dc.title.alternativeDev veri depolama ve Türkçe metin için otomatik özetlemeen_US
dc.typeMaster Thesisen_US
dspace.entity.typePublication

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
11729-1385.pdf
Boyut:
1.28 MB
Biçim:
Adobe Portable Document Format
Açıklama:
MasterThesis
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.71 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: