Aynı oteli temsil eden farklı kayıtlar için akıllı eşleştirme
dc.authorid | 0009-0009-6043-2765 | |
dc.authorid | 0000-0001-5838-4615 | |
dc.contributor.author | Bayrak, Ahmet Tuğrul | en_US |
dc.contributor.author | Özbek, Eyüp Erkan | en_US |
dc.contributor.author | Kestepe, Sedat | en_US |
dc.contributor.author | Yıldız, Olcay Taner | en_US |
dc.date.accessioned | 2020-02-18T04:13:57Z | |
dc.date.available | 2020-02-18T04:13:57Z | |
dc.date.issued | 2019-09 | |
dc.department | Işık Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü | en_US |
dc.department | Işık University, Faculty of Engineering, Department of Computer Engineering | en_US |
dc.description.abstract | Otel sayısının her geçen gün arttığı turizm sektöründe, aracı firmaların tüm oteller ile ayrı ayrı çalışma imkanı bulunmadığından, firmalar dünya üzerinde bir çok otelle anlaşması bulunan servis sağlayıcılarıyla beraber çalışmaktadır. Farklı servis sağlayıcılarından alınan otel kayıtlarında tekrarlayan otel verileri olabilmektedir. Tekrarlayan bu kayıtlar aynı bilgilere sahip olabileceği gibi, farklı bilgilere sahip olmasına rağmen aynı oteli temsil edebilmektedir. Otel verilerini tutarlı hale getirmek için aynı oteli temsil eden kayıtlar eşleştirilmelidir. Bu amaçla, otel kayıtları üzerinde çalışılarak, adres zenginleştirmesi ve ön işleme yapılan aday kayıtlar için kategorik ve görsel verilerin benzerliklerinin kullanıldığı makine öğrenmesi algoritmaları uygulanmıştır. Yapılan işlem sonucunda, 132.287 satırlık otel verisinde 14.985 adet otel %99,12 doğruluk oranı ile eşleştirilmiştir. | en_US |
dc.description.abstract | Having the day by day increasing number of hotel entities, dealing with the whole set of hotels individually is almost impossible. Therefore, travel agencies work with online hotel providers which have deals with many hotels around the world. Whereas, working with online providers saves agencies from a big challenge, it degrades the problem of agency to another one: duplicate hotel records from different sources. The repeating records might either have all same set of identical features or features with different values that represent the same hotel. Matching and merging such records need to be applied for a consistent database. In this study, we propose a set of methods which aims to solve the pointed problem. We work on hotel records, applied machine learning algorithms using string and image similarity on records for which address enrichment and pre-processing applied, selecting prior methods as a baseline. Proposed method achieved 99.12% accuracy, matching 14.985 hotels on a 132.287 rows of data. | en_US |
dc.description.version | Publisher's Version | en_US |
dc.identifier.citation | Bayrak, A. T., Özbek, E. E., Kestepe, S. & Yıldız, O. T. (2019). Intelligent mapping for hotel records representing the same entity. Paper presented at the UBMK 2019 - Proceedings, 4th International Conference on Computer Science and Engineering, 560-563. doi:10.1109/UBMK.2019.8907030 | en_US |
dc.identifier.doi | 10.1109/UBMK.2019.8907030 | |
dc.identifier.endpage | 563 | |
dc.identifier.isbn | 9781728139647 | |
dc.identifier.isbn | 9781728139630 | |
dc.identifier.isbn | 9781728139654 | |
dc.identifier.scopus | 2-s2.0-85076229652 | |
dc.identifier.scopusquality | N/A | |
dc.identifier.startpage | 560 | |
dc.identifier.uri | https://hdl.handle.net/11729/2248 | |
dc.identifier.uri | https://dx.doi.org/10.1109/UBMK.2019.8907030 | |
dc.identifier.wos | WOS:000609879900106 | |
dc.identifier.wosquality | N/A | |
dc.indekslendigikaynak | Web of Science | en_US |
dc.indekslendigikaynak | Scopus | en_US |
dc.indekslendigikaynak | Conference Proceedings Citation Index – Science (CPCI-S) | en_US |
dc.institutionauthor | Yıldız, Olcay Taner | en_US |
dc.institutionauthorid | 0000-0001-5838-4615 | |
dc.language.iso | tr | en_US |
dc.peerreviewed | Yes | en_US |
dc.publicationstatus | Published | en_US |
dc.publisher | Institute of Electrical and Electronics Engineers Inc. | en_US |
dc.relation.ispartof | 2019 4th International Conference on Computer Science and Engineering (UBMK) | en_US |
dc.relation.publicationcategory | Konferans Öğesi - Uluslararası - Kurum Öğretim Elemanı | en_US |
dc.rights | info:eu-repo/semantics/closedAccess | en_US |
dc.subject | Görsel benzerliği | en_US |
dc.subject | Makine öğrenmesi | en_US |
dc.subject | Metin benzerliği | en_US |
dc.subject | Otel eşleştirme | en_US |
dc.subject | Tekrarlayan kayıtların tespiti | en_US |
dc.subject | Address enrichment | en_US |
dc.subject | Address preprocessing | en_US |
dc.subject | Algorithms | en_US |
dc.subject | Applied machine learning | en_US |
dc.subject | Database systems | en_US |
dc.subject | Duplicate hotel records | en_US |
dc.subject | Hotel entities | en_US |
dc.subject | Hotel industry | en_US |
dc.subject | Hotel mapping | en_US |
dc.subject | Hotels | en_US |
dc.subject | Image analysis | en_US |
dc.subject | Image similarity | en_US |
dc.subject | Information retrieval | en_US |
dc.subject | Intelligent mapping | en_US |
dc.subject | Learning (artificial intelligence) | en_US |
dc.subject | Learning algorithms | en_US |
dc.subject | Learning systems | en_US |
dc.subject | Machine learning | en_US |
dc.subject | Machine learning algorithms | en_US |
dc.subject | Mapping | en_US |
dc.subject | Near dupli-cate detection | en_US |
dc.subject | Online hotel providers | en_US |
dc.subject | Online providers | en_US |
dc.subject | Pre-processing | en_US |
dc.subject | Privacy-preserving record | en_US |
dc.subject | Records management | en_US |
dc.subject | String similarity | en_US |
dc.subject | Travel agencies | en_US |
dc.subject | Travel agency | en_US |
dc.title | Aynı oteli temsil eden farklı kayıtlar için akıllı eşleştirme | en_US |
dc.title.alternative | Intelligent mapping for hotel records representing the same entity | en_US |
dc.type | Conference Object | en_US |
dspace.entity.type | Publication |