Arama Sonuçları

Listeleniyor 1 - 10 / 12
  • Yayın
    Sınıflandırma için diferansiyel mahremiyete dayalı öznitelik seçimi
    (Gazi Univ, Fac Engineering Architecture, 2018) Var, Esra; İnan, Ali
    Veri madenciliği ve makine öğrenmesi çözümlerinin en önemli ön aşamalarından biri yapılacak analizde kullanılacak verinin özniteliklerinin uygun bir alt kümesini belirlemektir. Sınıflandırma yöntemleri için bu işlem, bir özniteliğin sınıf niteliği ile ne oranda ilişkili olduğuna bakılarak yapılır. Kişisel gizliliği koruyan pek çok sınıflandırma çözümü bulunmaktadır. Ancak bu yöntemler için öznitelik seçimi yapan çözümler geliştirilmemiştir. Bu çalışmada, istatistiksel veritabanı güvenliğinde bilinen en kapsamlı ve güvenli çözüm olan diferansiyel mahremiyete dayalı özgün öznitelik seçimi yöntemleri sunulmaktadır. Önerilen bu yöntemler, yaygın olarak kullanılan bir veri madenciliği kütüphanesi olan WEKA ile entegre edilmiş ve deney sonuçları ile önerilen çözümlerin sınıflandırma başarımına olumlu etkileri gösterilmiştir.
  • Yayın
    Mobile applications discovery: a subscriber-centric approach
    (Wiley Periodicals, 2011-03) Erman, Bilgehan; İnan, Ali; Nagarajan, Ramesh; Uzunalioğlu, Hüseyin
    Rapid adoption of smartphones and the business success of the Apple App Store have resulted in the rampant growth of mobile applications. Seeking new revenue opportunities from application development has created a gold rush. However, free or very cheap applications constitute a great bulk of the application downloads putting great pricing pressure on the developers. Furthermore, usage statistics suggest that most of the applications have been either one-trick applications or are downright useless, meriting no attention from the user beyond the first day. This is not surprising since cheap prices will dissuade developers from investing large sums of money to continue to develop more sophisticated, high quality applications. Developers have been complaining about the lack of visibility of their applications in stores that are beginning to resemble a high volume warehouse. It is clear that enhancing application discovery and building better marketing tools will be essential for the continued success of the mobile application marketplace and application stores. This paper proposes and investigates techniques for effective discovery of applications by matching user interests with application characteristics, with a special focus on adapting classical data mining techniques to user ratings of the applications. The user ratings are leveraged to make recommendations on potential applications of interest.
  • Yayın
    Soft decision trees
    (IEEE, 2012) İrsoy, Ozan; Yıldız, Olcay Taner; Alpaydın, Ahmet İbrahim Ethem
    We discuss a novel decision tree architecture with soft decisions at the internal nodes where we choose both children with probabilities given by a sigmoid gating function. Our algorithm is incremental where new nodes are added when needed and parameters are learned using gradient-descent. We visualize the soft tree fit on a toy data set and then compare it with the canonical, hard decision tree over ten regression and classification data sets. Our proposed model has significantly higher accuracy using fewer nodes.
  • Yayın
    Kural bazlı otomatik haber etiketleme
    (IEEE, 2017-06-27) Özenç, Berke; Solak, Ercan
    Bu çalışmada , genel ağ kaynaklarından haber toplayan ve topladığı bu haberleri otomatik olarak etiketleyen kural tabanlı bir uygulama yapılmıştır. Çalışmanın alt amacı hangi özelliklerin etiket belirleme işine daha uygun olduğunu ölçmektir. Elle etiketlenmiş 100 haber üzerinde her bir kuralın başarısı oranı ölçülmüştür.
  • Yayın
    İlişkisel veri tabanlarında mükerrer kayıtların makine öğrenmesiyle tespiti
    (Institute of Electrical and Electronics Engineers Inc., 2018-07-05) Bayrak, Ahmet Tuğrul; Yılmaz, Aykut İnan; Yılmaz, Kemal Burak; Düzağaç, Remzi; Yıldız, Olcay Taner
    Veri miktarının artışına paralel olarak, ilişkisel veri tabanlarında mükerrer kayıtlar da artmaktadır. Artan bu kayıtlar kullanıldıkları rapor veya analizlerde tutarsızlığa sebep olabilmektedir. Bu sorunu en aza indirgemek için yaptığımız çalışmada, kayıtların birbirlerine olan benzerlikleri ve alan uzmanlık bilgisiyle belirlenen ağırlıklar, öznitelik olarak kullanılarak makine öğrenmesi algoritmaları ile mükerrer kayıtların bulunması hedeflenmiştir. Yapılan işlem sonucunda 9301467 satır veride 28412 mükerrer çift tespit edilmiştir. Bulunan bu mükerrer kayıtlar veri kaynağından temizlenerek verinin daha tutarlı hale gelmesi sağlanmaktadır.
  • Yayın
    Regularizing soft decision trees
    (Springer, 2013) Yıldız, Olcay Taner; Alpaydın, Ahmet İbrahim Ethem
    Recently, we have proposed a new decision tree family called soft decision trees where a node chooses both its left and right children with different probabilities as given by a gating function, different from a hard decision node which chooses one of the two. In this paper, we extend the original algorithm by introducing local dimension reduction via L-1 and L-2 regularization for feature selection and smoother fitting. We compare our novel approach with the standard decision tree algorithms over 27 classification data sets. We see that both regularized versions have similar generalization ability with less complexity in terms of number of nodes, where L-2 seems to work slightly better than L-1.
  • Yayın
    Parallel univariate decision trees
    (Elsevier B.V., 2007-05-01) Yıldız, Olcay Taner; Dikmen, Onur
    Univariate decision tree algorithms are widely used in data mining because (i) they are easy to learn (ii) when trained they can be expressed in rule based manner. In several applications mainly including data mining, the dataset to be learned is very large. In those cases it is highly desirable to construct univariate decision trees in reasonable time. This may be accomplished by parallelizing univariate decision tree algorithms. In this paper, we first present two different univariate decision tree algorithms C4.5 and univariate linear discriminant tree. We show how to parallelize these algorithms in three ways: (i) feature based; (ii) node based; (iii) data based manners. Experimental results show that performance of the parallelizations highly depend on the dataset and the node based parallelization demonstrate good speedups.
  • Yayın
    Evcil hayvanlar için eylem tanıma ve izleme sistemi
    (Institute of Electrical and Electronics Engineers Inc, 2018-07-05) Demir, Güneycan; Tüysüz Erman, Ayşegül
    Ülkemizde dünyada olduğu gibi evcil hayvan sahiplenme oranı gün geçtikçe artmaktadır. Evcil hayvan sahipleri hayvanlarının sağlıklarını takip etmek için çeşitli araçlar ve yöntemler kullanmaktadırlar. Hayvan sağlığının takibi için kullanılan yöntemlerin başında hayvanın hareketlilik seviyesinin gözlemlenmesi gelmektedir. Hareketlik seviyesinde azalma çoğu hayvan hastalığında ilk ve en belirgin semptomlardandır. Bu çalışmada, evcil hayvanların eylemlerinin otomatik olarak tanınması ve takibi için bir Nesnelerin Interneti sistemi geliştirilmiştir. Sistemde evcil hayvanın tasmasına takılan bir sensör düğüm, bu düğümün topladığı verileri bulut mimarisine aktaran bir mobil uygulama ve bulut mimaride verileri otomatik olarak sınıflandıran ve görselleştiren bir yazılım ve arayüz bulunmaktadır. Elde edilen veriler ile evcil hayvanın bir gün içindeki hareketliliği farklı eylem sınıfları (oturma, yürüme, koşma) gösterilerek belirlenmiştir. Çalışmada denek olarak köpek kullanılmıştır.
  • Yayın
    An experimental evaluation of prior polarities in sentiment lexicons
    (IEEE, 2017) Kanburoğlu, Ali Buğra; Solak, Ercan
    We present the results of an experiment to assess the validity of prior polarities available in sentiment lexicons. We designed a ranking task that was elicited through pairwise comparisons and compared the results to those predicted by two popular sentiment lexicons. We find that the experiment results show a moderate level of agreement between the lexicons and human judgments.
  • Yayın
    Forecasting and analysis of domestic solid waste generation in districts of istanbul with support vector regression
    (Institute of Electrical and Electronics Engineers Inc., 2020-10-12) Özçelik, Şuayb Talha; Tek, Faik Boray
    Waste planning is essential for large and developing cities such as Istanbul. In this report, we perform data analysis on "Waste Amount Based on District, Year and Waste Type"dataset shared by Istanbul Metropolitan Municipality. After analyzing the waste of the districts, we used support vector regression (SVR) to forecast the waste amounts for the coming years. The analysis has shown an overall increasing trend in the waste generation, although it dropped in 2019. The SVR predicts that the most waste generating district will be Küçükçekmece in the coming years.