Arama Sonuçları

Listeleniyor 1 - 10 / 10
  • Yayın
    Spectral coding of mesh geometry with a hierarchical set partitioning algorithm
    (Spie-Int Soc Optical Engineering, 2008) Konur, Umut; Bayazıt, Uluğ; Ateş, Hasan Fehmi; Gürgen, Sadık Fikret
    This work proposes a progressive mesh geometry coder, which expresses geometry information in terms of spectral coefficients obtained through a transformation and codes these coefficients using a hierarchical set partitioning algorithm that assigns right priorities to those coefficients at all bit planes. The spectral transformation used is the one proposed in [8] where the spectral coefficients are obtained by projecting the mesh geometry on an orthonormal basis determined by mesh topology. The set partitioning method used in coding, treats spectral coefficients belonging to the three spatial coordinates with the right priority at all bit planes and realizes a truly embedded system by achieving implicit bit allocation via joint coding the zeroes of coefficients at the bit planes. The experiments performed on common irregular meshes reveal that the rate-distortion performance of the coder is significantly superior to the coding system proposed in [8].
  • Yayın
    Low complexity inter-mode selection for H.264
    (IEEE, 2006) Ba, Seydou Nourou; Altunbaşak, Yücel; Ateş, Hasan Fehmi
    The coding efficiency of the H.264/AVC standard enables the transmission of high quality video over bandwidth limited networks. Due to the use of multiple Macroblock (MB) partitions, the Motion estimation module has extremely high complexity that makes it unpractical for most real-time applications on resource-limited platforms such as hand held devices. In this paper we propose a novel algorithm that significantly reduces the encoding complexity while maintaining high rate distortion performance. The proposed method reduces the Motion estimation (ME) computational complexity by accurately predicting the optimal MB partitions and restricting the number of candidate modes based on a-priori probabilities computed from spatio-temporal information. The experimental results show that the speed up of UmHexagonS [1] (one of the most efficient ME algorithms) can be doubled while maintaining the coding efficiency of Full Search.
  • Yayın
    Çok-hipotezli süperpikseller ile sahne bölütleme ve etiketleme
    (IEEE, 2015-06-19) Ak, Kenan Emir; Ateş, Hasan Fehmi
    Süperpikseller son zamanlarda imge bölütleme ve sınıflandırma problemlerinde giderek önem kazanmaktadır. Sahne etiketlemede imge öncelikle bir süperpiksel algoritması ile görsel olarak tutarlı küçük parçalara bölütlenmekte; daha sonra süperpikseller farklı sınıflara ayrı¸stırılmaktadır. Sınıflandırma performansı kullanılan süperpiksel algoritmasının özellikleri ve parametre ayarlarından önemli ölçüde etkilenmektedir. Bu bildiride sahne etiketleme doğruluğunu iyileştirmek için birden fazla süperpiksel bölütleme sonucunu sınıflandırıcı seviyesinde kaynaştıran bir yöntem önerilmiştir. Öncelikle basit, parametrik olmayan ve eğitim gerektirmeyen SuperParsing algoritması kullanılarak süperpiksel etiketleri için olabilirlik oranları tespit edilir. Daha sonra alternatif süperpiksel bölütleme senaryoları için hesaplanan olabilirlik oranları piksel seviyesinde kaynaştırılarak, ilgili sahnenin bölütlenmesi ve etiketlenmesi tamamlanır. Önerilen yöntem 2,688 imge ve 33 etiket içeren SIFT Flow veri kümesi üzerinde test edilmiş ve SuperParsing’den daha yüksek sınıflandırma doğruluğu elde edilmiştir.
  • Yayın
    Wavelet image coding using the spherical representation
    (IEEE, 2005) Ateş, Hasan Fehmi; Orchard, Michael T.
    In this paper, we introduce the "spherical representation", which provides a new adaptive framework for modeling and coding the image information in wavelet subbands. Based on this representation, a practical coding algorithm is developed. This coder uses local energy as a direct measure to differentiate between parts of the wavelet subband and to decide how to allocate the available bitrate. As local energy becomes available at finer resolutions, i.e. in smaller size windows, the coder automatically updates its decisions about how to spend the bitrate. We use a hierarchical set of variables to specify and code the local energy up to the highest resolution, i.e. the energy of individual wavelet coefficients. The overall scheme is nonredundant, meaning that the subband information is conveyed using this equivalent set of variables without the need for any side parameters. Despite its simplicity, the algorithm produces PSNR results that are competitive with the state-of-art coders in literature.
  • Yayın
    Occlusion aware motion compensation for video frame rate up-conversion
    (2010) Çizmeci, Burak; Ateş, Hasan Fehmi
    Since the emergence of high definition (HD) display technologies, video standards conversion problem has become an important issue in storage, transmission and display of video content. Video frame rate up-conversion (FRUC) is considered as a standard task for today's HD displays because these displays reach high refresh rates of at least 100/120 Hz and low video frame rates should be pulled up by a factor of 2 or more before display. Motion compensated FRUC techniques are proposed to avoid motion blur and motion judder at high refresh rates, but these techniques suffer from spatial inconsistencies and artifacts especially in occluded regions of the interpolated frames. This paper introduces a new video FRUC method that aims to remove both motion judder and occlusion artifacts and generate smooth object motion for high quality displays. An occlusion adaptive overlapped block motion compensation (OBMC) technique is proposed, which provides spatio-temporally consistent frame interpolation. Covered/uncovered regions are detected by analyzing the discontinuities of the motion vector field. The occlusion regions are interpolated using this covered/uncovered decision and a new error metric that measures spatial consistency. Compared to existing methods, the proposed algorithm achieves FRUC with fewer artifacts and better spatial resolution especially in occluded areas.
  • Yayın
    H.264 video kodlamada B-çerçeveler için kodçözücü tarafında aday devinim vektör seçimi
    (IEEE, 2012-04-18) Ateş, Hasan Fehmi; Gaurav, Rahul
    H.264 standardında devinim vektör farklarının kodlanması sebebiyle özellikle düşük bit hızlarında nesne sınırlarında devinimdeki ani değişiklikler harcanan bit miktarlarını artırmaktadır. Bu bildiride B-çerçevelerde kod çözücü desteği ile verimli devinim vektör kodlama için özgün bir yöntem sunulmuştur. Bu yöntemde kod çözücü gerçek devinim kestirimi kullanarak az sayıda aday vektör içeren bir vektör kümesi belirler. Devinim kestirim doğrulu günün iyileştirilmesi amacıyla bu aday vektörler etrafında kısıtlı bir arama yapılır. Bu aramaya en iyi olma ihtimali düşük vektörler dahil edilmeleyerek aday vektor alt-kümesinin küçük tutulması sağlanır. Sonuç¸ta her makroblok için aday vektör kümeleri kod çözücü tarafından belirlendiği için, belirtik bir şekilde devinim bilgisinin kodlanmasına gerek kalmamakta ve bu da kodlama için gerekli bit hızını düşürmektedir. Algoritmanın aynı bit hızlarında referans H.264 sonuçlarına göre 0.39 dB PSNR kazancı sağladığı gösterilmiştir. Ayrıca sıkıştırılmış B-çerçevelerin görsel kalitesinde kayda değer bir iyileşme gözlenmistir.
  • Yayın
    Kodlayıcı destekli video çerçeve hız artırımı
    (IEEE, 2011) Çizmeci, Burak; Ateş, Hasan Fehmi
    Videoda çerçeve hız artırımı (ÇHA), devinim denkleştirme yöntemlerinin kullanılmasıyla hareketlerin daha keskin ve sürekli gösterimini sağlayarak görsel kaliteyi artırmaktadır. Fakat, devinim kestiriminde karşılaşılan problemler ÇHA başarımını etkileyen yapaylıklara neden olabilmektedir. Bu bildiride, kodlayıcı desteği ile kodçözücüdeki ÇHA art işleminin başarımını artıran bir yaklaşım önermekteyiz. Bu yaklaşımda, kodlayıcı, ÇHA sırasında yardımcı olabilecek yan bilgiyi türetip kodlayarak kodçözücüye göndermektedir. Kodçözücü, bu yan bilgiyi kullanarak ÇHA ile daha kaliteli çerçeveler sentezleyebilmektedir. Geliştirilen algoritma, ÇHA sırasında özellikle kapatmadan kaynaklanan yapaylıkları azaltarak önemli görsel kalite kazançları sağlamaktadır. Ayrıca çeşitli video içeriklerinde kodlayıcı destekli ÇHA ile sentezlenen çerçevelerin ortalama PSNR değerlerinin, aynı bithızında H.264 standardı ile kodlanan B-çerçevelere göre daha yüksek olduğu gözlenmiştir.
  • Yayın
    Rate-distortion and complexity optimized motion estimation for H.264 video coding
    (IEEE-INST Electrical Electronics Engineers Inc, 2008-02) Ateş, Hasan Fehmi; Altunbaşak, Yücel
    11.264 video coding standard supports several inter-prediction coding modes that use macroblock (MB) partitions with variable block sizes. Rate-distortion (R-D) optimal selection of both the motion vectors (MVs) and the coding mode of each MB is essential for an H.264 encoder to achieve superior coding efficiency. Unfortunately, searching for optimal MVs of each possible subblock incurs a heavy computational cost. In this paper, in order to reduce the computational burden of integer-pel motion estimation (ME) without sacrificing from the coding performance, we propose a R-D and complexity joint optimization framework. Within this framework, we develop a simple method that determines for each MB which partitions are likely to be optimal. MV search is carried out for only the selected partitions, thus reducing the complexity of the ME step. The mode selection criteria is based on a measure of spatiotemporal activity within the MB. The procedure minimizes the coding loss at a given level of computational complexity either for the full video sequence or for each single frame. For the latter case, the algorithm provides a tight upper bound on the worst case complexity/execution time of the ME module. Simulation results show that the algorithm speeds up integer-pel ME by a factor of up to 40 with less than 0.2 dB loss in coding efficiency.
  • Yayın
    Gerçel ve karmaşık süzgeç öbeklerinin eşdalgacıklı tasarımı
    (IEEE, 2006-07-31) Ateş, Hasan Fehmi; Orchard, Michael T.; Kanberoğlu, Berkay
    Bu bildiride, eşdalgacıklı tam geri çatma süzgeç öbekleri tasarlamak için, Parks-McClellan algoritması gibi tekniklerle üretilen enküçük-enbüyük optimal eşdalgacıklı kısıtsız süzgeçleri eşlemlemede kullanılan basit bir yöntem sunulmaktadır. Bu yöntem, hem standart alçak- ve yüksek geçiren süzgeçlerin tam geri çatması sağlayacak şekilde tasarımlarına hem de kritik örneklenmiş karmaşık süzgeçlerin tasarımlarına uygulanmıştır. Gerçel süzgeç öbeği tasarımı için, yöntemimiz, tam geri çatma kısıtlarını karşılayan ve aynı zamanda standart enküçük-enbüyük süzgeç tasarımı ölçütlerini eniyileyen eşdalgacıklı alçak ve yüksek geçiren süzgeçleri üretmektedir. Karmaşık süzgeç öbeği tasarımı için, yöntemimiz, tam geri çatmaya izin verirken aynı zamanda rezone eden sinyaller için kritik örneklenmiş bir zarf/faz gösterimi oluşturmaktadır. Karmaşık süzgecin genlik tepkisi, ideal pozitif bir frekans geçirme kuşağının eşdalgacıklı yaklaşımıdır. Faz tepkisi ise salt doğrusal fazın eşdalgacıklı yaklaşımıdır.
  • Yayın
    Fast algorithm analysis and bit-serial architecture design for sub-pixel motion estimation in H.264
    (World Scientific Publishing Company, 2010-12) Fatemi, Mohammad Reza Hosseiny; Ateş, Hasan Fehmi; Salleh, Rosli Bin
    The sub-pixel motion estimation (SME), together with the interpolation of reference frames, is a computationally extensive part of the H.264 encoder that increases the memory requirement 16-times for each reference frame. Due to the huge computational complexity and memory requirement of the H.264 SME, its hardware architecture design is an important issue especially in high resolution or low power applications. To solve the above difficulties, we propose several optimization techniques in both algorithm and architecture levels. In the algorithm level, we propose a parabolic based algorithm for SME with quarter-pixel accuracy which reduces the computational budget by 94.35% and the memory access requirement by 98.5% in comparison to the standard interpolate and search method. In addition, a fast version of the proposed algorithm is presented that reduces the computational budget 46.28% further while maintaining the video quality. In the architecture level, we propose a novel bit-serial architecture for our algorithm. Due to advantages of the bit-serial architecture, it has a low gate count, high speed operation frequency, low density interconnection, and a reduced number of I/O pins. Also, several optimization techniques including the sum of absolute differences truncation, source sharing exploiting and power saving techniques are applied to the proposed architecture which reduce power consumption and area. Our design can save between 57.71-90.01% of area cost and improves the macroblock (MB) processing speed between 1.7-8.44 times when compared to previous designs. Implementation results show that our design can support real time HD1080 format with 20.3 k gate counts at the operation frequency of 144.9 MHz.