Search
Вычислительная конфигурация для реализации на архитектуре CUDA алгоритма фильтрации изображений
View/ Open document files
Date
2009Publisher
БрГТУUDC
004.272.26Citation
Уваров, А. А. Вычислительная конфигурация для реализации на архитектуре CUDA алгоритма фильтрации изображений / А. А. Уваров, Р. Х. Садыхов // Вестник Брестского государственного технического университета. Серия: Физика, математика, информатика. – 2009. – № 5. – С. 34–38 : ил. – Библиогр.: с. 38 (5 назв.).Abstract
В статье продемонстрирован способ построения вычислительной конфигурации для алгоритмов сверточной фильтрации изображения различного радиуса. Способ позволяет создавать вычислительные конфигурации, которые для всех обращений к глобальной памяти формируют транзакции. Для выбора оптимальных размеров блоков данных были сформированы математические критерии. На их основе для каждого радиуса фильтра было сформировано множество вычислительных конфигураций. Экспериментально было продемонстрировано, что для фильтров с радиусом 1–4 существует две оптимальные конфигурации с размерами блоков данных 512х14 и 512х30 байт соответственно. В качестве обобщения можно добавить, что найденные вычислительные конфигурации будут оптимальны для алгоритмов обработки изображений, которые используют тот же размер окрестности пикселя, что и рассмотренные алгоритмы фильтрации.
Annotation in another language
The paper demonstrates approach for constructing optimal execution configuration for CUDA implementation of image convolution filter with different radius. The main goals of execution configuration are to eliminate uncoalesced memory access to improve memory bandwidth and maximize multiprocessor threads utilization. Several mathematical criteria were proposed to choose optimal data block size for execution configuration. Multiple execution configurations based on selected criteria for every filter radius have been formed. It is experimentally find out that two execution configurations with data block size 512х14 and 512х30 are optimal for image convolution filter with radius from 1 to 4. Also described execution configurations are optimal
for image processing algorithms which use the same pixel area like considered image convolution filter.
Collection
- 2009 [33]
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция-Некоммерчески») 4.0 Всемирная.