dc.contributor | Брестский государственный технический университет | ru_RU |
dc.contributor | Brest State Technical University | ru_RU |
dc.contributor.author | Уваров, А. А | |
dc.contributor.author | Садыхов, Рауф Хосровович | |
dc.coverage.spatial | Брест | ru_RU |
dc.date.accessioned | 2020-09-09T13:58:45Z | |
dc.date.available | 2020-09-09T13:58:45Z | |
dc.date.issued | 2009 | |
dc.identifier.citation | Уваров, А. А. Вычислительная конфигурация для реализации на архитектуре CUDA алгоритма фильтрации изображений / А. А. Уваров, Р. Х. Садыхов // Вестник Брестского государственного технического университета. Серия: Физика, математика, информатика. – 2009. – № 5. – С. 34–38 : ил. – Библиогр.: с. 38 (5 назв.). | ru_RU |
dc.identifier.uri | https://rep.bstu.by/handle/data/7288 | |
dc.description | UVAROV А. A., SADYKHOV R. Kh. Execution configuration for cuda implementation of image convolution filter | ru_RU |
dc.description.abstract | В статье продемонстрирован способ построения вычислительной конфигурации для алгоритмов сверточной фильтрации изображения различного радиуса. Способ позволяет создавать вычислительные конфигурации, которые для всех обращений к глобальной памяти формируют транзакции. Для выбора оптимальных размеров блоков данных были сформированы математические критерии. На их основе для каждого радиуса фильтра было сформировано множество вычислительных конфигураций. Экспериментально было продемонстрировано, что для фильтров с радиусом 1–4 существует две оптимальные конфигурации с размерами блоков данных 512х14 и 512х30 байт соответственно. В качестве обобщения можно добавить, что найденные вычислительные конфигурации будут оптимальны для алгоритмов обработки изображений, которые используют тот же размер окрестности пикселя, что и рассмотренные алгоритмы фильтрации. | ru_RU |
dc.language.iso | ru | ru_RU |
dc.publisher | БрГТУ | ru_RU |
dc.relation.ispartofseries | Физика, математика, информатика; | |
dc.subject | информационные технологии | ru_RU |
dc.subject | information technology | ru_RU |
dc.title | Вычислительная конфигурация для реализации на архитектуре CUDA алгоритма фильтрации изображений | ru_RU |
dc.type | Статья (Article) | ru_RU |
dc.identifier.udc | 004.272.26 | ru_RU |
dc.abstract.alternative | The paper demonstrates approach for constructing optimal execution configuration for CUDA implementation of image convolution filter with different radius. The main goals of execution configuration are to eliminate uncoalesced memory access to improve memory bandwidth and maximize multiprocessor threads utilization. Several mathematical criteria were proposed to choose optimal data block size for execution configuration. Multiple execution configurations based on selected criteria for every filter radius have been formed. It is experimentally find out that two execution configurations with data block size 512х14 and 512х30 are optimal for image convolution filter with radius from 1 to 4. Also described execution configurations are optimal
for image processing algorithms which use the same pixel area like considered image convolution filter. | ru_RU |