Search
Персептроны и нейронные сети глубокого доверия : обучение и применение
View/ Open document files
Date
2014Publisher
БрГТУUDC
004.89Citation
Головко, В. А. Персептроны и нейронные сети глубокого доверия : обучение и применение / В. А. Головко, А. А. Крощенко // Вестник Брестского государственного технического университета. Серия: Физика, математика, информатика. – 2014. – №5. – С. 2–12.Abstract
В данной статье рассматриваются и анализируются основные
парадигмы обучения персептронных нейронных сетей: от однослойного персептрона к многослойным сетям глубокого доверия, которые
считаются революционным шагом в области интеллектуальной обработки данных. Показана несостоятельность некоторых мифов о
возможностях персептронных нейронных сетей и обосновывается
переход к сверхбольшим персептронным сетям глубокого доверия.
рассмотрены основные модели обучения нейронных сетей глубокого
доверия, базирующиеся на ограниченной машине Больцмана (RBM)
и автоассоциативном подходе. предложен новый метод для обучения ограниченной машины Больцмана и показано, что правило обу-
чения ограниченной машины Больцмана является частным случаем
предложенного метода обучения, который базируется на минимизации суммарной квадратичной ошибки восстановления информации.
доказана эквивалентность максимизации вероятности распределения данных в ограниченной машине Больцмана и минимизация суммарной квадратичной ошибки восстановления информации в слоях
(RBM). рассматривается применение нейронных сетей глубокого
доверия для сжатия, визуализации и распознавания данных.
Annotation in another language
This paper discusses and analyzes the basic paradigm of learning perceptron neural networks: from single layer perceptron to multilayer deep
belief neural networks, which are considered now as a revolution in the field of data mining. It is shown the inconsistency of some of the myths about
the possibilities of perceptron neural networks and is substantiated the transition to deep belief neural networks. The basic models of deep belief neural
networks training are examined, which are based on the restricted Boltzmann machine (RBM) and auto-associative approach. A new method for
training of RBM is proposed and is shown that traditional approach for restricted Boltzmann machine training is particular case of proposed technique,
which is based on minimization of reconstruction square error.It is proved the equivalence of maximizing the probability distribution of the data in a
restricted Boltzmann machine and the minimization of the total reconstruction squared error in layers of RBM. The application of deep belief neural
network for compression, visualization and data recognition is considered.
Collection
- 2014 [18]
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция-Некоммерчески») 4.0 Всемирная.