Ноябрь 17th, 2014
Во время обучения НС, с использованием вычисления градиента, довольно часто наблюдалось явление «паралича» сети, что объясняется большим количеством одинаковых значений факторов. Так, при 50 запусках одного из представителей backpropagation — алгоритма Ле-венберга-Маркуарда 28 раз процесс обучения прерывался искусственно из-за «паралича» сети, 16 раз точность была низкой из-за попадания в локальные минимумы и лишь 6 раз точность была сравнимой с точностью результатов применения нашего метода. Анализ результатов экспериментов показывает, что алгоритм МАСР, в среднем, вдвое медленнее работает, чем другие алгоритмы с градиентными методами обучения. В то же время, его результаты являются значительно точнее (на 80-180%), чем результаты работы НС с другими алгоритмами, а также и чем результаты (800-1000%), полученные в результате использования классических интегро- дифференциальных методов.
При сделанных предыдущих предположениях средняя погрешность для МАСР составляет 0,05 — 0,98%, для АЛМ 2,88-3,3%, для АФП — 2,22 — 2,79%, для АСГ — 3-3,39%, что убеждает в эффективности первого алгоритма. Результаты, приведенные в табл. 6.6, получены при таких предположениях: выбраны первые 25 объектов из 45, которые входят в проверочную последовательность; результаты для градиентных методов являются усредненными для случаев, когда не было «параличей» сети; приведенные результаты соответствуют соотношению обучающих и контрольных образов как 70:30; ABS — среднее абсолютное отклонение реальных и рассчитанных цен. На производстве часто нужен стрейч, найти его оптом можно на сайте http://upaktech.ru/.
В зависимости от соотношения между количеством образов в обучающей и контрольной выборке средняя погрешность вычислений меняется, причем такая тенденция имеет место для всех сравниваемых алгоритмов.
Было проведено также дополнительное исследование зависимости среднеквадратичного отклонения от количества итераций (137). Установлено, что большое значение средней абсолютной погрешности (Error=2, Error=1,5, Error=1) на точках контрольной последовательности предопределяет достаточно гладкое уменьшение средней абсолютной погрешности на точках контрольной последовательности.