ОБУЧАЮЩАЯСЯ АВТОМАТИЧЕСКАЯ СИСТЕМА
обучаемая
машина, самоприспосабливающаяся система, алгоритм управления к-рой изменяется
в соответствии с оценкой результатов управления так, что с течением времени
она улучшает свои характеристики и качество функционирования (см. Автоматическое
управление). Проектирование и построение технич. систем возможно только
на основе начальной априорной информации о характере процессов, протекающих
в системе, и условиях, сопровождающих работу системы и оказывающих на неё
возмущающее воздействие. Когда имеется полная начальная априорная информация,
можно достаточно точно определить такие значения характеристик проектируемой
системы, к-рые обеспечивают заданное качество её функционирования; в этом
случае нет необходимости в её обучении. При отсутствии полной начальной
информации единственной возможностью создания системы с заданным качеством
функционирования является использование при её разработке принципа обучения.
Обучение - процесс многократных воздействий
на систему и корректирования её реакций на эти воздействия. Внешняя корректировка,
или, как её ещё называют, "поощрение" и "наказание", осуществляется "учителем",
к-рому известна желаемая реакция на определённые воздействия. "Учителем"
может быть либо человек - оператор, либо автомат. Именно на основе обработки
контрольной (апостериорной) информации происходит восполнение недостающей
начальной информации. Если обучение осуществляется без внешнего обучающего
устройства, то подобная система называется самообучающейся.
Обучение осуществляется с помощью алгоритмов,
к-рые в зависимости от того, является ли О. а. с. дискретной или непрерывной,
представляют собой систему стохастич. разностных либо стохастич. дифференциальных
уравнений. Алгоритмы обучения реализуются средствами вычислит, техники
- цифровыми либо аналоговыми вычислит, машинами (в частности, электроинтеграторами)
либо,
наконец, гибридными вычислит, системами. По мере обучения О. а. с. накапливает
опыт, на основе к-рого постепенно вырабатывается требуемая реакция системы
на внешние воздействия; О. а. с. - асимптотически оптимальная система,
т. к. оптимальная реакция системы на внешние возмущения достигается не
сразу, а с течением времени, в результате обучения. Наиболее полно исследованы
О. а. с. распознавания образов, идентификации, фильтрации и управления.
В О. а. с. распознавания образов до начала
их функционирования всё множество подлежащих опознанию объектов подразделяется
на классы в соответствии с избранным принципом классификации. После этого
составляется словарь признаков распознаваемых объектов и создаются технич.
средства для определения этих признаков. Если объём начальной априорной
информации достаточен для того, чтобы произвести описание классов на языке
признаков, то можно построить систему распознавания без обучения. Если
же объём первонач. информации недостаточен для описания классов либо такое
описание по нек-рым причинам составить неудобно, то система распознавания
образов может быть сформирована с помощью обучения. О. а. с. до начала
функционирования в качестве распознающей системы работает с "учителем",
к-рый предъявляет системе обучающие объекты всех выделенных классов и указывает,
к каким именно классам они принадлежат. Затем учитель "экзаменует" систему,
корректируя её ответы до тех пор, пока ср. количество ошибок не снизится
до желаемого уровня. В результате обучения начальная априорная информация
пополняется, что и обеспечивает О. а. с. распознавания возможность описывать
классы с помощью избранного словаря признаков. При этом, чем точнее удаётся
восстановить описание классов на языке словаря признаков, тем качественнее
работает система и тем реже она допускает ошибки при распознавании неизвестных
объектов или явлений (см. также Распознавание образов).
Структурная схема автоматической
обучающейся системы управления: Аь Аг - устройство управления; В - управляемый
объект; С - вычислительное устройство; х
R - критерий оптимальности; F
О. а. с. фильтрации предназначены для отделения
полезного сигнала от помех, что необходимо, в частности, в радиолокации
и при дальней радиосвязи. В условиях полной априорной информации о входных
воздействиях (полезном сигнале и помехах) можно построить систему фильтрации,
обеспечивающую экстремальное значение соответствующему критерию оптимальности,
характеризующему работу системы. Однако в условиях недостаточности априорной
информации обучение - единственный путь построения оптимальной системы
фильтрации. В процессе обучения изменяются параметры системы фильтрации,
а иногда даже её структура, в результате чего критерий оптимальности асимптотически
приближается к своему экстремальному значению.
О. а. с. управления могут применяться на
Лит.: Фельдбаум А. А., Процессы
летательных аппаратах, в технологич. агрегатах и др. Структурная схема
типовой системы автоматич. управления, в к-рой на основе обучения реализуется
оптимальный (в определённом смысле) процесс управления, представлена на
рис. Положим, цель управления состоит в том, чтобы обеспечить наименьшее
значение нек-рой величины (функционала) R, зависящей в общем случае
от функций задающего х
воздействий и от управляемой величины х (t), т. е.
<R[x
Эта цель должна быть достигнута при наличии
определённых ограничений, состоящих в том, что нек-рые величины (функционалы)
F
i = = 1,2,..., т, не должны превосходить установленных для них значений,
т. е.
F
,
где Г (t) - возмущение, воздействующее
на объект управления. Положим, кроме того, что полная априорная информация
относительно z (t) и x
в противном случае задача построения оптимальной системы управления может
быть, в принципе, решена без обучения. В рассматриваемой системе осн. часть
управляющего устройства A
способный изменяться в широком диапазоне, а др. часть - A
на цели управления, устройство A
A
возможные изменения режимов работы объекта
В,
вырабатывает воздействия
у* (t), к-рые всё более и более приближаются к требуемым значениям.
Требуемыми являются такие значения
у (t), к-рые в соответствии с
полученными в вычислит, устройстве С значениями критерия оптимальности
R
(при ограничениях F
работы A
О. а. с. управления является асимптотически оптимальной.
обучения людей и автоматов, в сб.: Кибернетика, мышление, жизнь, М., 1964;
Н и л ь с о н Н. Д ж., Обучающиеся машины, пер. с англ., М., 1967; Ц ы
п к и н Я. 3., Адаптация и обучение в автоматических системах, М., 1968;
его же, Основы теории обучающихся систем, М., 1970; Горелик А. Л., С к
р и п к и н В. А., Некоторые вопросы построения систем распознавания объектов
и явлений, М., 1974. А. Л. Горелик.
А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я