14. ПРИНЦИП ОПТИМАЛЬНОСТИ БЕЛЛМАНА
Принцип Беллмана. При поиске оптималь-
ного решения многошаговой задачи
оптимизации выбор управления uk на
каждом шаге, независимо от его начального
состояния xk-1, должен быть направлен на
оптимизацию не только данного, но и всех
оставшихся шагов.
16. 1. Выбрать параметры (фазовые координаты), характеризующие состояние S
управляемой системы перед каждым шагом.
2. Расчленить операцию на этапы (шаги).
3. Выяснить набор шаговых управлений ui для каждого шага и налагаемые
на них ограничения.
4. Определить какой выигрыш приносит на i-ом шаге управление ui, если
перед этим система была в состоянии xi, т.е. записать функцию управления
5. Определить, как изменяется состояние системы под влиянием
управления ui на i-ом шаге: оно переходит в новое состояние
6. Записать основное рекуррентное уравнение динамического
программирования, выражающее условный оптимальный выигрыш Z через
функцию Беллмана
7. Произвести условную оптимизацию последнего (m-го) шага, задаваясь
гаммой состояний xm-1, из которых можно за один шаг дойти до конечного
состояния, вычисляя для каждого из них условный оптимальный выигрыш
8. Произвести условную оптимизацию (m-1)-го, (m-2)-го и т.д.
9. Произвести безусловную оптимизацию управления, начиная с первого
шага