• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Get Ft
 

Get Ft

on

  • 560 views

 

Statistics

Views

Total Views
560
Views on SlideShare
560
Embed Views
0

Actions

Likes
0
Downloads
0
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Get Ft Get Ft Document Transcript

    • ИЗВЕСТИЯ АКАДЕМИИ НАУК СССР Серия математическая: 25 (1961), 477—498 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН ОБ ОДНОЙ СТАТИСТИЧЕСКОЙ ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В работе рассматривается вопрос об оптимальном достижении управляемой точкой малой окрестности другой, стохастически движу­ щейся точки. В связи с этим решается задача с малым параметром для параболического дифференциального уравнения с частными производ­ ными. § 1. Постановка задачи Точку z фазового пространства R переменных z1, . . ., zn назовем управляемой, если ее движение в пространстве R описывается системой обыкновенных дифференциальных уравнений Z* = f (Z . . . , Zn, U . . ., О , I = 1, . . . , Щ (1) где и = (и1, . . .,'и г ) — управляющий параметр. Точку Q фазового пространства R назовем случайной, если процесс ее движения есть марковский процесс. Как известно [см. (*)], вероят­ ностную характеристику этого процесса дает функция р (о, х, %, у), равная плотности вероятности того, что случайная точка Q, находящаяся в момент а в положении х, в момент т будет находиться в положении у. Функция р (сг, х, т, ?/), как функция первой пары переменных а и х, удовлетворяет параболическому дифференциальному уравнению второго порядка — первому дифференциальному уравнению А. Н. Колмогорова | £ + av (в, х) -р^ + Ь1(б,х)^- = 0 (2) и является фундаментальным решением этого уравнения. Таким обра­ зом, решение уравнения (2) F (а, х), имеющее наперед заданное началь­ ное значение Fx (x): F (о, х) - Fx (х), а -+ т, (3) дается формулой F(o,x)=^p(o,x,x,y)F1t!/)dy. (4) (В этой формуле, как и всюду в дальнейшем, если специально не ука­ зана область интегрирования, интегрирование ведется по всему про­ странству R.) Отметим еще одно важное свойство функции р (о, х, т, у). Пусть тре­ буется решить неоднородное параболическое уравнение, соответствующее
    • 478 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН уравнению (2): + а (0 Х) Ъ ' Ш? + Ь (<Т' х) ^ = Р ( °' х) (5) при нулевом начальном условии. Тогда искомое решение дается формулой и{о, х, т) = —^ds^p (о, х, s, у) Р (s, у) dy. (6) а В настоящей работе мы будем предполагать, что правые части системы уравнений (1), описывающей движение управляемой точки z, непрерывно зависят от всех переменных и непрерывно дифференцируемы по z1, . . ., zn Относительно же коэффициентов уравнения (2), описывающего движе­ ние случайной точки Q, мы сделаем следующие предположения: а) коэффициенты а^ (сг, х), Ь1 (а, х), г, / = 1, . . . п, определены и непрерывны при а > О и при любых x^R; б) все собственные значения матрицы || а^ (а, х) при этих значениях аргументов ограничены сверху и снизу положительными константами; в) коэффициенты Ьг (а, х) при возрастании J x возрастают не бы­ стрее, чем е|х1. Итак, пусть в пространстве R движутся управляемая точка z и слу­ чайная точка Q. Пусть вместе с управляемой точкой z движется некоторая ее окрестность 2 2 , например шар или, вообще, область, ограниченная произвольной кусочно гладкой поверхностью, кусочно гладко меняющей­ ся вместе с z. Если задан закон управления точкой z, т. е. если параметр и задан как кусочно непрерывная функция времени и — и (/), то система диф­ ференциальных уравнений (1) однозначно определяет непрерывное дви­ жение точки z в пространстве R. Следовательно, если заданы начальные положения управляемой точки z и случайной точки (?, то однозначно определяется вероятность встречи точки Q с окрестностью 2 Z на отрезке времени < <^ t < ; т или на бесконечном отрезке времени 0 < ; t <C ос, или т вероятность встречи с тем или иным весом. Эти вероятности являются, таким образом, функционалами управления и (t), и естественно возни­ кает задача о таком выборе управлений и (t) точкой z, при которых эти функционалы достигают экстремальных значений. Чтобы точно формулировать задачу, введем в рассмотрение неотри­ цательную и не превосходящую единицы функцию h (t), определенную на всей оси t. Обозначим через tyu (а, х, т) вероятность того, что случай­ ная точка Q, находящаяся в момент времени а в положении х, на отрезке времени а <^ t <^ x встретится с окрестностью 2 2 управляемой точки z (при этом предполагается, что начальное положение точки z, равное z (а), задано). Ставится следующая задача: выбрать управление и (t), точкой z таким образом, чтобы функционал со / =h(s)~[qu(o, х, s)]ds (7) О достигал максимума.
    • СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 479 Управление и (t) и соответствующую ему траекторию z (t) системы (1), обеспечивающие максимум функционала (7), будем называть оптималь­ ными. Таким образом, решение задачи сводится к принципу максиму­ ма [см. ( 2 )], если только функционал (7) известен как функционал от и (0, z (t). Само собой разумеется, что функционал (7) зависит также от размеров и формы окрестности 2 2 управляемой точки 2. Как мы увидим ниже, для его вычисления нам потребуется решать граничную задачу для уравнения (2). При этом нас будет интересовать эффективная, хотя бы и приближенная, формула для этого решения. Оказывается, что такую формулу можно получить, если размер окрестности 2 2 считать малым* Но задача «накрыть» малой управляемой окрестностью случайную точку Q как раз и является естественной. Итак, в настоящей работе окрестность 2 2 мы будем считать малой. Д л я простоты мы будем предполагать, что 2 2 есть ^-мерный шар радиуса 8 с центром в точке z. Однако внимательный читатель сможет увидеть, что все наши рассуждения и сам результат почти не изменятся, если под 2 Z понимать произвольную область малого «радиуса», ограниченную произвольной кусочно гладкой поверхностью, кусочно гладко меняющей­ ся вместе с z. § 2. Сведение вычисления функционала I к решению граничной задачи для уравнения Колмогорова Прежде чем указать подход к вычислению функционала (7), сделаем несколько замечаний, относящихся к произвольному марковскому про­ цессу. Выделим в пространстве R фиксированную область Г, ограниченную (п — 1)-мерной кусочно гладкой поверхностью S. Обозначим через q (о, х, т, у) плотность вероятности точки Q, находящейся в момент а в положении х, быть в момент х в положении ?/, не заходя при этом на протяжении времени о <J t <^ т в область Г. Очевидно, что q (о, х, т, у) < р (а, х, т, у), (8) l i m q (а, х, т, у) dy = lim р (а, х, т, у) dy = 1. Далее, известно, что функция q (а, х, т, у) вне области Г является фундаментальным решением уравнения (2), а при приближении точки х к границе области Г справедливо соотношение q (а, х, т, у) dy -> 0 при х -> х0£ S. (9) д—г Пусть теперь область Г не фиксирована, а движется вместе с t, т. е. имеется однопараметрическое семейство областей Г*. Обозначим через q (о, х, т, у) плотность вероятности случайной точки Q, находящейся в момент времени а в положении х, быть в момент т в положении г/, не
    • 480 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН встречаясь на протяжении времени а <^ t <^ x с движущейся областью Г*. Тогда, очевидно, функция ?(<т, х, т, y)dy (10) является решением уравнения (2) и удовлетворяет следующему гранич­ ному значению: q (а, #, т, у) dy -»0 при ж -» Sa. (11) Теперь мы можем указать подход к вычислению функционала (7). Пусть движущаяся область Г* есть шар радиуса е с центром в управляе­ мой точке z (t). В соответствии с § 1 будем обозначать его через S z щ. Положим У(о,<х, 1) = i — q(o, х, r,y)dy. (12) •" Непосредственно из определения следует, что функция г|) (а, х, т) есть вероятность того, что случайная точка Q, находящаяся в момент 0 в положении х, на отрезке времени о <^ t ^ т будет «накрыта» окре­ стностью 2 2 (о управляемой точки z. Следовательно, функция я|) (а, ж, т), определенная формулой (12), есть та же самая функция, которая фигу­ рирует в функционале (7). Таким образом, для вычисления функционала (7) мы должны решить уравнение дв ' дх%дх3 У ' дх1 Х ' при условиях: ф (а, х, т) - 0, (14) |) (а, х, т) — 1 при ж -» £ а . » (15) Мы покажем, что решение задачи (13), (14), (15) представляется в виде ф (а, х, т) - е п - 2 ¥ (а, х, т) + о (е п - 2 ), (16) и получим эффективную формулу для W (а, х, т), представляющую глав­ ную часть вероятности я|) (о, #, т). § 3. Некоторые предварительные оценки В настоящем параграфе мы докажем ряд вспомогательных неравенств, связанных с фундаментальным решением уравнения (2). Кроме того, мы решим внешнюю задачу Дирихле для многомерного уравнения Лап­ ласа вне эллипсоида Se a i 2 + . . • + Kln2 - е2 (17) с единичным граничным значением. Результаты этого параграфа элемен­ тарны, однако мы выделяем их в специальный параграф, чтобы в после­ дующем можно было на них ссылаться не прерывая основных доказа­ тельств.
    • СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 481 Обозначим через g (о, £, т, ц) фундаментальное решение уравнения теплопроводности Как известно, оно имеет вид: g (в, Е, ?, Т]) = п.е 4(т-а) Т [2л; (t с- а ) ] Положим, далее, /•(6)= К £ 1 2 + . . . + Г 2 •'''* (20) и введем следующие обозначения: ©А. (о, Е, т) - ^g (or, lf т], t)—L-.rfr,, (21) Q, (a, E, t) = U * U (*. E, *, Л) -rr7d4. (22) Чтобы интегралы, стоящие в правых частях формул (21) и (22), имели смысл, мы, конечно, должны считать, что к < п. -; ; ^ Нам понадобятся следующие три неравенства, оценивающие фулШщи ©л (а, |, т) и Й* (а, |, т) при г (|) = е: °>л (а> Е, t) |г (5)==Е < - ^ - при т — о > 8, (23) ©л (сг, Е, т) |г {1)==е < — при т — а < 8, (24) Q*K6,t)|rR)=.<-^r. (25) Здесь С — константа, не зависящая от е, а б (е) -» 0 при е -» 0. В ы в о д н е р а в е н с т в (23), (24). Легко видеть, что • со* (о, Е • • • , Еп, т) = ©л (сг, г (Е), 0, . . . , 0, т) = (2Ь) =— — К 2 '<~> - ^ ч - ;1 [2я(т —о)] ' ' Положим т)* = г (Е) ж*, т — а = / 2 (Е) .Л Тогда из (26) получим: _1 со* (a, g, т) = - J — F (0, (27) где (.х*-1)Ч--.-+*п3 , 2 (2яг)
    • 482 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН Очевидно, что V (0 -> 1 при t -> 0. (29) Для дальнейшего отметим, что V (t) при больших значениях t имеет сле­ дующую асимптотику: rv> (30) '°{J) Действительно, положив в формуле (28) 2 J/Iyi = х (31) получим: ..+1/ n 2 J V(t) = -^e t * U ^/ А)"* (32) (К — константа), откуда и следует (29). Итак, имеем: щ 1°> *>х) <i*®v {*т) • (33) Но легко видеть, что V(1^) < Me) при т - о > г, (34) ^ ( т ) < С при T f f - <6> ( 35 ) откуда и вытекают неравенства (23), (24). В ы в о д н е р а в е н с т в а (25). Мы имеем: Q* (а, 1 . . ., Г , т) - О* (а, г (*), 0, . . ., 0, т) = J I JL г*(т|) ' [2я(*-<з)]2 Отсюда, полагая rf = г (£) # s — о = г2 (£) г, получим: т—о Qft (a, gf т) = _ < ? F W Л| (36) г (I) - <} где V (t) — функция, определенная формулой (28). В частности, т—о £2 «* (а, £, т) | r №)=t = - ^ jj 7 ( 0 Л. (37) О Если теперь учесть асимптотику функции V (t) при больших значениях t (см. формулу (30)), то сразу найдем: т—о £2 ^ F (t) dt < С In в при ft = 2, о ^ К (0 Л < С при /с > 2, откуда и следует неравенство (25). Одновременно мы установили, что Q»(a, £, т ) < - £ - . (38) г (S)
    • СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 483 Замечание к неравенствам (23), (24), (25). Пусть р (б, | , т, ц) — фундаментальное решение общего уравнения Колмогорова ~ + а** (а, 1)-^~ + Ъ1 (а, I) ~ = О. (39) v да v » *>/ Q^IQ^O д1г Исходя из этого фундаментального решения, определим функции <ол (а, £, т) и йл- (сг, £, т) соответственно по формулам (21), (22), подста­ вив в них вместо q (а, £, т, и) функцию /? (а, £, т, т]). Оказывается, что для так определенных функций о^ (а, £, т) и й* (о, £, т) справедливы те же неравенства (23), (24), (25). Действительно, в теории параболических уравнений доказывается, что при тех ограничениях на коэффициенты уравнения (39), которые мы предположили выполненными в § 1, фунда­ ментальное решение уравнения (39) мажорируется фундаментальным решением некоторого уравнения теплопроводности, т. е. для него имеет место неравенство: с -т^-1 р (а, £, т, г)) < —j- e -*-* , 2 (?-с) где у — константа. Эта оценка обеспечивает возможность буквального повторения вычислений, проведенных при выводе неравенств (23), (24), (25). Для дальнейшего нам потребуется также решить внешнюю задачу Дирихле для уравнения Лапласа U + ...+ 4 = ° (40) оря единичном граничном значении на эллипсоиде Sz (17). Мы докажем следующее предложение: ЛЕММА. Исчезающее в бесконечности решение внешней задачи Дирихле для уравнения (40) с граничным условием ^(IJIfes^1. (41) где Sz — эллипсоид (17), имеет вид 2 ^(I) = e " - - ^ + S(!;e), (42) еде а — положительная константа, однозначно определяемая размерами эллипсоида (42), а г (|) = Vx2 + . . . + f™2. При этом функция л (£, е) л/ж г (£) < 1 удовлетворяет следующим неравенствам: я(1г)<М-^^, (43) — я(£, е) < ^ ^ г - = - (44) {М — константа).
    • 484 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН Доказательство. Будем искать решение задачи (40)* (41) в виде v() = ^~2~1^Ж + S (¥, в), (45) г "(g) где а — пока не определенная константа, а л (£, е) — потенциал двой­ ного слоя, создаваемый эллипсоидом S£ в точке £, с не известной пока плотностью (х (ц) (через ц мы обозначаем координаты точек, лежащих на эллипсоиде Зг). Так как л (|, е) — решение уравнения (40), то оба слагаемых в правой части формулы (45) при любом значении константы а являются решениями уравнения (40). Таким образом, функция v (£), представляемая формулой (45), является решением уравнения (40). В силу хорошо известного свойства потенциала двойного слоя, граничное* условие (41) дает: ле(ц, в) = 1 - a - g ^ - (46> Г (Г)) для любого т]б^£» где через ле (г), е) обозначен предел функции л (£, е) при стремлении точки £ к точке г поверхности Sz извне. Но так как лГе(т), е) = — 2ni (г|) + л0 (т), 8), (47) где % (т], е) — значение л (£, е) в точке ц поверхности SZ1 то из (46) полу­ чаем: -2л|х й ) + я 0 (ч) = 1 - « Ч & • (48) Известно, что M v ) = U(ii) п-^- Ф , ^ , (49) J Р (м> 4i) где ф — угол, составленный направлением нормали в точке гц с радиу­ сом-вектором р (т), T]i), проведенным из точки гц в точку т]. Введем обозначения: Z t j 1 2^ /"" ~ ~ ! ^ ft' Л1) = 9 F Р (TJ» MI) C0S Ф n-i ,- - , > (50) Тогда из условия (48) мы получаем неоднородное интегральное уравнение для неизвестной плотности i (ц): р(ц)=к (ц^цг) |i Ы dSz + ф (л). (51) Уравнение (51) есть уравнение Фредгольма второго рода. Согласно изве­ стной теореме Фредгольма, для его разрешимости необходимо и дост'а-
    • СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 485 точно, чтобы свободный член был ортогонален ко всем собственным функ- циям сопряженного однородного интегрального уравнения (* — V(T,)= )K(41,4)ii(41)dSt. (52) iE Известно также [см. ( 3 )], что если ядро К (п, %) дается формулой (50), то уравнение (52) имеет только одну собственную функцию. Обозначим эту функцию через v 0 (r) и будем считать ее известной. Условие ортогональности дает возможность определить константу а. Запишем его: : •••'•' - 1 v0(n)d££-0. (53) ) [ r n - 2 (t]) Отсюда следует: I Vo(t|) dSt a = — ."i-JStfi. ,.. В полученной формуле константа а зависит от е, но зависимости эта лишь кажущаяся. В самом деле, обозначим через S эллипсоид 2 W + . . . +КЦП2 = 1, — . - iiv • - : - . , (54) ~ч 1 получающийся из эллипсоида 6е увеличением всех осей в — раз. Без труда обнаружим, что Vo(n)dS (55) С Vo (Л) Уо(Л) r jT dS г^(п) S Таким образом, а не зависит от е и полностью определяется размерами эллипсоида (54). Итак, функция v (g), даваемая формулой (45), при а, определяемой по формуле (55), является решением задачи (40), (41). Остается лишь проверить выполнение неравенств (43), (44). Но они непосредственно сле­ дуют из определения потенциала двойного слоя я (£, е): 1 J р {1, л) § 4. Вычисление функционала I в случае, когда уравнение . Колмогорова имеет^постоянные коэффициенты В этом параграфе вероятность р (о, х, т), а следовательно, функцио­ нал (7) будут вычисленыГдля одного важного частного случая, когда ч урав­ нение (2) имеет постоянные коэффициенты. Мы б^дем предполагать, что размерность фазового пространства R больше двух: я > 2.
    • 486 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН Итак, мы будем решать уравнение где ai;>, Ъ{ — постоянные коэффициенты, при начальных и граничных условиях (14), (15), которые в дальнейшем будем записывать в виде: г|) (т, х, х) = О, (57) ф(а, ж, т)|„ = 1, (58) ^z (а) где %Z(<J) —сфера радиуса 8 с центром в точке z (a). Прежде всего перейдем от этой задачи к задаче с граничным условием на сфере радиуса Б С центром в начале координат. Для этой цели в про­ странстве (z, t) введем новые координаты по формулам z = £ + z (t), о < * < s, (59) так, что х = I + z (а), у - 1 + z (s). 1 (60) При таком преобразовании координат сфера 22(о) перейдет в сферу Sz; ll2 + . . . + Ъп* = в2. (61) Положим z Ф(а, £, т) = я|) (а, £ + И> т )- (62) Тогда для функции ф (а, £, т) мы получаем дифференциальное уравнение ^ + а ^_4Х+(6{-/(а))-^=0 (63) ш условия: Ф (т, 6, т) - 0, (64) Ф(а, I, т)| 5 е = 1. (65) Чтобы решить уравнение (63) при условиях (64), (65), нам потребу­ ются вспомогательные построения. Нашим первым шагом будет конструкция некоторого специального решения уравнения Для того чтобы получить это специальное решение, перейдем с помощью линейного преобразования от координат J-1, . . ., £п к координатам £ . . ., £п, в которых уравнение (66) приведется к виду §+Дф 0 = 0, (67) где А — оператор Лапласа. При такому преобразовании координат сфера Sz перейдет, очевидно, в эллипсоид Sz ххГ + . . . + к¥* = е2, (68) ij где Хъ . . ., Кп суть собственные значения матрицы || a |.
    • СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 487 Обозначим через g (а, £, т, rj) фундаментальное решение уравнения (67): g (о, I т, ч) = - ! z exp { - ^ J l j . (69) [2я (т - а)] 2 Положим ф0 (о, f, т) = е"-* _ _ ^ _ + я (f, е) _ - g (а, I , т, л) Г е"-* ^ г - + л (л, в) 1 £/ч, (70) где а — константа, определенная формулой (55), а я (1, е) — потенциал двойного слоя, создаваемый эллипсоидом Sz в точке £. Перепишем фор­ мулу (70) в несколько ином виде: ф0 (а, I, т) = ф0 (а, I , т) + бф0 (а, £ т), (71) где Ф (а, £: т) = е - 2 _ ^ о _^ g (а> Б> Tj ц) _Л_^ d (72) Г (g) Г " (Т|) Очевидно, функция ф0 (а, £, т) является решением уравнения (67) м удовлетворяет начальному условию Фо(т, I, т) = 0. (73) Перейдем теперь от координат £', . . . ,"|п вновь к координатам I1, . . . , £п, и пусть при этом функции •ф0(а, | , т), ф0(а, |, т), бф 0 (а, |", т), g(o, f, t, TJ) перейдут соответственно в функции qT0(cr, | , т), ф0(сг, £, т), бф 0 (а, £, т), g(<x, £, т, TJ). Нам впоследствии понадобится явное выражение для функции <р0(а, £, т). Чтобы выписать его, надо знать, как запишутся в координа­ тах £ . . . , 1п функции г(1) и g(a, £, т, т]). Это легко выяснить. В са­ мом деле, обозначим через (щ элементы матрицы, обратной матрице ||ai;"||, так что aV* = д£. (74) Тогда легко можно убедиться, что (-п — g | = [ay (-п- — Г) (rj^ — i J )l 2 • Учитывая еще, что dt = VK • • • К dr], (76)
    • 488 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН мы получим для функции ф0 (а, £, т) следующее явное выражение: а Фо (о, £, т) = *™ ^ - J g(а, £, т, т,) 8 " ' : ' ' К * * - * * ^ (77) 2 2 [*#'] K^W] где g(а, g, т, I]) = ^ ехр 1 4(т _б) | . (78) [2я(т-с)]2 Итак, доказана следующая ЛЕММА 1. Функция Фо(<*> £, t) = ф0(а, £, т)+бф 0 (а, £, т), гЗе ф0 (сг, £, т) определена формулой (77), является решением^ уравнения* (66) а удовлетворяет нулевому начальному условию Ф0(т, £, т) = 0. (79). Следует отметить, что функция ф0 (а, £, т) не равна единице на сфере Sz. Однако, как будет выяснено дальше, ее граничное значение в некото­ ром смысле лишь несущественно отличается от единицы. Теперь уже все подготовлено, чтобы решать уравнение (63) при усло­ виях (64), (65). Сначала мы найдем некоторое специальное решение урав­ нения (63), удовлетворяющее лишь нулевому начальному условию (64). Оценив затем граничное значение этого специального решения, мы уви­ дим, что оно лишь несущественно отличается от единицы. Отсюда мы выведем, что и само это специальное решение лишь несущественно, с точностью до величин более высокого порядка малости по е, отличается от точного решения задачи (63), (64), (65). После этого полученное спе­ циальное решение будет упрощено путем отбрасывания некоторых чле­ нов и, таким образом, мы получим приближенное решение задачи (63), (64), (65). Перейдем к осуществлению этой программы. Будем искать специальное решение уравнения (63), удовлетворяющее условию (64), в виде Ф (<т, g, т) - фо (а, 6, т) + ф! (а, £, т), (80) где фо (сг, £, т) — только что построенное специальное решение уравне­ ния (63), удовлетворяющее условию (64), а фх (а, £, т) — пока не извест­ ная функция. Непосредственно проверяется, что фх (сг, £, т) должна удовлетворять неоднородному параболическому уравнению &. + а н - i , + [bl - 7}' (о)] - % = _ [ & * _ z* (о)] а Ф«( д '£' т > (81) и начальному условию Ф1 (т, £,. т) = 0. (82)
    • СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 489 1Решение задачи (81), (82) во всем пространстве В с помощью формулы, аналогичной формуле (6) § 1, очевидно, невозможно, так как правая часть уравнения (81) при £ = О имеет полюс порядка п, получающийся при дифференцировании функции я (£, г). Однако эту трудность можно обой­ ти, так как нас интересует решение ф1 (а, £, т) лишь вне шара, ограни­ ченного сферой Se. Для этого рассмотрим функцию q (a, х, s, у), введен­ ную в начале § 2 и равную плотности вероятности того, что случайная точка Q, находящаяся в момент времени а в положении х, в момент т находится в положениии у, не встречаясь при этом на протяжении вре­ мени а <; t ^ s с шаром, ограниченным сферой 2 Z (o радиуса г с центром в управляемой точке z (t). Очевидно, функция q (or, Б, s, ц) = q (a, I + z (а), s, т) + z (s)) = q (а, х, s, у) (83) см. формулы (59), (60)) является вне сферы Se фундаментальным реше­ нием уравнения (63), удовлетворяет граничному условию Jg(cr, g, s, r)dv) ^ -0, (84) ж решением задачи (81), (82) будет функция ф2 (о, g, т) Л tf Л ? (<r, I, s, т|) [6* - **' (5)] ^ о ^ ^ т ) dt), (85) 'а 4 *» где i?£ обозначает дополнение в й к шару, ограниченному сферой Sz. Очевидно, что ф! К S *) |^6S£ - 0. » Таким образом, нами получена следующая ЛЕММА 2. Функция Ф(о, £, т) =ф 0 (а, £, T)+(^(cr, £, т), (86) где ф0 (о, £, т) определена формулой (70), а фа (а, £, т) — формулой (85), является решением уравнения (63), удовлетворяет нулевому начальному условию Ф (т, £, т) = 0 и имеет те же граничные значения на сфере Ss, что и функция ф0 (<т, £, т). Теперь мы докажем, что функция Ф (о, £, т) вне сферы радиуса г0 (т*0 — любое конечное, не зависящее от 8 число) аппроксимирует решение задачи (63), (64), (65). Доказательство этого факта базируется на одной лемме об оценке решений параболического уравнения. Сформулируем эту лемму. ЛЕММА 3 (об оценке решений параболического уравнения). Пусть >и (а, g, т) — решение параболического уравнения *L = _ а и ( 0 , 1)-^U-bl(о, l)^^L(и), (87)
    • 490 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН удовлетворяют^ условиям: и(т, £, т) = 0, (88> и (в, £, т) | адве = W(a, т), (89) где fС при х — а < е, VF(6, т ) < х / . ^ (90> v у v ^ 16(e) л/? и х — 0 > е ' (С — константа, 6 (е) -* 0 л/ж 8 -» 0). Тогда для решения и (а, £, т) справедлива следующая оценка: | и (а, £, т) | < A (£, е) + 6 (8) х (а, £, т), (91). где А (£, е) — положительная функция, имеющая при | £ j > г0 порядок о (8П~2), а л/(сг, |, т) — решение уравнения (87), имеющее при а = т нуле­ вые начальные значения и принимающее на сфере $г единичное значение. Д о к а з а т е л ь с т в о . Положим г/; (а, т) = г^ (а, т) + га2 (а, т), (92), где функции WX (а, т), w2(a, х) определены следующим образом: 7 _ (С при х —а < е, ^1 (<*, t) = п . (93> 14 ; v (0 при х — ог> 8, ' _ f0 при х — а<Г 8, ^>(а, т) = L / 4 ^ (94> "V ' ' 16(8) ПРИ Т — 0 > 8. Решения уравнения (87), имеющие нулевые начальные значения и крае­ вые значения, равные w(a, t), w1(a, т), w2 (0, т), обозначим соответствен­ но через и (а, | , т), ui (а, £, т), и"2 (о, £, т). Очевидно, и (а, £, т) = щ (а, |, т) + и, (а, £, т). (95> На основании теоремы о максимальном значении для решений пара­ болических уравнений, решение и (а, £, х) задачи (87), (88), (89) оцени­ вается следующим образом: и (а, £, т ) < й ( а , £, т). (96> Оценим отдельно функции их (а, £, т) и м2 (о, £, т). Для т (а, | , т) оцен­ ка получается из той же теоремы о максимальном значении решения пара­ болического уравнения: Мог, Б, т ) < 6 ( е ) х ( а , ё, т). (97) Для получения оценки функции Mj_(a, £, т) потребуются более тонкие рассуждения. Прежде всего оценим ги (о, £, т) при т — a < s. Положим Т О - * ^ (98).
    • СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 491 где К — константа, К ^> С. Будем теперь искать решение уравнения (87) с начальным значением, равным у (£), и с граничным значением на сфере SE1 равным К, в виде v(o, £,,т) = Y(g)-i- v0(o, I, r). (99). Тогда для функции v0 (a, £, т) получается неоднородное уравнение %-+а^(р, g ) ^ + & > , E)-§-=L[T(g)b (ЮО) которое мы должны решить при нулевых начальных и нулевых гранич­ ных условиях. Такое решение, как мы знаем, вне сферы S£ дается форму­ лой: v0(a, £, т ) = — ds q(e, £, s, ц)Ь [т(г))Ыт]. (101) Итак, v(o, £, т) = г (|) — ^ с?5 [ q(e, I 5, Tj)L[Y(Ti)]rfT|. (102) Очевидно, й 2 (а, £, т ) < г ? ( а , £, т). (103) Нам остается, таким образом, оценить лишь функцию v (с>, £, т) при, | g j >• г0 и т — а <^ е. Заметив, что ^[тШО* 1 - 1 rn+i(E) r n(g)j (104V» где У11? /I2 — достаточно большие константы, и принимая во внимание неравенство q(o, | , т, т ] ) < / ? ( а , | , т, г)), (105)' из формулы (102) получаем: I v (a, g, т) ; < у (£) + ^ dv р (a, g, 5, rj) - ^ Т Г у ^ + + ds U ( a , g, * , T , ) - ^ l ? - r f T | . (106). Интегралы, стоящие в правой части неравенства (106), обозначим соот­ ветственно через 1г, 1.2 и оценим отдельно их величины. Мы имеем: Л < Л х е " - 2 - ' ^ as f ^ (a, £, <- !]) — i ,, dr = r i «i '~ w = Л! • e"-2-^ Jrf*.(B„_V (a, ^ , s ) т о ( e " ' 2 ) , (107), где 0 <^ v <^ 1. Отсюда, принимая во внимание неравенство co,j_v(a, £, s)<" •— г
    • 492 Б. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН находим: т 1г < А1 ~^~~ 8-2- [ds+O (8-2). (108) г (Е) J Следовательно, при т — о <; 8 и | £ | > г0 Л « о (е^-а). (109) Аналогично получим, что при т — о <^ 8 и | £ | У> г0 12^0 (8^2). (НО) Таким образом, функция v (a, £, т), мажорирующая на границе сферы £ £ решение 1гх (а, £, т), при | £ | > г0 и т — а ^ 8 имеет порядок о (еп~2). Отсюда следует, что и само решение их (а, £, т) при | £ | > г0 и т — cr ^ e имеет порядок о (&п~2). Несколько изменяя предыдущее построение, можно убедиться, что такая же оценка для щ (о, £, т) имеет место и при т — а ^> е. Лемма доказана. Теперь мы можем доказать, что функция Ф (а, £, т), фигурирующая в формулировке леммы 2, вне сферы любого конечного радиуса с точно­ стью до величин порядка о (8П~2) аппроксимирует решение задачи (63), (64), (65). Иными словами, справедлива следующая ЛЕММА 4. Пусть ф (а, £, т) — решение уравнения (63), удовлетворяю­ щее начальным и^граничным условиям (64), (65), а Ф (а, £, т) — решение уравнения (63), определенное в лемме 2. Тогда для , юбого г0, не зависящего от 8 п/ж | £ | > г0, решение Ф (а, £, т) с точностью [до величин порядка о (еп~2) аппроксимирует решение ф (о, £, т): Ф (а, £, т) - Ф (а, £, т) ^ о (8—2). (111) Доказательство. Обозначим через и (а, £, т) разность функ­ ций ф и Ф: и (а, £, т) = < (а, £, т) — Ф (а, | , т). р (112) Функция и (а, £, т) является решением уравнения (63) и удовлетворяет нулевым начальным условиям. Далее, из формулы (85) видно, что гра­ ничные значения функции и (а, £, т) на сфере Se совпадают с граничны­ ми значениями функции ф0 (о, £, т) -—jp0 (б, £, т). Оценим эти послед­ ние. Для этого запишем разность ф — ф0 в следующем виде: ? (о, 6, т) - фо (а, 6, т) = {Ф (а, Б, т) - ^ 8 - 2 _ | " - + я (I, 8) j j - - ^ g ( a , | , т, ^ ) ^ п - 2 7 _ ^ _ + я(л ? e)]efrj. (ИЗ) Граничные значения слагаемого, заклю еиного в фигурную скобку в правой части формулы (ИЗ), равны нулю (см. § 3). Остается, таким обра­ зом, оценить лишь граничные значения второго слагаемого на сфере Sz (в координатах £ . . . , £п — на эллипсоиде Se).
    • СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 493 Так как для потенциала двойного слоя я (3-, е) справедлива оценка (43), то, очевидно, имеем: g(<x, £, т, т]) + я(т), е) rfrj ! (Т]) ^ ?г 2 1 Л! • е ~ • (оп__2 (а, | , т) -|- Л 2 • е"- . соп_! (а, g, т), (114) где А1 и Л2 — константы, а соп„2 (о, g, т) и co n _ 1 (a, £, т) — функции, определенные формулой (21) соответственно при к = п — 2, А = п — 1. Используя теперь неравенства (23), (24), получаем., что граничные зна­ чения второго слагаемого в формуле (113), а следовательно, и граничные значения w (а, т) функции и (а, £, т) удовлетворяют условиям леммы 3. Следовательно, на основании леммы 3, мы можем заключить, что соотно­ шение (111) справедливо. Лемма 4, таким образом, доказана. Упростим полученное приближенное решение Ф (а, £, т), отбросив в нем величины, имеющие при | £ | > г0 порядок о (е п ~ 2 ). Чтобы сделать это, выпишем решение Ф (о, g, т) в явном виде. Вспоминая формулы (70), (71). (80), (85), мы можем написать: Ф (о, I, т) = ф0 (a, g, т) 4- бф 0 (а, £, т) + + ^ds ^ q (а, т ; s, л) fft''— z1' (5)] - Д - [ср0 (о, g, т) + б ф0 (а, £, т)Ыи. (115) Прежде всего ясно, что при 111 > /•„ бф 0 яго(е"-2). (116) Поэтому второе слагаемое в правой части формулы (115) можно отбро­ сить. Несколько сложнее упрощается интеграл, стоящий в правой части формулы (115). Во-первых, можно отбросить член h = ds g(a, £, s, ц) [Ьг — z1'(s)]-?-r [6<p0(s, r,x)dr. (117) В самом деле, |/,K^ds ^{a,l,s,v[)bi-zi'{s) • б ф 0 ( 5 , 1], t ) fi?T|, dr: Но так как [см. формулы (70), (71), (43), (44)] I д г б ф 0 ( 5 , ц, т) < e " - i i ? ( r ] ) , дг где R (т)) в нуле имеет полюс порядка не выше п, то h< 8 " - 1 ~ v d s p (a, I, s, ii) | V — zv (s) I ! B 1 ft) j rfti, (119) где 7/j (т)) имеет теперь в нуле уже полюс порядка не выше п — v (0 <J v <C 1). Таким образом, 1Х « О (8™-2). (120) 2 Известия АН СССР, серия математическая, № 4
    • 494 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН Нам остается упростить член т J, = ^ds^q(o, I, s, r) [Ъ1 - zi (в)] - Л [Фо (б-, л , x)]di. (121) Покажем, что при j £ j > г0 т / 2 = ds р (о, g, s, Ti) [6* - г*' (s)] Л - [ф0 (s, л, t)]dri + о(в'-*). (122) Мы имеем: I2 = [jdsip(a, I, s, т)) [ й * _ г * » ] - Л - [ф0 (s, т), т)] + а + ^ s ^ (р (а, £, 5, т]) — g (а, £, 5, т|)] [6* — z1' (s)] JJ [<р0(s, rj, t)] drj + о т + ds p(a, I, s, т]) [6* - zi'(s)} Л - [Фо(*, т|, x)]di. (123) Последнее слагаемое в правой части формулы (123) имеет, очевидно, порядок о (еп—2). Обозначим через и (а, £, т) второе слагаемое. Функция и (а, £, т) при а = т имеет нулевое начальное значение и является в области /? е решением уравнения (63). Так как | - ^ [ ф о ( * , Т1, т ) ] | < е ™ - 2 Д ( т 1 ) , (124) где R(r) имеет полюс порядка не выше п — 1, то граничные значения функции и (о, £, т) оцениваются следующим образом: | и (a, g, т) |E6S£ < М- 8—^ Qn_T (а, g, т) ^т (125) Отсюда, на основании неравенства (25), заключаем, что и(о, 1,т)^<Ь(г), (126) • где б (е) — 0 при г — 0. Следовательно, всюду в области Л£ > > |и(а, £, т) | < б (е) а (а, £, т). (127) Лемма 4 и неравенства (120), (127), а также формула (123) доказывают следующее предложение. ЛЕММА 5. Функция т Ф (а, | , т) = ф0 (<т, I, х) + ds [p(a, I, s, л ) [Ь{ - z*' («)] ^ О ^ т , , (128) где ф0 (a, £, т) определена формулой (77) тг/ж j g | > г0 (г0 — произвольное, не зависящее от е положительное число), с точностью до величин порядка о(еп—2) аппроксимирует решение ф (а, £, т) уравнения (63), удовлетво­ ряющее условиям, (64), (65).
    • СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 495 Чтобы подвести итог всем рассмотрениям настоящего параграфа, нам остается вновь возвратиться к старым координатам х и у согласно формулам (59), (60). Проведя соответствующие замены, на основании леммы 5 мы можем сформулировать следующее предложение. ТЕОРЕМА 1. Пусть движение управляемой точки z, имеющей в на­ чальный момент времени G положение z (о), описывается системой диф­ ференциальных уравнений z1 = f (z1, . . . , zn, и1, . . . , ur), i = 1, . . . , п, где (и1, . . . , иг) — управляющие параметры. Пусть в пространстве В переменных z1, . . . , zn движется еще случайная точка Q, плотность пере­ хода которой р (о, х, х, у) удовлетворяет уравнению Колмогорова с по­ стоянными коэффициентами dp i а д2р у i dp A -т£- - - № —г*—.. ч- о —ч- = 0. д 3 дхгдх1 дхг Обозначим через 2 Z шар радиуса е с центром в управляемой точке z, дви­ жущейся вместе с z. Обозначим, далее, через я|) (а, х, т) вероятность того, что случайная точка Qt находящаяся в момент о в положении х, на отрезке времени о <J t <J х будет «накрыта» шаром 2 Z . Тогда вероятность if (а, х, х), являющаяся функционалом управления и (t), представляется при х — z (а) | ^> г0, где г0 — произвольное -положительное, не зависящее от е число, в следуюгцем виде: Ц (сг, х, х) - 8П~2 [ij?0 (о, х, х) +Цг (а, х, х)]+ о (г71-*). Чтобы выписать явные выражения для функций aj)0 (а, х, х) и рг (а, х, т), введем следующие обозначения: а) Хь . . . , Хп — собственные значения матрицы а1Ц б) || dij -~ матрица, обратная матрице || aij ||; в) G (а, х, х, г) = g (G, x — z (G), X, TJ) = . . = Kexpl—: 2 4тг^) —}; [2я(т — с)] г) а — константа, не зависящая от уравнений, описывающих движе­ ние точек z и Q, и определяемая формулой (55) § 3. Тогда П—2 [а. • (я* - zl (в)) (xj — ^ (а))] Т " •S G{G X, х, т|) ^=2"-*% *i (а, *, т) = J efe J p (а, я;, в, у) [Ь1 - **' (s)) ^ W ) dy. Таким образом, теорема 1 дает явное выражение для главного члена вероятности tj) (а, х, х) и, следовательно, для главного члена функцио­ нала (7).
    • 496 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН § 5. Вычисление функционала (7) в общем случае В настоящем параграфе вероятность г|э (а, х, т), а следовательно, и функционал (7) будут вычислены для случая, когда коэффициенты урав­ нения Колмогорова зависят от а и х. Мы предполагаем, что эти коэффи­ циенты удовлетворяют условиям а), б), в), сформулированным в § 2. Схема вычисления в значительной степени воспроизводит схему, которой мы следовали в предыдущем параграфе, поэтому подробно мы будем про­ водить лишь существенно новые построения. Итак, вам нужно решить уравнение + al5 ^ ^^-£ij+bi^x^° (129> при условиях -ф (т, х, т) = 0, (130) я|)(а, Х) t) S o = l. (131) Как и в § 4, с помощью формул (51), (60) приведем эту задачу к за­ даче решения уравнения : § + « i i ( £ + 2 ( a ) , a ) - i ^ r + L64S + 3 ( o r ) , a ) - z ' - ' ( a ) ] J | - = 0 (132) при условиях <р(тЛ, т) = 0, (133) Ф(а, 6, T)| S E = 1. (134) Перепишем уравнение (132) в несколько иной форме: : I J + « у ( * ( " > . ° ) - ^ Г + 1^(6 + z(а), о)-аН*(«), а)1-^Х + + [6*(5 + 2 (а),а)-^(а)]^-=0. (135) Нашим первым шагом будет конструкция некоторого специального реше­ ния q>J (a, £,' т) уравнения • ^ + а « (2 (0), О) - ^ ^ = 0. (136) Для того чтобы получить это специальное решение, перейдем с по­ мощью линейного преобразования от координат I 1 , . . ., | , г к координатам I"1» . • . , Т в которых уравнение (136) запишется в виде §-+Аф„=0. (137) Такое преобразование координат теперь уже зависит от параметра 9. Сфера Sz перейдет, очевидно, в эллипсоид ^(9)1" 1 2 + . • . + М В ) | п , = е2, ( 138 ) где Ях (0), . . ., >„п(0) суть собственные значения матрицы a^(z (0), 0||. Так же как и в предыдущем параграфе, мы можем сконструировать функцию Ф90 = Ф° (*, 1*) + бфо № *)> ( 139 )
    • СТАТИСТИЧЕСКАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 497 где Ф0 «г, I т) = г - -Щ- - J j(o, I х, л) ^Щ^1^ <**>) которая является решением уравнения (137) и удовлетворяет нулевому начальному условию. Перейдем теперь от [координат £ . . ., gn вновь к координатам £ . . ., |п> и пусть при этом функции 5 Фо' Ф~о' Фо> #9 перейдут соответственно в функции ~е о с ~о е Фо. фо, О фо, g . Мы можем выписать функцию ф0 (a, g, т) в явном виде. Для этого, как и раньше, обозначим через а) (z (8), 8) элементы матрицы, обратной матрице || al'J (z (в), 8) ||, так что а « И в ) , 9)ад.( 2 (в), в) = (141) Тогда ф > , | , Т) = в»"* ^(6) п—2 2 «{,•(«(6), 0] - J «• (а, £, т, Л) ^ • а ( 0 ) - П 1 ( 9 ) . . . М 9 ) f (142) 2 К,-(М9), 0)rf-V] где £ (а, g, т, т)) = j - exp ^ '— 4(T_g) J -(143) - 2 [2я(т-в)] Рассмотрим теперь функцию фо (a, g, т), т. е. построенную нами функ­ цию при значении параметра в. равном о. Функция фо (а, g, т) уже не удовлетворяет уравнению (136), в коэффициентах которого вместо 8 подставлено о Однако очевидна следующая ЛЕММА 1'. Функция Ф (а, g, х) = фо (а, | , т) + бфо, о где фо определена формулой (142), является решением дифференциального уравнения ^ . + ^(,(а),а)^-^.[ф»1^=0 (144) и имеет нулевые начальные значения при а = т. Теперь, как и в предыдущем параграфе, мы можем искать специаль­ ное решение уравнения (132), имеющее нулевые начальные значения, в следующем виде: Ф (а, Е, т) - фо7 (а, g, т) + фх (а, g, т), (145)
    • 498 Е. Ф. МИЩЕНКО, Л. С. ПОНТРЯГИН где фо (сх, £, т) — только что построенное решение уравнения (144), а ф1 (<?, £ f) — пока не известная функция. Подставляя Ф (о, £, т) в урав­ > нение (132) и учитывая лемму 1' дляф х (о, £, т), мы получим неоднородное параболическое уравнение %• + & (I + ж {а), о)^-+ [Ь> (Б + г (а), о) - * • » ] | f = = - ( № ( £ > z (а), а) - a» (z (а), о)}8^'1' %) + + lb' (£ + z (a), a) - z»' (a)] a < ( ° ' * ' T > + A. ft» (a, g, T)]e==( j {i46) и начальное условие Ф (т, ё, т) = 0. Х (147) Так как правая часть уравнения (146) имеет при £ = 0 полюс порядка п (а не (д + 1)!), то мы можем почти буквально повторить все рассужде­ ния предыдущего параграфа и доказать лемму, аналогичную лемме 5. ЛЕММА 5'. Функция Ф (а, £, т) - Ф° (о, £, т) + + cfe р (а, 1 + z (а), 5, т) + ^(5)). [а1* (т) + z (s), 5) — а4* (2 (s), 5)] х х + [b {ri + z т ^s) -zi (s)] -^H+ + -^Гф?(*.Л.т)]в=,}^. (148) где фо (сг, 5» т ) определена формулой (142), при | £ j > г0 (г0 — произ­ вольное положительное число, не зависящее от г) с точностью до величин порядка о (вп~2) аппроксимирует решение ф (о, £, т) уравнения (132), удовлетворяющее начальным и граничным условиям (165)—(169). Чтобы формулировать теперь окончательный результат, мы вновь должны перейти к координатам х и у по формулам (51), (60). Тогда из леммы 5 последует теорема, аналогичная теореме 1 предыдущего пара­ графа. Мы не будем здесь выписывать окончательных формул, так как при желании читатель легко это сделает сам. Поступило 29.Х.1960 ЛИТЕРАТУРА 1 К о l m o g o r o f f A.- N-, Uber die analytischcn Methoden in der Wahrscheinlich- keitsrechnung, Math. Ann., 104 (1931), 415—458. 2 С о б о л е в С. Л., Уравнения математической физики, Физматгиз, М-, 1954. 3 Б о л т я н с к и й В. Г., Г а м к р е л и д з е Р. В., П о н т р я г и н Л. С , Тео­ рия оптимальных процессов. I, Известия Ак. наук СССР, серия матем., 24 (1960), 3-42. 4 М и щ е н к о Е . Ф . , П о и т р я г и н Л . С , Одна статистическая задача оптималь­ ного управления, Доклады Ак. наук СССР, 128, № 5 (1959), 390—392.