Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...
Ứng dụng mạng nơ-ron trong nhận dạng và điều khiển.pdf
1. TRƯỜ Ạ Ọ Ộ
NG Đ I H C BÁCH KHOA HÀ N I
LUẬN VĂN THẠC SĨ
Ứ ụ ạng nơ ậ ạ
ng d ng m -ron trong nh n d ng
và điề ể
u khi n
TẠ THỊ CHINH
Ngành thu
Kỹ ậ ề
t Đi u khi n và T ng hóa
ể ự độ
Giả ớ
ng viên hư ng dẫn: TS. Nguyễn Hoài Nam
Viện: Điện
HÀ NỘI, 2020
2. TRƯỜ Ạ Ọ Ộ
NG Đ I H C BÁCH KHOA HÀ N I
LUẬN VĂN THẠC SĨ
Ứ ụ ạng nơ ậ ạ
ng d ng m -ron trong nh n d ng
và điề ể
u khi n
TẠ THỊ CHINH
Ngành K u khi n và T ng hóa
ỹ thuậ ề
t Đi ể ự độ
Giả ớ
ng viên hư ng dẫn: TS. Nguyễn Hoài Nam
Viện: Điện
HÀ NỘI, 2020
Chữ ký của GVHD
3. CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độ ậ ự ạ
c l p – T – H
do nh phúc
BẢN XÁC NHẬN CHỈNH SỬA LUẬ Ạ
N VĂN TH C SĨ
Họ và tên tác giả ậ
lu n văn: Tạ Thị Chinh
Đề ậ
tài lu n văn: Ứ ụ ạ ậ ạ ề ể
ng d ng m ng nơ-ron trong nh n d ng và đi u khi n
Chuyên ngành: Kỹ thuậ ề
t đi u khiể ự độ
n và t ng hóa
Mã số HV: CB180117
Tác gi c và H
ả ờ ớ
, Ngư i hư ng dẫn khoa họ ộ ồ
i đ ng chấm luậ ậ
n văn xác nh n
tác gi a ch a, b
ả ử
đã s ữ ổ ậ ả
sung lu n văn theo biên b n họp Hộ ồ
i đ ng ngày
29/10/2020 với các nội dung sau:
- Thống nhất các kí hiệu của luận văn
- Đã sửa chữa các lỗi chính tả, bỏ đại từ ta ở trong phần tóm tắt và kết
luận chương.
- Đưa định nghĩa Robot công nghiệp vào mục 1.5.
Ngày tháng năm 2020
n
Giáo viên hướng dẫ Tác giả ậ
lu n văn
TS. Nguyễn Hoài Nam Tạ Thị Chinh
CH NG
Ủ Ị
T CH HỘ Ồ
I Đ
4. LỜI CẢM ƠN
Trước tiên, tôi xin bày tỏ ế ắ
lòng bi t ơn chân thành và sâu s c của mình tới
ngườ ự ế ớ ẫ
i đã tr c ti p hư ng d n khoa học là TS. Nguyễn Hoài Nam. Thầy đã tạo
điều kiệ ợ ở
n và g i m cho tôi nhiều ý tưở ậ
ng, luôn t n tình hướ ẫ
ng d n trong suố ờ
t th i
gian tôi nghiên c c hi n lu
ứu và thự ệ ận án.
Đồ ờ ợ ử ờ ả ế ầ ộ
ng th i tôi cũng xin đư c g i l i c m ơn đ n các th y cô trong b môn
Đi n Đi
ề ể ự độ
u khi n t ng – Việ ệ ờ ạ ọ ộ ệ
n – Trư ng Đ i h c Bách khoa Hà N i, đã nhi t
tình có nh ng góp ý xây d
ữ ự ể
ng đ tôi hoàn thành luận văn của mình.
Tôi cũng xin đư n đào t
ợ ọ ả ớ ệ ệ
c trân tr ng c m ơn t i Ban giám hi u, Vi ạo sau
đạ ọ ệ ệ ờ ạ ọ ộ ạ ề ệ ậ
i h c, Vi n đi n - Trư ng Đ i h c Bách khoa Hà N i đã t o đi u ki n thu n lợi
cho tôi trong quá trình h c t có th
ọ ập và nghiên cứ ể
u đ ể hoàn thành luận văn này.
Xin chân thành cảm ơn!
Hà Nội, ngày tháng năm 2020
Tác giả
Tạ Thị Chinh
5. M C
ỤC LỤ
DANH MỤC HÌNH VẼ..........................................................................................i
DANH MỤC CÁC CH CÁI VI
Ữ ẾT TẮT VÀ KÝ HIỆU....................................ii
CHƯƠNG 1. MẠ Ứ Ụ
NG NƠ-RON VÀ NG D NG ............................................... 1
1.1 L -
ịch sử phát triển mạng nơ ron.................................................................. 1
1.2 M -
ạng nơ ron nhân tạo................................................................................ 2
1.3 ron
Ứng dụng của mạng nơ- ....................................................................... 3
1.4 Mô hình nơ- o
ron nhân tạ ............................................................................ 4
1.4.1 Mô hình nơ-ron ........................................................................... 4
1.4.2 ng
Cấu trúc mạ ............................................................................. 7
1.5 Ứng dụng trong điều khiển ...................................................................... 12
1.5.1 Nhận dạng hệ ố
th ng .................................................................. 12
1.5.2 Thiế ế ộ ề
t k b đi u khiển............................................................... 12
1.5.3 Ứng dụng trong cánh tay Robot m t b c t
ộ ậ ự do......................... 18
1.6 Kết luận chương 1.................................................................................... 19
CHƯƠNG 2. PHƯƠNG PHÁP ĐIỀ Ể
U KHI N DỰ BÁO DỰA TRÊN MẠNG NƠ-
RON ..................................................................................................................... 20
2.1 Phương pháp điều khiể ự
n d báo............................................................... 20
2.2 Phương pháp điều khiể ự ự ạ
n d báo d a trên m ng nơ-ron........................... 22
2.2.1 Nhận dạng dùng mạng nơ-ron ..................................................22
2.2.2 Phương pháp tối ưu................................................................... 28
2.2.3 Mô hình mạng nơ-ron ............................................................... 42
2.3 Kết luận chương 2.................................................................................... 45
CHƯƠNG 3. THI ĐI
Ế Ế Ộ
T K B Ề Ể Ự
U KHI N D BÁO CHO CÁNH TAY MÁY
MỘT BẬC TỰ DO .............................................................................................. 46
3.1 Mô hình toán củ ộ ậ ự
a cánh tay máy m t b c t do........................................ 46
3.2 Nhận dạng dùng mạng nơ-ron.................................................................. 47
3.3 ron
Tuyến tính hóa mạng nơ- .................................................................... 52
3. Thi
4 ế ế ộ
t k b điề ể ự
u khi n d báo dùng mạng nơ-ron................................... 54
3.5 Kết quả mô phỏng.................................................................................... 57
3.6 Kết luận chương 3.................................................................................... 58
K N-
ẾT LUẬ KIẾN NGHỊ................................................................................... 60
TÀI LIỆU THAM KHẢO....................................................................................61
PHỤ Ụ
L C............................................................................................................. 62
6. i
DANH MỤC HÌNH VẼ
Hình 1.1 Mạng nơ-ron sinh học [8]. ...................................................................... 3
Hình 1.2 Sơ đồ -
mô hình nơ ron mộ ầ
t đ u vào.........................................................4
Hình 1.3 Đồ thị hàm a=tansig(n) ........................................................................... 6
Hình 1.4 Mô hình nơ-ron vớ ầ
i R đ u vào................................................................ 6
Hình 1.5 Sơ đ i R đ
ồ ọ ớ
rút g n nơ-ron v ầu vào........................................................6
Hình 1.6 Sơ đồ ấ ủ ộ ớ
c u trúc c a m t l p nơ-ron [3].................................................... 8
Hình 1.7 Cấ ạ ớ
u trúc m ng nơ-ron 1 l p.................................................................... 8
Hình 1.8 Sơ đồ ọ ầ
rút g n R đ u vào và S nơ-ron...................................................... 9
Hình 1.9 Cấ ạ ớ
u trúc m ng nơ-ron 3 l p.................................................................. 10
Hình 1.10 Sơ đồ ọ
rút g n mạ ớ
ng nơ-ron 3 l p........................................................ 10
Hình 1.11 Sơ đồ ạ ồ
m ng h i quy ............................................................................ 11
Hình 1.12 điều khiển theo nguyên tắ ả
c ph n hồ ầ
i đ u ra [2].................................. 12
Hình 2.1 Cấ ệ ề ể ự
u trúc h đi u khi n d báo............................................................... 20
Hình 2.2 Đư tơ gradient và qu i ưu .[2].
ờ ồ ứ
ng đ ng m c, véc- ỹ đạ ệ ố
o tìm nghi m t 37
Hình 2.3 Nguyên tắc làm vi c c
ệ ủa phương pháp tìm nghiệm có hướng (line search)
[2]. ........................................................................................................................ 38
Hình 3.1 Cánh tay máy mộ ậ ự
t b c t do ................................................................. 47
Hình 3.2: Tín hiệ ầ
u đ u vào mẫu...........................................................................48
Hình 3.3 Tạ ầ ẫ ừ
o đ u ra m u t mô hình trong Simulink.......................................... 48
Hình 3.4 Tín hiệ ầ ẫ
u đ u ra m u...............................................................................49
Hình 3.5 Cấ ạ ủ ố ợ
u trúc m ng nơ-ron c a đ i tư ng nnp ............................................. 50
Hình 3.6 Mô hình huấn luyện cánh tay máy........................................................ 50
Hình 3.7 Đáp ứ ầ
ng đ u ra củ ạ ố
a m ng nơ-ron và sai s ........................................... 51
Hình 3.8 Đồ thị ụ
hàm m c tiêu.............................................................................. 51
Hình 3.9 Tín hiệ ề
u đi u khiển tối ưu..................................................................... 58
Hình 3.10 Đáp ứ ầ ị đặ
ng đ u ra và giá tr t............................................................... 58
Bảng 2.1: Bảng công thứ ậ
c tính ma tr n Hesse..................................................... 34
7. ii
DANH MỤC CÁC CHỮ Ế
CÁI VI T TẮT VÀ KÝ HIỆU
Ch Gi
ữ ế ắ
vi t t t ải thích
IEEE Institute of Electrical and Electronic Engineer
IJCNN n N
International Joi t Conference on eural Networks
ANN M - o
ạng nơ ron nhân tạ
IC ch
Vi mạ
ARMA a
Autoregressive moving aver ge
NNc -
Neural network control
NNp -
Neural network plant
NN -
Neural network
MAC Model Algorithmic Control
DMC Dynamic Matrix Control
GPC a
Gener lized Predictive Control
A M - o
nns ạng nơ ron nhân tạ
RBF Radial Basis Function
LTI tuyến tính tham số ằ
h ng
LM Levenberg Marquardt
MPC P C
Model redictive ontrol
LS Least Square
MLP MultiLayer Preceptron Neural Networks
8. 1
CHƯƠNG 1. MẠNG NƠ-RON VÀ ỨNG DỤNG
1.1 ron
L -
ịch sử phát triển mạng nơ
Từ những năm 1890, nghiên cứu củ ọ
a nhà tâm lý h c William đã phát hiện ra
h -
ệ nơ ron thần kinh của con ngư n năm 1943, nhà th
ờ ế
i. Đ ần kinh học Warren
M m -
cculloch và nhà toán học Walter Piits đã có công trình nghiên cứu về ạng nơ
ron nhân t o tính b
ạ ằng mộ ạ
t hàm đ i số ho ng
ặc logic, họ xây dựng một mạ nơ-ron
đơn giản bằng mạ ệ ể ồ
ch đi n. Đây có th coi là ngu n gố ủ ự
c c a lĩnh v c mạng ron.
nơ-
Đầu nhữ ữ
ng năm 1950, Nathanial Rochester đã có nh ng mô phỏ ầ
ng đ u tiên
của một mạng nơ-ron tại phòng thí nghiệm nghiên cứu của IBM. Năm 1956, dự án
Dartmouth nghiên cứu về trí tuệ ạ
nhân t o (Artificial Intelligence) m ra th i k
ở ờ ỳ
phát tri i c c trí tu
ển mớ ả trong lĩnh vự ệ ạ
nhân t o lẫn n -
ơ ron. Sau đó, John von
Neumann đã sử ụ ệ ặ
d ng role đi n áp ho c đèn chân không mô ph nơ
ỏng các -ron đơn
giản.
Năm 1958, nhà sinh học Frank Rosenblatt nghiên cứu về perception và luật
h m
ọc. Mạng perception chỉ có khả năng nhận dạng ẫu, tuy nhiên chỉ ể
có th giải
quyế ợ
t đư c mộ ố ứ
t s bài toán mà thôi, nó không dùng cho các hàm logic ph c.
Năm 1959, Bernard Windrow và Ted Hoff thu c trư
ộ ờng đạ ọ
i h c Stanford đã
đưa ra luật học mớ ể ấ ệ ạ ơ ế ầ
i và dùng nó đ hu n luy n m ng n -ron tuy n thích nghi đ u
tiên là MADALINE, mạng này có cấu trúc và khả ự ạ
năng tương t như m ng mạng
perceptron c a Rosenblatt. Lu t h c c a Windrow và Hoff hi c s
ủ ậ ọ ủ ện nay vẫ ợ
n đư ử
dụng. Tuy nhiên sự ứ
nghiên c u này đã bị ừ ạ
d ng l i trong nhiề ậ
u th p kỷ sau đó.
M n - p,
ột mạng ơ ron đã được phát triể ộ
n đ c lậ có thể thực hiệ ộ
n như các b
nhớ được Kohonen và Anderson nghiên cứu vào năm 1972. Năm 1973 Von Der
Marlsburg đưa ra quá trình học cạnh tranh và m t
ạng tự ổ chức Self organization.
-
Năm 1974 Paul Werbos đã phát triể ứ ụ
n và ng d ng phương pháp Back-propagation
(lan truy c). Các m c bi t và áp d
ề ợ
n ngư ạ ợ
ng này đư ế ế
t đ n nhiều nhấ ụng rộng rãi
cho đến ngày nay.
n -
Đầu nhữ ạ
ng năm 80, John Hopfield đã đưa ra m ng ơ ron hồi quy. David
Rumelhart và James Mcclelland là nh ng tác gi n lan
ữ ả đầ ậ
u tiên đã đưa ra thu t toá
truyề ợ
n ngư c để ấ
hu n luyện mạng Perceptron nhiều lớp.
9. 2
Vào đầu nhữ ậ
ng năm 1990, thu t toán Leven-berg Marquart đã được Martin
Hagan đề ấ ể
xu t đ huấn luyện mạng. Bên cạnh còn có phương pháp Bayes cũng
đượ ử ụ
c s d ng rấ ề
t nhi u trong việc huấn luyện mạng nhiều lớp.
Cũng trong thời gian này, Lecun và đồng tác giả đã nghiên cứu và ứng dụng
m -
ạng nơ ron nhiều lớp để ử ả ạ
x lý nh, m ng nơ-ron này đượ ọ ạ ậ
c g i là m ng tích ch p
(Convolutional Networks) và được ứ ụ ấ ề ự
ng d ng r t nhi u trong lĩnh v c xử lý ảnh,
giọng nói và tín hiệu.
Từ sau năm 1987 đế ạ
n nay, m ng nơ-ron trở thành một vấ ề
n đ được quan tâm
c -
ủ ớ
a các nư c, các cuộc hội thảo quốc tế liên tụ ợ
c đư c diễ ể
n ra đ phát triển nơ ron
m K t m
ột cách triệ ể
t đ nhất: viện vật lý Hoa ỳ ổ chức cuộc họ ề
p hàng năm v ạng
nơ c năm 1985, h
- d
ron ứng ụng trong tin họ ộ ả
i th o quố ế đầ ề ạ
c t u tiên v m ng n -
ơ
ron của Viện các kỹ sư đi n và đi
ệ ệ ử
n t IEEE (Institute of Electrical and Electronic
Engineer). Hàng năm th i đ
ế ớ
gi ều mở ộ
h i nghị ầ ề
toàn c u chuyên v Neural IJCNN
(International Joi t Confere
n nce on Neural Networks).
1.2 M -
ạng nơ ron nhân tạo
Mạng nơ-ron nhân t o (anns) hay h
ạ ệ thống kết n i là h
ố ệ ố
th ng tính toán được
lấy cảm hứng từ ạ ầ ọ ấ
m ng th n kinh sinh h c c u thành bộ ộ
não. M t ANN dựa trên
một tập hợp các đơn vị đượ ế ố
c k t n i đượ ọ ế
c g i là t bào thần kinh nhân tạo (artificial
Nơ-rons) tương t như t
ự ế ầ
bào th n kinh sinh học trong não. Mỗi khớp (synapse)
giữa các nơ-ron có thể truyền tín hiệu đế ộ
n m t nơ-ron khác. Tế bào thần kinh nhân
t o - x n
ạ (post synaptic) có thể ử lý các tín hiệ ề
u và sau đó truy n xuố g tín hiếu tới
các n -
ơ ron đư nơ
ợ ế ố ớ
c k t n i v i nó. Các -ron có thể có trạ ờ
ng thái, thư ng đượ ể
c bi u
th th
ị ằ
b ng số ực, thường n m trong kho
ằ ảng từ ế
0 đ n 1. Các nơ-ron và khớp thần
kinh cũng có thể ọ
có tr ng số ổ
thay đ i khi tiế ọ ậ ể ặ ả
n hành h c t p, có th tăng ho c gi m
cườ ộ
ng đ tín hiệ ề ố
u mà nó truy n xu ng.
Thông thường, nơ-ron đượ ổ ứ ớ ớ
c t ch c theo l p. Các l p khác nhau có thể ự
th c
hiện các lo i bi
ạ ến đổ ầ
i khác nhau trên đ u vào c a chúng. Tín hi
ủ ệ ề ừ ớ
u truy n t l p
đầ ầ ế ớ ầ ố ể ớ ề
u tiên (đ u vào), đ n l p (đ u ra) cu i cùng, có th sau khi đi qua các l p nhi u
lần.
Mục tiêu ban đầu của m -
ạng nơ ron là gi t các v
ải quyế ấ ề
n đ theo cách tương
tự như bộ não củ ờ
a con ngư i. Theo thời gian, sự chú ý tập trung vào việ ợ
c phù h p
10. 3
với khả năng cụ thể, dẫ ế
n đ n những sai lệch so với sinh họ ề ợ
c như truy n ngư c,
hoặc truyền thông tin theo hướng ngượ ạ
c l i và điề ỉ ạ
u ch nh m ng để ả
ph n ánh thông
tin đó.
Hình ng
1.1 Mạ nơ-ron sinh học [8].
Neural Networks đã đượ ử
c s dụng trên nhiều nhiệm vụ, bao gồm thị giác máy
tính, nh ch máy, l c m
ận dạng giọng nói, dị ọ ạng xã hội và chẩn đoán y tế.
Tính đến năm 2017, các Neural Networks thườ ế
ng có vài nghìn đ n vài triệu
đơn vị ệ ế ố ặ ố ỏ
và hàng tri u k t n i. M c dù con s này nh hơn số ợ ế
lư ng t bào thần kinh
trên não ngư i, nhưng các m
ờ ạ ể
ng này có th thực hiệ ề ệ ụ ở ấ ộ
n nhi u nhi m v c p đ
vượ ờ ụ ậ
t xa con ngư i (ví d : nh n diệ ặ
n khuôn m t, chơi “Go” …).
1.3 ron
Ứng dụng của mạng nơ-
M -
ạng nơ ron được ứng dụng rất nhiề ể
u đ giải quyết các bài toán trong thực
tế như phân loại (ảnh, giọng nói, tín hiệu), xấp xỉ, dự báo, nhận dạng hệ thống và
thiết kế ộ ề
b đi u khiển. Sau đây là m t s
ộ ố ứng dụng của mạng nơ- :
ron
• Điện t n quá trình, phân tích l
ử: sự ố ề
b trí chíp IC, đi u khiể ỗi chip, thị ự
l c
máy, t p ti
ổng hợ ếng nói, mô hình hóa phi tuyến.
• Robot: điều khiển quỹ đạo, xe nâng hàng, các bộ điều khiển tay máy, các
hệ thống thị giác, xe tự hành.
11. 4
• ng d
Ô tô: các hệ thố ẫ ớ
n hư ng tự độ ề
ng, đi u khiể ệ
n bơm nhiên li u, các hệ
thống phanh tự động, dò đ ng cơ không n
ộ ổ, các cả ế ự
m bi n dò s phát khí ảo.
• S s
ản xuấ ề
t: đi u khiển quá trình sản xuất, phân tích và thiết kế ản phẩm,
chuẩn đoán máy và quá trình, nh t th i gian th c, các h
ận dạng hạ ờ ự ệ ố
th ng kiểm tra
chất lượng, thử bia, phân tích chấ ợ
t lư ng hàn, dự ấ
đoán ch t lượng giấy, phân tích
chất lượng chip máy tính, phân tích các hoạ ộ
t đ ng nghiề ế ế ả
n, phân tích thi t k s n
ph ho
ẩm hóa h u d
ọc, phân tích bả ỡ ấ
o dư ng máy, đ u thầ ự ả
án, qu n lí và kế ạch hóa,
mô hình động củ ọ
a các quá trình hóa h c.
• Vũ trụ, ngân hàng, quốc phòng, giải trí, tài chính, b m, y t , d
ảo hiể ế ầu khí,
an ninh, giao thông và truy n thông. [3].
ề
1.4 Mô hình nơ-ron nhân tạo
1.4.1 Mô hình nơ-ron
a) Mô hình nơ-ron mộ ầ
t đ u vào
Hình 1.2 Sơ đồ -
mô hình nơ ron mộ ầ
t đ u vào
Hình 1.2 biểu thị sơ đồ ấ ủ ộ
c u trúc c a m t nơ-ron nhân tạo có mộ ầ
t đ u vào. Quan hệ
vào ra của nơ-ron như sau:
n wp b
= + (1.1)
n wp b
= + (1.2)
Trong đó:
p : đầ ủ
u vào c a nơ-ron
w : trọng số đầu vào
b : ngưỡng (bias)
t
Σ: là bộ ổng số
12. 5
n: là đầu vào net
f : là hàm truyền
a : đầ ủ
u ra c a nơ-ron
Một số hàm truyề ả
n cơ b n: [3].
Hàm giớ ạ
i h n cứng Hardlim:
ardlim(n)
0, 0
1, 0
a h
n
n
=
<
=
≥
(1.3)
Hàm Purellin:
tuyến tính
a n
=
(1.4)
Hàm Logsig:
( )
1
1 n
a logsig n
e−
=
=
+
(1.5)
Hàm tuyến tính dương:
(n)
0, 0
1, 0
a posline
n
n
=
<
=
≥
(1.6)
Hàm khuế ạ
ch đ i bão hòa:
(n)
1, 1
, 1 1
1, 1
a satlins
n
n n
n
=
− < −
= − ≤ ≤
>
(1.7)
Hàm tansig:
( )
n n
n n
a tansig n
e e
e e
−
−
=
−
=
+
(1.8)
Vì bài toán này chỉ ử ụ ế
s d ng đ n hàm tansig nên chỉ nghiên cứu về hàm
tansig .
13. 6
Đồ ị ợ ể ễ
th hàm tansig(n) đư c bi u di n như sau:
Hình hàm
1.3 Đồ thị a=tansig(n) [7].
Hàm này có giá tr o hàm liên t c v
ị ế ả
bi n dương trong kho ng -1 tớ ạ
i 1, có đ ụ ới
mọi n d n.
và thườ ợ
ng đư c sử ụng trong các lớp ẩ
b) Mô hình i nhi
nơ-ron vớ ều đầu vào:[3].
Hình 1.4 -
Mô hình nơ ron vớ ầ
i R đ u vào
Hình 1.5 Sơ đồ rút gọn nơ-ron vớ ầ
i R đ u vào
Nơ-ron có nhiề ầ ợ
u đ u vào đư c mô tả như hình 1.4, trong đó đầ ộ
u vào là m t
véc-tơ p có R thành phần:
14. 7
1 2
[ , , , ]T
R
p p p
=
p (1.9)
v -
à véc tơ trọng số như sau:
1,1 1,2 1,
[ , , ]
, R
w w w
=
w (1. )
10
Mỗ ầ
i đ u vào i
p s t
ẽ đượ ộ
c đưa vào b ổng thông qua một trọng số 1,i
w . Đầu
vào net được tính theo công thức sau:
1,1 1 1,2 2 1,R R
n w p w p w p b
= + + + +
(1. )
11
Đầ ủ
u ra c a nơ-ron là:
( )
a f n
= (1. )
12
Với f -
là hàm truyền nơ ron. Công thứ ể ợ ế
c (1. ) có th
11 đư c vi t gọn như
sau:
1, 1,
1
R
i i
i
n w p b
b
=
= +
= +
∑
wp
(1. )
13
1.4.2 Cấu trúc mạng
L -
ớp nơ ron
Khi nhiều u p
nơ-ron có cùng chung đầ vào thì được gọi là một lớ nơ-ron
(gọi t t là l p). M t l
ắ ớ ộ ớp có số đầu ra bằng s u vào. Trong m
ố ầ
nơ-ron có chung đ ột
lớp các hàm truyề ờ
n thư ng đượ ọ ố
c ch n là gi ng nhau, chẳng hạn cùng là hàm tuyến
tính. Sơ đồ cấu trúc một lớp nơ ron như hình 1.6, trong đó có
- m nơ ron, đ
- ầ ủ
u ra c a
nơ-ron thứ i là ( )
i i i
a f n
= v :
ới
,
1
R
i i i j j
j
i
i
n b w p
b w p
=
= +
= +
∑
(1. )
14
Đặt 1 2
[ ]
T
m
a a a a
=
, 1 2
[ ]
T
m
b b b b
=
và 1 2
[ ; ; ; ]
m
W w w w
=
. Đầu ra
của lớp sẽ là ( )
a f n
= , trong đó:
W
n p b
= + (1. )
15
và
1 3
[ ]T
m
f f f f
=
15. 8
Hình ron
1.6 Sơ đồ ấ ủ
c u trúc c a mộ ớ
t l p nơ- .
[3]
• C p
ấu trúc mạng một lớ
Hình 1.7 C -
ấu trúc mạng nơ ron 1 lớp
Một cấu trúc toán học mạng 1 lớp với R đầu vào và S -
nơ ron được chỉ ra
trên hình 1.7. Trong m n t
ạng này mỗi phầ ử ủ
c a véc-tơ vào p v
liên hệ ớ ầ
i đ u vào
mỗi nơ-ron thông qua ma trận trọng số W. Bộ c -
ộng của nơ ron thứ i thu thập các
trọng liên kết đ c đ
ầ ộ ố
u vào và đ d ể ạ
t o thành một đầ ớ
u ra vô hư ng i
n . Các i
n tập
16. 9
hợp với nhau tạo thành s c -
phần tử ủa véc tơ vào n. Cuối cùng ở ớ
l p nơ-ron thu
được véc-tơ a gồm s .
phần tử
C -
ó thể thiết lập lớ ủ
p đơn c a các nơ ron có các hàm truyền khác nhau một
cách dễ dàng bởi lẽ hai mạng được đặ ấ ả
t song song. T t c các mạng có thể có chung
đầ ỗ ạ ể ế ậ
u vào và m i m ng có th thi t l p mộ ầ
t vài đ u ra.
Các phần tử c -
ủa véc tơ đầu vào đư c đưa vào m
ợ ạ ậ ọ
ng thông qua ma tr n tr ng
số W , với:
11 12 1
21 22 2
1 2
w w w
w w w
W
w w w
R
R
s s sR
=
Trong đó chỉ số hàng trong các ph n t
ầ ử ủ ậ
c a ma tr n W cho biết nơ-ron nơi
đế ỉ ố ộ ế ấ ủ ọ ế
n, còn ch s c t cho bi t nơi xu t phát c a tr ng liên k t.
Để ả
đơn gi n kí hi u m
ệ ộ ạ
t m ng gồ ầ
m S nơ-ron, R đ u vào như hình 1.8.
Hình 1.8 Sơ đồ rút g ng m
ọ ạ
n m ột lớp R đầu vào và S nơ-ron
Trong hình 1.8 có véc-tơ vào P có kích thước R, ma trận trọng liên kết W có
kích thư tơ có kích thư
ớc SxR, còn a và b là các véc- ớc S, b là bias.
• Mạng nhiều lớp
M - p
ột mạng nơ ron có thể có một vài lớ . Mỗi lớp có ma trận trọng số W , bias
b và đầu ra a .
Hình 1.9 là sơ đồ ấ ạ
c u trúc m ng nơ p. Trong đó có
-ron 3 lớ R đầu vào, và i
S là
nơ- l
ron ở ớp i, i
i
S
a p
là đầu ra lớ i , v i
ớ 1,2,3
i = .
Để ả
đơn gi n kí hi u s ron 3 l
ệ ơ đồ ọ
rút g n mạng nơ- ớp như hình 1.10.
17. 10
Hình 1.9 C -
ấu trúc mạng nơ ron 3 lớp
Hình ng p
1.10 Sơ đồ rút gọ ạ
n m nơ-ron 3 lớ
Mạng hồi quy (mạng phản hồi) là loại mạng tự liên kết thành các vòng và
liên k t h a các
ế ồi quy giữ nơ-ron. [2].
• Mạng xuyên tâm .
(RBF) [3]
Khi các hàm liên thu c có d
ộ ạ ộ
ng Gaussmf, đ thỏa mãn được tính sử ụ
d ng
công thức PROD ,1 ,2 ,
i i i i m
α α α α
= , và các hàm i
g là các hằng số, có thể biểu
diễn mô hình mờ Sugeno dư ng như sau:
ớ ạ
i d
( )
T
y x
θ
= Φ
′ (1. )
16
18. 11
trong đó 1 2
[ , , , ]T
n
y y y
θ = , 1 2
( ) [ ( ), ( ), , ( )]T
n
x x x x
α α α
Φ = , 1 2
[ , , , ]T
m
x x x x
=
và ,
1
( ) ( )
j i
m
i A j
j
x x
α µ
=
= ∑ . Công th ng xuyên tâm
ức (1.16) có quan h vào ra c
ệ ủa mạ
(RBF). Như vậy hàm ( )
i x
α còn được gọ ở
i là các hàm cơ s hay hàm truyền trong
m -
ạng nơ ron và θ - c
còn được gọi là véc tơ các trọng số ủa mạng.
Mạng RBF gồm hai lớp. Lớp thứ nhất gồm các nơ-ron với hàm truyền như sau:
1 2
( )
1 i
n
i
a e−
= (1. )
17
trong đó:
1 1 1
|| ( ) ||
T
i i i
n b
= − w
p (1. )
18
1
i
w - c -
là véc tơ trọng số ủa nơ ron i hay là tâm, 1
i
b -
là ngưỡng của nơ ron i , ||*|| là
khoảng cách gi u vào v
ữa vec-tơ đầ ới véc-tơ trọng số, p -
là véc tơ đầu vào. Khi
( )
1
1/ 2
i
b σ
= trong đó σ l
là độ ệch chuẩn, thì hàm truyền (1.17) có dạng
Gaussmf. L p th hai có hàm tru n là tuy
ớ ứ yề ến tính:
2 2 1 2
a a b
= +
W (1. )
19
Mạng này thườ ợ ử ụ ể ấ
ng đư c s d ng đ x p xỉ các thành phần bấ ị
t đ nh của tượng
trong quá trình thi t k
ế ế ộ ề
b đi u khiển.
Hình 1. m
11 Sơ đồ ạng h i quy
ồ
19. 12
1.5 Ứng dụ ề
ng trong đi u khiển
1.5.1 Nhận dạng hệ thống
Xét mộ ể
t bài toán đi u khiển theo nguyên t n h
ắc phả ồ ầ
i đ u ra như ở hình
1.12, muốn tổng hợ ợ
p đư c bộ ề
đi u khiể ố ợ ể ệ ợ
n cho đ i tư ng đ h kín có đư c chất
lư n thì trư i tư
ợ ố
ng như mong mu ớc tiên cầ ả
n ph i hiể ế
u bi t về đố ợ ứ
ng, t c là cần
ph ng
ải có một mô hình toán học mô tả đố ợ
i tư ng. Không thể điều khiển đố ợ
i tư
khi không hi u bi
ể ết về nó. Kết quả tổng hợp bộ điề ể ụ
u khi n ph thuộc rất nhiều vào
mô hình mô tả đố ợ
i tư ng. Mô hình càng chính xác, hiệu suất công việc càng cao.
Hình 1.12 điều khiển theo nguyên t n h u ra [
ắ ả
c ph ồ ầ
i đ 2].
Việc xây dựng mô hình cho đố ợ ọ
i tư ng g i là mô hình hóa. Thường phân
chia các mô hình hóa làm hai loại:
- t
Phương pháp lý thuyế
- m
Phương pháp thực nghiệ
Một số bài toán trong nhận dạng:
- Nhận dạng trực tuyến mô hình không tham số ệ ế
h tuy n tính
- Nhận dạng chủ động tham số mô hình AR
- .
Nhận dạng tham số mô hình ARMA
1.5.2 Thiết kế bộ điều khiển
Để ế ế ộ ề ể
thi t k b đi u khi n có các cách sau:
- Bộ điều khiển theo mô hình mẫu
- Điều khiển dự báo
- p
Điều khiển thích nghi trực tiế
- p
Điều khiển thích nghi gián tiế
- d
Điều khiển sử ụng ADP
20. 13
a) Thiế ế ộ
t k b điề ể
u khi n theo mô hình mẫu
Để ế ế ộ ề ể
thi t k b đi u khi n nơ-ron cần phải có tín hiệu vào ra mẫu. Ở đây
dùng một mô hình mẫu thể hiện đáp ứng đầu ra mong muốn của đối tượng. Thường
mong muốn đáp ng đư
ứ ộ ủ ệ ả ứ
ng quá đ c a h kín ph i đáp ợ ờ ậ ộ
c th i gian xác l p và đ
quá điề ỉ
u ch nh theo yêu c t khâu
ầ ể
u, do đó có th chọn mô hình mẫu là mộ ổ ị
n đ nh
có th là quán tính ho
ể ặ ộ
c dao đ ng.
Bộ điề ể
u khi n nơ-ron có cấu trúc là mạng hồi quy, thườ ớ ạ
ng có hai l p. M ng
vòng điề ể ả
u khi n ph n hồi: giá trị đặt sẽ ợ
đư c đưa vào đầu vào củ ạ ầ
a m ng NNc, đ u
ra c a m
ủ ạng NNc sẽ ợ ầ
đư c đưa vào đ u vào củ ạ ậ ạ ẽ
a m ng NNp. Như v y m ng NN s
có đ t và đ u ra là đ
ầ ị đặ
u vào là giá tr ầ ầ ủ ạ
u ra c a m ng NNp.
b
Để thiết kế ộ điều khiể ẽ
n NNc s huấn luyện m ng b
ạng NN sử ụ
d ộ tín hiệu
vào ra mẫ ấ
u. Trong quá trình hu n luyện mạng NN, chỉ chỉ ị
nh đ nh các tham số ủ
c a
m c
ạng NNc, còn các tham số ủa mạng NNp giữ nguyên các giá trị đã được xác
đị ừ
nh t quá trình nhận dạng.
Mạ ờ
ng NN thư ng là mạng sâu (deep network) bởi vì mỗi mạng NNc và
NNp đề ấ ớ ạ ấ ớ ộ ạ
u có ít nh t là hai l p, do đó m ng NN có ít nh t 4 l p. Đây là m t m ng
hồ ấ
i quy, trong đó có ít nh t 3 vòng phản hồi, cho nên phải dùng thuật toán lan
truy tính gradient.
ề ợ
n ngư c để
b
Như vậy bài toán thiết kế ộ điều khiển mạng ron
nơ- ở ở
đây tr thành bài
toán nh u trúc ph
ận dạng hệ thố ấ
ng, nhưng c ức tạ ề
p hơn nhi u. [3].
b) Thiế ế ộ
t k b điều khiể ự
n d báo
Để ế ế ộ ề ể ự ạ ớ ả
thi t k b đi u khi n d báo dùng m ng nơ-ron, trư c tiên ph i xây
d - .
ựng một mô hình toán cho đố ợ
i tư ng bằng mạng nơ ron
Khi có mô hình mạng nơ ng này đ
-ron đố ợ ẽ ạ
i tư ng s dùng m ể dự ầ
báo đ u ra
của đối tư tương lai. Sau đó s
ợng trong ử dụng thuật toán tối ưu để tìm tín hiệu điều
khiển tố ự ụ
i ưu d a trên hàm m c tiêu như sau:
2
1
2 2
1
[ ( ) ( )] [ n
( 1) ( 2)] mi
u
d p
N
N
k N k
J y t k y t k u t k u t k
ρ
= =
+ − + + +
= + − − →
−
∑ ∑ (1. )
20
trong đó 2 1
N N
− t m d
là ầ ự báo, u
N là tầ ề
m đi u khiển, u là tín hiệ ề
u đi u khiển,
d
y là đầu ra mong muốn và p
y -
là đầu ra của mô hình nơ ron củ ố ợ
a đ i tư ng NNp.
21. 14
1 ) s
Hàm mục tiêu ( .20 ẽ đượ ả ế ả
c gi i online. K t qu tìm được là các giá trị ố
t i
ưu c u trong đi
ủ ệ
a tín hi ều khiển trong tầ ề
m đi u khiển
* [ *( ) *( 1) *( 1)]
u
u u t u t u t N
= + + −
, với t là thờ ể
i đi m hiện tại. Ở thời
điể ế
m ti p theo 1
t + , giá tr u*(t) s p theo
ị ẽ ợ để ề
đư c đưa ra đi u khiể ố ợ
n đ i tư ng tiế
1
t + , giá tr u*(t) s c tiêu (1
ị ẽ ợ ể ề
đư c đưa ra đ đi u khi ng và hàm m
ể ố ợ
n đ i tư ụ .20)
l t
ạ ợ
i đư c giả ể
i online đ tìm giá trị ố ỳ
i ưu cho chu k tiế ể
p theo. Đ giải bài toán tối
ưu (1. c phương pháp bình phương
20) thườ ạ ấ
ng dùng phương pháp h sâu nh t, hoặ
cực tiểu sau khi tuyến tính hóa mô hình mạng ng
nơ-ron củ ố ợ
a đ i tư . [3].
c) Điều khiển thích nghi tr c ti
ự ếp
Xét đ i tư
ố ợ ế ạ
ng phi tuy n có d ng như sau: [3].
( ) ( 1)
( , ,..., )
n n
x f x x x bu
−
= +
(1. )
21
trong đó ( )
i
i
i
d x
x
dt
= , ulà tín hiệ ầ
u đ u vào, f và 0
b > là các hàm số và hằng số
chưa biết, y x
= t
là đầu ra củ ố ợ
a đ i tư ng. Đặ ( 1)
[ , , , ]
n T
x x x x −
=
Bài toán đặt ra là thi t k
ế ế ộ
b điều khiển mờ ự ế
tr c ti p ( | )
D D
u u x θ
= sao cho
m
y y
→ , trong đó m
y là đầu ra mong mu n hay giá tr
ố ị đặt.
Bộ điều khiể ờ ự ế ạ
n m tr c ti p có d ng như sau:
( )
T
D
u x
θ ζ
= (1. )
22
trong đó ( )
x
ζ - .
là véc tơ các hàm cơ sở
Tín hiệ ề
u đi u khi p h
ể ở ờ
n lý tư ng trong các trư ng hợ ệ ị
xác đ nh là :
( )
1
* [ ( ) ]
n T
m
u f x y k e
b
= − + + (1. )
23
Thay (1. ) vào (1.
22 23), sau khi biế ổ ợ
n đ i đư c:
( )
( * )
n T
D
e k e b u u
= − + −
(1. )
24
với 1 2
[ , , , ]T
n
k k k k
= .
Định nghĩa ( 1)
[ , , , ]
n T
e e e e −
=
. Có thể viết l i (1.
ạ 24) dưới dạng phương
trình trạng thái như sau:
[ * ( , )]
D
e e b u u x θ
= Λ + −
(1. )
25
22. 15
trong đó:
1 2 3 4 1
0 1 0 0 0 0
0 0 1 0 0 0
nxn
n n
k k k k k k
−
Λ =
(1. )
26
và 1 [0,0,0, ,0, ]T
nx
b b
= .
G x :
ọi sai số ấp xỉ là
( , *) *
D
w u x u
θ
= − (1. )
27
Với *
θ -
là véc tơ tham số t m
ố ủ
i ưu c a hệ ờ. Viết lại phương trình (1. thu đư
25) ợc:
( * ) ( )
T
e e b x bw
θ θ ζ
= Λ + − −
(1. )
28
Chọn hàm Lyapunov:
1
( * ) ( * )
2 2
T T
b
V e Pe θ θ θ θ
γ
= + − − (1. )
29
Với 0
γ > . Đ V thu đư
ạo hàm ợc:
1
( * ) [ ( ) ]
2
T T T T
n n
b
V e Qe e p x e p w
θ θ γ ζ θ
γ
= − + − − −
(1. )
30
trong đó n
p - n
là véc tơ cột cuối cùng của ma trậ P .
Chọ ậ
n lu t thích nghi:
( )
T
n
e p x
θ γ ζ
=
(1. )
31
có:
2
1
2
| | / 2 | || |
T T
n
min n
V e Qe e p w
e e p w
λ
= − −
≤ − +
(1. )
32
trong đó min
λ là giá trị riêng nhỏ nhất c a ma tr
ủ ận Q . Khi sai l ch n
ệ ằm ngoài miền
min
2 | w |
{e|e|< }
n
p
λ
Γ = thì 0
V <
. Điều đó có nghĩa là sai lệ ề ể ẽ
ch đi u khi n s tiến về
vùng Γ có ch a g c 0.
ứ ố
23. 16
d) Điều khi n thích nghi gián ti
ể ếp
( ) ( 1) ( 1)
( , , , ) ( , , , )
n n n
x f x x x g x x x u
− −
= +
(1. )
33
trong đó ( )
i
i
i
d
x
dt
= là đạo hàm bậc i của ,
x u là tín hiệ ầ
u đ u vào, f và g là các
hàm số ế
chưa bi t, y x
= là đầu ra củ ố ợ
a đ i tư ng.
Bài toán đặt ra là thiết kế bộ điều khiển sao cho m
y y
→ , trong đó m
y là đầu
ra mong muốn hay giá trị đặt.
Mô hình xác định
Đầ ờ
u tiên xét trư ng hợp các hàm số f và g là xác định.
Đặt ( 1)
[ , , , ]
n T
x x x x −
= .
Khi đó phương trình (1.14) có dạng:
( )
( ) ( )
n
x f n g x u
= + (1. )
34
Đặt m
e y y
= − và ( 1)
[ , , , ]
n T
e e e e −
=
.
Thiế ế ộ
t k b điều khi nh (1.
ển cho hệ ị
cho mô hình xác đ 34) như sau:
( )
1
* [ ( ) ]
( )
n T
m
u f x y k e
g x
= − + + (1. )
35
với 1 2
[ , , , ]T
n
k k k k
= . Thay b u khi
ộ ề
đi ể ợ
n (1.35) vào (1.34) đư c:
( ) 1 2
1 1 0
n n n
n n
e k s k s k
− −
−
+ + + + =
Như vậ ứ ẽ ổ ị ế ứ ể ự ằ
y đa th c trên s n đ nh n u như đa th c sau là Hurwitz (đi m c c n m
bên trái trục ảo):
1 2
n n n
− −
− (1. )
36
Tóm lại, khi đ i tư
ố ợng (1.33) xác đị ớ
nh thì v i bộ điều khiển (1.35) th a mãn
ỏ
điều kiện (1.36) là đa thức Hurwitz sẽ làm cho hệ thống ổ ị
n đ nh.
Mô hình bấ ị
t đ nh
Khi mô hình củ ố ợ
a đ i tư ng (1.33) là b nh, các hàm b
ấ ị
t đ ấ ị
t đ nh ( )
f x và
( )
g x s b i m
ẽ được xấp xỉ ở các ạng nơ như sau:
-ron
24. 17
ˆ( , ) ( )
ˆ( , ) ( )
T
f f
T
g g
f x x
g x x
θ θ ς
θ θ η
=
=
(1. )
37
trong đó ( )
x
ζ và ( )
x
η -
là véc tơ các hàm cơ sở (hàm cơ sở thường là hàm
gaussmf), f
θ và g
θ - .
là các véc tơ tham số ở đầu ra của mạng xuyên tâm
Khi đó b đi p đư như sau s
ộ ều khiển mờ ế
thích nghi gián ti ợ ế ế
c thi t k ẽ làm
cho hệ ổ ị
n đ nh.
( )
1 ˆ
[ ( , ) ]
ˆ( , )
n T
I f m
g
u f x y k e
g x
θ
θ
= − + + (1. )
38
v :
ới luật chỉ ị
nh đ nh thích nghi là
1
2
( )
( )
T
f
T
g I
e Pb x
e Pb x u
θ γ ζ
θ γ η
= −
= −
(1. )
39
trong đó P là ma trậ ố
n đ i xứ ị ỏ
ng xác đ nh dương th a mãn phương trình Lyapunov
và k được chọ ở
n như trên.
Thay 38
(1. ) vào (1. và bi
33) ế ổ ợ
n đ i đư c:
( ) ˆ ˆ
[ ( , ) ( )] [ ( , ) ( )]
n T
f g I
e k e f x f x g x g x u
θ θ
= − + − + − (1. )
40
Viế ạ ớ ạ
t l i dư i d ng ma trận có:
ˆ ˆ
[ ( , ) ( ) }
]
{ [ ( , ) ( )]
f g I
e e b f x f x g x g x u
θ θ
= Λ + − + −
(1. )
41
trong đó:
1 2 3 4 1
0 1 0 0 0 0
0 0 1 0 0 0
nxn
n n
k k k k k k
−
Λ =
(1. )
42
và
1 [0,0,0, ,0, ]T
nx
b b
=
Kí hiệu *
f
θ và *
g
θ t
là các tham số ối ưu củ ệ ờ ạ ể
a h m (m ng nơ-ron). Khi đó có th
viế ạ
t l i phương trình (1.41) dưới dạng sau:
* *
ˆ ˆ
[ ( , ) ( , )] }
[ ( , ) ( , )]
{ +w
f f g g I
e e b f x f x g x g x u
θ θ θ θ
= Λ + − + −
(1. )
43
25. 18
với
* *
ˆ ˆ
[ ( , ) ( )] [ (
w , ) ( )]
f g I
f x f x g x g x u
θ θ
= − + −
Định nghĩa hàm Lyapunov:
* * * *
1 2
1 1 1
( ) ( ) ( ) ( )
2 2 2
T T T
f f f f g g g g
V e Pe θ θ θ θ θ θ θ θ
γ γ
= + − − + − − (1. )
44
với P :
thỏa mãn phương trình Lyapunov
T
P P Q
Λ + Λ = − (1. )
45
trong đó Q là ma trậ ố
n đ i xứng xác đị ạ
nh dương. Đ o hàm (1.44) có:
*
1
1
*
2
2
1 1
( ) [ ( )]
2
1
( ) [ ( ) ]
T T T T
f f f
T T
g g g I
V e Qe e Pbw e Pb x
e Pb x u
θ θ θ γ ζ
γ
θ θ θ γ η
γ
= − + + − +
+ − +
(1. )
46
V )
ới luật thích nghi (1.38 và bộ điều khiển (1.38) thì 0
V <
-
khi véc tơ sai
lệch e nằm bên ngoài miền hấp dẫn || |
min
Pbw
e e e
λ
∉Γ = ≤ v i
ớ min
λ là giá trị riêng
nh nh
ỏ ấ ủ ậ
t c a ma tr n Q .
, do đó hệ thống sẽ ổ ị
n đ nh.[3]
1.5.3 Ứng dụng trong cánh tay Robot một bậc tự do
Đị ẩ
nh nghĩa theo tiêu chu n AFNOR (Pháp): Robot công nghiệp là một cơ
c l
ấu chuyể ộ
n đ ng tự động có thể ập trình, lặp lạ ổ
i các chương trình, t ng hợp các
chương trình đặt ra trên các trục toạ độ; có khả năng đ nh hư
ị ị ị
nh v , đ ớng , di
chuyể ố ợ
n các đ i tư ng v o c ng hành trình
ật ch t: chi ti
ấ ế ạ
t, đ ụ, giá l p ... theo nh
ắ ữ
thay đ i đã chương trình hoá nh
ổ ằ ự
m th c hiệ ệ ụ
n các nhi m v công nghệ khác nhau -
Định nghĩa theo R n năng
CA (Robot institute of America): Robot là mộ ạ
t tay máy v
có th c thi t k t li t, d
ể ặ
l p lạ ợ
i các chương trình đư ế ế để ể
di chuy n vậ ệu, chi tiế ụng
cụ hoặc các thiết bị chuyên dùng thông qua các chương trình chuyể ộ
n đ ng có thể
thay đ i đ
ổ ể hoàn thành các nhiệm vụ khác nhau .
-
Định nghĩa theo GHOCT 25686 85 (Nga): Robot công nghiệp là một máy
tự động, đượ ặ ố đị
c đ t c nh hoặc di độ ợ
ng đư c, liên kết giữa một tay máy và một hệ
thố ề
ng đi u khiển theo chương trình, có thể ậ ạ ể
l p trình l i đ hoàn thành các chức
năng vậ độ ề
n ng và đi u khi n trong quá trình s n xu
ể ả ất .
26. 19
Có th t thay th
ể ệ
nói Robot công nghi p là một máy tự động linh hoạ ế ừ
t ng
phân n ho
đoạ ặc toàn bộ các hoạ ộ ắ
t đ ng cơ b p và hoạ ộ
t đ ng trí tuệ ủ ờ
c a con ngư i
trong nhiều khả năng thích nghi khác nhau.
1.6 Kết luận chương 1
Như vậ ổ
y, t ng kế ạ ớ ề ị ử ể
t l i, chương 1 đã gi i v l ch s hình thành và phát tri n
c -
ủa mạng nơ ron từ năm 1980 đ , cũng như tìm hi
ến nay ểu về khái niệm, mô hình,
cấu tạo của mạng nơ-ron nhân tạo. Mạng nơ-ron đang phát triể ấ
n r t mạ ẽ
nh m trong
th c
ực tế ợ
n
nên ó đư ứng dụng rất nhi u c u khi n l n trong
ề ả ứ ề
trong nghiên c u đi ể ẫ
công nghiệp.
Trên cơ sở tính năng củ ạ ề ể
a m ng nơ-ron trong đi u khi n, từ đó có thể ậ
nh n
d b n
ạ ợ
ng đư c hệ thống, hay thiết kế ộ điều khiể .
C v -
ác chương sau sẽ đi ào phân tích cụ thể ứng dụng của mạng nơ ron vào
phương pháp đi đi đi
ều khiển dự ẽ
báo. Và s b
vào bài toán cụ thể là thiết kế ộ ều
khi do
ển dự ộ ậ ự
báo cho cánh tay máy m t b c t .
27. 20
CHƯƠNG 2. PHƯƠNG PHÁP ĐIỀU KHIỂN DỰ BÁO D A TRÊN
Ự
M -
ẠNG NƠ RON
2.1 Phương pháp điều khiể ự
n d báo
- Điều khiển hệ thố ợ
ng đư c hiểu là bài toán can thiệp vào đ ng đi
ố ợ
i tư ều
khi hi bi
ể ể
n đ ệ ỉ ể
u ch nh, đ ến đ i sao cho nó đư t lư
ổ ợ ấ
c ch ợ ố
ng mong mu n.
- Định nghĩa tối ưu hóa: Trong điều khiển hệ thống, thườ ặ
ng g p bài toán chọn
các tham số ề
đi u khi n trong s ng tham s p sao cho h
ể ố nhữ ố ợ
thích h ệ ố ạ
th ng đ t
đượ ấ ợ ộ ố ấ ợ ọ ề
c ch t lư ng m t cách t t nh t. Bài toán đó đư c g i là đi u khiển tối ưu tĩnh,
hay còn gọ ố
i là t i ưu hóa. [3].
Hình báo
2.1 Cấu trúc hệ điều khiển dự
Điề ể ự ờ ả ậ ỷ ừ ữ
u khi n d báo ra đ i cách đây kho ng vài th p k (t nh ng năm 1960
và đã có nhiều ứ ụ ệ ệ
ng d ng thành công trong công nghi p) (Richalet, 1993). Hi n nay
điều khiển dự ế ợ ề
báo là chi n lư c đi u khiển bi
đượ ử ụ
c s d ng phổ ến nhất trong việc
đi đi t mô hình đ đoán trư
ều khiể ộ
n quá trình. B ề ể
u khi n dự ộ
báo dùng m ể ớc đáp
ứng tương lai c a đ i tư
ủ ố ợng điều khiển tạ ờ ể ờ ạ ộ ạ
i các th i đi m r i r c trong m t ph m vi
dự báo (Prediction horizon) nhấ ị
t đ nh. Dự ứ
a vào đáp ng dự ộ
báo này, m t thuật
toán tối ưu hoá đượ ử
c s dụng để tính toán chu i tín hi
ỗ ệ ề
u đi u khiển tương lai trong
phạm vi điều khiể ệ
n (Control horizon) sao cho sai l ch giữa đáp ứ ự
ng d báo bởi mô
hình và tín hiệu chuẩ ớ
n cho trư c là tối thiể ề
u. Phương pháp đi u khiển dự báo là
phương pháp tổ ế ế ộ ề ể
ng quát thi t k b đi u khi n trong miề ờ
n th i gian có thể ụ
áp d ng
cho hệ ế ệ
tuy n tính cũng như h phi tuyến.
28. 21
Điều khiển dự báo là phương pháp điều khiển đượ ụ ủ ế
c áp d ng ch y u cho các
quá trình. Chấ ợ
t lư ng hệ thống điều khiển dự báo được xác định hoàn toàn trên cơ
sở bài toán tố ậ
i ưu hóa và thu t toán tìm nghiệm tối ưu cho bài toán đó.
Hình 2.1 c
mô tả ấu trúc cơ bả ủ
n c a một hệ thống điều khiển dự báo. Nó gồm
ba phần chính như sau:
- Hàm mục tiêu ( )
Q p
. Hàm mục tiêu này được xây d ng theo nguyên t
ự ắc là
nghiệm tối ưu của nó phải làm cho tổng bình phương các sai lệch k i
e + ,
0,1,2, , 1
i M
= … − a
giữa tín hiệu ra tương l i ˆk i
y +
t c d
rong toàn bộ ửa sổ ự báo
[ )
,
k k M
+ , kể ừ
t thờ ể
i đi m k t
hiện tại, và tín hiệ ặ
u đ wk i
+ , t.
đạt giá trị ỏ ấ
nh nh
- Mô hình dự báo đượ ử ụ ể
c s d ng đ xác đị ấ ỉ
nh x p x các tín hi u ra
ệ ầ
u đ ˆk i
y +
từ
giá tr i th
ị đầ ứ ứ
u vào quá kh tương ng tính tạ ờ ể
i đi m k i
+ , tứ ị
c là xác đ nh:
1
ˆ ( ,..., )
k k i
i
k i
y u u
ϕ + −
+
= .
- Thuật toán tìm nghiệm bài toán t t b toán t
ố ộ
i ưu. Cho cùng m ài ối ưu có
nhiều thuật toán tìm khác nhau. Tuy nhiên phù h p v u khi n d
ợ ớ ề
i đi ể ự ả
báo hơn c
là nh t toán i tích ho c các thu t toán l mang tính tr c tuy n, có t
ững thuậ giả ặ ậ ặp ự ế ốc
độ ộ ụ
h i t .
nhanh. [2]
Các phương pháp trong điều khiển dự báo:
a) Điều khiển dự ệ ế
báo theo h tuy n tính
Bộ điều khiển dự báo sẽ được gọi là tuyến tính nếu mô hình dự báo là tuyến
tính. Hệ LTI (tuy n tính tham s
ế ố hằ ố
ng) có b n mô hình toán tương đương nhau là:
• Hàm trọ ợ
ng lư ng k
g
• Hàm quá độ k
h
• Hàm truyề ạ
n đ t ( )
G z
• Mô hình trạng thái
Tương ứng cũng sẽ có bốn mô hình dự báo và từ đó là bốn phương pháp điều
khiển d báo tuy n tính khác nhau, bao g
ự ế ồm:
• Điề ể ự
u khi n d báo theo mô hình MAC (Model Algorithmic Control)
• Ma trậ ộ ọ ề ể
n đ ng h c đi u khi n DMC (Dynamic Matrix Control)
29. 22
• Điề ể ự ổ
u khi n d báo t ng quát GPC (Generalized Predictive Control)
• Bộ điều khiển dự báo ph ng thái
ản hồ ạ
i tr [2].
b) Điều khi báo ph song tuy
ển dự ản hồ ạ
i tr ng thái hệ ến
Điề ể ự ả
u khi n d báo ph n hồi tr c áp d
ạng thái hệ ế ợ
song tuy n đư ụng cho từng
bài toán riêng bi t, c
ệ ụ thể là:
• Điề ể ổ ị ệ
u khi n n đ nh h
• Điề ể ệ ẫ
u khi n bám tín hi u m u ở đầu ra
2.2 Phương pháp điều khiể ự ự ạ
n d báo d a trên m ng nơ-ron
2.2.1 Nhận dạng dùng mạng nơ-ron
Đị ậ ạ ậ ạ ự ệ ể ị
nh nghĩa nh n d ng: Nh n d ng là phương pháp th c nghi m đ xác đ nh
một mô hình cụ thể trong l p các mô hình thích h p, sao cho sai l
ớ ợ ệch giữa mô hình
đó vớ ệ ố ỏ
i h th ng là nh nhất.[3]
Bài toán nhận dạ ặ ể ể ậ
ng có ba đ c đi m đ nh n biết đó là:
+ Th c nghi n bi
ự ệ ậ
m, nh ết qua vi u vào và ra.
ệc đo các tín hiệ
+ Lớp các mô hình thích h u v
ợ ợ
p, có đư c từ những thông tin ban đầ ề ố
th ng
(gọi chung lại là thông tin A priori ).
-
+ Sai l t t
ệch giữ ợ
a mô hình có đư c và hệ thống là nhỏ ấ
nh t, được nhận biế ừ
hàm m c tiêu mô t sai l c th c hi
ụ ả ệ ợ
ch và đư ự ện bằng phương pháp tối ưu.[7].
Dự ị
a trên các đ nh luậ ả ị
t cơ b n như: đ nh luật bả ợ ị
o toàn năng lư ng, đ nh luật
bảo toàn vật chất, đ t Newton, đ t Kirch Hoff, đ
ị ậ
nh lu ị ậ
nh lu ị ậ
nh lu t Ohm,… có thể
xây dự ợ
ng đư c mô hình toán đối tượng. Thông qua dữ ệ ầ ầ ặ
li u đ u vào và đ u ra ho c
tính toán ướ ợ ự ế ố ủ ợ ị
c lư ng tr c ti p các tham s c a mô hình toán đư c xác đ nh. Tuy
nhiên, trong công nghi ng truy
ệ ệ ố
p như các h th ền nhiệ ộ
t, đ ng học chất lỏng việc
xây dựng mô hình toán là vô cùng ph y s
ức tạp, vì vậ ẽ ử ụ
s d ng mạng nơ-ron nhân
tạo.
Phương pháp huấn luyện.
M -
ạng nơ ron nhiều l p x
ớp có thể ấ
x ỉ gần đúng mộ ấ ế ủ
t hàm b t kì, ti p đó là th
t c
ục tính chọn các thông số ủa các mạng cho mộ ố ợ
t đ i tư ng cụ ể ợ
th đư c gọi là quá
trình hu n n.
ấ luyệ
30. 23
Hiện nay có r n luy n m
ất nhiề ấ
u phương pháp hu ệ ạng. Chúng có thể hu n
ấ
luyện mạng bằng các phương pháp như:
• Dùng thuậ ề ợ
t toán lan truy n ngư c
- Gradient
- Newton
- Levenberg Marquardt
• S d M
ử ụng công cụ atlab huấn luyện nơ-ron như:
- T -
ạo mạng nơ ron mô phỏng trong Matlab
- -
Các hàm huấn luyện mạng nơ ron trong Matlab
Trong bài toán này sẽ s d
ử ụng Matlab để huấn luy n m
ệ ạng, mà phương pháp
dùng sẽ là Thuậ ề ợ
t toán lan truy n ngư c.
a) Thuậ ề
t toán lan truy n ngược
Xét m t m ng truy n th
ộ ạ ề ẳng có M lớp, R đầu vào và M
S đầu ra. Cho tập dữ
liệu mẫu { ; }
i i
p t
Ω = , 1, 2,..,
i Q
= , trong đó i
p là đầu vào mẫu thứ i và i
t là đầu
ra m u th
ẫ ứ i (đích). Đị ụ
nh nghĩa hàm m c tiêu:
1
1
1
min
1
min
Q
T
q q
q
Q
q
q
J
J e e
Q
Q
=
=
= →
= →
∑
∑
(2.1)
Trong đó q
q
T
q
J e e
= , M
q q q
e t a
= − với M
q
a là đầu ra của mạ ứ
ng tương ng vớ ầ
i đ u
vào q
p .
Để ọ ố ố ủ ạ ử ụ
tìm các tr ng s t i ưu c a m ng s d ng phương pháp gradient ngẫu
nhiên cho mẫ ứ
u th q như sau:
, ,
,
( 1) ( ) q
m m
i j i j m
i j
J
w k w k
w
α
∂
+ = −
∂
(2.2)
trong đó , ( )
m
i j
w k c -
là trọng số ủa nơ ron thứ i l
thuộc ớp m liên kết vớ ầ
i đ u ra của
nơ-ron thứ j p
thuộc lớ 1
m − , k thể hiện giá trị hiện tại, 1
k + m
thể hiện giá trị ới,
0
α > h
là tố ộ
c đ ọc.
31. 24
Đố ớ ỡ
i v i ngư ng có:
( 1) ( ) q
m m
i i m
i
b
J
k b k
b
α
∂
+ = −
∂
(2.3)
trong đó m
i
b -
ngưỡng nơ ron thứ i p
thuộc lớ m .
Việc tính
,
q
m
i j
J
w
∂
∂
rất phức tạp khi mạng có nhi u l
ề ớp. Do đó dùng quy tắc đạo
hàm hợp như sau:
a a n
w n w
∂ ∂ ∂
=
∂ ∂ ∂
(2.4)
Trong đó ( )
a f n
= và 0
n wp b
= +
Áp dụng quy tắc trên cho (2.2), có:
, ,
m
q q i
m m m
i j i i j
J J n
w n w
∂ ∂ ∂
=
∂ ∂ ∂
(2.5)
Nhưng
m
i
n là đầu vào net của nơ-ron thứ i p
thuộc lớ m , do đó nó là một
hàm tuy a các tr
ến tính củ ọng số và ngưỡng, có:
1
1
1
,
m
S
m m m
i i v
v
m
i v
n b w a
−
=
−
+
= ∑ (2.6)
trong đó
1
m
v
a −
-
là đầu ra của nơ ron thứ v thuộc lớ ớ
p trư c đó 1
m − . Vì vậ ợ
y, đư c:
1
,
m
m
i
j
m
i j
n
a
w
−
∂
=
∂
(2.7)
và
,
1
m
i
m
i j
n
w
∂
=
∂
(2.8)
Đị ộ ạ ủ ứ
nh nghĩa đ nh y c a nơ-ron th i của lớp
m
là:
q
m
i m
i
J
s
n
∂
=
∂
(2.9)
Thay (2.9), (2.7), (2.8) vào (2.2) và (2.3) được:
1
, ,
( 1) ( )
m m m m
i j i j i j
w k w k s a
α −
+ = − (2. )
10
32. 25
và
( 1) ( )
m m m
i i i
b k b k s
α
+ = − (2. )
11
Biểu diễ ớ ạ
n dư i d ng ma trận có:
1
( 1) ( ) ( )
m m m m T
W k W k a
α −
+ = − (2. )
12
và
( 1) ( )
m m m
b k b k s
α
+ = − (2. )
13
trong đó
1
2
q
m
m
q
m
q
m
q
m
i
J
s
n
J
n
J
n
J
n
∂
=
∂
∂
∂
∂
= ∂
∂
∂
(2. )
14
l - p
à véc tơ độ nhạy của lớ m.
L :
ại có
1 1
,
1
1
1
,
1
,
1
,
( )
( )
m
S
m m m
i l l i
m
l
i
m m
j j
m
m i
i l m
j
m m
j
m
i l m
j
m m m
i l j
w a b
n
n n
a
w
n
f n
w
n
w f n
+ +
+
=
+
+
+
∂ +
∂
=
∂ ∂
∂
=
∂
∂
=
∂
=
∑
33. 26
1 1 1
1
1
1
1 1
1 2
2
1
1 1 1
1
1
2
1
2
2
1
1
1
1
2
( )
m
m
m m m
m
m m m
m m m
m m
S
m
m
m m m
i
m
j
m m m
m m
S
m
m
S
m
S
m
S
S
n n n
n n n
n n n
n n n n
n
n n n
n n n
W F n
+ + +
+ + +
+ + +
+
+ + +
+
∂ ∂ ∂
∂ ∂ ∂
∂ ∂ ∂
∂ ∂ ∂ ∂
=
∂
∂ ∂ ∂
∂ ∂ ∂
=
(2. )
15
t :
rong đó
1
2
( ) 0 0
0 ( ) 0
( )
0 0 ( )
m
m m
m m
m m
m m
S
f n
f n
F n
f n
=
(2. )
16
S d
ử ụng công thức (2.15) và quy tắc chuỗi có:
1
1
1
1
1 1
( )( )
( )( )
q
m
m
T
m
q
n m
q
m m m T
m
m m m T m
J
s
n
J
n
n n
J
F n W
n
F n W s
+
+
+
+
+ +
∂
=
∂
∂
∂
=
∂ ∂
∂
=
∂
=
Từ công thức này có thể tính được độ nhạy c p l
ủa các lớ ần lượ ừ
t t lớp đầu ra ngược
trở ề ớ ầ
v l p đ u vào như sau:
1 2 1
M M
s s s s
−
→ → → →
(2. )
17
Đây chính là cơ sở ủ ậ ề ợ ầ ộ
c a thu t toán lan truy n ngư c. Đ u tiên tính đ nh p
ạy của lớ
đầ Ứ ớ ẫ ứ
u ra. ng v i m u th q :
có
34. 27
( )
2
1
( ) ( )
2( )
M
q
M
i M
i
T
q q q q
M
i
S
j j
j
M
i
i
i i M
i
J
s
n
t a t a
n
t a
n
a
t a
n
=
∂
=
∂
∂ − −
=
∂
∂ −
=
∂
∂
= − −
∂
∑
(2. )
18
Do đó véc-tơ độ ạ ủ ớ đầ
nh y c a l p u ra là:
2 ( )( )
M M M
q q
s F n t a
= − −
(2. )
19
Tổng kết lại có thuật toán lan truyề ợ
n ngư c:
• Quá trình khở ạ ạ ọ ị ầ ấ ả ọ ố
i t o m ng: Ch n giá tr ban đ u cho t t c các tr ng s và
ngưỡ ạ
ng trong m ng.
• Quá trình lan truyề ậ
n thu n .
0
a p
= (2. )
20
1 1 1 1
( )
0,1, , 1
m m m m m
a f W a b
m M
+ + + +
= +
∀ = −
(2. )
21
M
a a
= (2. )
22
• Quá trình lan truyề ợ ộ ạ
n ngư c đ nh y.
2 ( )( )
M M M
s F n t a
= − −
(2. )
23
1 1
( )( )
1, ,2,1
m m m m T m
s F n W s
m M
+ +
=
∀ = −
(2. )
24
• Quá trình cậ ậ ố ủ ạ
p nh t các tham s c a m ng.
1
( 1) ( ) ( )
m m m m T
W k W k s a
α −
+ = − (2. )
25
và
( 1) ( )
m m m
b k b k s
α
+ = − (2. )
26
Công th n luy n ng
ứ ừ
c tính t (2.2 i
0) đến công thức (2.26) được gọ là huấ ệ ẫu
nhiên, bởi vì các tham s a m t m t l
ố ủ
c ạng sẽ ợ
đư c cập nhậ ộ ần mỗi khi m t b
ộ ộ tín
hiệu vào ra mẫ ứ
u th q d
được sử ụng.
35. 28
N d c c
ếu sử ụ ồ
ng đ ng thời tất cả các mẫ ể
u đ ập nhật tham số ủa mạng một
lần thì gọi là quá trình huấn luyện theo mẻ ứ
. Khi đó công th c cập nhật các tham số
cho mạng như sau:
1
1
( 1) ( ) ( )
Q
m m m m T
q q
q
W k W k s a
Q
α −
=
+ = − ∑ (2. )
27
1
( 1) ( )
Q
m m m
q
q
b k b k s
Q
α
=
+ = − ∑ (2. )
28
t s
rong đó chỉ ố q tương ứng với mẫu thứ q .
V u
ới mỗi mẫ q , ph a các l
ả ầ ộ ạ
i tính đ u ra và đ nh y củ ớp trong mạng, sau đó tính
giá tr t tham s a m
ị ớ
gradient trung bình trư c khi cập nhậ ố ủ
c ạng. [3].
b) Phương pháp tố ụ
i ưu hóa hàm m c tiêu
Khi ph sao cho m
ải tìm các tham số ủ
c a mạng nơ-ron để ạng nơ-ron có thể
thực hi t m t s
ện tố ộ ố chức năng như phân loạ ọ ẽ ử
i hay h c, s s dụng phương pháp tối
ưu hóa Nó đư ng cách bình phương sai l
hàm mục tiêu. ợ ử ụ ằ
c s d ng b ệch giữ ầ
a đ u
ra c a m c vào các tham s a m
ủ ạng vớ ầ
i đ u ra mẫu, phụ thuộ ố ủ
c ạng nơ-ron.
• Hàm mục tiêu
Cho một hàm mục tiêu ( )
F x v -
ới véc tơ biế ố
n s (các tr , bias c a m
ọng số ủ ạng)
là 1 2 .
[ ]
.. T
m
x x x x
= . F là tổ ệ
ng bình phương sai l ch giữ ầ
a đ u ra của mạng
v T
ớ ầ
i đ u ra mẫu, là một hàm phi tuyến không âm. ìm x* sao cho hàm F đạt giá
trị ỏ ấ
nh nh t. Dùng phương pháp lặp để ệ
tìm nghi m:
1
k k k k
x x p
α
+ = +
Với 0
k
α > h l .
là tố ộ
c đ ọc ở ần hiện tại k
k
p .
là hướng tìm [3].
2.2.2 Phương pháp tối ưu
Một số phương pháp:
- Phương pháp hạ sâu nhất (Steepest descent)
- Phương pháp Newton
- Phương pháp Levenberg Marquardt
36. 29
a) Phương pháp hạ ấ
sâu nh t (Steepest descent)
Theo phương pháp lặ ỗ ặ ố
p, sau m i vòng l p mong mu n:
1
( ) ( )
k k
F x F x
+
< (2. )
29
Khai triển Taylor hàm F xung quanh k
x b
và xấp xỉ ậc nhất, có:
1
( ) ( )
( )
k k k
T
k k k
F x F x x
F x g x
+ = + ∆
≈ + ∆
(2. )
30
trong đó:
( )
k
k
k x x
x x
g F x
F
x
=
=
= ∇
∂
=
∂
(2. )
31
l -
à véc tơ gradient của hàm F -
theo vec tơ x :
là
1
k k k
k k
x x x
p
α
+
= −
=
(2. )
32
Điề ệ ỏ
u ki n (2.29) th a mãn khi:
0
T T
k k k k k
g x g p
α
∆ = < (2. )
33
Suy ra
0
T
k k
g p < (2. )
34
v h
ì tố ộ
c đ ọc 0
k
α > .
Giả ử độ ớ
s l n của véc-tơ hướng tìm k
p không đổi, khi đó T
k k
g p đạt giá trị
nh nh
ỏ ấ ợ
t khi hai véc-tơ này ngư c chiều nhau:
k k
p g
= − (2. )
35
Thay (2.35) vào (2.30) có:
1
k k k k
x x g
α
+ = − (2. )
36
Đây đư i là phương pháp h
ợ ọ
c g ạ sâu (steepest descent), vì hư ng tìm ngư
ớ ợc
hướ ớ ớ ủ ị ụ ả ề
ng v i hư ng c a véc-tơ gradient làm cho giá tr hàm m c tiêu gi m nhi u
nhất.[3].
38. 31
b) Phương pháp Newton
Phương pháp Newton-Raphson
Phương pháp này có nguồ ố ừ ậ ặ ủ ể ệ
n g c t thu t toán l p c a Newton đ tìm nghi m
đa th c, sau đư
ứ ợ ở ộ ể
c Raphson m r ng đ tìm nghiệm hệ phương trình phi tuyến khả
vi:
( ) 0
f p = với n
f R
∈ và n
p R
∈ (2. )
37
Trướ ọ
c tiên g i *
p )
là nghiệm của (2.37
1
( *) 0
( *) 0
( *) 0
n
f p
f p
f p
= ⇔ =
(2. )
38
Phân tích thành chu i Taylor t
(2.38) ỗ ạ ể
i đi m k
p rồi bỏ qua tất cả các thành
phần bậ ỗ ẽ
c cao trong chu i, s được:
0 ( *) ( ) ( * )
k k k
f p f p H p p
= ≈ + − (2. )
39
Trong đó:
1 1 1
1 2
2 2 2
1 2
1 2
k
k
n
n
k
p p
n n n
n p p
f f f
p p p
f f f
f
p p p
H
p
f f f
p p p
=
=
∂ ∂ ∂
∂ ∂ ∂
∂ ∂ ∂
∂
∂ ∂ ∂
= =
∂
∂ ∂ ∂
∂ ∂ ∂
k
H là ma trận Jacobi của vector hàm ( )
f p t m
ạ ể
i đi k
p .
Biểu thức :
1
1 1
0 ( ) ( ) ( )
k k k k k k
k k
f p H p p p p H f p
−
+ +
= + − ⇒ = − (2. )
40
Áp dụng thu Raphson trên b
ật toán Newton- ài c
toán tố ộ
i ưu không ràng bu
tìm đượ ệ
c nghi m *
p ):
cho hệ phương trình (2.37
* ( )
p argminQ p
= (2. )
41
Khi ( )
Q p l k
là khả vi hai ần sẽ có từ ết luận:
39. 32
( *) 0 ( *) (0)
gradQ p f p
= ⇔ = với ( ) ( )
f p gradQ p
=
=>
1
1
( )
k k k k
p p H gradQ p
−
+
= − (2. )
42
trong đó:
2 2 2
1 1 1 2 1
2 2 2
2
2 1 2 2 2
2
2 2 2
1 2
k
k
n
k n
p p
n n n n p p
Q Q Q
p p p p p p
Q Q Q
f Q
H p p p p p p
p p
Q Q Q
p p p p p p
=
=
∂ ∂ ∂
∂ ∂ ∂ ∂ ∂ ∂
∂ ∂ ∂
∂
∂
= = ∂ ∂ ∂ ∂ ∂ ∂
∂ ∂
∂ ∂ ∂
∂ ∂ ∂ ∂ ∂ ∂
đượ ọ ậ ủ
c g i là ma tr n Hesse c a hàm vô hướng ( )
Q p tại điểm k
p . Do ( )
Q p đượ ả
c gi
thiết là kh vi hai l
ả ần nên k
H là ma trậ ố
n đ i xứng vì:
2 2
i j j i
Q Q
p p p p
∂ ∂
=
∂ ∂ ∂ ∂
K n
ết luậ : T k
ừ đây dễ dàng kiểm chứ ợ ắ
ng đư c tính đúng đ n của một số ết
luận sau về phương pháp Newton-Raphson:
- Nếu k
H xác định dương thì 1
( ) ( )
k k
Q p Q p
+
< . Th t v y, t ), t c là t
ậ ậ ừ (2.42 ứ ừ:
1
1
( )
k k k k
p p H gradQ p
−
+
− = −
hay:
1
1
( ) ( ) ( ) ( ) 0
T T
k k k k k k
gradQ p p p gradQ p H gradQ p
−
+
− = − <
thấy góc ϕ tạo bởi hai vector 1
k k
p p
+ − và ( )
k
gradQ p phải lớn hơn 90o
, nên cũng
phải có 1
( ) ( )
k k
Q p Q p
+
< .
- -
Phương pháp Newton Raphson cũng được áp dụng cho cả bài toán tối ưu tìm
đượ ị ự ạ
c giá tr c c đ i:
* ( )
p argmaxQ p
=
Tuy nhiên khi đó n m
phải luôn là ma trậ ị
n xác đ h âm ở ỗ ớ
i bư c lặp.
- Phương pháp Newton-Raphson (2.42) cũng là một dạng phương pháp line search
vớ ớ
i hư ng tìm:
40. 33
1
( )
k k k
h H gradQ p
−
= −
và khoả ớ
ng cách bư c tìm 1
k
s = .
- Để tăng hiệu quả tìm kiếm nghiệm tối ưu *
p h i t
theo nghĩa tăng tố ộ
c đ ộ ụ cho
thuật toán, có thể ổ ả
b sung kho ng cách bước tìm tối ưu k
s vào công thức tính lặp
(2. thành:
42) để nó trở
1
k k k k
p p s h
+
= + với 1
( )
k k k
h H gradQ p
−
= − (2. )
43
- Với bài toán tố ạ
i ưu d ng toàn phương
1
( )
2
T T
Q p p Ap b p
= + có 0
T
A A
= > thì
phương pháp Newton-Raphson sẽ cho ra nghiệm tối ưu *
p chỉ sau đúng mộ ớ
t bư c
tính. Th t v y, t
ậ ậ ừ:
( )
k k
gradQ p Ap b
= + và
2
2
k
k
p p
Q
H A
p =
∂
= =
∂
t d 42
hì khi sử ụng công dụng thức tính lặp (2. ), có ngay từ bướ ầ
c đ u tiên vớ ể
i đi m
xu n:
ấ ọ
t phát tùy ch
1 1 1
1 0 0 0 0 0
( ) ( )
p p H gradQ p p A Ap b A b
− − −
= − = − + = −
Do giá trị 1
p c
không phụ thuộ 0
p , nên nó phả ệ
i là nghi m tối ưu 1
*
p p
=
Thuật toán chi ti t c
ế ủa phương pháp Newton- g
Raphson sẽ ồ ớ
m các bư c sau:
Thuật toán T
: ìm nghiệm tối ưu theo phương pháp Newton-Raphson:
1) Chọn điểm khởi phát 0
p thích hợp và một giá trị 0
ε > .
đủ nhỏ
2) Thực hiện lầ ợ ớ ớ
n lư t các bư c sau v i k=0,1,…
- Xác đị ớ
nh hư ng tìm k
h (2. )
theo công thức 43 và từ đó là 1
k
p +
, trong đó khoảng
cách bước tìm k
s có thể được chọn 1
k
s = hay là một giá trị tùy ý thỏa mãn điều
kiện Wolf hoặc theo phương pháp thu nhỏ ả
kho ng nghiệ ặ
m ho c theo
(
0
argmin ( )
k
k k
s
s Q p sh
>
= + ) v - c
ớ ớ ợ ớ
i có hư ng ngư c hư ng với véc tơ gradient ủa
hàm m c tiêu
ụ ( )
Q p t i.
ại thờ ể
i đi m hiện tạ
41. 34
- Kiểm tra: Nếu 1
| ( ) ( ) |
k k
Q p Q p ε
+ − < thì dừng và cho ra đáp số 1
* k
p p +
≈ . Ngược
lại thì gán : 1
k k
= + r .
ồi quay lạ ớ
i bư c a). [2]
Phương pháp tựa Newton (Quasi Newton)
Phương pháp Newton Raphson có mộ ạ ế
t h n ch cơ bản khi đưa vào ứ ụ
ng d ng,
đó là vi i xác đ
ệc phả ị ợ
nh đư c ma trậ ị ả
n Hesse ngh ch đ o 1
k
H −
tại từ ớ
ng bư c lặp.
Để ắ ụ ợ ể ế ứ
kh c ph c như c đi m này, đã thay th công th c (2.3 ) thành:
9
1
0 ( ) ( )
k k k k
f p f p H d
+
= ≈ + (2. )
44
v i:
ớ
1
k k k
d p p
+
= − , ( ) ( )
k k
f p gradQ p
=
Khi đó:
1
( ) ( )
k k k k k
d H gradQ p B gradQ p
−
= − = − (2. )
45
trong đó k
B là giá trị x c
ấp xỉ ủa 1
k
H −
. Ma trận 1
k k
B H −
= cũng s đư
ẽ ợ ặ
c tính l p theo
1
k
B − tại từ ớ
ng bư c lặp k với nhiề ả ấ ỉ ả
u phiên b n tính x p x khác nhau (b ng 2.1).
Chúng chủ ế ợ ừ ệ ầ
y u đư c rút ra t quan h g n đúng:
1
1
( ) ( ) ( ) ( )
2
T T
k k k k k k k k k
Q p Q p d Q p gradQ p d d H d
+
= + ≈ + +
1
( ) ( )
k k k k
gradQ p gradQ p H d
+
=> ≈ +
k k k
d B y
≈
=> với 1
( ) ( )
k k k
y gradQ p gradQ p
+
= − và 1
k k
B H−
= (2. )
46
Thuật toán: Tìm nghiệm tối ưu theo phương pháp Quasi Newton
1) Chọn điể ở
m kh i phát 0
p thích hợp và một giá trị 0
ε > đủ nhỏ. Tính ma trận
Hesse nghị ả
ch đ o 1
−
= .
2) Thự ệ
c hi n lầ ợ ớ ớ
n lư t các bư c sau v i 0,1,
k = … .
a) Tính ( )
k k k k
d s B gradQ p
= − với 0
k
s > được thỏ ề
a mãn đi u kiện Wolf.
b) Tính 1
k k k
p p d
+ = + .
c) Kiểm tra, nếu 1
| ( ) ( ) |
k k
Q p Q p ε
+ − < thì dừ ố
ng và cho ra đáp s 1
* k
p p +
≈ .
42. 35
d) Tính 1
( )
k
gradQ p + và 1
( ) ( )
k k k
y gradQ p gradQ p
+
= − . Từ ị
đó xác đ nh 1
k
B +
theo công thức ở ả
b ng (2.1) rồi gán : 1
k k
= + .
và quay về bước a)
B 2.1
ảng : Bảng công thức tính ma trận Hesse
Tên 1
1 1
k k
H B
−
+ +
=
Davidon-Fletcher Powell
-
(DFP)
1
T T
T
k k k k
k k
k k T T
k k k k k
B y y B
d d
B B
y d y B y
+ + −
=
Broyden- - -
fletcher Goldfarb
Shanno
(BFGS)
1
T T T T T
k k k k k k
k k
T T T
k k k k k k
T
y d y d d d
B
y
I I
B
y d d y d
+
= − − −
Symmetric rank one
(SR1)
1
( )( )
( )
T
k k k k k k
k k
k k k k
d B y d B y
B B
d B y y
+ = +
− −
−
Broyden 1
( ) T
k k k k k
k k T
k k k
d B y d B
B B
d B y
+ +
−
=
Phương pháp Gauss-Newton
Xét một bài toán có hàm mụ ạ
c tiêu d ng toàn phương:
Với hàm ( )
Q p dạng toàn phương:
1
( )
2
T T
Q p p Ap b p c
= + + (2. )
47
Cho ma trận A là ma trậ ố
n đ i xứng. Khi đó ( )
Q p là hàm lồi khi và chỉ khi
A
bán xác đị ợ
nh dương (đư c kí hiệu là 0
T
A A
= ≥
). S ng tính ch t nêu trên
ử ụ
d ấ
về nghiệm tối ưu *
p được :
0 ( *) *
gradQ p Ap b
= = +
Do đó nế ậ
u A còn là ma tr n không suy biến, t c là khi ma tr n A còn là ma
ứ ậ
trận xác dịnh dương (đượ ệ
c kí hi u là 0
T
A A
= ≥ ), thì bài toán sẽ ệ
có nghi m tối ưu
duy nhất:
43. 36
1
*
p A b
−
= − (2. )
48
Gauss đã gi i ưu không ràng bu
ớ ạ ố
i h n bài toán t ộ ổ
c t ng quát
* ( )
p argminQ p
= p
cho trường hợ ( )
Q p là tổ ủ
ng bình phương c a m hàm vô
hướ ả
ng, kh vi ( )
i
q p , 1,2,3, ,
i m
= … -
(được gọi là bài toán LS Least Squares):
2 2
1
( ) ( ) ( ) ( ) | ( ) |
m
T
i
i
Q p q p q p q p q p
=
=
=
= ∑ (2. )
49
trong đó:
1 2
( ) ( ( ), ( ),..., ( ))T
m
q p q p q p q p
=
với k
p là giá trị tìm được tạ ớ
i bư c lặp thứ k , k
d là lượng hiệ ỉ ể
u ch nh cho nó đ
được 1
k
p +
ở bước lặp tiếp theo, tức là:
1
k k k
p p d
+ = +
T :
ừ công thức xấp xỉ
1
( ) ( ) ( )
k k k k k k
q p q p d q p J d
+ = + ≈ + với
k
k
p p
q
J
p
=
∂
=
∂
Sẽ có:
2
1
( ) ( ) | ( ) | ( ( ) ) ( ( ) )
T
k k k k k k k k k k k
Q p Q p d q p d q p J d q p J d
+
= + + +
≈
= +
Do đó bài toán xác đị ợ ệ
nh lư ng hi u chỉnh k
d ở bước lặp thứ k sao cho
1
( )
k
Q p min
+ → là tương đương với:
( ) ( ) 2( ( )) ( ) ( ) min
k
T T T T
k k k k k k k k k k k
d
Q p d d J J d J q p d q p q p
+ ≈ + + →
( min
( ) 2( ))
k
T T T
k k k k k k k
d
d J J d J q p d
⇔ →
Thấ ạ
y đây l i chính là bài toán tối ưu toàn phương (2.47) đã xét ở bài toán
d k
ạng toàn phương trên, nên từ ết quả (2.48) tương ứ ợ
ng, thu đư c:
1
)
( ) (
T T
k k k k k
d J J J q p
−
= −
Vậy:
1
1
( ) ( ( )
T T
k k k k k k
p p J J J q p
−
+
= − (2. )
50
44. 37
Dựa vào thuật toán của phương pháp line search ở hình 2.3, đi đến các bước cụ
th au Newto
ể ủ
c a thu t toán G
ậ ss- n để tìm nghiệm tối ưu *
p .
Thuật toán: Tìm nghiệm *
p t -
ối ưu theo phương pháp Gauss Newton:
1) Chọn điể ở
m kh i phát 0
p thích hợp và một giá trị 0
ε > .
đủ nhỏ
2) Thự ệ
c hi n lầ ợ ớ ớ
n lư t các bư c sau v i 0,1,2,
k = …
a) Tính 1
k
p + .
theo (2.39)
b) Kiểm tra, n u thì d c l i thì gán
ế ừ ố ợ
ng và cho ra đáp s . Ngư ạ : 1
k k
= + rồi
quay về bước 0.
Hình 2.2 Đường đồng mứ ỹ đạ
c, véc-tơ gradient và qu o tìm nghiệm tối ưu .[2].
Kết luận:
V - k
ề thuật toán Gauss Newton trên, còn có một số ết luận bổ sung sau:
- Do tạ ể
i đi m tối ưu *
p có ( *) 0
gradQ p = nên điều kiện dừng thuật toán ở đây
bằng 1
| ( |
k
q p ε
+ < , vì có 1 1 1
( ) 2( ( ))
T
k k k
gradQ p J q p
+ + +
= .
- Trong nhiều trư p, đ
ờ ợ
ng h ể ế
k t thúc thuật toán, thì bên cạ ề ệ ừ
nh đi u ki n v a nêu,
còn có thêm đi c đ
ề ệ
u ki n về ố ặ ớ ạ ự
s vòng l p gi i h n c ại là k K
≤ .
45. 38
- Nếu so sánh vớ ớ ở
i phương pháp Newton-Raphson trư c đây thì phương pháp
Gauss ng:
- b
Newton này, ma trậ ợ
n Hesse đã đư c xấp xỉ ằ
2( )
T
k k k
H J J
≈ (2. )
51
Hình 2.3 Nguyên tắc làm việc của phương pháp tìm nghiệ ớ
m có hư ng (line
search) [2].
Điề ớ ệ
u này, v i kí hi u ij
h , , 1,2, ,
i j n
= … c
là các phần tử ủa k
H , là suy ra
đư đi
ợ ừ
c t ều hiển nhiên:
2
1
2
k
m
l l l
ij l
l j i i j
p p
q q q
h q
p p p p
=
=
∂ ∂ ∂
= +
∂ ∂ ∂ ∂
∑ (2. )
52
Cũng như khi kí hiệu ij
h′ , c
là các phần tử ủa T
k k
J J :
thì
1
ij
k
m
l l
l j i
p p
h q q
p p
=
=
∂ ∂
=
∂ ∂
′
∑
Nói cách khác, công th qua các thành
ức xấp xỉ (2.51) có đư c là do đã b
ợ ỏ
ph 2.
ầ ạ
n đ o hàm bậc cao trong ( 52).
46. 39
Thực chất phương pháp Gauss-Newton cũng là phương pháp tìm nghiệm
có hư i hư
ớ ớ
ng (line search) v ớng tìm:
1
( ) ( )
T
k k k k
k
T
h J J J q p
−
= − (2. )
53
- Và khoảng cách giữ ớ
a các bư c tìm 1
k
s = tại tất cả các bước lặp.
Để ạ ệ ề ỉ ố ộ ộ ụ ậ ề
linh ho t hơn trong vi c đi u ch nh t c đ h i t cho thu t toán, đi u
chỉ ớ
nh bư c tìm k
s t
ở ừ ớ
ng bư c lặp k bằng một giá trị được chọn thỏ ề
a mãn đi u
kiện Wolf, ho ng nghi
ặc chọ ỏ ả
n theo phương pháp thu nh kho ệm, hoặc bằng
phương pháp tối ưu theo
0
(
argmi )
n k
s
k k
s Q p sh
>
= + d c
, thay vì sử ụng giá trị ố định
1
k
s = . Nói cách khác, t i m c l
ạ ỗ ớ
i bư ặp k , công thứ ẽ ợ ằ
c (2.38) s đư c thay b ng:
1
1
( ) ( )
k
T T
k k k k k k k k
k
p p J J J q p h
s p s
−
+
+
= − = (2. )
54
- c l
Cuối cùng, ở bướ ặp k , để ợ
có đư c 1
k
p + , cho dù theo (2.50) hoặc (2. 4), thì
5
cũng luôn cầ ả
n ph i có giả thiết T
k k
J J là nghị ả ợ ể
ch đ o đư c. Đ có điều này, do kích
thước ma trận k
J là m n
× , nên ít nh t s các ph
ấ ố ần tử n c a
ủ p phả ợ
i không đư c
nhiều hơn m c a
là số các phần tử ủ q , t c là chí ít ph i có
ứ ả m n
≥ . [2].
Điề ệ ệ ị ả
u ki n Wolf cho vi c xác đ nh kho ng cách bước tìm.[2].
Điề ệ ợ ế ế ộ ả ữ
u ki n Wolf đư c bi t đ n như m t gi i pháp h u hiệ ị
u giúp xác đ nh
đượ ấ
c x p xỉ ả ớ
kho ng cách bư c tìm k
s tố ợ
i ưu, đư c hiểu là nghiệm của
( )
k k k
s argminQ p sh
= + . Sau đây s g t
ẽ ọi nghiệm xấp xỉ ối ưu của
( )
k k k
s argminQ p sh
= + là khoả ớ
ng cách bư c tìm thích hợp cho các phương pháp
line search.
Điề ệ ộ
u ki n Wolf có n i dung như sau:
Đị ề
nh lí đi u kiện Wolf: khoả ớ
ng cách bư c tìm k
s
sẽ là thích hợp nếu:
+ 1
)
( ) ( ( )
T
k k k k k k k
Q p s h Q p c s h gradQ p
+ ≤ +
+ 2
)
( ) (
T T
k k k k k k
h gradQ p s h c h gradQ p
+ ≥
trong đó 1
0 c
< và 2
0 1
c
< < .
là hai hằng số
47. 40
c) Phương pháp Levenberg Marquardt
Ở phương pháp Gauss-Newton, như đã được biết trư c đây, thì đ
ớ ể có hướng
tìm k
h 3) n
theo công thức (2.5 , cần phải có giả thiết ma trậ T
k k
J J nghị ả ợ
ch đ o đư c
và giả thiết đó sẽ không có đượ ế
c n u như số các các hàm ( )
i
q p , 1,2, ,
i m
= ít hơn
số các phần tử p . Mặc dù trong các trườ ợ
ng h p khi T
k k
J J không nghị ả ợ
ch đ o đư c,
vẫn có thể xác định hướng tìm k
h là một nghiệm thỏa mãn:
( ) ( )
T T
k k k k k
J J h J q p
= − (2. )
55
Levenberg Marquardt nh s
đề ấ
xu t chỉ ửa phương trình (2.55) cho bài toán
LS đã nêu ở -
Gauss Newton thành:
( ) ( )
T T
k k k k k
J J D h J q p
δ
+ = − (2. )
56
với 0
δ > là hệ ố ợ
s đư c tha i trong t
y đổ ừ ớ
ng bư c lặp, gọi là hệ ố ả
s suy gi m
Levenberg Marquardt, ( ), 1,2, ,
i
D diag d i n
= = là ma trậ ờ
n đư ng chéo có các
phần tử i
d chính là các phần tử trên đường chéo chính của ma trận T
k k
J J , t c là:
ứ
[ ]
T
i k k ii
d J J
=
M s
ụ ổ
c đích thay đ i hệ ố suy giảm 0
δ > là luôn tạ ợ
o ra đư c sự đơn điệu
giảm cho dãy | ( ) |
k
q p . Có thể ậ
nh n th y là khi
ấ 0
δ = , công thức Levenberg
Marquardt (2. ) tr
56 ở về dạng ban đầu củ ủ
a (2.55) c a Gauss-Newton. Ngược lại khi
δ → ∞, nó lạ ạ
i có d ng:
( )
T
k k k
h J q p
δ = − vì T
k k
J J D D
δ δ
+ →
1 1
( ) ( )
T
k k k k
h J q p gradQ p
= − =
⇒
⇒ 1 ( ) ( )
T T
k
k k k k k k k k k k k
s
p p s h p J q q p s J q q
δ
+ ′
= + = − = − (2. )
57
Do đó hướng tìm k
h -
là véc tơ ngược hướ ớ
ng v i ( )
k
gradQ p , hay nó đã trở
thành phương pháp gradient. Bởi vậy phương pháp Levenberg Marquardt còn
đư c xem như phương pháp trung gian gi
ợ ữa Gauss- .
Newton và gradient
48. 41
7
Hơn nữa, nhìn vào (2.5 ) nhận thấy khi δ càng l c tìm
ớ ớ
n, bư k
s′ càng nhỏ.
Việc chọ ớ
n bư c tìm càng nhỏ càng đả ả
m b o sẽ có 1
( ) ( )
k k
Q p Q p
+ < . Ngượ ạ
c l i, khi
giá trị ủ
c a hàm ( )
Q p đã giảm, lại hoàn toàn có thể ố ộ ộ
tăng t c đ h i t ng cách
ụ ằ
b
b s
ằ ả ớ
ng cách tăng kho ng cách bư c tìm, tức là giảm hệ ố δ .
Như vậ ạ ỗ ặ
y t i m i vòng l p k , nếu có 1
( ) ( )
k k
Q p Q p
+ < thì có thể giảm δ ở
vòng sau. Ngượ ạ
c l i thì ngay ở vùng lặp đó phải tăng δ cho tới khi có lạ ợ
i đư c bất
đẳ ứ
ng th c 1
( ) ( )
k k
Q p Q p
+ < . Nguyên tắc chung là như vậy, song có nhiều phiên bản
khác nhau đư ng tăng gi
ợ ề ấ
c đ xu t cho việ ị ợ
c xác đ nh lư ảm cho δ và mỗi phiên
b u
ả ậ ề
n như v y đ có các ưu nhượ ể ủ
c đi m riêng c a nó.
Ngoài ra, Levenberg Marquardt, m c d
ở pương pháp ặ ù có sự ấ ệ ủ
xu t hi n c a
hướng tìm k
h , song thực chất trong đó còn chứ ả
a c khoảng cách bước tìm và hệ số
suy giảm δ .
Nói cách khác, Levenberg Marquardt
ở phương pháp , không quan tâm tới
khoảng cách bướ ộ
c tìm m t cách tường minh, vì thực chấ ợ ằ
t nó đã đư c n m ẩn trong
h s
ệ ố suy giảm δ , tức là cũng đã nằm ẩ ớ ệ
n cùng v i nghi m k
h của hệ phương trình
đạ ố ế
i s tuy n tính (2.56). Do đó phương pháp này không được xếp vào nhóm các
phương pháp line search.
Thuật toán: Tìm nghiệm tối ưu theo Levenberg Marquardt.
1) Chọn điể ở
m kh i phát 0
p , giá tr i phát
ị ở
kh δ và 0
ε > đủ nhỏ làm điề ệ
u ki n
kết thúc thuật toán. Gán : 0
k = .
2) Tính , ,
T
k k
J J D và ( )
T
k k
J q p .
3) u
Nế ( )
T
k k
J q p ε
< thì dừng và cho ra đáp số * k
p p
≈ .
4) Giải phương trình (2.56) để có k
h . Từ đó tính 1
k k k
p p h
+ = + , ( )
k
Q p và
1
( )
k
Q p + .
5) u
Nế 1
( ) ( )
k k
Q p Q p
+ ≤ thì tăng δ rồi quay về 0. Ngượ ạ
c l i thì gán : 1
k k
= +
và giảm δ r . .
ồi quay về 2) [2]
49. 42
2.2.3 Mô hình mạng nơ-ron
a) Khai triển Taylor
Đị ế
nh lí N
: u hàm ( )
y f x
= có các đạo hàm đến cấp n liên tụ ạ
c trong đo n [a,b]
và có đạo hàm
( 1)
( )
n
f x
+
trong đoạn ( )
,
a b i
thì tồn tạ ( , )
c a b
∈ sao cho 0
( , )
x a b
∈
và với ( , )
x a b
∀ ∈ có :
( ) ( 1)
1
0
0 0
0
( ) ( )
( ) ( ) ( )
! ( 1)!
k n
n
k n
k
f x f c
f x x x x x
k n
+
+
=
= − + −
+
∑ (2. )
58
Với 0 0
( ), 0 1
c x x x
θ θ
= + − < < . .
[4]
Khi f có đạo hàm cấp 1
n + trong ( )
,
a b a
chứ 0
x .
( )
' '' ( )
2
0 0 0
0 0 0 0 0
( ) ( ) ( )
( ) ( ) ( ) ( ) ... ( ) 0 ( )
1! 2! !
n
n n
f x f x f x
f x f x x x x x x x x x
n
= + − + − + + − + −
(2. )
59
Với:
( 1)
1
0
( )
( )
( 1)!
n
n
n
f c
R x x
n
+
+
= −
+
, c n a
ằm giữ x và 0
x .
Khi f có đạo hàm cấp n t i
ạ 0
x :
( )
' '' ( )
2
0 0 0
0 0 0 0 0
( ) ( ) ( )
( ) ( ) ( ) ( ) ... ( ) 0 ( )
1! 2! !
n
n n
f x f x f x
f x f x x x x x x x x x
n
= + − + − + + − + −
(2. )
60
b) uy
T ến tính hóa mạng nơ-ron
Chọn mạng nhiều lớ ể
p đ mô hình hóa mạng phi tuyến (Multilayer Perceptron
n - ) i
eural netwoks MLP . Tuy nhiên, v ệc chọn chi tiết mô hình phi tuyến mô tả là
không còn quan trọng với thiết k n. M t khác ki
ế ộ ề
b đi u khiể ặ ểu cấu trúc mô hình
phi tuyến chung có thể d ng .
được sử ụ để thay thế
Có nhi u ki
ề ểu cấ ủ ấ ả ể
u trúc khác nhau c a c u trúc mô hình cơ b n MLP có th
được xem xét để nhận ra phương pháp mô hình. Tuy nhiên, giả thiết rằng đối tượng
có th ng có th
ể ợ
đư c hệ thố ể ợ
đư c mô tả ở
b i phương trình sau:
ˆ
( ) ( | 1, ) ( ) ( ( ), ) ( )
y t y t t e t g t e t
θ ϕ θ
= − + = + (2. )
61
50. 43
trong đó: ( )
t
ϕ -t
là véc ơ chứ ợ
a đư c các thông tin trạng thái trong quá khứ, g là
hàm network,
phi tuyến b -
ới MLP θ là tham số mô hình (trọng số), ( )
e t là nhiễu
trắng, nhiễu cộng, không phụ ộ
thu c vào thông tin quá khứ.
Bằng cách đưa g , cái mà được giả thiế ạ ở
t t o b i 2 lớ ớ
p -
MLP network v i
các hàm kích ho t hyperbolic
ạ ( tansig ) tiếp tuyến trong các hàm tansig lớp 1 và
tuyến tính lớp 2, được dự đoán bằng công thức sau:
0 0
1 1
ˆ( | ) W tanh ( )
n
q
j ji i j
j i
y t w t w W
ϕ
θ ϕ
= =
= + +
∑ ∑ (2. )
62
t h a
rong đó sự ợp thành củ ,
,W ,w
j j i
θ .
các trọng số
Để ả ậ ự ậ ợ ế ế ệ ố ề ể ờ
gi m b c t do và thu n l i trong thi t k h th ng đi u khi n, thư ng
đượ ấ ạ
c xem xét các c u trúc mô hình có d ng ARX, ARMAX, OE giống như véc-tơ
h .
ồ ợ
i quy đư c xem xét
Trong khối NARX, các véc-tơ ( )
t
ϕ là những biến đ u vào và đ
ầ ầu ra quá
khứ ( 0
d > ).
biểu thị thời gian trễ
[ ]
( ) ( 1) ( ) ( ) ( 0)
T
t y t y t n u t d u t d m
ϕ = − − − − −
(2. )
63
Tuy thu
ến tính hóa ở ộ
m t thờ ể
i đi m nhấ ị
t đ nh trình bày chi ti t m t k
ế ộ ỹ ật
tuyến tính hóa mạng nơ-ron mô hình xung quanh điể ạ ộ ệ
m ho t đ ng hi n tại.
Giả ử ằ
s r ng mô hình NARX củ ợ ị
a quy trình đang xem xét đã đư c xác đ nh:
( ) ( ( ), ) ( )
y t g t e t
ϕ θ
= + (2. )
64
v -
à thể hiện véc tơ hồi quy, ( )
t
ϕ là trạng thái của quá trình. Tại thờ ể
i đi m t τ
=
tuyến tính hóa g xung quanh tr n t
ạng thái hiệ ại ( )
t
ϕ để thu được mô hình tuyến
tính xấp xỉ:
1 1
( ) ( 1) ( ) ( ) ( ) ( ) ( )
n m
y t a y t a y t n bu t d b u t d m e t e τ
= − − − − − + − + + − − + −
(2. )
65
trong đó:
51. 44
( ) ( )
( ( ))
( )
i
t
g t
a
y t i ϕ ϕ τ
ϕ
=
∂
= −
∂ −
( ) ( )
( ( ))
( )
i
t
g t
b
u t d i ϕ ϕ τ
ϕ
=
∂
= −
∂ − −
( ) ( ) ( )
y t i y t i y i
τ
− = − − −
( ) ( ) ( )
u t i u t i u i
τ
− = − − −
Đạ ủ ầ ế ầ ợ
o hàm c a đ u ra Network liên quan đ n đ u vào đư c cung cấp bởi:
1
2
0
1 1
ˆ( )
W 1 tanh ( )
( )
q n m
j ji jk k j
j k
i
y y
w w t w
t
ϕ
ϕ
+ +
= =
∂
= − +
∂
∑ ∑ (2. )
66
Tách ph a bi u th c bao g a véc
ần củ ể ứ ồm các thành phần củ - tơ trạ ệ
ng thái hi n
t i ( - h
ạ véc tơ ồ ợ
i quy), đư c mô hình toán x p x
ấ ỉ như sau:
1 1
( ) (1 ( )) ( ) ( ) ( ) ( ) ( )
d
y t A q y t q B q u t e t
ζ τ
− − −
= − + + + (2. )
67
trong đó ( )
ζ τ là phần bù cho sự tuyến tính hóa, đượ ị ở
c xác đ nh b i:
1 1
( ) ( ) ( 1) ( 1) ( 1) ( ) ( )
n m
y a y a y b d b d m e
ζ τ τ τ τ τ τ τ
= + − + + − − − − − − − − −
1 1
1
( ) 1 n
n
A q a q a q
− − −
= + + +
1 1
0 1
( ) n
n
B q b b q b q
− − −
= + + +
Mô hình x p x
ấ ỉ có thể đượ ể ố
c hi u gi ng như mô hình ARX tuyến tính bị ảnh
hưở ở
ng b i nhiễu, ( )
ζ τ phụ ộ
thu c vào điểm hoạ ộ
t đ ng. Nếu những s phi tuy
ự ến
tính c c di
ủ ợ
a quá trình đư ễn ra hợp lí, nó không phải là không hợp lí cho mô hình
( ) ( )
e t
ζ τ + giố ộ ộ
ng như m t quá trình di đ ng ngẫu nhiên y tích phân ti
(lấ ếng ồn
trắng).
( )
( ) ( )
v t
e t
ζ τ + =
∆
(2. )
68
Đây là mộ ổ ế ờ ờ ử ụ ề ể
t phép ph bi n thư ng đư ng s d ng trong đi u khi n và thiết
k h t
ế người quan sát cho mô hình xấp xỉ ằng số (hoặc giá trị thay đổi từ ừ) nhiễu.
Mô hình tuy n tính hóa s
ế ẽ ằ ờ
n m trong trư ng hợp tương đương với mô hình ARZX
(ARX tích hợp).
Đị ậ ề ể
nh lu t đi u khi n: Ý tưở ằ
ng đ ng sau điều khi n d
ể ự đoán tổ ở
ng quát là
mỗi lần lặ ặ
p đi l p lạ ể
i đ giảm thiểu mộ ẩ ể
t tiêu chu n theo ki u sau:
52. 45
[ ] [ ]
2
1
2 2
1
ˆ
( , ( )) ( ) ( ) ( 1)
u
N
N
i N i
J t u t r t i y t i u t i
ρ
= =
= + − + + ∆ + −
∑ ∑ (2. )
69
với u
N .
là điều khiển trong tương lai
1 1
ˆ ( , , )
k k k i
i
y u u
ϕ
+ + −
= (2. )
70
v c:
à nó chịu sự ràng buộ
2
( ) 0, u
u t i N i N d
∆ + = ≤ ≤ −
V i
ớ 1
N là trục thờ ớ ợ
i gian ư c lư ng tối thiểu, 2
N là trục thời gian dự đoán
tương lai (ước lượ ớ ấ
ng l n nh t), R là mẫu và ρ chỉ ra m t h
ộ ệ số trọng số ảnh hưởng
giá trị ề
trong đi u khiển. V c gi i l
ấ ề ố ợ
n đ t i ưu hóa đư ải quyết ngay trong mỗ ần lấy
mẫu, kết quả là mộ ỗ ề
t chu i các đi u khiển trong tương lai, ( )
U t . Từ ỗ
chu i này,
thành phầ ầ
n đ u tiên ( )
u t là sau đó được áp dụng cho quy trình.
Giả ử ộ
s m t mô hình ARX gầ ợ
n đúng đã thu đư c b ng cách tuy
ằ ến tính hóa
tức thời:
1 1
( ) ( ) ( ) ( ) ( ) ( )
d
A q y t q B q u t e t
ζ τ
− − −
= + + (2. )
71
N u
ế ( ) ( )
e t
ζ τ + được là mô hình nhiễu trắng tích h p và các d
ợ ự đoán trong
tương lai là đư c xác đ
ợ ịnh rõ ràng để đạ ợ ị
t đư c giá tr nhỏ nhất.[5].
2.3 Kết luận chương 2
Ở ể ề
chương 2, đã tìm hi u v phương pháp d và các phương pháp đi
ự báo ều
khi ng u
ển dự ự
báo d a trên mạ nơ-ron. Trên cơ sở đó m
có thể thiết kế ột bộ điề
khiển d báo cho m
ự ột th .
đối tượng cụ ể
Ở ẽ ể ế ế ộ ề ự ộ
chương sau s tìm hi u và thi t k b đi u d báo cho cánh tay máy m t
bậc tự do.
53. 46
CHƯƠNG 3. THIẾ Ế Ộ Ề
T K B ĐI U KHIỂ Ự
N D BÁO CHO CÁNH TAY
MÁY M T B C T
Ộ Ậ Ự DO
3.1 Mô hình toán c a cánh tay máy m
ủ ộ ậ ự
t b c t do
Robot công nghiệp là lo i thi t b
ạ ế ị tự độ ề ụ
ng nhi u công d ng. Cơ cấu tay máy
của chúng phải được cấu tạo sao cho bàn k p gi
ẹ ữ ậ ẹ ộ ớ ấ
v t k p theo m t hư ng nh t
đị ể ễ
nh nào đó và di chuy n d dàng trong vùng làm việc. Muốn vậy cơ cấu tay máy
ph ng
ả ạ ợ ộ ố ậ ự
i đ t đư c m t s b c t do chuyể ộ
n đ .
B u
ậc tự do là số khả năng chuyể ộ
n đ ng của mộ ấ
t cơ c (chuyể ộ
n đ ng quay
ho p
ặc t c m t th u ch
ịnh ti ch chuy
ế ể ị
n). Đ d ể ợ
n đư ột vậ ể ấ
trong không gian, cơ c ấ
hành c do. Nói u h
ủa robot ph c m t s c t
ả ạ ợ
i đ t đư ộ ố ậ
b ự chung cơ cấ ệ ủ
c a robot là
m . S b ô
ộ ấ
t cơ c u hở ố ậc tự do củ ợ
a cánh tay đư c tính theo c ng thức:
5
1
6 i
i
w n ip
=
= − ∑ (3.1)
với n là số khâu động, i
p i
là số khớp loạ i, 1,2,3..,5
i = b h
là số ậc tự do bị ạn
chế.
Cánh tay robot i nhau
(tay máy) là kết cấ ồ
u cơ khí g m các khâu liên kết vớ
b t
ằng khớ ộ ể
p đ ng đ có thể ạo nên những chuy n c
ể ộ ả
n đ ng cơ b ủa robot. [6].
Với l là chiều cài của cánh tay, m là khố ợ
i lư ng và ϕ là góc quay của
khớp cánh tay, τ moment làm quay khớp nối.
T c t
ọ ộ
a đ ủa cánh tay máy trong hệ ọ ộ
a đ OXY là:
R
X lsinϕ
= −
R
Y lcos
ϕ
=
Mô hình toán củ ộ ậ ự
a cánh tay máy m t b c t do:
a bsin
θ θ θ τ
+ + =
(3.2)
với ,
a b t.
là các hằng số chưa biế
54. 47
Hình 3.1 Cánh tay máy một bậc tự do
3.2 Nhận dạng dùng mạng nơ-ron
Trong phần này ta dùng m t mô hình toán c
ộ ủa tay máy để tạo ra tín hiệu mẫu,
mô hình toán củ ể ộ ệ ẫ
a cánh tay máy đ phát ra b tín hi u vào ra m u như sau:
2 10sin( )
θ θ θ τ
+ + =
(3.3)
trong đó, τ là mô men hoặc lự ộ
c tác đ ng lên kh p và
ớ θ là góc quay củ ớ
a kh p.
Thực t ta s
ế ẽ đo mô men τ tác độ ớ
ng lên kh p quay của cánh tay và góc quay của
cánh tay máy θ . .
[3]
Vì mô hình toán có dạng phương trình vi phân, và có hàm sin nên đối tượng
ở ộ ọ ế ể ộ ớ ả ậ ạ
đây là đ ng h c và phi tuy n, ta không th dùng hàm m t bư c nh y nh n d ng
mà phải dùng nhi c nh
ề ớ
u hàm bư ảy v khác nhau. Cho nên tín hi
ớ ộ
i biên đ ệ ầ
u đ u
vào mẫu p sẽ được lựa chọn có dạng như trong hình 3.2a.
55. 48
Hình a: Tín hi u m
ệ ẫ ầ
u đ u vào Hình b: Tín hiệ ầ
u đ u vào mẫu cho
nh ng
ận dạ
Hình 3.2 i u u
: Tín h ệ đầu vào mẫ
Hình 3.3 Tạ ầ
o đ u ra mẫu từ mô hình trong Simulink
Các hàm bướ ả ộ ộ ẫ ạ
c nh y này có đ r ng ng u nhiên trong đo n [0.1;1] và biên
độ nằm trong đoạn [-10;10]. Tín hiệu đầ ẫ
u vào m u p sẽ đượ ử ụ
c s d ng để tác động
vào đ ng tương
ố ợ ầ ủ ố ợ
i tư ng, và đo đ u ra c a đ i tư ứ ể ệ ầ ẫ
ng đ có tín hi u đ u ra m u.
Tín hiệ ầ
u đ u ra m c t
ẫ ợ
u thu đư ừ mô hình trong Simulink như hình 3.3.
Trong đó, tín hi u đ c đưa vào kh
ệ ầu vão mẫ ợ
u đư ối From Workspace và tín hiệu
đầ ẫ ợ ố
u ra m u đư c lưu vào kh i To Workspace.
Vớ ầ
i đ u vào mẫ ầ
u p, đ u ra củ ố ợ
a đ i tư ng thu thậ ợ ứ
p đư c tương ng là t như
hình 3.4.
56. 49
Hình 3.4 u
Tín hiệ ầ
u đ u ra mẫ
Bộ tín hiệu
p
t
sẽ dư c dùng đ
ợ ể hu ng
ấn luyện mạ nơ-ron. Mạng nơ ron đư
- ợc
tạo ra trong Matlab có sơ đồ ấ
c u trúc như hình 3.6 . M p, l
ạng gồm 2 lớ ớp thứ ấ
nh t
có hàm truyền tansig và lớp thứ hai có hàm truyền tuyến tính, khối DB củ ầ
a đ u
vào th 1:2, l
ứ nhất có trễ 1:2 và kh u vào th
ối DB củ ầ
a đ ứ ễ ự
2 có tr tương t ớp thứ
nh ron.
ất có 6 nơ-
Tín hi i chu kì
ệ ợ
u vào ra đư c lấy mẫu vớ 0.01
Ts = m
giây, do đó số ẫu là
50001.
B m u
ộ ẫ { ; }
k k
p t sẽ dược dùng để huấ ệ ạ
n luy n m ng, phương pháp LM được
s d
ử ụ ể
ng đ huấn luyện mạng, các tham số cho quá trình huấn luyệ ợ ặ
n đư c cài đ t
như sau: số ỉ
k nguyên là 1000, giới h a gradient
ạ ớ ủ
n dư i c 7
10−
, giới hạ ớ
n dư i của
hàm m c tiêu là
ụ 7
10
ε −
= . Ta th hàm m c tiêu nh
ấy sau 10 kỉ nguyên giá trị ụ ỏ hơn
nên quá trình huấn luyện m y gradient còn l
ạng kết thúc, ngoài ra ta thấ ớn hơn
0.0224. Sau khi huấn luyện mạng, đáp ứ ầ ủ ạ ố ợ
ng đ u ra c a m ng nơ-ron và sai s đư c
v 7.
ẽ trong hình 3.
Đồ ị ụ ố ỉ ấ ệ
th hàm m c tiêu theo s k u
nguyên h n luy n như trong hình 3.8.
Sau khi hu n luy n m ng này s
ấ ệ ạng ng
nơ-ron củ ố ợ
a đ i tư NNp, mạ ẽ ấ
có c u
trúc và tham s c ti
ố ị ớ
xác đ nh. Bư ế ề
p theo là dùng phương pháp đi u khiển dự báo
MPC để ế ế ộ ề ể
thi t k b đi u khi n dự .
báo
57. 50
Hình 3.5 C -
ấu trúc mạng nơ ron c ng nnp
ủ ố ợ
a đ i tư
Hình 3.6 Sơ đồ ấ ạ
c u trúc m ng nơ-ron
58. 51
Hình 3.7 Đáp ứ ầ
ng đ u ra c ron và sai s
ủa mạng nơ- ố
Hình 3.8 Đồ thị hàm mục tiêu
Nhận xét:
- Giá trị hàm m c tiêu: Giá tr
ụ ị hàm mục tiêu giảm nhanh và tiế ớ ề
n t i v không.
- n [-
Đáp ứ ầ ứ ầ ộ ạ
ng đ u ra: Đáp ng đ u ra dao đ ng trong đo 2;2], đáp ứ ợ
ng đư c
tín hiệ ề
u đi u khiển mong muốn.
59. 52
- r n
Giá trị sai số: Giá trị sai số ất nhỏ ằm trong khoảng [-0.05;0.05]
3.3 Tuyến tính hóa mạng nơ-ron
Đầ ủ ạ
u ra c a mô hình m ng nơ- :
ron
2 1,2 1 2
( )
a t LW a b
= +
với b là bias, a -
là véc tơ đầu ra, ,
i j
LW -
là ma trận trọng số liên kết giữa véc tơ
đầ ớ
u ra l p j v i l p
ớ đầu vào ớ i.
Đầ ủ ớ ứ ấ
u ra c a l p nơ-ron th nh t là:
1 1 1
( )
a f n
=
trong đó :
1 1
( ) ( )
n n
i i n n
e e
f n tagsig n
e e
−
−
−
= =
+
1 1
1,1 1,2
( 1) ( 1)
. .
( 2) ( 2)
u t y t
n IW IW b
u t y t
− −
= + +
− −
Đặt :
1 ( 1)
v u t
= −
1 ( 1)
v u t
= −
3 ( 1)
v y t
= −
4 ( 2)
v y t
= −
Ta có hàm phi tuy u vào ph c vào
ế ầ
n đ ụ ộ
thu 1 3 3 4
, , ,
v v v v.
2
1 2 3 4
( ) ( , , , )
a t g v v v v
=
Xét t i th
ạ ời điểm t bất kì , ta có hàm phi tuyến tại thờ ể
i đi m đó là:
2
1 2 3 4
( ) ( , , , )
a t g v v v v
=
Coi giá tr i t
ị ệ
hi n tạ ại thờ ể
i đi m t là:
1
2
0
3
4
v
v
v
v
v
=
Áp dụ ể
ng khai tri n Taylor ta có:
60. 53
0
4
0 ,0
1
ˆ( ) ( ) ( )
| i
v i
i
v
i
g
y t g v v v
v
=
=
∂
≈ + −
∂
∑
với 0
( )
g v c
là đầu ra ủa mạ ầ
ng đ u vào tại thờ ể
i đi m 0
v v
= .
Vì vi c tính
ệ 1
a rất phức tạp khi mạng ở đây có 2 lớ ắ ạ
p. Do đó ta dùng quy t c đ o
hàm hợp.
1 1 1
1 1 1 1
1 1 1
ˆ
. . .
y y n y a n
a
v v v
n a n
∂ ∂ ∂ ∂ ∂ ∂
= = =
∂ ∂ ∂
∂ ∂ ∂
1
1,1
1
n
IW
v
∂
=
∂
1 1
1 1
1 1
2 2
1 1
1 1
3 3
1 1
4 4
1 1
5 5
1 1
6 6
,
n a
n a
n a
n a
n a
n a
n a
= =
1 1
( )
i i
a tanh n
=
Đặt:
1
1
1
1
1
2
1
2
1
3
1
1
3
1
1 1
4
1
4
1
5
1
5
1
6
1
6
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
0 0 0 0 0
a
n
a
n
a
n
a
F
n a
n
a
n
a
n
∂
∂
∂
∂
∂
∂
∂
= =
∂ ∂
∂
∂
∂
∂
∂
v :
ới
61. 54
1,2 1 1,1
1 (1)
1
. .
y
a LW F IW
v
∂
= =
∂
1,2 1 1,1
2 (2)
2
. .
y
a LW F IW
v
∂
= =
∂
1,2 1 1,2
3 (1)
3
. .
y
a LW F IW
v
∂
= =
∂
1,2 1 1,2
4 (2)
4
. .
y
a LW F IW
v
∂
= =
∂
Tín hiệ ầ ự ế
u đ u ra th c t :
0
1,2 1 1,1 1,1
(1) 0 (2) 0
1,2 1,1
(1) 0 (2) 0
ˆ ( )
. .( ( ( 1) ( 1)) ( ( 2) ( 2))
( ( 1) ( 1)) ( ( 2) ( 2)))
y y g u
LW F IW u t u t IW u t u t
IW y t y t IW y t y t
= −
= − − − + − − −
+ − − − + − − −
v i:
ớ
0 1 1 1,0 2 2 2,0 3 3 3,0 4 4 4,0
ˆ ( ) ( ) ( ) ( ) ( )
y g v a v v a v v a v v a v v
= + − + − + − + − [5].
3.4 t
Thiế k b
ế ộ điều khiể ự ạ
n d báo dùng m ng nơ-ron
Đáp ứ ấ ỉ đầ ủ ệ
ng x p x u ra c a h thống là:
1 2 3 3
2 4 4
1
ˆ( ) ( )
a
v v
y t a a a v v e t
= + + + + (3.4)
V i
ớ ( )
y t là đáp ứ ầ
ng đ u ra tại thờ ể
i đi m t , 4
1 3
2 ,
, ,
a a a
a s
là các hệ ố,
0 1 1,0 2 2,0 3 3,0 4 4,0
( ) ( )
e t g v a v a v a v a v
= − − − − .
Áp dụ ị
ng đ nh lu u khi
ậ ề
t đi ển ở 9
(2.6 ) cho bài toán ta được mô hình dự báo:
[ ] [ ]
3 2
2 2
1 0
ˆ( ) ( ) min
d
k k
J y y t k u t k
ρ
= =
= − + + ∆ + →
∑ ∑ (3.5)
Trong thờ ể
i đi m dự báo ta có giá trị đặt là , là giá trị sai
lệch của u
tại thờ ể
i đi m
( )
1
t k
+ +
và
( )
t k
+
.
V :
ới
( ) ( ) ( 1)
u t u t u t
∆ = − −
( 1) ( 1) ( )
u t u t u t
∆ + = + −
( 2) ( 2) ( 1)
u t u t u t
∆ + = + − +
(3.6)
62. 55
với u :
là
( )
( 1)
( 2)
u t
u u t
u t
= +
+
T p
ừ hương trình hàm ( )
J u 5
ở (3. ) ta có phương trình ở bài toán như sau:
1
( ) min
2
T
Au
J u u Bu C
= + + → (3.7)
trong đó A c
là ma trậ ớ
n có kích thư 3 3
x , là ma tr i x
ậ ố
n đ ứng T
A A
= , B là ma
trận 3x1 và C .
là hằng số
Đạo hàm hàm J theo u ta được:
0
J
Au B
u
∂
= + =
∂
(3.8)
Nghiệm của (3.8) là:
1
*
u A B
−
= − (3.9)
Từ (3.5) ta có đáp ứ ầ
ng đ u ra tại thờ ể
i đi m 1, 2, 3
t t t
+ + + lầ ợ
n lư t là:
1 2 3 4
ˆ( 1) ( ) ( 1) ( ) ( 1) ( )
y t a y t a y t a u t a u t e t
+ = + − + + − + (3. )
10
1 2 3 4
ˆ( 2) ( 1) ( ) ( 1) ( ) ( )
y t a y t a y t a u t a u t e t
+ = + + + + + + (3. )
11
1 2 4
ˆ( 3) ( 2) ( 1) ( 2) ( 1) ( )
y t a y t a y t a u t a u t e t
+ = + + + + + + + + (3. )
12
Biế ổ ứ ợ
n đ i công th c (3.6) ta đư c:
( )
3 2
2 2 2
1 0
2 2
2 2
2 2
2 2 2
2 ( ) ( ) ( )
2 ( 1) ( 1)
2 ( 2) ( 2)
2 ( 3) ( 3)
( ) ( 1) ( 2)
d d
k k
d d
d d
d d
J y y y t k y t k u t k
y y y t y t
y y y t y t
y y y t y t
u t u t u t
ρ
ρ
= =
= − + + + + ∆ +
= − + + +
+ − + + +
+ − + + +
+ ∆ + ∆ + + ∆ +
∑ ∑
(3. )
13
63. 56
Thay (3.7), (3.11), (3.12), (3.13) vào (3.14) ta được:
( )
( )
( )
( )
1 2 1 2
1 2 1 2
1 2 1 2
1 2 1 2
1 2
2
2
2
2
1
2
( ) ( 1) ( ) ( 1) ( )
( ) ( 1) ( ) ( 1) ( )
( 1) ( ) ( 1) ( ) ( )
( 1) ( ) ( 1) ( ) ( )
( 2) ( 1) (
2
2
2
2 )
d d
d d
d d
J
a
a y t a y t bu t b u t e t
a y t a y t bu t b u t e t
a y t y t bu t b u t e t
a y t a y t bu t b u t e t
a y t a y t b
y y
y y
y y u t
+ − + + − +
+ − + + − +
+ + + + + +
+ + + + + +
+ + + + + +
= − +
+ − +
+ − ( )
( )
( ) ( ) ( )
2
1 2 1 2
2 2 2
2
( 1) ( )
( 2) ( 1) ( 2) ( 1) ( )
( ) ( 1) ( 1) ( ) ( 2) ( 1)
b u t e t
a y t a y t bu t b u t e t
u t u t u t u t u t u t
ρ
+
+ +
+ +
+ + + + + + + +
− − + − + + − +
Đặt:
1 1 2
( ) ( 1) ( )
m a y t a y t e t
= + − +
2
2 1 ( 1) ( ) ( )
m a y t a y t e t
+
= + +
2
3 1
( 2) ( 1) ( )
a y t a
m y t e t
+ + +
= +
Ta được:
( ) ( )
( ) ( )
( ) ( )
( ) ( ) ( )
1 1 2 1 1 2
2 1 2 2 1 2
3 1 2 3 1 2
2
2
2
2
2
2
2
2
2
( ) ( 1) ( ) ( 1)
( 1) ( ) ( 1) ( )
( 2) ( 1) ( 2) ( 1)
( ) ( 1) ( 1) (
2
) ( 2)
2
( 1)
2
d d
d d
d d
J y y
y y
y
m bu t b u t m bu t b u t
m bu t b u t m bu t b u t
m bu t b u t m bu t b u t
u t u t u t
y
u t u t u t
ρ
= − +
+ − +
+ − +
+ +
+ + − + + −
+ + + + + +
+ + + + + + + +
− − + − + + − +
[ ]
2
1 2 3 2 1 2 1 2 1
2 2 2 2 2
1 1 2 1 1 1 2 1 2
2 2 2 2 2
2 1 2 2 1 1 2 2 2
2
3
3 2 ( 1) ( ) ( ) ( ) ( 1) ( 2)
( ) ( 1) 2 ( ) 2 ( 1) ( ) 2 ( 1)
( 1) ( ) 2 ( 1) 2 ( ) ( 1) 2 ( )
d d
J y y m m m b u t b b u t b b u t bu t
m b u t b u t m bu t bb u t u t m b u t
m b u t b u t m b u t bb u t u t m b u t
m b
= − + + + − + + + + + + +
+ + + − + + − + −
+ + + + + + + + +
+ + 2 2 2 2
1 2 3 1 1 2 3 2
2 2
2 2
2 2
( 2) ( 1) 2 ( 2) 2 ( 1) ( 2) 2 ( 1)
[ ( ) 2 ( 1) ( ) ( 1)
( 1) 2 ( ) ( 1) ( )
( 2) 2 ( 1) ( 2) ( 1) ]
u t b u t m bu t bb u t u t m b u t
u t u t u t u t
u t u t u t u t
u t u t u t u t
ρ
+ + + + + + + + + +
+ − − + −
+ + − + +
+ + − + + + +
64. 57
[ ]
[ ] [ ]
2
1 2 3 2
2 2 2 2 2 2
1 2 1 2 2 3
2 2 2 2 2 2 2 2
1 2 1 2 1
1 2 1 2
1 2 1 1 1 2
3 2 ( 1)
( 1) 2 ( 1) ( 1)
( ) 2 ( 1) 2 ( 2)
( ) ( 1) 2 2 ( 1) ( 2) 2 2
( ) 2 ( ) 2 2 (
d d
d
J y y m m m b u t
m b u t m b u t m m u t
u t b b u t b b u t b
u t u t bb u t u t bb
u t y b b m b bb u
ρ
ρ ρ ρ
ρ ρ
= − + + + −
+ + − + − + + + −
+ + + + + + + + + +
+ + − + + + −
+ − + + +
[ ]
[ ]
[ ]
2 2
1 2 2 1 3 2
1 3 1
1) 2 2 ( 1)
( 1) 2 ( ) 2 2
( 2) 2 2
d
d
t m b u t
u t y b b m b m b
u t y b m b
ρ
− + − −
+ + − + + +
+ + − +
(3. )
14
Kết hợp (3.9) và (3.15) ta được:
2 2
1 2 1 2
2 2
1 2 1 2 1 2
2
1 2 1
2 2 2 0
2 2 2 2 2
0 2 2
b b bb
A bb b b bb
bb b
ρ ρ
ρ ρ ρ
ρ ρ
+ + −
= − + + −
− +
(3. )
15
và
1 2 1 1 1 2 2 2
1 2 2 1 3 2
1 3 1
2 ( ) 2 2 ( 1) 2 2 ( 1)
2 ( ) 2 2
2 2
d
d
d
y b b m b b b u t m b u t
B y b b m b m b
y b m b
ρ
− + + + − + − −
= − + + +
− +
(3. )
16
Kết luận:
Qua quá trình tính toán ta tìm được :
1
( )
( ) ( 1)
( 2)
u t
u t u t A B
u t
∗
∗ ∗ −
∗
= + = −
+
(3. )
17
Ở ế
chu kì ti p theo, ta đưa ( )
u t
∗
ra điều khiể ố ợ
n đ i tư ng và thực hiện lại các
bướ ể
c như trên đ tìm ( 1)
u t
∗
+ .
3.5 Kết quả mô phỏng
Dùng mô hình (3.3) để ỏ
mô ph ng tay máy và công thứ ể
c (3.17) đ tính toán
tín hiệ ề
u đi u khiển tố ủ ộ
i ưu c a b MPC.
Chọn 0.05
ρ = và chu kì lấy m u là 5000.
ẫ
Kết quả mô phỏng thực hiện trên hình (3.9) và (3.10).
65. 58
Hình 3.9 i
Tín hiệu đ ều khiển tối ưu
Trong hình 3.9, u là tín hiệ ề
u đi u khiển tối ưu.
Hình 3.10 Đáp ng đ
ứ ầu ra và giá trị t
đặ
Trong hình 3.10, t.
y là đầu ra củ ố ợ
a đ i tư ng và r là giá trị đặ
Nhận xét: Bộ điều khiể đầ ả ớ ệ
n MPC làm cho u ra cơ b n là bám sát v i tín hi u
mẫu.
3.6 Kết luận chương 3
Trong phần này, phương pháp LM d n ngư
ự ậ ể
a trên thu t toán lan truy ợc được
s d -
ử ụ ể
ng đ huấn luyện mạng nơ ron cho đố ợ
i tư ng. Sau khi huấn luyện mạng nơ-
ron, thu đư i ưu c
ợ ộ ố ố
c b tham s t ủ ạ
a m ng. Quan hệ ủ
vào ra c a m ng là phi tuy
ạ ến,
0 5 10 15 20 25 30 35 40 45
Giây
-6
-4
-2
0
2
4
6
8
u
u
0 5 10 15 20 25 30 35 40 45
Giây
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
y
y
r
66. 59
do đó n đi
ếu dùng mô hình mạ ể ế ế ộ
ng này đ thi t k b ều khiển dự ẽ ặ
s
báo g p khó
khăn. Cho nên, m ng nơ ron đã đư n tính hóa xung quanh đi
ạ - ợ ế
c tuy ể ệ
m làm vi c
hiện tại, hàm m c tiêu có d
ụ ạng b ng qu
ậc hai, m t công th c t
ộ ứ ổ át tìm nghiệm tối ưu
đã đượ ự ể ể ứ ỏ ệ
c xây d ng. Đ ki m ch ng, chương trình mô ph ng và tính toán tín hi u
đi thu đư n tính đúng đ
ều khiển tố ợ ế ế ả
i ưu đã đư c vi t. K t qu ợ ể
c th hiệ ắn củ ậ
a thu t
toán và khả ự
thi trong th c tế.