Luận văn: Mô hình xác suất trong khoa học máy tính, HAY, 9đ

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
- - - - - - - - - - - - - - - - - - - - - - -
PHẠM THỊ THU HẰNG
MỘT SỐ MÔ HÌNH XÁC SUẤT
TRONG KHOA HỌC MÁY TÍNH
LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội - Năm 2015

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
- - - - - - - - - - - - - - - - - - - - - - -
PHẠM THỊ THU HẰNG
MỘT SỐ MÔ HÌNH XÁC SUẤT
TRONG KHOA HỌC MÁY TÍNH
Chuyên ngành: Lý thuyết Xác suất và Thống kê toán học
Mã số: 60406106
LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
GS.TSKH. ĐẶNG HÙNG THẮNG
Hà Nội - Năm 2015

LỜI NÓI ĐẦU
Trong những năm gần đây, xác suất đã phát triển đa dạng và có nhiều ứng
dụng quan trọng trong lĩnh vực khoa học máy tính. Ví dụ, các chủ đề liên quan
đến thuật toán như thuật toán ngẫu nhiên, thuật toán ước lượng và phân tích
xác suất của thuật toán đều sử dụng phương pháp xác suất.
Trong luận văn này, tôi muốn giới thiệu các loại mô hình và phân tích xác
suất hữu dụng nhất trong khoa học máy tính. Giả sử với một hàm mở đầu trong
xác suất, tôi trình bày một số đề tài quan trọng như phương pháp xác suất,
xích Markov, mô phỏng MCMC và quá trình Poisson không dừng. Luận văn này
cung cấp nhiều ví dụ và bài tập mô tả các đề tài như thuật toán sắp xếp, thuật
toán tìm kiếm và biểu đồ ngẫu nhiên, bài toán tự sắp xếp theo danh sách, phản
xích, phân hoạch cực đại và cực tiểu trong đồ thị và nhiều đề tài khác.
Cấu trúc luận văn được chia làm 3 chương chính:
• Chương 1 đưa ra các ví dụ hay trong khoa học máy tính, đồng thời trình
bày phương pháp xác suất và một số cách ứng dụng phương pháp này.
• Chương 2 viết về xích Markov trên không gian trạng thái rời rạc, phương
pháp Monte Carlo và xích Markov Monte Carlo (MCMC).
• Chương 3 giới thiệu một số lớp quá trình Poisson, từ đó nghiên cứu bài
toán phân loại biến cố của một quá trình Poisson không dừng và bài toán
xác định phân phối có điều kiện của thời điểm đến.
Trong khuôn khổ của luận văn này, do sự hạn hẹp về thời gian cũng như
năng lực của bản thân, vì vậy không thể tránh khỏi những hạn chế về nội dung
cũng như việc trình bầy. Tôi nhận thấy xác suất trong khoa học máy tính còn
rất nhiều điều thú vị khác nữa và tôi rất mong có dịp trình bầy đầy đủ hơn.
Luận văn được hoàn thành dưới sự hướng dẫn tận tâm của GS.TSKH Đặng
Hùng Thắng. Tôi xin được bày tỏ lòng biết ơn và kính trọng sâu sắc của mình
đến thầy. Qua đây tôi xin chân thành gửi lời cảm ơn tới các thầy cô trong Tổ
2

Luận văn tốt nghiệp Phạm Thị Thu Hằng
bộ môn Xác suất thống kê và Ban Chủ nhiệm khoa Toán - Cơ - Tin học Trường
Đại học Khoa học Tự nhiên - Đại học Quốc gia Hà Nội đã chỉ bảo và hướng
dẫn tận tình giúp tôi hoàn thành luận văn này!
Rất mong nhận được ý kiến đóng góp của các thầy cô và các bạn!
Hà Nội, tháng 11/2015
Phạm Thị Thu Hằng
3

Chương 1
Xác suất trong lý thuyết tổ hợp
và đồ thị
1.1 Các ví dụ
1.1.1 Đồ thị ngẫu nhiên
Mỗi đồ thị bao gồm hai yếu tố: tập V là tập hợp các đỉnh (hay nút) và
A là tập hợp các cặp đỉnh gọi là cạnh (hoặc cung). Ta thường khoanh tròn
số hiệu của mỗi đỉnh và nối các đỉnh bởi một đường thẳng hoặc cong nếu
có cạnh tạo bởi hai đỉnh đó. Ví dụ, một đồ thị có V = {1, 2, 3, 4, 5, 6} và
A={(1, 2), (1, 4), (1, 5), (2, 3), (2, 5), (3, 5), (5, 6)} được mô tả trong Hình 1.1. Ở đây
ta chỉ xét các đồ thị không có hướng, tức là ta không định hướng các cạnh của
đồ thị.
Một chuỗi các đỉnh i, i1, i2, . . . , ik, j trong đó (i, i1), (i1, i2), . . . , (ik−1, ik), (ik, j)
là các cạnh được gọi là một đường đi từ đỉnh i tới đỉnh j. Hình 1.2 biểu thị một
đường đi từ đỉnh 1 tới đỉnh 6.
Một đồ thị được coi là liên thông nếu có một đường đi giữa mọi cặp đỉnh của
đồ thị. Đồ thị như trong Hình 1.1 và 1.2 là đồ thị liên thông còn đồ thị trong
Hình 1.3 không phải đồ thị liên thông.
Giờ hãy xem xét đồ thị với tập hợp đỉnh V = {1, 2, . . . , n} và tập hợp cạnh
A = {(i, X(i)), i = 1, . . . , n} trong đó X(i) là các biến ngẫu nhiên độc lập thỏa
mãn
P{X(i) = j} = Pj,
n
j=1
Pj = 1
Nói cách khác, từ mỗi đỉnh i ta chọn ra ngẫu nhiên một đỉnh trong số n đỉnh
còn lại của đồ thị (bao gồm cả i), trong đó xác suất để đỉnh j được chọn là Pj,
4

Hình 1.1: Đồ thị
Hình 1.2: Đường đi từ 1 tới 6: 1, 2, 3, 5, 6.
Hình 1.3
sau đó ta nối đỉnh i với đỉnh vừa chọn bởi một cung. Đồ thị vừa xây dựng là
một đồ thị ngẫu nhiên. Chúng ta sẽ tính xác suất để đồ thị ngẫu nhiên này là
5

đồ thị liên thông. Để tìm được xác suất này, ta chọn một đỉnh, giả sử đỉnh 1 và
lần theo chuỗi các đỉnh 1, X(1), X2(1), . . . , trong đó Xn(1) = X(Xn−1(1)) để xác
định giá trị của biến ngẫu nhiên N là chỉ số k nhỏ nhất sao cho Xk(1) không là
một đỉnh mới. Tức là,
N = min(k : Xk
(1) ∈ {1, X(1), . . . , Xk−1
(1)})
Đồng thời, gọi
W = P1 +
N−1
i=1
PXi(1)
Nói cách khác, N là số đỉnh tiếp xúc trong chuỗi 1, X(1), X2(1), . . . trước khi
một đỉnh xuất hiện hai lần còn W là tổng các xác suất của các đỉnh này. (xem
Hình 1.4).
Hình 1.4
Để tính toán xác suất đồ thị này liên thông, ta lấy điều kiện với N:
Xác suất đồ thị liên thông =
n
k=1
P(đồ thị liên thông|N = k)P(N = k).
Bây giờ, với điều kiện N = k, các đỉnh 1, X(1), . . . , Xk−1(1) liên thông với nhau
và không còn cạnh nào khác xuất phát từ các đỉnh này tới các đỉnh còn lại của
đồ thị. Nói cách khác, ta có thể hợp k đỉnh này lại làm một siêu đỉnh. Không
có cạnh nào xuất phát từ siêu đỉnh này và xác suất để một đỉnh ở ngoài đi vào
siêu đỉnh này là W. Ta sẽ cần đến kết quả sau.
Bổ đề 1.1.1. Xét một đồ thị ngẫu nhiên gồm các đỉnh 0, 1, . . . , r, và các cạnh
(i, Yi), i = 1, . . . , r, trong đó Yi là các biến ngẫu nhiên độc lập và
P{Yi = j} = Qj, j = 0, ..., r,
r
j=0
Qj = 1
Khi đó,
6

P{đồ thị liên thông} = Q0.
Đồ thị ngẫu nhiên ở trên bao gồm r đỉnh thông thường (đánh số từ 1 đến r)
và một đỉnh đặc biệt (đánh số 0); cứ mỗi đỉnh thông thường có một cạnh độc
lập đi qua đỉnh j với xác suất Qj; không có cạnh nào xuất phát từ đỉnh đặc biệt.
Chứng minh. : Để chứng minh, ta sử dụng phương pháp quy nạp theo r, bổ đề
hiển nhiên đúng khi r = 1, giả sử bổ đề đúng với mọi giá trị nhỏ hơn r. Xem
xét Y1 nếu Y1 = 1 thì dễ thấy đồ thị là không liên thông. Nếu Y1 = 0 thì đỉnh
1 và 0 có thể coi là một đỉnh đơn lẻ và trường hợp này không thay đổi nếu ta
có r − 1 đỉnh thông thường và một đỉnh đặc biệt, trong đó cứ mỗi đỉnh thông
thường có một cạnh đi qua đỉnh đặc biệt với xác suất Q0 + Q1. Nếu Y1 = j = 0, 1
thì bằng cách coi đỉnh 1 và j là một đỉnh đơn lẻ, kết quả này vẫn không thay
đổi nếu ta có r − 1 đỉnh thông thường và một đỉnh đặc biệt, trong đó mỗi đỉnh
thông thường có một cạnh đi qua đỉnh đặc biệt với xác suất Q0. Do vậy, từ giả
thiết quy nạp, chúng ta thấy:
P{đồ thị là liên thông|Y1 = j} =



0, nếu j = 1
Q0 + Q1, nếu j = 0
Q0, nếu j = 0, 1
Lấy xác suất với điều kiện với Y1 ta có:
P{đồ thị là liên thông} =
r
j=0
P{đồ thị là liên thông|Y1 = j}Qj
= (Q0 + Q1)Q0 + Q0(1 − Q0 − Q1)
= Q0
và giả thiết quy nạp là đúng.
Trở lại với đồ thị ngẫu nhiên ban đầu, coi tập hợp đỉnh 1, . . . , XN−1(1) là một
đỉnh đặc biệt của Bổ đề 1.1.1 ta có:
P{đồ thị là liên thông|N, 1, . . . , XN−1
(1)} = W
Lấy kỳ vọng thu được kết quả sau:
Mệnh đề 1.1.1. P{đồ thị liên thông} = E[W]
Từ lập luận ở trên ta nhận thấy nếu thực hiện một dãy các phép thử đa thức
độc lập với xác suất P1, . . . , Pn thì với điều kiện kết quả ban đầu là 1, kỳ vọng
7

của tổng các xác suất của tất cả kết quả riêng biệt thu được đến trước khi có
một kết quả bị lặp lại bằng với xác suất để đồ thị ngẫu nhiên liên thông. Điều
này vẫn đúng nếu ta thay kết quả bân đầu là 1 bởi một kết quả ban đầu bất kì
khác (khi phân tích đồ thị ngẫu nhiên, chúng ta đã có thể bắt đầu bằng bất cứ
chuỗi đỉnh i, X(i), X2(i), . . . nào), vì thế, với mỗi dãy phép thử đa thức ta có kì
vọng của tổng các xác suất của các kết quả thu được cho đến trước khi có một
kết quả lặp lại là độc lập với kết quả đầu tiên. Đây là một phát hiện không hiển
nhiên chút nào.
Trong phần còn lại của mục này, chúng ta sẽ tập trung phân tích trường hợp
đặc biệt trong đó cạnh xuất phát từ mỗi đỉnh có thể đến mọi đỉnh của đồ thị
với cùng xác suất
Pj =
1
n
, j = 1, . . . , n
.
Hệ quả sau cho ta công thức tính xác suất đồ thị liên thông trong trường
hợp đặc biệt này.
Hệ quả 1.1.1. Khi Pj = 1/n,
P{đồ thị là liên thông} =
(n − 1)!
nn
n−1
j=0
nj
j!
Chứng minh. Vì W = N/n, ta có:
E[W] =
1
n
E[N]
=
1
n
n−1
i=0
P(N > i)
=
1
n
n−1
i=0
(n − 1)...(n − i)
ni
=
1
n
n−1
i=0
(n − 1)!
(n − i − 1)!ni
=
(n − 1)!
nn
n−1
i=0
nn−1−i
(n − i − 1)!
=
(n − 1)!
nn
n−1
j=0
nj
j!
8

Để thu được ước lượng đơn giản xác suất để đồ thị là liên thông khi n lớn,
ta thấy nếu X là một biến Poisson ngẫu nhiên với trị số trung bình n thì
P{X < n} = e−n
n−1
i=0
ni
i!
Tuy nhiên, vì một biến Poisson ngẫu nhiên có trị số trung bình n có thể được
coi là tổng của n biến Poisson ngẫu nhiên độc lập với trị số trung bình bằng 1,
điều này được suy ra từ định lý giới hạn trung tâm rằng một biến ngẫu nhiên
có một phân phối xấp xỉ chuẩn với trị số trung bình n. Xác suất của biến ngẫu
nhiên thông thường nhỏ hơn trị số trung bình của nó là 1/2, hay :
P{X < n}
1
2
Do đó với n lớn
n−1
i=0
ni
i!
en
2
Từ Hệ quả 1.1.1 ta thấy với n lớn,
P{đồ thị là liên thông}
(n − 1)!en
2nn
=
n!en
2nn+1
Do vậy, bằng cách sử dụng công thức tiệm cận Stirling trong đó chỉ ra rằng:
n! nn+1/2
e−n
√
2π
ta thấy, với n lớn
P{đồ thị là liên thông}
√
2π
2
√
n
Từ đó chúng ta thu được Hệ quả sau.
Hệ quả 1.1.2. Với n lớn, P{đồ thị là liên thông} π/2n
Một đồ thị được coi là bao gồm r thành phần nếu các đỉnh của nó có thể
được phân chia vào r tập hợp con sao cho mỗi tập hợp con liên thông và không
có cạnh nào được tạo thành bởi các đỉnh thuộc các tập hợp con khác nhau. (Do
đó, đồ thị liên thông là đồ thị có một thành phần đơn lẻ.)
Gọi C là số thành phần trong đồ thị ngẫu nhiên ta đang xem xét, chúng ta sẽ
tính giá trị kỳ vọng của nó. Trước hết, chúng ta sẽ chứng minh rằng mỗi thành
phần phải chứa đúng một chu trình, trong đó chu trình là một cạnh của cặp
9

(i, i) hoặc một chuỗi của cạnh của cặp (i, i1), (i1, i2), . . . , (ik, i) với các đỉnh riêng
biệt i, i1, i2, . . . , ik. Ví dụ, đồ thị trong Hình 1.5 là một chu trình.
Dễ dàng thấy một đồ thị liên thông có số cạnh bằng số đỉnh chỉ chứa duy
nhất một chu trình. Vì trong đồ thị ngẫu nhiên xuất phát từ mỗi đỉnh có duy
nhất một cạnh nên một thành phần chứa k đỉnh chỉ có đúng k cạnh và do đó
chỉ có duy nhất một chu trình. Với S ⊂ {1, . . . , n} thì S là một chu trình nếu tồn
tại một chu trình mà các đỉnh của nó là đỉnh của S. Do đó, nếu ta lấy
I(S) = 1, nếu S là 1 chu trình
0, ngược lại
thì
E[C] = E số của chu trình
= E
s
I(S)
=
s
E[I(S)]
Nếu S gồm một đỉnh đơn lẻ, tức là S = {1}, thì S sẽ là một chu trình nếu
X(1) = 1. Do đó,
E[I({1})] = P{X(1) = 1} = 1/n
Nếu S gồm k > 1 đỉnh, tức là S = {1, . . . , k}, thì S sẽ tạo thành một chu trình
nếu 1, X(1), . . . , Xk−1(1) là các giá trị khác nhau trong S và Xk(1) = 1.
Do vậy,
E[I(S)] =
k − 1
n
k − 2
n
...
1
n
=
(k − 1)!
nk
Kết quả là, do có n
k tập hợp con kích thước k, ta thấy rằng
E[C] =
n
k=1
n
k
(k − 1)!
nk
1.1.2 Thuật toán Tìm kiếm và Sắp xếp nhanh
Giả sử chúng ta muốn sắp xếp một tập hợp n giá trị khác nhau cho trước
x1, x2, . . . , xn. Thuật toán sắp xếp nhanh được xác định theo cách như sau : Khi
n = 2, thuật toán so sánh hai giá trị và xếp chúng theo thứ tự thích hợp. Khi
n > 2, gọi xi là giá trị được chọn, khi đó tất cả các giá trị khác được so sánh với
10

xi. những giá trị nhỏ hơn xi được đặt vào một nhóm phân cách bởi dấu ngoặc
bên trái xi còn những giá trị lớn hơn xi thì đặt bên phải, lặp lại thuật toán với
mỗi nhóm này cho tới khi tất cả các giá trị được sắp xếp. Ví dụ, giả sử chúng
ta muốn sắp xếp 10 giá trị khác nhau như sau:
5, 9, 3, 10, 11, 14, 8, 4, 17, 6
Một trong những giá trị này được lựa chọn, giả sử là 10. Chúng ta sẽ so sánh
từng giá trị với 10, đặt những giá trị nhỏ hơn 10 vào một nhóm bên trái 10 và
đặt những giá trị lớn hơn 10 vào bên phải 10 ta được
{5, 9, 3, 8, 4, 6}, 10, {11, 14, 17}
Giờ chúng ta hãy nhìn vào một nhóm chứa nhiều hơn một giá trị, giả sử nhóm
bên trái và chọn một giá trị trong đó như 6 chẳng hạn. So sánh từng giá trị
trong ngoặc với 6 và xếp các giá trị nhỏ hơn vào một nhóm bên trái 6 và giá trị
lớn hơn và bên phải 6
{5, 3, 4}, 6, {9, 8}, 10, {11, 14, 17}
Nếu chúng ta xem xét nhóm ngoài cùng bên trái và chọn giá trị 4 để so sánh thì
thu được
{3}, 4, {5}, 6, {9, 8}, 10, {11, 14, 17}
Thuật toán tiếp tục cho tới khi không còn tập hợp nào chứa nhiều hơn một giá
trị.
Bằng trực giác có thể thấy được trường hợp xấu nhất xảy ra khi giá trị so
sánh được chọn là một giá trị tuyệt đối, hoặc là giá trị nhỏ nhất, hoặc là giá trị
lớn nhất trong nhóm. Trong trường hợp này, dễ thấy số lượng phép so sánh cần
thiết là n(n − 1)/2. Tuy nhiên, thuật toán sẽ hữu dụng hơn bằng cách xác định
số lượng so sánh trung bình cần thiết khi giá trị so sánh được chọn ngẫu nhiên.
Giả sử mỗi giá trị so sánh được chọn trong ngoặc có thể là bất cứ giá trị nào .
Gọi X là số phép so sánh cần sử dụng. Để tính E[X], trước hết ta biểu diễn X
thành tổng các biến ngẫu nhiên khác theo cách sau. Đầu tiên, ta đánh dấu cho
các giá trị được sắp xếp: 1 biểu thị giá trị nhỏ nhất, 2 biểu thị giá trị nhỏ nhì,
cứ như vậy cho tới hết. Khi đó, với 1 ≤ i < j ≤ n, lấy I(i, j) bằng 1, nếu i và j
được so sánh trực tiếp và bằng 0 nếu i và j không được so sánh trực tiếp. Tính
11

tổng các biến này với i < j cho ta tổng số phép so sánh. Đó là
X =
n
j=2
j−1
i=1
I(i, j)
tức là
E[X] = E[
n
j=2
j−1
i=1
I(i, j)]
=
n
j=2
j−1
i=1
E[I(i, j)]
=
n
j=2
j−1
i=1
P{ i và j được so sánh }
Để tính xác suất để i và j được so sánh, chú ý rằng giá trị i, i + 1, . . . , j − 1, j
ban đầu cùng nằm trong một nhóm (vì tất cả các giá trị ban đầu đều cùng
trong nhóm) và sẽ vẫn cùng nhóm nếu giá trị so sánh được chọn đầu tiên không
nằm giữa i và j. Ví dụ, nếu số được so sánh lớn hơn j thì tất cả các giá trị
i, i + 1, . . . , j − 1, j sẽ cùng nằm trong nhóm bên trái số đó còn nếu số được so
sánh nhỏ hơn i thì tất cả sẽ cùng nằm trong nhóm bên phải. Do đó, tất cả các
giá trị i, i + 1, . . . , j − 1, j sẽ vẫn cùng nhóm cho tới khi một trong số các giá trị
này được chọn làm giá trị so sánh. Nếu giá trị so sánh này không phải là i và j
thì khi so sánh với nó, i sẽ nằm trong nhóm bên trái còn j thì thuộc nhóm bên
phải, do đó i và j sẽ không bao giờ được so sánh. Biết rằng giá trị so sánh là một
trong các giá trị nằm giữa i và j nên nó có thể là bất cứ giá trị nào trong j −i+1
giá trị còn lại, do đó xác suất để hoặc i hoặc j được so sánh là 2/(j − i + 1). Ta
có thể rút ra kết luận:
P{i và j được so sánh} =
2
j − i + 1
12

Từ đó ta thấy,
E[X] =
n
j=2
j−1
i=1
2
j − i + 1
= 2
n
j=2
j
k=2
1
k
bằng cách cho k=j-i+1
= 2
n
k=2
n
j=k
1
k
qua việc trao đổi thứ tự của tổng
= 2
n
k=2
n − k + 1
k
= 2(n + 1)
n
k=2
1
k
− 2(n − 1)
Áp dụng công thức tiệm cận cho n lớn
n
k=2
1
k
log(n)
Ta thấy (bỏ qua giới hạn tuyến tính 2(n − 1) thuật toán sắp xếp nhanh yêu
cầu trung bình khoảng 2n log(n) phép so sánh để sắp xếp n giá trị.
1.1.2.1 Thuật toán tìm kiếm
Tiếp tục giả sử một tập hợp gồm n giá trị khác nhau x1, x2, . . . , xn nhưng lần
này, mục đích của chúng ta là tìm giá trị nhỏ thứ k trong số đó. Thuật toán tìm
kiếm khá giống với thuật toán sắp xếp nhanh, cả hai cùng bắt đầu bằng cách
chọn ngẫu nhiên một giá trị rồi so sánh từng giá trị còn lại với nó và đặt các giá
trị nhỏ hơn vào trong nhóm bên trái và giá trị lớn hơn vào nhóm bên phải. Giả
sử r − 1 giá trị được đặt trong nhóm bên trái, có ba khả năng xảy ra :
1. r=k
2. r<k
3. r>k
Trong trường hợp (1), giá trị nhỏ thứ k là giá trị so sánh và thuật toán kết
thúc. Trong trường hợp (2), vì giá trị nhỏ thứ k là giá trị nhỏ thứ (k − r) trong
13

(n − r) giá trị trong nhóm bên phải nên quá trình bắt đầu lại với một giá trị
trong nhóm này. Trong trường hợp (3), quá trình bắt đầu lại bằng cách tìm kiếm
giá trị nhỏ thứ k trong r − 1 giá trị ở nhóm bên trái.
Đặt X là số so sánh thuật toán sử dụng. Như trong phân tích thuật toán sắp
xếp nhanh ở trên, coi 1 là giá trị nhỏ nhất,2 là giá trị nhỏ thứ hai,. . . và quy
ước I(i, j) bằng 1 nếu i và j được so sánh trực tiếp và bằng 0 nếu i và j không
được so sánh trực tiếp. Khi đó
X =
n
j=2
j−1
i=1
I(i, j)
và
E[X] =
n
j=2
j−1
i=1
P{i và j được so sánh }
Để tìm được xác suất để i và j được so sánh, chúng ta xem xét các trường hợp
sau :
Trường hợp 1: i < j ≤ k
Trong trường hợp này, i, j, k sẽ vẫn cùng nhóm cho tới khi một trong các giá
trị i, i + 1, . . . , k được chọn làm giá trị so sánh. Nếu giá trị được chọn hoặc là i
hoặc là j thì cặp giá trị sẽ được so sánh, nếu không, chúng sẽ không được so
sánh. Vì giá trị so sánh có thể là bất cứ giá trị nào trong k − i + 1 giá trị này,
chúng ta thấy :
2
k − i + 1
Trường hợp 2: i ≤ k < j
Trong trường hợp này, i, j, k vẫn nằm trong cùng nhóm cho tới khi một trong
j − i + 1 giá trị i, i + 1, . . . , j được chọn làm giá trị so sánh. Nếu giá trị được chọn
là i hoặc j thì cặp giá trị sẽ được so sánh và ngược lại. Do đó,
2
j − i + 1
Trường hợp 3: k < i < j
Trong trường hợp này,
2
j − k + 1
Từ đó ta có
1
2
E[X] =
k
j=2
j−1
i=1
1
k − i + 1
+
n
j=k+1
k
i=1
1
j − i + 1
+
n
j=k+2
j−1
i=k+1
1
j − k + 1
14

Để ước lượng giá trị trên khi n và k lớn, đặt k = αn với 0 < α < 1.
Có
k
j=2
j−1
i=1
1
k − i + 1
=
k−1
i=1
k
j=i+1
1
k − i + 1
=
k−1
i=1
k − i
k − i + 1
=
k
j=2
j − 1
j
k − log(k)
k = αn
Tương tự,
n
j=k+1
k
i=1
1
j − i + 1
=
n
j=k+1
1
j − k + 1
+ ... +
1
j
n
j=k+1
(log(j) − log(j − k))
n
k
log(x)dx −
n−k
1
log(x)dx
n log(n) − n − (αn log(αn) − αn)
−(n − αn) log(n − αn) + (n − αn)
n[−α log(α) − (1 − α) log(1 − α)]
Tương tự như trên
n
j=k+2
j−1
i=k+1
1
j − k + 1
n − k = n(1 − α)
Ta thấy
E[X] 2n[1 − α log(α) − (1 − α) log(1 − α)]
Do đó, số phép so sánh trung bình thuật toán tìm kiếm cần là công thức tuyến
tính của số giá trị.
1.1.3 Mô hình danh sách tự tổ chức
Xem xét n phần tử e1, . . . , en ban đầu được sắp xếp theo một trật tự. Tại mỗi
thời điểm có một yêu cầu đối với một trong số các phần tử này; ei được yêu cầu
15

độc lập với trước đó, xác suất Pi. Sau khi đáp ứng được yêu cầu, phần tử này
được chuyển lên đầu danh sách. Ví dụ, nếu trật tự hiện tại là e1, e2, e3, e4 và e3
được yêu cầu thì trật tự sau đó là e3, e1, e2, e4.
Chúng ta sẽ xác định vị trí kỳ vọng của phần tử được yêu cầu với giả thiết
quá trình này diễn ra trong thời gian dài. Đặt R là vị trí phần tử được yêu cầu,
ta sẽ tìm E[R] phần tử được chọn bằng cách kiểm tra điều kiện với Y . Ta có
E[R] =
n
i=1
E[R|Y = ei]Pi
=
n
i=1
E[ vị trí của ei | Y = ei]Pi
=
n
i=1
E[ vị trí của ei]Pi (1.1)
Dấu bằng cuối cùng dựa trên cơ sở vị trí của ei và biến cố ei được yêu cầu
độc lập với nhau. Điều này có được do xác suất để ei được yêu cầu là Pi cho dù
hiện tại ei có ở vị trí nào đi nữa. Tuy nhiên, ta thấy
vị trí của ei = 1 +
j=i
Ii,j
trong đó
Ii,j =
1, nếu ej đứng trước ei
0, ngược lại
ta thu được
E[vị trí của ei] = 1 +
j=i
E[Ii,j]
= 1 +
j=i
P{ej đứng trước ei} (1.2)
Để xác định P{ej đứng trước ei}, ta thấy ej đứng trước ei nếu lần yêu cầu
cuối cùng với một trong hai phần tử này là lần yêu cầu với ej. Tuy nhiên, biết
rằng một lần yêu cầu có thể yêu cầu hoặc ei hoặc ej nên xác suất để ej được
yêu cầu là
P(ej | ei hoặc ej) =
Pj
Pi + Pj
Do đó, P{ej đứng trước ei} = Pj/(Pi + Pj). Từ kết quả (??) và (??) ta có
E[R] = 1 +
n
i=1
Pi
j=i
Pj
Pi + Pj
16

1.1.4 Sinh hoán vị ngẫu nhiên
Ta nói rằng vec-tơ X(1), . . . , X(n) ngẫu nhiên là hoán vị ngẫu nhiên của giá
trị 1, . . . , n nếu
P{(X(1), . . . , X(n)) = (i1, ...in)} = 1/n!
cho tất cả n! hoán vị i1, . . . , in của 1, . . . , n. Khi đó, một hoán vị ngẫu nhiên có
thể là bất cứ hoán vị nào trong n! hoán vị của 1, . . . , n. Giả sử trong phần này
X(1), . . . , X(n) là một hoán vị ngẫu nhiên.
Ví dụ 1.1.1. Bài toán đối sánh Giả sử mỗi người trong n người tham gia
bữa tiệc đóng góp chiếc mũ của họ. Số mũ này được tổng hợp lại để sau đó mỗi
người ngẫu nhiên chọn một chiếc. Nếu ta xác định một chiếc mũ bằng người sở
hữu nó và gọi X(i) là chiếc mũ được chọn bởi người i thì giả sử người chọn mũ
có thể chọn bất cứ chiếc mũ nào còn lại vào thời điểm chọn thì X(1), . . . , X(n)
là một hoán vị ngẫu nhiên.
Gọi
X1
(i) = X(i)
và với j > 1:
Xj
(i) = X(Xj−1
(i))
Ví dụ, trong bài toán đối sánh, X2(i) sẽ là chiếc mũ được chọn bởi người có chiếc
mũ được chọn bởi người i. Nếu Xk(i) = i thì chuỗi i, X(i), . . . , Xk−1(i) được gọi
là một chu trình. Ví dụ với n = 6, và
X(1) = 2, X(2) = 4, X(3) = 6, X(4) = 1, X(5) = 5, X(6) = 3
khi đó
1, 2, 4 3, 6 5
đều là chu trình. Lưu ý rằng một chu trình là một chuỗi tuần hoàn mà trong đó
nó có thể bắt đầu tại bất cứ giá trị nào. Nếu Xk(i) = i thì i, X(i), . . . , Xk−1(i) và
Xj(i), . . . , Xk−1(i), i, X(i), . . . , Xj−1(i) là phép biểu diễn của cùng một chu trình.
Ngoài ra, mỗi giá trị 1, . . . , n là một phần tử của đúng một chu trình.
Ví dụ 1.1.2. Trong bài toán đối sánh, 1, 5, 3 là một chu trình nếu người 1 chọn
mũ của người 5, người 5 chọn mũ của người 3 và người 3 chọn mũ của người 1.
Các chu trình 1, 5, 3 5, 3, 1 3, 1, 5 được coi là một chu trình.
17

Nếu X(i) = i ta nói rằng i là một điểm cố định của hoán vị. Trong bài toán
đối sánh, i là điểm cố định nếu người i chọn đúng chiếc mũ của mình. Bây giờ
chúng ta sẽ tính toán hàm phân phối xác suất số điểm cố định của một hoán
vị ngẫu nhiên. Trước hết chúng ta phải tìm xác suất để không có điểm cố định
nào. Gọi En là biến cố không có điểm cố định trong hoán vị ngẫu nhiên n giá trị
(một hoán vị ngẫu nhiên mà không có điểm cố định nào được gọi là Xáo trộn),
và Pn = P(En). Để tìm Pn, gọi C là chiều dài chu trình chứa một giá trị thiết
lập, giả sử 1. Kiểm tra điều kiện với C được
Pn =
n
k=1
P(En | C = k)P{C = k} (1.3)
bây giờ
P{C = k} = P{X(1) = 1, X2
(1) = 1, ..., Xk−1
(1) = 1, Xk
(1) = 1}
=
n − 1
n
n − 2
n − 1
...
n − k + 1
n − k + 2
1
n − k + 1
=
1
n
(1.4)
Khi đó, kích thước của chu trình chứa một giá trị thiết lập có thể là bất cứ
giá trị nào trong số các giá trị 1, . . . , n. Vì C = 1 tương đương với X(1) = 1, ta
thấy
P(En | C = 1) = 0 (1.5)
Giả sử C = k > 1, gọi S là chu trình chứa giá trị 1. Vì S là một chu trình nên
nếu i /∈ S thì X(i) /∈ S. Biết rằng C = k, do đó vec-tơ ngẫu nhiên X(i), i /∈ S, là
một hoán vị của n − k giá trị không thuộc chu trình. Vì thế với k > 1 thì
P(En | C = k) = Pn−k, k > 1 (1.6)
Thay thế kết quả từ (??), (??), (??) vào (??) ta được
Pn =
1
n
n
k=2
Pn−k
tương đương với
nPn =
n
k=2
Pn−k
18

Thay n bằng n − 1 vào đẳng thức trước
(n − 1)Pn−1 =
n−1
k=2
Pn−1−k
Thực hiện phép trừ
nPn − (n − 1)Pn−1 = Pn−2
Hay
Pn − Pn−1 = −
1
n
(Pn−1 − Pn−2)
Với P1 = 0 và P2 =
1
2
, từ đẳng thức trên trên ta có:
P3 − P2 = −
1
3
(P2 − P1) = −
1
3!
hoặc P3 =
1
2!
−
1
3!
P4 − P3 = −
1
4
(P3 − P2) = −
1
4!
hoặc P4 =
1
2!
−
1
3!
+
1
4!
Tổng quát,
Pn =
1
2!
−
1
3!
+
1
4!
− ... +
(−1)n
n!
=
n
i=0
(−1)i
i!
Để tính toán xác suất của chính xác k điểm cố định, chúng ta sẽ xem xét
một tập hợp cố định gồm k phần tử trong các giá trị 1, . . . , n, giả sử là 1, 2, . . . , k.
Gọi S là tập hợp các phần tử cố định thì
P{S = {1, ..., k}} = P{X(i) = i, i = 1, ..., k
không có điểm cố định khác}
Tuy nhiên,
P{X(i) = i, i = 1, ..., k} =
1
n
1
n − 1
...
1
n − k + 1
Và
P{ không có điểm cố định khác|X(i) = i, i = 1, ..., k} = Pn−k
trong đó đẳng thức trên trên dựa trên điều kiện X(i) = i, i = 1, . . . , k, số lượng
X(j), j > k có thể coi là một hoán vị trên tập hợp gồm n − k giá trị j, j > k, khi
đó xác suất để không có điểm cố định nào trong hoán vị này là Pn−k. Do vậy,
P{S = {1, ..., k}} =
(n − k)!
n!
Pn−k
19

Vì có n
k lựa chọn k điểm cố định nên từ đẳng thức trên trên, với F là số điểm
cố định của hoán vị ngẫu nhiên thì
P{F = k} =
n
k
(n − k)!
n!
Pn−k =
Pn−k
k!
=
n−k
i=0
(−1)i
/i!
k!
Với n lớn
lim
n→∞
P{F = k} = e−1
/k!
Kết quả là, khi n lớn số điểm cố định của hoán vị ngẫu nhiên xấp xỉ một
biến Poisson ngẫu nhiên với trị số trung bình là 1.
Bây giờ ta sẽ xác định hàm phân phối của N với N là số chu trình của hoán
vị ngẫu nhiên. Coi chu trình đầu tiên là chu trình chứa giá trị 1, chu trình thứ
hai chứa giá trị nhỏ nhất không thuộc chu trình đầu, chu trình thứ ba là chu
trình chứa giá trị nhỏ nhất không thuộc chu trình thứ nhất và thứ hai, cứ tiếp
tục như vậy cho tới chu trình cuối cùng. Ta hãy xem xét một hoán vị chứa các
chu trình theo thứ tự tăng dần, mỗi chu trình bắt đầu từ giá trị được đánh số
thấp nhất trong chu trình đó. Gọi hoán vị này là hoán vị chu trình, đặt Ij bằng
1 nếu giá trị ở vị trí j trong hoán vị chu trình là giá trị cuối cùng của một chu
trình và bằng 0 trong các trường hợp còn lại. Ví dụ, nếu hoán vị ngẫu nhiên là
X(1) = 2, X(2) = 4, X(3) = 6, X(4) = 1, X(5) = 5, X(6) = 3
thì hoán vị chu trình là
1, 2, 4, 3, 6, 5
và I3 = I5 = I6 = 1, I1 = I2 = I4 = 0. Vì N là tổng số các chu trình nên ta có
N =
n
j=1
Ij
Gọi Yj là giá trị thứ j trong hoán vị chu trình, biết rằng chuỗi
X(Y1), . . . , X(Yj−1), biến ngẫu nhiên X(Yj) có thể là bất cứ giá trị nào trong
n − j + 1 giá trị trong chuỗi này, trong đó một giá trị sẽ dẫn tới kết quả Yj là giá
trị cuối cùng trong dãy. Như vậy, ta đã chứng minh Hệ quả sau:
Hệ quả 1.1.3.
N =
n
j=1
Ij
20

trong đó I1, . . . , In là các biến ngẫu nhiên độc lập sao cho
P{Ij = 1} =
1
n − j + 1
= 1 − P{Ij = 0}, j = 1, ..., n
Từ Hệ quả 1.1.3 , có
E[N] =
n
i=1
1
i
Var(N) =
n
i=1
i − 1
i2
Ngoài ra, khi n lớn, từ Hệ quả 1.1.3 và định lý giới hạn trung tâm, N có hàm
phân phối xấp xỉ chuẩn.
1.1.4.1 Phép nghịch đảo
Một số liệu khác cần tính toán là số nghịch đảo của hoán vị ngẫu nhiên mà
tại đó với bất cứ hoán vị nào trong các hoán vị 1, 2, . . . , n, ta nói rằng cặp thứ
tự (i, j) là một nghịch đảo nếu i < j nhưng j đứng trước i trong hoán vị. Ví dụ
hoán vị
2, 4, 1, 5, 6, 3
có năm nghịch đảo là (1, 2), (1, 4), (3, 4), (3, 5), (3, 6).
Gọi N là số nghịch đảo của một hoán vị ngẫu nhiên của 1, . . . , n. Nếu ta gọi
I(i, j) = 1, nếu (i,j) là một nghịch đảo
0, ngược lại
thì
N =
j i<j
I(i, j) (1.7)
Vì cũng như hoán vị ngẫu nhiên,i đứng trước j vẫn giống như j đứng trước
i, ta thấy rằng:
E[N] =
j i<j
E[I(i, j)] =
n
2
2 =
n(n − 1)
4
(1.8)
Chúng ta có thể áp dụng đẳng thức (??) để tính phương sai của N nhưng sẽ
rõ ràng hơn nếu xác định được biến ngẫu nhiên Nj, j = 1, . . . , n bằng cách:
Nj =
i<j
I(i, j)
21

Trong đó, Nj là số nghịch đảo của hoán vị tạo ra khi j đứng trước một phần tử
nhỏ hơn nó. Ta có
N =
n
j=1
Nj
tầm quan trọng của biểu thức này nằm ở chỗ biến ngẫu nhiên N1, . . . , Nn là độc
lập với nhau. Để biết nguyên nhân tại sao, hãy nhớ rằng nếu biết các giá trị
N1, . . . , Nj thì cũng sẽ biết thứ tự tương đối của 1, . . . , j trong hoán vị. Ví dụ
nếu 2 đứng trước 3 và 3 đứng trước 1 thì sẽ là trường hợp N1 = 0, N2 = 1, N3 = 1
trong hoán vị ngẫu nhiên. Tuy nhiên vì thứ tự tương đối 1, . . . , j không cho ta
biết có bao nhiêu giá trị trong số các giá trị này đứng sau j + 1 nên Nj+1 độc
lập với N1, . . . , Nj; do đó, các biễn ngẫu nhiên N1, . . . , Nn độc lập. Hơn nữa, vì
trong hoán vị ngẫu nhiên, j có thể xuất bất cứ vị trí nào với xác suất như nhau
trong các giá trị 1, . . . , j nên
P{Nj = k} = 1/j, k = 0, ..., j − 1
Do vậy,
E[Nj] =
1
j
j−1
k=0
k =
j − 1
2
E[N2
j ] =
1
j
j−1
k=0
k2
=
(j − 1)(2j − 1)
6
thu được
Var(Nj) =
j2 − 1
12
Áp dụng biểu thức trên N =
n
j=1
Nj
cùng với sự độc lập của Nj ta được:
Var(N) =
n
j=1
j2 − 1
12
=
n(n − 1)(2n + 5)
72
(1.9)
Ví dụ 1.1.3. Một phương pháp thông dụng để sắp xếp một dãy các số khác
nhau là phương pháp sắp xếp chèn. Phương pháp này được thực hiện theo nguyên
tắc lần lượt sắp xếp các giá trị i đầu tiên trong danh sách với i = 1, 2, . . . , n. Tại
bước i, i = 1, . . . , n, giá trị thứ i trong danh sách được xem xét và chèn vào vị trí
thích hợp giữa danh sách đã sắp xếp theo thứ tự của i − 1 giá trị đầu, chuyển
22

mỗi giá trị lớn hơn vào bên phải để tạo chỗ cho giá trị mới. Ví dụ, giả sử danh
sách ban đầu là:
6 1 4 2 5 3
Bảng dưới đây thể hiện danh sách được sau xếp sau mỗi bước, in đậm thể
hiện các giá trị được di chuyển.
6
1 6
1 4 6
1 2 4 6
1 2 4 5 6
1 2 3 4 5 6
Gọi X là tổng số giá trị được di chuyển. Giả sử thứ tự ban đầu trong danh sách
có thể là bất cứ thứ tự nào trong n! thứ tự có thể có, ta hãy tìm E[X] và Var(X).
Lời giải. Với i < j, giá trị nhỏ thứ j sẽ được di chuyển khi giá trị nhỏ thứ i được
chèn vào nếu thấy giá trị nhỏ thứ j đứng trước giá trị nhỏ thứ i trong danh sách
ban đầu. Vì vậy, số giá trị được di chuyển bằng với số nghịch đảo của thứ tự
ban đầu. Khi đó, từ (??) và (??) ta thấy
E[X] =
n(n − 1)
4
V ar[X] =
n(n − 1)(2n + 5)
72
♦
1.1.4.2 Dãy số con tăng dần
Chúng ta gọi X(i1), . . . , X(ik) là dãy số con tăng dần của hoán vị ngẫu nhiên
nếu i1 < i2 < . . . < ik và X(i1) < X(i2) < . . . < X(ik).
Ví dụ 1.1.4. Tìm E[X] trong đó X là số dãy số con tăng dần
Lời giải. Với bất cứ dãy số con Sk của k chỉ số i tăng dần i1 < i2 < . . . < ik, I(S)
bằng 1 nếu X(i1) < . . . < X(ik) và bằng 0 nếu không thỏa mãn điều kiện này.
Vì tất cả thứ tự có thể của các giá trị X(i1), . . . , X(ik) là
E[I(Sk)] = 1/k!
Nên với
X =
k Sk
I(Sk)
23

Ta có
E[X] =
n
k=1 Sk
1/k! =
n
k=1
n
k
k!
Một dãy số con tăng dần không phải là một phần riêng biệt của một dãy số con
tăng dần lớn hơn được gọi là dãy số con tăng dần tối đa. Ví dụ hoán vị
3, 5, 1, 2, 4, 6
có hai dãy số con tăng dần tối đa là 3, 5, 6 và 1, 2, 4, 6. ♦
Ví dụ 1.1.5. Tìm E[M] với M là số dãy số con tăng dần tối đa.
Lời giải. Coi Ij bằng 1 nếu có một dãy số con tăng dần tối đa bắt đầu bằng j
và bằng 0 trong trường hợp còn lại thì
M =
n
j=1
Ij
tức là
E[M] =
n
j=1
P{Ij = 1}
Vì có một dãy số con tăng dần tối đa bắt đầu bằng j khi và chỉ khi j là giá trị
đầu tiên trong số các giá trị 1, .., j xuất hiện trong hoán vị, ta thu được :
E[M] =
n
j=1
1/j
Một chuỗi tăng của hóa vị là một dãy số con tăng dần của các giá trị liên tiếp
không phải là một phần của một dãy số con lớn hơn. Ví dụ hoán vị
4, 3, 5, 1, 2, 6
Có ba chuỗi tăng là 4, 5, 6 3 1, 2 ♦
Ví dụ 1.1.6. Tìm E[R] với R là số chuỗi tăng
Lời giải. nếu coi Ij bằng 1 khi có một chuỗi tăng bắt đầu với j và bằng 0 trong
các trường hợp khác thì
R =
n
j=1
Ij
24

Vì Ij bằng 1 nếu j đứng trước j − 1 trong hoán vị nên
P{I1 = 1} = 1/2, j > 1
Vì P{Ij = 1} = 1 ta được kết quả
E[R] = 1 +
n − 1
2
=
n + 1
2
♦
1.2 Phương pháp xác suất
1.2.1 Lời giới thiệu
Phương pháp xác suất là một kỹ thuật phân tích thuộc tính của phần tử
trong một tập hợp bằng cách đưa ra một không gian xác suất cho tập hợp này
và khảo sát một phần tử ngẫu nhiên. Phương pháp này chủ yếu được ứng dụng
để giải quyết các bài toán lý thuyết tổ hợp và đồ thị.
1.2.2 Ứng dụng xác suất để chứng minh sự tồn tại
Giả sử chúng ta muốn chứng minh một phần tử của tập hợp S có một tính
chất nào đó. Ta có thể nghiên cứu một phần tử ngẫu nhiên X trong tập hợp S
rồi chứng minh xác suất của biến cố đối ,biến cố mà X không có tính chất này,
nhỏ hơn 1.
Ví dụ 1.2.1. Giả sử mỗi cạnh trong n
2 cạnh của một đồ thị hoàn chỉnh gồm
n đỉnh được tô màu đỏ hoặc màu xanh. Câu hỏi đặt ra là, với một số nguyên k
cố định, tìm điều kiện của k và n để có thể tô màu các cạnh trong đó không có
tập hợp k đỉnh nào có tất cả k
2 cạnh liên thông cùng màu.
Để tìm được điều kiện này, ta giả sử mỗi cạnh độc lập đều có khả năng
được tô màu xanh hoặc đỏ như nhau. Đánh số n
k các tập hợp i có k đỉnh,
i = 1, . . . , n
k , gọi Ei là biến cố tất cả các cạnh liên thông của tập hợp thứ i được
tô cùng màu. Vì mỗi cạnh trong k
2 cạnh liên thông của một tập hợp k đỉnh
đều có khả năng là đỏ hoặc xanh như nhau nên
P(Ei) = 2(1/2)k(k−1)/2
Do đó,
P
i
Ei ≤
i
P(Ei) =
n
k
2(1/2)k(k−1)/2
25

Như vậy, nếu
n
k
2(1/2)k(k−1)/2
< 1
thì xác suất để ít nhất một tập hợp k đỉnh chứa tất cả các cạnh liên thông cùng
màu nhỏ hơn 1. Tuy nhiên, điều này cũng có nghĩa rằng tồn tại một xác suất
dương để không tập hợp k đỉnh nào chứa tất cả các cạnh liên thông cùng màu,
tức là có ít nhất một cách tô màu cho ta kết quả này.
Ví dụ 1.2.2. Kết quả của giải đấu thể thức vòng tròn. Một giải đấu thi
đấu theo thể thức vòng tròn gồm n đấu thủ là giải đấu trong đó mỗi cặp trong
n
2 cặp đấu thủ thi đấu với nhau một lần, chỉ có thắng hoặc thua, không có kết
quả hòa. Với một số nguyên k cố định, k < n, ta phải tìm điều kiện đủ cho k và
n để trong giải đấu này, có một người thắng tất cả các đối thủ trong mỗi tập
hợp k đấu thủ.
Để tìm điều kiên đủ thỏa mãn, giả sử kết quả của mỗi trận đấu khác nhau
là độc lập và trong mỗi trận, các đấu thủ có khả năng giành chiến thắng như
nhau. Nếu A là biến cố mỗi tập hợp k đấu thủ có một người thắng tất cả các đối
thủ khác trong tập hợp thì Ac là biến cố tồn tại một tập hợp k đối thủ không có
ai thắng tất cả các đối thủ trong tập hợp này. Do đó, nếu ta đánh số ngẫu nhiên
n
k tập hợp kích thước k và gọi Bi là biến cố không ai thắng tất cả k thành
phần của tập hợp thứ i thì
P(Ac
) = P ∪i Bi ≤
i
P(Bi)
Xác suất để bất cứ đấu thủ cho trước không thuộc tập hợp thứ i không thắng
tất cả các đối thủ khác trong tập hợp này là 1 − (1/2)k nên
P(Bi) = [1 − (1/2)k
]n−k
có nghĩa là
P(Ac
) ≤
n
k
[1 − (1/2)k
]n−k
Do vậy, nếu
n
k
[1 − (1/2)k
]n−k
< 1
thì tồn tại một xác suất dương để giải đấu có thể xảy ra một kết quả như trên.
26

1.2.3 Xác định cận từ kỳ vọng
Gọi f là hàm của phần tử s thuộc tập hợp hữu hạn S, giả sử ta muốn tìm
m = max
s∈S
f(s)
Cận dưới hữu ích có thể được xác định bằng cách sau: gọi X là một phần tử
ngẫu nhiên của S có giá trị kỳ vọng f(X) có thể tính được, với m ≥ f(X) ta có
m ≥ E[f(X)]
Bất đẳng thức mạnh nếu f(X) là một đại lượng ngẫu nhiên không đổi.
Ví dụ 1.2.3. Hệ thống tin cậy vòng tròn k trong r trên n với k ≤ r ≤ n gồm n
thành phần, mỗi thành phần hoặc có hoạt động hoặc bị lỗi được sắp xếp thành
một hình tròn. Hệ thống hoạt động nếu không tồn tại một nhóm r thành phần
liên tiếp nào chứa ít nhất k thành phần bị lỗi. Chứng minh rằng không thể sắp
xếp 47 thành phần trong đó có 8 thành phần bị lỗi để tạo ra một hệ thống vòng
tròn 3 trong 12 trên 47 thành phần.
Lời giải. Ta phải chứng minh với cách sắp xếp 47 thành phần đều có một nhóm
12 thành phần liên tiếp chứa ít nhất 3 thành phần bị lỗi. Khi đó, chọn ngẫu
nhiên một trong 47 thành phần này. Xem xét thành phần đó cùng với 11 thành
phần tiếp theo tính theo chiều kim đồng hồ. Gọi X là số thành phần lỗi trong
nhóm 12 thành phần. Để xác định E[X], đánh số i ngẫu nhiên 8 thành phần lỗi,
i = 1, . . . , 8.
Xi =
1, nếu thành phần i bị lỗi thuộc nhóm 12 thành phần
0, ngược lại
Khi đó,
X =
8
i=1
Xi
Và
E[X] =
8
i=1
E[Xi]
Vì Xi bằng 1 nếu thành phần được chọn ngẫu nhiên hoặc là thành phần i
bị lỗi hoặc là bất cứ thành phần nào trong 11 thành phần liền kề theo hướng
ngược chiều kim đồng hồ nên E[Xi] = 12/47. Ta có:
E[X] = 8(12/47) = 96/47
27

Vì E[X] > 2 nên có ít nhất một tập hợp 12 thành phần liên tiếp chứa ít nhất
ba thành phần lỗi. ♦
Ví dụ 1.2.4. Số đường đi Hamilton tối đa trong một giải đấu. Xem xét
một giải đấu thi đấu theo thể thức vòng tròn gồm n > 2 đấu thủ (xem định nghĩa
Ví dụ 1.2.2), giả sử các đấu thủ được đánh số 1, 2, 3, . . . , n. Hoán vị i1, i2, . . . , in
là đường đi Hamilton nếu i1 thắng i2, i2 thắng i3, . . . ,và in−1 thắng in. Ta cần
xác định số đường đi Hamilton lớn nhất có thể xảy ra.
Giả sử có ba đấu thủ. Nếu một trong số họ thắng hai lần thì có một đường
đi Hamilton duy nhất (ví dụ nếu 1 thắng hai lần và 2 thắng 3 thì chỉ có một
đường đi Hamilton là 1, 2, 3); ngược lại, nếu mỗi đấu thủ thắng một lần thì có ba
đường đi Hamilton (ví dụ, nếu 1 thắng 2, 2 thắng 3 và 3 thắng 1 thì 1, 2, 3 2, 3, 1,
và 3, 1, 2 đều là đường đi Hamilton.) Do đó, khi n = 3 thì có tối đa ba đường đi
Hamilton.
Ta sẽ chứng minh giải đấu có thể có hơn n!/2n−1 đường đi Hamilton. Giả sử
kết quả của n
2 trận đấu độc lập với nhau, mỗi đấu thủ đều có khả năng giành
chiến thắng như nhau. Gọi X là số đường đi Hamilton có được. Để tính E[X],
đánh số n! hoán vị từ i = 1, . . . , n!. Đặt
Xi =
1, nếu hoán vị i là đường đi Hamilton
0, ngược lại
Vì
X =
i
Xi
nên
E[X] =
i
E[Xi]
Tuy nhiên, với giả thiết kết quả các trận đấu độc lập với nhau, vì xác suất
để bất cứ hoán vị cho trước nào là đường đi Hamilton là (1/2)n−1 nên
E[Xi] = P{X1 = 1} = (1/2)n−1
Do vậy
E[X] = n!(1/2)n−1
trong đó vì X không phải biến ngẫu nhiên cố định nên giải đấu tồn tại một kết
quả có hơn n!/2n−1 đường đi Hamilton.
28

Trong ví dụ trước, phần tử ngẫu nhiên X của tập hợp S có thể là bất cứ
phần tử nào trong S. Tuy nhiên, như trong hai ví dụ tiếp theo, chúng ta có thể
tìm được kết quả hay hơn bằng cách chọn một phân phối khác cho X.
Ví dụ 1.2.5. Bài toán phân hoạch cực đại. Xem xét một đồ thị hoàn chỉnh
gồm các đỉnh {1, . . . , n} với n = 2k là chẵn, giả sử với mỗi cặp đỉnh riêng biệt
i = j, có một số không âm c(i, j) = c(j, i) được gọi là sức chứa của cạnh (i, j).
Việc phân bổ các đỉnh vào các tập hợp không rỗng X và Xc được gọi là một
phân hoạch. Số lượng
c(X, Xc
) =
i∈X j∈Xc
c(i, j)
bằng tổng sức chứa các cạnh có một đỉnh thuộc X và một đỉnh thuộc Xc được
gọi là sức chứa của phân hoạch X, Xc. Gọi
m = max
X
c(X, Xc
)
là sức chứa phân hoạch cực đại. Ta phải tìm một cận dưới của m.
Trước hết ta hãy giải quyết bài toán chia các đỉnh thành các cặp rời để tối
đa hóa tổng sức chứa của k cặp. Với cách phân bổ M các đỉnh thành k cặp, gọi
c(M) =
(i,j)∈M
c(i, j)
và M∗ là
max
M
c(M) = c(M∗
)
Đặt C = i<j c(i, j) là tổng sức chứa các cạnh.
Mệnh đề 1.2.1.
m ≥ C/2 + c(M∗
)/2
Chứng minh. Gọi (ir, jr), r = 1, . . . , k là các cặp của M∗. Giả sử một trong hai
đỉnh của mỗi cặp được chọn ngẫu nhiên và độc lập. Gọi X là tập hợp chứa k
đỉnh được chọn đó còn Xc là tập hợp chứa các đỉnh còn lại. Đặt
I(i, j) =
0, nếu i ∈ X, j ∈ X hoặc i ∈ Xc, j ∈ Xc
1, ngược lại
Tức là I(i, j) bằng 1 nếu i và j đều không cùng thuộc tập hợp X hay Xc. Do đó
ta có
c(X, Xc
) =
j i<j
c(i, j)I(i, j)
29

hay
E[c(X, Xc
]) =
j i<j
c(i, j)E[I(i, j)]
=
j i<j
c(i, j)P{I(i, j) = 1}
Tuy nhiên
P{I(i, j) = 1} =
1, nếu (i, j) ∈ M∗
1/2, nếu (i, j) /∈ M∗
nên m ≥ E[C(X, Xc)]
1.2.4 Bài toán tập hợp độc lập có trọng số tối đa: Thuật toán
cận biên và ngẫu nhiên
Xem xét một đồ thị có tập hợp đỉnh {1, . . . , n}. Một tập hợp có các đỉnh được
coi là độc lập nếu không có cặp đỉnh nào trong đồ thị kề nhau, trong đó hai cạnh
i và j kề nhau nếu (i, j) là một cạnh của đồ thị. Ví dụ, cho đồ thị trong Hình
1.6, tập hợp đỉnh {2, 3, 4, 5, 6} độc lập với nhau, còn tập hợp đỉnh {1, i}, i = 1 thì
không độc lập với nhau. Với đồ thị trong Hình 1.7, tập hợp đỉnh {1, 2, 3} và tập
hợp đỉnh {4, 5, 6} là các tập hợp độc lập còn tập hợp {1, 4} không là tập hợp độc
lập.
Hình 1.6
Giả sử mỗi đỉnh i, i = 1, . . . , n có trọng số wi dương liên hợp với nó. Với mỗi
tập hợp đỉnh A thì
w(A) =
i∈A
wi
30

Hình 1.7
và
m = max
A
w(A)
trong đó lấy cực đại trên các tập hợp A độc lập. m được gọi là số độc lập của
đồ thị.
Với mỗi hoán vị i1, . . . , in của đỉnh, ta có thể liên hợp một tập hợp độc lập bằng
cách:
• Gộp i1 vào
• Sau đó gộp đỉnh tiếp theo của hoán vị vào nếu đỉnh đó không kề với bất
cứ đỉnh nào đã được gộp vào trước đó.
Dễ thấy tập hợp của các đỉnh được gộp như vậy là một tập hợp độc lập.
Trong đồ thị Hình 1.6, nếu i1 = 1, tập hợp độc lập thu được là 1; nếu i1 = 1 thì
tập hợp độc lập thu được là {2, 3, 4, 5, 6}. Với đồ thị như trong Hình 1.7, tập hợp
độc lập là {1, 2, 3} hoặc {4, 5, 6} nếu i1 ≤ 3 hoặc i1 > 3.
Gọi Xi, i = 1, . . . , n là các biến ngẫu nhiên lũy thừa độc lập với hệ số λi, i =
1, . . . , n. Sắp xếp các biến này theo thứ tự, gọi ij là số mũ của biến nhỏ thứ j,
xem xét tập hợp A độc lập liên hợp với hoán vị i1, . . . , in. Khi đó, với I(B) là chỉ
31

số của biến cố B và D(i) là tập hợp gồm i và các đỉnh kề i, ta có:
m ≥ E[w(A)]
= E
i
wiI(i ∈ A)
=
i
wiP{i ∈ A}
≥
i
wiP{Xi = min
j∈D(i)
Xj}
=
i
wi
λi
j∈D(i) λj
trong đó tồn tại bất đẳng thức vì i chắc chắn là một đỉnh thuộc tập A nếu nó
xuất hiện trong hoán vi trước các đỉnh kề với nó. Từ đó, ta có mệnh đề sau.
Mệnh đề 1.2.2. Với mỗi số dương λi, i = 1, . . . , n,
m ≥
n
i=1
wiλi/∧i
trong đó
∧i =
j∈D(j)
λj
Nhận xét Rõ ràng từ đồ thị Hình 1.6, bỏ qua trọng số của đỉnh (coi các
trọng số là hằng số), ta có thể thu được một tập hợp độc lập lớn hơn nếu các
đỉnh trước đó của hoán vị có bậc nhỏ, trong đó bậc của đỉnh a bằng số cạnh kề
với nó. Tương tự, nếu tính cả trọng số của đỉnh, như ta thấy trong Hình 1.7 thì
một tập hợp độc lập có tổng trọng số lớn nếu các đỉnh trước đó của hoán vị là
các đỉnh có trọng số lớn. Do vậy, nếu d(i) là bậc của đỉnh i thì các lựa chọn cho
dạng thức λi = (wi/d(i))c, i = 1, . . . , n với mỗi giá trị dương của c sẽ cho một cận
đủ tốt.
Phải lưu ý rằng E[w(A)] có thể lớn hơn cận dưới được cho trong Mệnh đề
1.2.2. Ví dụ, với đồ thị trong Hình 1.7, cận bằng tổng kỳ vọng các trọng số của
tất cả các đỉnh cùng nằm về một phía của đồ thị với đỉnh đầu tiên của hoán
vị và xuất hiện trước bất kỳ đỉnh nào ở phía còn lại; ngược lại E[w(A)] bằng
tổng kỳ vọng các trọng số của tất cả các đỉnh cùng nằm một phía của đồ thị
với đỉnh đầu tiên của hoán vị. Do đó, ta có thể tìm được một kết quả chính xác
hơn nhiều (so với cận) bằng cách áp dụng quá trình này. Hơn nữa, sau mỗi lần
32

đỉnh mới được thêm vào tập hợp độc lập, ta nên loại bỏ đỉnh đó và tất cả các
đỉnh kề nó khỏi đồ thị và tính toán lại bậc của các đỉnh còn lại. Đây là thuật
toán sắp xếp ngẫu nhiên để ước lượng cả m và tập hợp độc lập có trọng số tối
ưu.
Thuật toán ước lượng ngẫu nhiên hóa
1. Đặt λi = (wi/d(i))b với tất cả các đỉnh i trong tập hợp đỉnh V
2. Tạo giá trị cho mỗi biến ngẫu nhiên I theo
P{I = j} =
λj
i∈V
λi
, j ∈ V
3. Đặt đỉnh I vào tập hợp độc lập, loại bỏ I và các đỉnh kề nó khỏi tập hợp
đỉnh của đồ thị. Tính lại bậc của các đỉnh còn lại rồi quay lại bước 1.
Lặp lại các bước này thu được tập hợp độc lập có trọng số lớn nhất là một
ước lượng của tập hợp độc lập có trọng số tối đa. Ta có thể chạy lại thuật toán
với cùng giá trị của b hoặc thay giá trị khác sau mỗi lần chạy.
Thuật toán ngẫu nhiên hóa rất hữu dụng khi giải quyết các bài toán có thể
nhanh chóng áp dụng một số thuật toán phỏng đoán khác. Bằng cách chọn ngẫu
nhiên giữa các thuật toán, chúng ta có thể tìm được một giải pháp gần như tối
ưu nhất.
Ví dụ 1.2.6. Xét một tập hợp các phần tử được chia thành hai tập hợp con để
giá trị tuyệt đối của hiệu hai tổng các trọng số các phần tử trong hai tập hợp
con là nhỏ. Như đã nói, thuật toán phỏng đoán thường được sử dụng cho bài
toán này là đánh số lại các phần tử để trọng số wi của phần tử i không tăng
trong i. Thuật toán xếp phần tử 1 vào tập hợp con 1, phần tử 2 vào tập hợp con
2, tiếp tục cho tới hết các phần tử. Ở mỗi bước, việc xếp các phần tử vào các
tập hợp con phải thỏa mãn điều kiện tổng trọng số là nhỏ nhất.
Dù đây là thuật toán hay để giải quyết bài toán nhưng ta vẫn có thể cải tiến
nó bằng cách xem xét một phiên bản ngẫu nhiên hóa cho phép thứ tự ban đầu
trở thành hoán vị ngẫu nhiên có trọng số. Để thực hiện thuật toán, ta cố định
các giá trị dương λ1 ≥ λ2 ≥ ... ≥ λn. Trước tiên thuật toán sẽ tạo ra một hoán
33

vị ngẫu nhiên không cố định I1, . . . , In của 1, . . . , n trong đó
P{I1 = j} =
λj
k λk
P{I2 = j | I1 = j} =
λj
k=I1
λk
P{I3 = j | I1 = j, I2 = j} =
λj
k=I1,I2
λk
Khi hoán vị được xác định, thuật toán phỏng đoán được áp dụng dựa vào
thứ tự hoán vị. Tuy nhiên, ta không dừng lại tại đây mà phải tạo ra một hoán
vị mới và lặp lại quá trình này. Việc này được thực hiện nhiều lần, giá trị tối
ưu nhất tìm được là giá trị ước lượng cho độ chênh lệch trọng số nhỏ nhất. Vì
hoán vị các phần tử có trọng số lớn ở gần đầu tốt nhất phải được xem xét nên
lựa chọn hợp lý cho λj có thể là
λj = wb
j , j = 1, ..., n
với b dương không đổi (không nhất thiết phải cố định b trước vì các giá trị b
khác nhau sẽ được thử khi áp dụng thuật toán.)
Các biến ngẫu nhiên lũy thừa có thể được sử dụng để tăng khả năng tạo ra hoán
vị ngẫu nhiên như trên. Để chứng minh điều này, gọi X1, . . . , Xn là các biến ngẫu
nhiên lũy thừa có hệ số tương ứng là λ1, ..., λn, và Ii là số mũ của biến nhỏ thứ
i trong n giá trị này (Ví dụ, XI1
= min Xi). Ta có
P{I1 = j} =
λj
k λk
Sử dụng đặc tính không nhớ của phân phối lũy thừa,
P{I2 = j | I1 = j} =
λj
k=I1
λk
Nói cách khác, I1, . . . , In chính là hoán vị ngẫu nhiên cần tìm. Do đó, ta có
thể sử dụng thuật toán ngẫu nhiên hóa như sau.
Thuật toán ước lượng ngẫu nhiên hóa
1. Tạo Y1, . . . , Yn là các biến ngẫu nhiên lũy thừa độc lập có trị số trung bình
1 bằng cách tạo ngẫu nhiên các số U1, . . . , Un và thiết lập Yi = −log(Ui)
2. Đặt Xi = Yi/λi, i = 1, . . . , n
34

3. Sắp xếp Xi theo thứ tự
4. Coi các chỉ số liền kề nhau của X đã sắp xếp là một hoán vị, áp dụng
thuật toán phỏng đoán với hoán vị này.
Thuật toán trên đây có thể được lặp lại nhiều lần, mỗi lần thực hiện ta có thể
sử dụng cùng các giá trị λi, nói λi = wb
i , hoặc thay đổi các giá trị khác.
1.2.5 Bài toán phủ tập hợp
Gọi Si, i = 1, . . . , m, là tập con của S = {1, 2, . . . , s}, Gọi ni là số tập hợp con
chứa i, và giả sử ni > 0 với mỗi i = 1, . . . , s. Bài toán phủ tập hợp là bài toán tìm
số tập con nhỏ nhất có thể hợp lại thành tập S. Gọi r là số tập con nhỏ nhất,
sử dụng phương pháp xác suất, chứng minh rằng với mỗi số nguyên k
r ≤ k +
s
i=1
m−ni
k
m
k
m − k + 1
ni + 1
(1.10)
Để chứng minh bất đẳng thức (??) , giả sử ta chọn ngẫu nhiên các tập hợp
con, loại bỏ các tập hợp đã chọn cho tới khi mỗi phần tử của S đều thuộc ít
nhất một trong những tập con này. Nếu gọi X là số tập con được chọn, thì
r ≤ E[X]
Do vậy, cận trên của E[X] sẽ là một cận trên của số tập con nhỏ nhất cần để
chứa hết các phần tử của S.
Để tìm cận trên của E[X], gọi Xi là số tập hợp con cần chọn để có một tập
hợp con chứa i. Khi đó
X = max
i≤s
Xi
Áp dụng đồng nhất thức sau: với mọi k > 0
max
i
Xi ≤ k +
i
(Xi − k)+
(1.11)
Ta có thể sử dụng ngay bất đẳng thức (??) . Nếu max Xi ≤ k thì vế trái bằng
max Xi và vế phải bằng k; ngược lại, nếu X(n) = max Xi > k, thì vế phải lớn hơn
hoặc bằng k +(X(n) − k) = X(n). Từ bất đẳng thức (??), lấy kỳ vọng của X ta có
E[X] ≤ k +
i
E[(Xi − k)+
] (1.12)
35

Có
E[(Xi − k)+
] = E[Xi − k | Xi > k]P{Xi > k} (1.13)
Rõ ràng
P{Xi > k} =
m−ni
k
m
k
(1.14)
Thêm vào đó, ta sẽ chứng minh
E[Xi − k | Xi > k] =
m − k + 1
ni + 1
(1.15)
Đẳng thức (??) đúng, với Xi > k thì có k tập hợp con được chọn ngẫu nhiên,
ni trong m − k tập hợp con không được chọn chứa i và m − k − ni tập hợp con
không được chọn không chứa i. Gọi Ij là biến giả cho biến cố tập hợp con thứ j
trong m − k − ni tập con không chứa i được chọn trước khi có một trong ni tập
hợp con chứa i vì mỗi tập hợp con chưa được chọn đều có khả năng là tập hợp
con được chọn tiếp theo, tức là P{Ij = 1} = 1/(ni + 1). Do vậy,
E[Xi − k | Xi > k] = E 1 +
m−k−ni
j=1
Ij
= 1 +
m−k−ni
j=1
E[Ij]
= 1 +
m − k − ni
ni + 1
=
m − k + 1
ni + 1
Từ kết quả trên và các kết quả (??), (??), (??) ta có
E[X] ≤ k +
i
m − k + 1
ni + 1
m−ni
k
m
k
Dấu bất đẳng thức trong (??) được chứng minh. Vì bất đẳng thức (??) là
đẳng thức nếu có đúng một tập hợp con Xi lớn hơn k, tốt nhất ta nên chọn k
để số tập hợp con Xi kỳ vọng lớn hơn k xấp xỉ bằng 1. Khi đó, k có thể là số
nguyên nhỏ nhất thỏa mãn
s
i=1
m−ni
k
m
k
≤ 1 (1.16)
36

1.2.6 Phản xích
Tập hợp A1, A2, . . . , Ar là các tập hợp con của {1, 2, . . . , n}, được gọi là một
phản xích nếu không có tập hợp nào trong các tập hợp này là tập hợp con của
tập khác, tức là Ai /∈ Aj với tất cả các cặp i = j. Định lý Sperner chỉ ra rằng
số tập hợp lớn nhất trong một phản xích là n
[n/2] trong đó [n/2] là số nguyên
lớn nhất nhỏ hơn hoặc bằng n/2. Do đó, tập hợp tất cả các tập hợp con của
{1, 2, . . . , n} kích thước [n/2] tạo thành phản xích lớn nhất. (Một tập hợp như
vậy chứa n
[n/2] tập hợp cùng kích thước và không có tập hợp nào là con của
một tập hợp khác).
Ta có thể áp dụng phương pháp xác suất để chứng minh định lý Sperner.
Trước hết, gọi I1, I2, . . . , In là một trong n! hoán vị bất kỳ của 1, 2, . . . , n. Xem
xét chuỗi tập hợp tăng sau:
{I1}, {I1, I2}, {I1, I2, I3}, . . . , {I1, I2, . . . , In}
Với mỗi phản xích A1, A2, . . . , Ar, gọi X là số tập hợp Ai chứa trong các tập
hợp {I1, . . . , Ij}, j = 1, . . . , n. Đặt Xi = 1 nếu Ai là một trong những tập hợp này
và Xi = 0 nếu Ai không là một trong những tập hợp đó, ta có
X =
r
i=1
Xi
Lấy kỳ vọng của X được
E[X] =
r
i=1
E[Xi]
=
r
i=1
P{Ai là một trong những tập hợp {I1, ..., Ij}, j = 1, ..., n}
Nếu Ai chứa ni phần tử thì nó sẽ là một trong những tập hợp tăng nếu
{I1, . . . , Ini } = Ai. Tuy nhiên, do phép đối xứng, {I1, . . . , Ini } đều có khả năng là
một trong số n
ni
tập hợp con kích thước ni nên xác suất để Ai là tập hợp con
này là 1/ n
ni
. Do đó, nếu gọi | Ai | là kích thước của Ai thì
E[X] =
r
i=1
1
n
|Ai|
Tuy nhiên, vì A1, A2, . . . , Ar là một phản xích nên tối đa chỉ có một trong số
chúng có thể thuộc các tập hợp tăng {I1, . . . , Ij}, j = 1, . . . , n. Vì vậy, X ≤ 1 tức
37

là
1 ≥ E[X] =
r
i=1
1
n
|Ai|
Tuy nhiên, sử dụng
n
j
≤
n
[n/2]
với mọi j
ta thấy
1 ≥
r
i=1
1
n
[n/2]
=
r
n
[n/2]
hay
r ≤
n
[n/2]
chính là định lý Sperner.
1.2.7 Bổ đề rút gọn Lovasz
Xem xét tập hợp các biến cố {Ai, i = 1, . . . , n} với 0 < P(Ai) < 1, giả sử ta
muốn chứng minh không biến cố nào có thể xảy ra. Rõ ràng đây là trường hợp
các biến cố độc lập với nhau nhưng ngay cả khi chúng không độc lập thì kết quả
này cũng có thể xảy ra khi mỗi biến cố “độc lập lẫn nhau” với mỗi tập hợp con
chứa hầu hết các biến cố khác như định nghĩa sau đấy.
Định nghĩa 1.2.1. Biến cố A độc lập lẫn nhau với tập hợp các biến cố
{B1, . . . , Br} nếu xác suất có điều kiện của A, với điều kiện để Bi xảy ra, bằng
xác suất không điều kiện P(A).
Bổ đề 1.2.1. Bổ đề rút gọn Lovasz Cho các biến cố A1, . . . , An, nếu với mỗi
i, i = 1, . . . , n, Ai độc lập lẫn nhau với một tập hợp chứa tất cả các biến cố ngoại
trừ nhiều nhất d biến cố Aj khác, j = i và
P(Ai) ≤
1
e(d + 1)
thì
P
n
j=1
Ac
j > 0
38

Chứng minh. Với S là một tập hợp con của {1, . . . , n}, gọi
Ac
S =
j∈S
Ac
j
là biến cố không biến cố Aj nào xảy ra, j ∈ S. Để xây dựng bổ đề, trước hết ta
phải chứng minh nếu i /∈ S thì
P(Ai | Ac
S) ≤
1
d + 1
(1.17)
Dùng phương pháp quy nạp với | S | để chứng minh bất đẳng thức (??)
trong đó | S | là số phần tử của S. Rõ ràng bất đẳng thức đúng với | S |= 0 vì
P(Ai) < 1/(d + 1). Giả sử bất đẳng thức đúng với mọi | S |≤ k, ta phải chứng
minh bất đẳng thức đúng với | S |= k + 1. Cố định i /∈ S, gọi E là một tập hợp
con chứa tất cả biến cố ngoại trừ nhiều nhất d biến cố Aj, j = i, mà Ai độc lập
lẫn nhau với các biến cố trong E. Đặt
S1 = {j ∈ S : Aj /∈ E}
S2 = {j ∈ S : Aj ∈ E}
Vì i /∈ S nên | S1 |≤ d. Có
P(Ai | Ac
S) =
P(AiAc
S)
P(Ac
S)
=
P(AiAc
S1
Ac
S2
)
P(Ac
S1
Ac
S2
)
=
P(AiAc
S1
| Ac
S2
)
P(Ac
S1
| Ac
S2
)
(1.18)
Để giới hạn tử số của phân số cuối trong (??), quan sát thấy Ai độc lập lẫn
nhau với các biến cố {Aj, j ∈ S2},
P(AiAc
S1
| Ac
S2
) ≤ P(Ai | Ac
S2
) = P(Ai) (1.19)
Để giới hạn mẫu số P(Ac
S1
| Ac
S2
) của phân số cuối trong (??) , ta giả sử
S1 = {j1, . . . , jr}. Nếu r = 0 thì mẫu số bằng 1, từ (??) và (??) ta thu được (??).
39

Nếu r > 0 thì
P(Ac
S1
| Ac
S2
) = P(Ac
j1
Ac
j2
...Ac
jr
| Ac
S2
)
= P(Ac
j1
| Ac
S2
)P(Ac
j2
| Ac
j1
Ac
S2
)...P(Ac
jr
| Ac
j1
...Ac
jr−1
Ac
S2
)
≥
d
d + 1
r
bằng giả thuyết quy nạp r − 1+ | S2 |= k
=
d
d + 1
|S1|
≥
d
d + 1
d
(1.20)
Vì (1 + 1
d)d < e nên từ (??), (??) và (??), ta có
P(Ai | Ac
S) ≤ P(Ai)e ≤
1
d + 1
chứng minh được bất đẳng thức (??). Khi đó,
P(Ac
i | Ac
S) ≥
1
d + 1
> 0
thu được
P
n
j=1
Ac
j = P(Ac
1)
n
j=2
P(Ac
j | Ac
1...Ac
j−1) > 0
và chứng minh hoàn thành.
Ví dụ 1.2.7. Gọi F là họ các tập hợp con của {1, 2, . . . , m}, mỗi tập con của
F có kích thước n. Giả sử mỗi tập hợp con trong F chứa một giao điểm không
rỗng với nhiều nhất d tập hợp con khác của F. Chứng minh rằng nếu
2n−1
> e(d + 1)
thì ta có thể tô màu đỏ hoặc xanh vào mỗi giá trị 1, 2, . . . , m để không tập hợp
con nào của F đơn sắc.
Lời giải. Tô màu độc lập mỗi giá trị i, i = 1, 2, . . . , m với xác suất 1/2 cho mỗi
màu xanh hoặc đỏ. Đánh số các tập con của F, gọi Ai là biến cố tập hợp con
thứ i đơn sắc. Vì Ai độc lập lẫn nhau với tập hợp tất cả các tập hợp con của F
để nó không có phần tử nào chung nên Ai độc lập lẫn nhau với tập hợp gồm tất
cả ngoại trừ tối đa d tập hợp con khác của F. Vì P(Ai) = 2(1/2)n nên kết quả
này tuân theo bổ đề rút gọn Lovasz.
40

Để áp dụng phương pháp xác suất mà không cần bổ để rút gọn, ta có thể tô
màu đỏ hoặc xanh lại một cách độc lập cho mỗi giá trị với xác suất bằng nhau
là 1/2. Số tập hợp con đơn sắc kỳ vọng của F là | F | (1/2)n−1 nghĩa là kết quả
sẽ tuân theo nếu
| F | (1/2)n−1
< 1
là một điều kiện rất khác điều kiện có được từ bổ đề rút gọn vì bổ đề này không
thực sự đề cập tới | F |.
♦
Ví dụ 1.2.8. Giả sử mỗi cạnh của một đồ thị hoàn chỉnh gồm n đỉnh được tô
màu đỏ hoặc xanh. Tìm một điều kiện thích hợp cho n và k để không có tập
hợp k đỉnh nào đơn sắc trong đó một tập hợp k đỉnh được cho là đơn sắc nếu
tất cả k
2 cạnh liên thông của nó đều cùng một màu.
Lời giải. Mỗi cạnh đều có thể được tô màu xanh hoặc đỏ như nhau. Đánh số
ngẫu nhiên N = n
k tập hợp đỉnh con có kích thước k- gọi là S1, . . . , SN - và gọi
Ai là biến cố Si đơn màu. Với i cố định, gọi
F = {Sj :| SiSj |≤ 1
là họ tập hợp đỉnh con kích thước k có nhiều nhất một đỉnh chung với Si. Vì
hai tập hợp đỉnh con có nhiều nhất một đỉnh chung không có cạnh liên thông,
dễ thấy bất cứ tập hợp con nào trong F đơn sắc cũng không ảnh hưởng đến xác
suất để Si đơn sắc. Do đó, Ai độc lập lẫn nhau với E = {Aj : Sj ∈ F}. Vì
| E |=| F |=
n − k
k
+ k
n − k
k − 1
nên Ai độc lập lẫn nhau với tập hợp của tất cả ngoại trừ
d =
n
k
−
n − k
k
− k
n − k
k − 1
của Aj khác. Vì
P(Ai) = 2(1/2)(k
2)
nên từ bổ đề rút gọn Lovasz ta có
2e(1/2)(k
2) ≤
1
1 + n
k − n−k
k − k n−k
k−1
là một điều kiện đủ để tồn tại cách tô hai màu như yêu cầu. ♦
41

1.2.8 Thuật toán ngẫu nhiên để tính phân hoạch cực tiểu của
một đồ thị
Như ví dụ 1.2.5, xem xét đồ thị đầy đủ có tập hợp đỉnh {1, . . . , n} với sức
chứa cạnh c(i, j). Giả sử ta muốn tìm một cách phân hoạch có sức chứa nhỏ
nhất. Tức là nếu ta đặt
m0 = min c(X, Xc
)
thì bài toán trở thành tìm m0 cùng với một phân hoạch sức chứa m0.
Với X0, Xc
0 là một phân hoạch có sức chứa nhỏ nhất. Ta sẽ trình bày một
thuật toán xác suất để cho ra một phân hoạch mà sức chứa của nó bằng c(X0, Xc
0)
với xác suất lớn hơn hoặc bằng 2/n2. Thuật toán này còn có thể cho ta một phân
hoạch cực tiểu với xác suất cao tùy ý.
Thuật toán bao gồm n − 1 bước lặp, ở mỗi bước lặp, nó sẽ chọn ngẫu nhiên
hai đỉnh đặt về cùng một phía của phân hoạch thu được từ thuật toán, tức là
cả hai đỉnh cùng thuộc X hoặc cùng thuộc Xc. Điều kiện để các đỉnh này thuộc
cùng một phía phân hoạch cho phép ta kết hợp chúng thành một đỉnh riêng lẻ
để bước lặp tiếp theo ta chỉ phải áp dụng thuật toán với số lượng đỉnh nhỏ hơn.
Để các cạnh của phân hoạch cuối cùng không có sức chứa lớn thì đỉnh-ghép cùng
nằm một phía của phân hoạch được chọn là đỉnh của các cặp có sức chứa lớn
thay vì các cặp có sức chứa nhỏ.
Đặt C = i<j c(i, j) là tổng tất cả sức chứa cạnh. Lưu ý
C =
1
2
i j=i
≥
1
2
i
m0 =
nm0
2
(1.21)
trong đó bất đẳng thức trên có được do j=i c(i, j) là sức chứa của phân hoạch
lấy X bằng một tập hợp điểm {i}, và do đó nó tối thiểu bằng mo. Với mỗi phân
hoạch X, Xc, gọi (X, Xc) là tập hợp tất cả các cạnh có một đỉnh thuộc X và một
đỉnh thuộc Xc, các cạnh như vậy được gọi là cạnh trong phân hoạch.
Để bắt đầu thuật toán, ta chọn một cặp cạnh theo cách sau. Đặt I < J được
chọn ngẫu nhiên thỏa mãn
P{I = i, J = j} =
c(i, j)
C
, i < j
Ta sẽ chỉ xem xét các phân hoạch trong đó I và J nằm cùng một phía. Khi
đó, (I, J) không là cạnh trong phân hoạch được thuật toán xác định. Do vậy, nếu
(I, J) là một cạnh trong phân hoạch cực tiểu (X0, Xc
0) thì thuật toán sẽ không
42

thể mô phỏng phân hoạch cực tiểu này. Tuy nhiên, vì tổng sức chứa các cạnh
trong (X0, Xc
0) là m0 nên bằng cách chọn ngẫu nhiên (I, J) và từ bất đẳng th
(??), có
P (I, J) là một cạnh của (X0, Xc
0) =
m0
C
≤
2
n
Cạnh được chọn ngẫu nhiên (I, J) không là cạnh của (X0, Xc
0) với xác suất nhỏ
Hình 1.8. Các đỉnh kết hợp
nhất là (n − 2)/n. Xem xét một phân hoạch chứa I và J cùng một phía. Nếu
đỉnh k nằm cùng một phía của phân hoạch với I và J thì sẽ không có cạnh phân
hoạch nào xuất phát từ k tới I hoặc J; nếu k thuộc phía kia của phân hoạch thì
sức chứa phân hoạch từ các cạnh (I, k) và (J, k) là c(I, k) + c(J, k). Vì vậy, nếu
chỉ tính các phân hoạch có I và J nằm cùng phía thì thay vì coi I và J như hai
đỉnh tách biệt, ta có thể kết hợp chúng thành một đỉnh duy nhất. Gọi đỉnh kết
hợp này là IJ, sức chứa của nó và n − 2 đỉnh khác (xem Hình 1.8) là
c(IJ, k) = c(I, k) + c(J, k), k = I, J
Mặt khác, ta vẫn phải giải quyết bài toán tìm phân hoạch cực tiểu. Xem xét
một đồ thị chỉ có n − 1 đỉnh. Thuât toán sẽ tiếp tục lặp lại những bước trên cho
tới khi chỉ còn hai đỉnh kết hợp, coi các đỉnh kết hợp này là tập hợp đỉnh X và
Xc của phân hoạch.
Nếu lấy (Ii, Ji) là các đỉnh được chọn ngẫu nhiên trong bước lặp i của thuât
toán, i = 1, . . . , n − 2, và gọi Bi là biến cố (Ii, Ji) ∈ (Xo, Xc
o), ta có phân hoạch
thu được từ thuật toán là (X0, Xc
0) với xác suất
P(B1B2...Bn−2) = P(B1)P(B2 | B1)...P(Bn−2 | B1...Bn−3)
Để tính P(Bi | B1. . . Bi−1), lưu ý biết rằng không đỉnh ghép nào trong i − 1
đỉnh-ghép được chọn ngẫu nhiên đầu tiên chứa các đỉnh thuộc hai phía khác
nhau của phân hoạch (X0, Xc
0) nên (X0, Xc
0) vẫn là một phân hoạch trong đồ thị
được xem xét ở bước lặp i và do đó, sức chứa của phân hoạch tối thiểu của đồ
43

thị này vẫn bằng mo. Tuy nhiên, kết hợp với (??) điều này cũng có nghĩa là tổng
sức chứa của n+1−i
2 cạnh của đồ thị ít nhất là (n + 1 − i)m0/2 nên
P(Bc
i | B1...Bi−1) ≤
m0
(n + 1 − i)m0/2
=
2
n + 1 − i
tương đương với,
P(Bi | B1...Bi−1) ≥
n − 1 − i
n + 1 − i
Từ đó ta thu được
P(B1B2...Bn−1) ≥
n−2
i=1
n − 1 − i
n + 1 − i
=
n − 2
n
n − 3
n − 1
n − 4
n − 2
...
2
4
1
3
=
2
n(n − 1)
≥
2
n2
Vậy với xác suất ít nhất là 2/n2, mỗi lần áp dụng thuật toán sẽ cho ta một
phân hoạch cực tiểu. Nếu ta thực hiện thuật toán kn2 lần độc lập, phân hoạch
có sức chứa nhỏ nhất trong những phân hoạch thu được từ những bước lặp này
sẽ là phân hoạch sức chứa cực tiểu với xác suất nhỏ nhất bằng
1 − 1 −
2
n2
kn2
= 1 − 1 −
2k
kn2
kn2
Tuy nhiên,
1 − x/n ≤ e−x/n
cũng đồng nghĩa khi n đủ lớn để 1 − x/n ≥ 0 thì
(1 − x/n)n
≤ e−x
Vì n ≥ 2 nên xác suất để ít nhất một trong k lần thực hiện thuật toán cho
ta kết quả một phân hoạch có sức chứa nhỏ nhất lớn hơn hoặc bằng 1 − e−2k.
Bằng cách chọn k đủ lớn, ta có thể đảm bảo với bất cứ mức xác suất cho trước
nào, thuât toán lặp lại này sẽ cho ta một phân hoạch cực tiểu.
44

Chương 2
Xích Markov và mô phỏng MCMC
2.1 Xích Markov
2.1.1 Giới thiệu
Quá trình ngẫu nhiên X = {X(t), t ∈ T} là một tập hợp các biến ngẫu nhiên.
Trong đó, với mỗi t trong tập hợp chỉ mục T, X(t) là một biến ngẫu nhiên. Với
t thường được hiểu là thời gian và X(t) là trạng thái quá trình tại thời điểm t.
Nếu tập hợp chỉ mục T là một tập hợp hữu hạn, giả sử T = {0, 1, 2, . . . }, ta nói
X là quá trình ngẫu nhiên thời gian rời rạc, ngược lại nếu T gồm các giá trị liên
tục, ta nói X là quá trình ngẫu nhiên thời gian liên tục.
Trong chương này, chúng ta sẽ nghiên cứu quá trình ngẫu nhiên thời gian
rời rạc Xn, n = 0, 1, 2, . . . chứa một số lượng giá trị hữu hạn hay đếm được. Nếu
không có giải thích gì thêm thì tập hợp các giá trị này sẽ được biểu hiện bằng
tập hợp các số nguyên không âm 0, 1, 2, . . . Nếu Xn = i thì quá trình được gọi là
“trong trạng thái i tại thời điểm n”. Giả sử khi quá trình ở trạng thái i, có một
xác suất cố định Pi,j để trạng thái tiếp theo là trạng thái j. Tức là
P{Xn+1 = j|Xn = i, Xn−1 = in−1, ..., X0 = i0} = Pi,j (2.1)
với mọi trạng thái i0, i1, . . . , in−1, i, j và mọi n ≥ 0. Mỗi quá trình ngẫu nhiên
như vậy là một xích Markov. Đẳng thức (??) có thể được hiểu là, với một xích
Markov, biết trạng thái X0, X1, . . . , Xn−1 và trạng thái hiện tại Xn, phân phối
có điều kiện của bất kỳ trạng thái Xn+1 trong tương lai đều độc lập với trạng
thái quá khứ và chỉ phụ thuộc vào trạng thái hiện tại. Điều này nghĩa là trạng
thái hiện tại, quá khứ và tương lại của một xích Markov là độc lập với nhau.
Giá trị Pi,j biểu thị xác suất để quá trình chuyển sang trạng thái j khi đang
ở trạng thái i. Vì xác suất không âm và quá trình phải chuyển tiếp sang một
45

trạng thái nào đó nên ta có
Pi,j≥0,
j
Pi,j = 1
Gọi P là ma trận các xác suất chuyển tiếp một bước Pi,j
P =




P0,0 P0,1 . . . P0,j . . .
P1,0 P1,1 . . . P1,j . . .
. . . . . . . . . . . . . . .
Pi,0 Pi,1 . . . Pi,j . . .
. . . . . . . . . . . . . . .




Ví dụ 2.1.1. Quan sát một hệ thống liên lạc truyền các số 0 và 1. Mỗi số được
truyền phải được thông qua nhiều bước, mỗi bước tồn tại một xác suất p để số
được đưa vào không đổi khi đưa ra. Gọi Xn là số được đưa vào ở bước thứ n,
thì {Xn, n ≥ 0} là xích Markov hai trạng thái có ma trận xác suất chuyển tiếp
như sau:
P =
p 1 − p
1 − p p
Ví dụ 2.1.2. Giả sử hôm nay trời có mưa hay không chỉ phụ thuộc vào điều
kiện thời tiết của hai ngày trước đó. Cụ thể, giả sử nếu hai ngày trước trời mưa
thì xác suất ngày mai trời mưa là 0.7; nếu hôm nay có mưa nhưng hôm qua
không mưa thì xác suất ngày mai trời mưa là 0.5; nếu hôm qua có mưa mà hôm
nay không mưa thì xác suất đó sẽ là 0.4; nếu cả hai ngày trước đó đều không
mưa thì trời sẽ mưa vào ngày mai với xác suất là 0.2.
Nếu trạng thái tại thời điểm n phụ thuộc vào trạng thái được trời mưa vào
ngày n thì trạng thái trước đó không là một xích Markov. Tuy nhiên, ta có thể
biến đổi chúng thành một xích Markov bằng cách xác định trạng thái của mỗi
ngày nhờ điều kiện thời tiết cả ngày hôm đó và ngày liền trước ngày đó. Ví dụ,
ta có thể nói quá trình đang ở
trạng thái 0 nếu cả hôm nay và hôm qua có mưa
trạng thái 1 nếu hôm nay có mưa nhưng hôm qua không mưa
trạng thái 2 nếu hôm qua có mưa nhưng hôm nay không mưa
trạng thái 3 nếu cả ngày hôm qua và ngày hôm nay đều không mưa
Các trạng thái trên là một xích Markov bốn trạng thái có ma trận xác suất
46

chuyển tiếp như dưới đây:
P =



0.7 0 0.3 0
0.5 0 0.5 0
0 0.4 0 0.6
0 0.2 0 0.8



2.1.2 Phương trình Chapman-Kolmogorov
Biết xích Markov đang ở trạng thái i, xác suất chuyển tiếp n bước Pn
i,j của
xích được tính là xác suất có điều kiện để xích chuyển từ trạng thái i sang trạng
thái j sau n bước. Tức là
Pn
i,j = P{Xn+m = j|Xm = i}, n ≥ 0, i, j ≥ 0
Tất nhiên P1
i,j = Pi,j. Phương trình Chapman – Kolmogorov giúp ta tính được
xác suất n bước này. Phương trình như sau:
Pn+m
i,j =
∞
k=0
Pn
i,kPm
k,j (2.2)
phương trình có được từ việc chỉ ra rằng Pn
i,kPm
k,j là xác suất để xích đang ở trạng
thái i chuyển sang trạng thái j sau n + m lần chuyển tiếp qua một đường mà
ở lần chuyển tiếp thứ n xích sẽ ở trạng thái k. Do đó, cộng các xác suất qua
các trạng thái k thu được xác suất để quá trình ở trạng thái j sau n + m bước
chuyển tiếp. Ta có
Pn+m
i,j = P{Xn+m = j | X0 = i}
=
∞
k=0
P{Xn+m = j, Xn = k | X0 = i}
=
∞
k=0
P{Xn+m = j | Xn = k, X0 = i}P{Xn = k | X0 = i}
=
∞
k=0
Pm
k,jPn
i,k
Nếu gọi P(n) là ma trận xác suất n bước chuyển tiếp Pn
i,j thì phương trình
Chapman – Kolmogorov khẳng định rằng
P(n+m)
= P(n)
.P(m)
47

trong đó dấu (.) thể hiện phép nhân ma trận. Khi đó,
P(2)
= P(1+1)
= P.P = P2
Chứng minh bằng quy nạp được
P(n)
= P(n−1+1)
= P(n−1)
.P = Pn
Vậy ma trận xác suất n bước chuyển tiếp bằng lũy thừa n bậc ma trận P.
Ví dụ 2.1.3. Giả sử trong Ví dụ 2.1.1, Thứ hai và Thứ ba trời có mưa. Tính
xác suất để Thứ năm trời mưa?
Lời giải. Vì ma trận xác suất chuyển tiếp là
P =



0.7 0 0.3 0
0.5 0 0.5 0
0 0.4 0 0.6
0 0.2 0 0.8



nên ma trận xác suất hai bước chuyển tiếp là
P2
=



0.49 0.12 0.21 0.18
0.35 0.20 0.15 0.30
0.20 0.12 0.20 0.48
0.10 0.16 0.10 0.64



Vì xích đang ở trạng thái 0 vào Thứ ba và vì trời sẽ mưa vào thứ năm nếu xích
ở trạng thái 0 hoặc 1 vào ngày đó nên xác suất cần tính là:
P2
0,0 + P2
0,1 = 0.49 + 0.12 = 0.61
♦
2.1.3 Phân loại trạng thái
Trạng thái j được coi là tiếp cận được từ trạng thái i nếu Pn
i,j > 0 với n ≥ 0.
Nó có nghĩa là trạng thái j tiếp cận được từ trạng thái i khi và chỉ khi bắt đầu
từ trạng thái i, quá trình có thể đi tới trạng thái j. Điều này là đúng vì nếu j
không tiếp cận được từ i thì
P{bước vào trạng thái j | bắt đầu từ i} = P
∞
n=0
{Xn = j} | X0 = i
≤
∞
n=0
P{Xn = j | X0 = i}
= 0
48

Vì
P0
i,j = P{X0 = i | X0 = i} = 1
nên mỗi trạng thái đều tiếp cận được từ chính nó. Nếu trạng thái j tiếp cận
được từ trạng thái i và trạng thái i tiếp cận được từ trạng thái j thì ta có thể
nói rằng, trạng thái i và j liên thông. Liên thông giữa trạng thái i và j được
biểu diễn là i ↔ j.
Quan hệ liên thông phải thỏa mãn ba đặc điểm sau:
1. i ↔ j
2. nếu i ↔ j thì j ↔ i
3. nếu i ↔ j và j ↔ k thì i ↔ k
Đặc điểm 1 và 2 rút ra được ngay từ định nghĩa liên thông. Để chứng minh
đặc điểm 3, ta giả sử i liên thông với j và j liên thông với k. Khi đó, tồn tại
các số nguyên n và m thỏa mãn Pn
i,jPm
j,k > 0. Dựa vào phương trình Chapman
Kolmogorov ta có,
Pn+m
i,k =
r
Pn
i,rPm
r,k ≥ Pn
i,jPm
j,k ≥ 0
Như vậy trạng thái k tiếp cận được từ trạng thái i. Chứng minh tương tự, ta
cũng có trạng thái i tiếp cận được từ trạng thái k. Vậy đặc điểm 3 đã được
chứng minh.
Hai trạng thái liên thông nằm trong cùng một lớp. Dễ thấy đây là hệ quả rút
ra từ ba đặc điểm 1, 2 và 3 rằng cứ hai lớp trạng thái thì hoặc giống hệt nhau
hoặc rời nhau. Nói cách khác, khái niệm liên thông chia không gian trạng thái
thành một số lớp tách biệt. Xích Markov được coi là tối giản nếu chỉ có một lớp,
hay tất cả các trạng thái đều liên thông với nhau.
Ví dụ 2.1.4. Xem xét xích Markov gồm ba trạng thái 0, 1, 2 và có ma trận xác
suất chuyển tiếp
P =





1
2
1
2
0
1
2
1
4
1
4
0
1
3
2
3





Dễ dàng chứng minh được xích Markov này tối giản. Ví dụ, trạng thái 0 có thể
chuyển sang trạng thái 2 vì
0 → 1 → 2
49

Như vậy, có một cách để đi từ trạng thái 0 sang trạng thái 2 là đi từ trạng thái
0 qua trạng thái 1 (với xác suất 1
2) và đi từ trạng thái 1 sang trạng thái 2 (với
xác suất 1
4).
Ví dụ 2.1.5. Xem xét một xích Markov gồm bốn trạng thái 0, 1, 2, 3 có ma trận
xác suất chuyển tiếp
P =







1
2
1
2
0 0
1
2
1
2
0 0
1
4
1
4
1
4
1
4
0 0 0 1







Các lớp của xích Markov này là {0, 1}, {2} và {3}. Lưu ý mặc dù trạng thái 0
(hoặc trạng thái 1) tiếp cận được từ trạng thái 2 nhưng điều ngược lại không
đúng. Vì trạng thái 3 là trạng thái hấp thụ (ví dụ P3,3 = 1) tức là trạng thái mà
không có trạng thái nào khác tiếp cận được từ nó.
Với mỗi trạng thái i, gọi fi là xác suất để bắt đầu từ trạng thái i, quá trình
sẽ trở lại trạng thái đó. Trạng thái i được gọi là hồi quy nếu fi = 1 và trạng thái
i được gọi là trans nếu fi < 1. Giả sử quá trình bắt đầu từ trạng thái i, và i hồi
quy thì với xác suất 1, quá trình rốt cuộc cũng sẽ trở lại trạng thái i. Tuy nhiên,
theo định nghĩa của xích Markov, quá trình theo xác suất sẽ bắt đầu lại khi trở
lại trạng thái i và do đó, trạng thái i rốt cuộc lại được quay lại lần thứ hai. Liên
tục lặp lại thu được kết quả: bắt đầu từ trạng thái i, nếu trạng thái i hồi quy
thì quá trình sẽ trở lại trạng thái i liên tục và thường là không có kết thúc. Mặt
khác, giả sử trạng thái i trans. Trong trường hợp này, mỗi lần quá trình ở trạng
thái i, tồn tại một xác suất dương, giả sử 1 − fi, để quá trình không bao giờ trở
lại trạng thái đó. Do đó, bắt đầu từ trạng thái i, xác suất để quá trình ở trạng
thái i chính xác n lần bằng fn−i
i (1 − fi), n ≥ 1. Nói cách khác, nếu trạng thái i
nhất trans thì bắt đầu từ trạng thái i, số lần để quá trình ở trạng thái i có phân
phối hình học với trị số trung bình 1/(1 − fi).
Từ đó ta thấy, trạng thái i hồi quy khi và chỉ khi bắt đầu từ trạng thái i, số
giai đoạn thời gian kỳ vọng để quá trình ở trạng thái i là vô hạn. Tuy nhiên, đặt
In =
1, nếu Xn = i
0, nếu Xn = i
50

Ta có
∞
n=0
In biểu thị số giai đoạn để quá trình ở trạng thái i. Ta có
E
∞
n=0
In | X0 = i =
∞
n=0
E[In | X0 = i]
=
∞
n=0
P{Xn = i | X0 = i}
=
∞
n=0
Pn
i,i
Như vậy, chúng ta đã chứng minh được mệnh đề sau đây.
Mệnh đề 2.1.1. Trạng thái i
hồi quy nếu
∞
n=0
Pn
i,i = ∞
trans nếu
∞
n=0
Pn
i,i < ∞
Lập luận đưa tới mệnh đề trên vô cùng quan trọng vì nó cũng chứng minh
được trạng thái trans chỉ xảy ra với một số hữu hạn lần. Điều này cho ta kết
luận trong một xích Markov hữu hạn trạng thái, không phải tất cả các trạng
thái đều trans. Để hiểu rõ hơn, ta giả sử các trạng thái là 0, 1, . . . , M và đều
trans. Khi đó, sau một khoảng thời gian hữu hạn (giả sử sau thời gian T0), trạng
thái 0 sẽ không bao giờ xuất hiện lại và sau một thời gian (giả sử T1) trạng
thái 1 không bao giờ xuất hiện lại, sau một thời gian (giả sử T2), trạng thái 2
không bao giờ xuất hiện lại, liên tục như vậy. Sau một khoảng thời gian hữu
hạn T = max(T0, T1, .., TM ), không trạng thái nào xuất hiện trở lại. Vì quá trình
phải ở trạng thái nào đó sau thời gian T nên mâu thuẫn xảy ra, chứng tỏ có ít
nhất một trạng thái phải hồi quy.
Một ứng dụng khác của Mệnh đề 2.1.1 là giúp ta chứng minh hồi quy là một
thuộc tính lớp.
Hệ quả 2.1.1. Nếu trạng thái i hồi quy và trạng thái i liên thông j thì trạng
thái j hồi quy.
Chứng minh. Chứng minh Vì trạng thái i liên thông với trạng thái j nên tồn tại
các số nguyên k và m thỏa mãn Pk
i,jPm
j,i > 0. Với mỗi số nguyên n,
Pm+n+k
j,i ≥ Pm
j,iPn
i,iPk
i,j
51

Vì vế trái của bất đẳng thức trên là xác suất để đi từ j tới j bằng m + n + k
bước, ngược lại vế phải là xác suất để đi từ j tới j bằng m + n + k bước qua một
con đường đi từ j tới i sau m bước, rồi từ i tới i sau n bước nữa cuối cùng đi từ
i tới j sau k bước tiếp theo. Cộng tất cả lại ta được
∞
n=1
Pm+n+k
j,i ≥ Pm
j,iPk
i,j
∞
n=1
Pn
i,i = ∞
trong đó
∞
n=0
Pn
i,i = ∞ vì trạng thái i hồi quy. Do đó, từ Mệnh đề 2.1.1, trạng
thái j cũng hồi quy.
Nhận xét
(a) Hệ quả 2.1.1 cũng chỉ ra rằng tính trans là một thuộc tính lớp vì nếu
trạng thái i trans và liên thông với trạng thái j thì j phải trans. Nếu nó hồi quy
thì theo Hệ quả 2.1.1, trạng thái i cũng hồi quy, như vậy là mâu thuẫn.
(b) Hệ quả 2.1.1 cùng với kết luận trước đó rằng không phải tất cả các trạng
thái trong một xích Markov hữu hạn đều trans cho thấy tất cả các trạng thái
của một xích Markov chưa tối giản hữu hạn đều hồi quy.
Ví dụ 2.1.6. Bài toán sạt nghiệp của con bạc Nghiên cứu một người chơi
mà ở mỗi ván bài, người đó có thể thắng 1 với xác suất p, 0 < p < 1 hoặc thua 1
với xác suất q = 1 − p. Giả sử kết quả các ván bài liên tiếp là độc lập. Tính xác
suất để bắt đầu từ i, số tiền của người chơi sẽ đạt tới N trước 0.
Lời giải. Nếu gọi Xn là số tiền của người chơi sau ván bài n thì giả sử người chơi
dừng chơi khi con số đạt tới N hoặc 0, {Xn, n ≥ 0} là một xích Markov có xác
suất chuyển tiếp
P0,0 = PN,N = 1
Pi,i+1 = p = 1 − Pi,i−1, i = 1, ..., N − 1
Xích Markov có ba lớp, giả sử {0}, {1, . . . , N − 1} và {N}; lớp thứ nhất và thứ
ba hồi quy còn lớp thứ hai trans. Vì mỗi trạng thái trans chỉ xuất hiện hữu hạn
lần nên sau một khoảng thời gian hữu hạn, người chơi sẽ đạt mục tiêu thu được
N hoặc sẽ phá sản. Gọi Pi là xác suất để bắt đầu từ i, số tiền của người chơi sẽ
đạt tới N trước 0. Kiểm tra điều kiện với ván bài đầu tiên ta có
Pi = pPi+1 + qPi−1, i = 1, ..., N − 1
52

hay, vì p + q = 1,
pPi + qPi = pPi+1 + qPi−1, i = 1, ..., N − 1
hay
Pi+1 − Pi =
q
p
(Pi − Pi−1)
= (
q
p
)2
(Pi−1 − Pi−2)
= ...
= ...
= (
q
p
)i
(P1 − P0)
Vì P0 = 0 nên
Pi+1 = Pi + (
q
p
)i
P1, i = 1, ..., N − 1
Tính giá trị của các giá trị i lớn dần thu được
P2 = P1 1 +
q
p
P3 = P1 1 +
q
p
+ (
q
p
)2
Tổng quát,
Pi = P1 1 +
q
p
+ (
q
p
)2
+ ... + (
q
p
)i−1
Do vậy,
Pi =
1−(q/p)i
1−q/p
P1, nếu q
p = 1
iP1, nếu q
p = 1
Vì PN = 1 nên hệ trên tương đương
P1 =
1−(q/p)
1−(q/p)N , nếu q
p = 1
1
N , nếu q
p = 1
Do đó, chũng ta có được kết quả
Pi =
1−(q/p)i
1−(q/p)N , nếu p = 1
2
i
N , nếu p = 1
2
♦
53

Ví dụ 2.1.7. Du động ngẫu nhiên đơn giản. Xích Markov có không gian
trạng thái là tập hợp của tất cả các số nguyên và biết xác suất chuyển tiếp là
Pi,i+1 = p = 1 − Pi,i−1, i = 0, ±1, ±2...
với 0 < p < 1, được gọi là một du động ngẫu nhiên đơn giản. Nói cách khác, ở
mỗi lần chuyển tiếp, chuỗi có thể tăng hoặc giảm đi 1 với xác suất tương ứng là
p và 1 − p. Vì tất cả trạng thái đều liên thông nên từ Hệ quả 2.1.1, ta thấy tất
cả chúng hoặc cùng trans hoặc cùng hồi quy. Do đó, ta có thể nghiên cứu trạng
thái 0 và xác định xem liệu ∞
n=0 Pn
0,0 là hữu hạn hay vô hạn.
Vì xích có thể trở lại trạng thái ban đầu sau một số lẻ lần chuyển tiếp nên
ta có
P2n+1
0,0 = 0, n ≥ 0
Mặt khác, xích sẽ trở lại trạng thái ban đầu sau 2n lần chuyển tiếp nếu trong số
đó có n lần tăng và n lần giảm. Vì mỗi lần chuyển tiếp độc lập dẫn đến trạng
thái tăng với xác suất p nên xác suất kỳ vọng là xác suất nhị thức
P2n
0,0 =
2n
n
pn
(1 − p)n
=
(2n)!
n!n!
[p(1 − p)]n
Sử dụng tiệm cận Stirling
n! nn+1/2
e−n
√
2π
Ta được
P2n
0,0
[4p(1 − p)]n
√
nπ
Dễ dàng chứng minh được rằng nếu an bn thì n an < ∞ khi và chỉ khi
n bn < ∞. Do đó ∞
n=0 Pn
0,0 = ∞ khi và chỉ khi
∞
n=0
[4p(1 − p)]n
√
nπ
= ∞
Tuy nhiên, 4p(1 − p) ≤ 1, dấu bằng xảy ra khi và chỉ khi p = 1/2. Do đó
∞
n=0 Pn
0,0 = ∞ khi và chỉ khi p = 1/2. Vậy xích hồi quy với p = 1/2 và trans với
p = 1/2.
Khi p = 1/2, du động ngẫu nhiên đơn giản được gọi là du động ngẫu nhiên
đối xứng. Các du động ngẫu nhiên trong hơn một chiều cũng có thể được xác
định. Ví dụ, trong du động ngẫu nhiên đối xứng hai chiều, ở mỗi lần chuyển
54

tiếp, xích có khả năng tiến một bước sang trái, sang phải, lên trên xuống dưới
như nhau, tức là xác suất chuyển tiếp của nó như sau
P(i,j),(i+1,j) = P(i,j),(i−1,j) = P(i,j),(i,j+1) = P(i,j),(i,j−1) =
1
4
Tương tự với trường hợp một chiều, ta có thể chứng minh xích Markov này cũng
hồi quy.
Vì du động ngẫu nhiên đối xứng hai chiều không tối giản nên tất cả các trạng
thái hồi quy nếu trạng thái 0 = (0, 0) hồi quy. Sau 2n lần chuyển tiếp, xích sẽ trở
lại vị trí ban đầu nếu với mọi i, 0 ≤ i ≤ n, trong 2n bước có i bước sang trái, i
bước sang phải, n − i bước lên trên và n − i bước xuống dưới. Vì hướng đi trong
mỗi bước là độc lập với xác suất 1/4 nên với mỗi i cho trước, xác suất của biến
cố trên là một xác suất nhị phân. Vì thế
P2n
0,0 =
n
i=0
(2n)!
i!i!(n − i)!(n − i)!
(
1
4
)2n
=
n
i=0
(2n)!
n!n!
n!
(n − i)!n!
n!
(n − i)!i!
(
1
4
)2n
= (
1
4
)2n 2n
n
n
i=0
n
i
n
n − i
= (
1
4
)2n 2n
n
2n
n
(2.3)
trong đó đẳng thức cuối cùng dựa trên đồng nhất thức tổ hợp
2n
n
=
n
i=0
n
i
n
n − i
có thể thấy được vì cả hai vế đều biểu thị số phân nhóm kích thước n có thể
chọn từ một tập hợp n phần tử đen và n phần tử trắng. Tuy nhiên,
2n
n
=
(2n)!
n!n!
(2n)2n+1/2e−2n
√
2π
2πn2n+1e−2n
sử dụng tiệm cân Stirling
=
4n
√
nπ
Do đó, từ (??) ta thấy
P2n
0,0
1
nπ
55

Luận văn: Mô hình xác suất trong khoa học máy tính, HAY, 9đ

Luận văn: Mô hình xác suất trong khoa học máy tính, HAY, 9đ

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Luận văn: Mô hình xác suất trong khoa học máy tính, HAY, 9đ

Similar to Luận văn: Mô hình xác suất trong khoa học máy tính, HAY, 9đ (20)

More from Dịch Vụ Viết Bài Trọn Gói ZALO 0917193864

More from Dịch Vụ Viết Bài Trọn Gói ZALO 0917193864 (20)

Recently uploaded

Recently uploaded (20)

Luận văn: Mô hình xác suất trong khoa học máy tính, HAY, 9đ