Your SlideShare is downloading. ×
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Bai toan va thuat toan
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Bai toan va thuat toan

32,981

Published on

Published in: Education
1 Comment
2 Likes
Statistics
Notes
No Downloads
Views
Total Views
32,981
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
456
Comments
1
Likes
2
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH CHƯƠNG II BÀI TOÁN VÀ THUẬT TOÁN 2.1. KHÁI NIỆM BÀI TOÁN 2.1.1. Bài toán Trong phạm vi Tin học, ta có thể quan niệm bài toán là việc nào đó tamuốn máy tính thực hiện. Viết một dòng chữ ra màn hình, giải phương trình bậc hai, quản lí điểmtrong trường học v.v… Khi dùng máy tính giải bài toán, ta cần quan tâm đến hai yếu tố: đưavào máy thông tin gì (Input) và cần lấy ra thông tin gì (Output). Do đó để phátbiểu một bài toán ta cần phải chỉ rõ Input và Output của bài toán đó. Ví dụ 1: Giải phương trình bậc nhất ax+b=0 Input: Các giá trị thực a,b Output: Nghiệm là giá trị x hoặc thông báo không có nghiệm Ví dụ 2: Quản lí điểm trong trường học Input: Thông tin cá nhân của từng học sinh Output: Thông tin cần khai thác về một học sinh, một lớp học sinh, một khối hay toàn trường. 2.1.2. Các bước giải bài toán bằng máy tính điện tử Học sử dụng máy tính thực chất là học cách giao cho máy tính việc màta muốn nó làm. Khả năng khai thác máy tính phụ thuộc rất nhiều vào sự hiểubiết của người sử dụng.Việc giải bài toán trên máy tính được tiến hành quacác bước sau: Bước 1: Xác định bài toán Như đã trình bày, mỗi bài toán được đặc tả bởi hai thành phần: Input vàOutput. Việc xác định bài toán chính là xác định rõ hai thành phần này. Cácthông tin đó cần được nghiên cứu cẩn thận để có thể lựa chọn thuật toán, cáchthể hiện các đại lượng đã cho và các đại lượng phát sinh trong quá trình giảibài toán và ngôn ngữ lập trình thích hợp. 20
  • 2. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH Ví dụ, trong một bài toán Tin học khi đề cập đến một số nguyên dươngN ta phải biết rõ phạm vi giá trị của nó, để lựa chọn cách thể hiện N bằng kiểudữ liệu thích hợp. Bước 2: Lựa chọn hoặc thiết kế thuật toán Bước lựa chọn và thiết kế thuật toán là bước quan trọng nhất để giảimột bài toán. Mỗi thuật toán chỉ giải một bài toán nào đó, nhưng có thể có nhiều thuậttoán khác nhau cùng giải một bài toán. Cần chọn một thuật toán phù hợp đểgiải bài toán đã cho. Khi lựa chọn thuật toán người ta thường quan tâm đến các tài nguyênnhư giờ CPU, số lượng ô nhớ,... Trong các loại tài nguyên, người ta quan tâmnhiều nhất đến thời gian vì đó là dạng tài nguyên không tái tạo được. Trong thực tế, khi lựa chọn thuật toán người ta còn quan tâm tới việcviết chương trình cho thuật toán đó được dễ dàng. Việc thiết kế và lựa chọn thuật toán để giải một bài toán cụ thể cần căncứ vào lượng tài nguyên mà thuật toán đòi hỏi và lượng tài nguyên thực tếcho phép. Bước 3: Viết chương trình Việc viết chương trình là một tổng hợp hữu cơ giữa việc lựa chọn cấutrúc dữ liệu và ngôn ngữ lập trình để diễn đạt đúng thuật toán. Khi viết chương trình ta cần lựa chọn một ngôn ngữ bậc cao, hoặc hợpngữ, hoặc ngôn ngữ máy, hoặc một phần mềm chuyên dụng thích hợp chothuật toán đã lựa chọn. Viết chương trình trong ngôn ngữ nào ta cần phải tuântheo đúng quy định ngữ pháp của ngôn ngữ đó. Chương trình dịch có thể giúpta phát hiện và thông báo đầy đủ các sai sót về mặt ngữ pháp. Bước 4: Hiệu chỉnh Sau khi được viết xong, chương trình vẫn còn có thể có nhiều lỗi khácchưa phát hiện được nên chương trình có thể không cho kết quả đúng. Vì vậy,cần phải thử chương trình bằng cách thực hiện nó với một số bộ Input tiêubiểu phụ thuộc vào đặc thù của bài toán. Các bộ Input này gọi là các Test. Nếu 21
  • 3. Bài toán và thu t toán Nguy n Th Vinh - ĐHKHcó sai sót, ta phải sửa chương trình rồi thử lại. Quá trình này được gọi là hiệuchỉnh. Bước 5: Viết tài liệu Tài liệu phải mô tả chi tiết bài toán, thuật toán, chương trình, kết quảthử nghiệm và hướng dẫn sử dụng. Tài liệu này rất có ích cho người sử dụngchương trình và cho việc đề xuất những khả năng hoàn thiện thêm. Các bước trên có thể lặp đi lặp lại nhiều lần cho đến khi mà ta cho làchương trình đã làm việc đúng đắn. 2.2. KHÁI NIỆM THUẬT TOÁN 2.2.1. Định nghĩa Thuật toán để giải một bài toán là một dãy hữu hạn các thao tác đượcsắp xếp theo một trình tự xác định sao cho sau khi thực hiện dãy thao tácđó, từ Input của bài toán, ta nhận được Output cần tìm. Có nhiều cách trình bày thuật toán: dùng ngôn ngữ tự nhiên; sơ đồkhối; ngôn ngữ lập trình(tựa Pascal). 2.2.2. Một số ví dụ Ví dụ 1: Mô tả thuật toán tìm phần tử lớn nhất trong một dãy hữu hạncác số bất kì (nguyên hoặc thực).a) Dùng ngôn ngữ tự nhiên để mô tả các bước cần phải thực hiện: 1. Đặt giá trị cực đại tạm thời bằng số đầu tiên trong dãy. 2. So sánh số tiếp sau với giá trị cực đại tạm thời, nếu nó lớn hơn giá trịcực đại tạm thời thì đặt cực đại tạm thời bằng số đó. 3. Lặp lại bước 2 nếu còn các số trong dãy. 4. Dừng khi không còn số nào nữa trong dãy. Cực đại tạm thời ở điểmnày chính là số lớn nhất của dãy.b) Dùng ngôn ngữ tựa Pascal:Procedure max (a1, a2, ..., an: Item);Begin max:= a1; for i:= 2 to n if max <ai then max:= ai; 22
  • 4. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH{max là phần tử lớn nhất}End;{Item quy ước là một kiểu dữ liệu bất kì nào đó} Ví dụ 2: Mô tả thuật toán tìm tổng các phần tử dương trong một dãyhữu hạn các số bất kì.a) Dùng ngôn ngữ tự nhiên để mô tả các bước cần phải thực hiện: 1. Đặt giá trị tổng ban đầu bằng 0. 2. Đi từ đầu dãy tới cuối dãy, kiểm tra số hiện thời nếu dương thì cộnggiá trị đó vào tổng S. 3. Dừng khi không còn số nào nữa trong dãy. Giá trị S chính là tổng cầntìm.b) Dùng ngôn ngữ tựa Pascal:Procedure max (a1, a2, ..., an: Item);Begin S:= 0; for i:= 1 to n if ai >0 then S:= S+ ai;{S là tổng các phần tử dương}End; 2.2.3. Các đặc trưng của thuật toán Tính hữu hạn: Sau một số hữu hạn lần thực hiện các thao tác thuậttoán phải kết thúc; Tính xác định: Sau khi thực hiện một thao tác, hoặc là thuật toán kếtthúc hoặc là có đúng một thao tác xác định để được thực hiện tiếp theo; Tính đúng đắn: Sau khi thuật toán kết thúc, ta phải nhận được Outputcần tìm; Tính chi tiết: Các thao tác trong thuật toán phải được xác định một cáchchặt chẽ theo nghĩa đủ chi tiết để đối tượng thực hiện thuật toán có thể làmđược; Tính phổ dụng: Thuật toán không chỉ cho phép giải một bài toán đơn lẻmà áp dụng cho cả một lớp bài toán có cùng cấu trúc. 23
  • 5. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH 2.3. THUẬT TOÁN TÌM KIẾM 2.3.1. Bài toán tìm kiếm: Bài toán xác định vị trí của một phần tửtrong một tập hữu hạn các phần tử. Chẳng hạn chương trình kiểm tra chính tảcủa các từ; tìm kiếm các từ trong một cuốn từ điển; tra cứu điểm thi đại họcv.v….Các bài toán thuộc loại này được gọi là các bài toán tìm kiếm. Bài toán tìm kiếm tổng quát được mô tả như sau: xác định vị trí củaphần tử x trong một dãy các phần tử a1, a2, ..., an hoặc xác định rằng nó khôngcó mặt trong dãy. Input: dãy số a1, a2, ..., an và giá trị x Output: Nghiệm là i nếu x=ai và là 0 nếu x không có mặt trong dãy. 2.3.2. Thuật toán tìm kiếm tuyến tính: Tìm kiếm tuyến tính hay tìmkiếm tuần tự. Tư tưởng thuật toán là bắt đầu bằng việc so sánh x với a1; khix=a1, nghiệm là vị trí a1, tức là 1; khi x≠a1, so sánh x với a2. Nếu x=a2, nghiệmlà vị trí của a2, tức là 2. Khi x≠a2, so sánh x với a3. Tiếp tục quá trình này bằngcách tuần tự so sánh x với mỗi số hạng của dãy cho tới khi tìm được số hạngbằng x hoặc là kết thúc dãy.Dùng ngôn ngữ tựa Pascal:Procedure tìm kiếm tuyến tính (x: Item, a1,a2,...,an: Item);Begin i := 1; while (i ≤ n and x ≠ ai) i := i + 1; if i ≤ n then kq := i else kq := 0;End;{kq là vị trí của số hạng bằng x hoặc là 0 nếu không tìm được x} 2.3.3. Thuật toán tìm kiếm nhị phân: Thuật toán này có thể đượcdùng khi dãy số được sắp xếp đơn điệu theo thứ tự tăng hoặc giảm dần.Tưtưởng thuật toán là chọn phần tử ở vị trí giữa làm chốt, chia dãy thành 2 phầncó kích thước nhỏ hơn. Sau đó so sánh phần tử cần tìm x với chốt, nếu x lớnhơn chốt tìm ở nửa sau của dãy, nếu x nhỏ hơn chốt tìm ở nửa trước củadãy(áp dụng với dãy tăng), quá trình trên tiếp tục cho tới khi tìm được x hoặcdãy chia không còn phần tử nào. 24
  • 6. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH Ví dụ: Cho dãy số: A={-6,1,3,5,8,10,14,16,19,21 }; x=5; dãy gồm 10phần tửGọi phần tử chốt là k, ban đầu k=8 Bước 1: k=8, so sánh x với k, x<k ta tìm kiếm x ở nửa trước {-6,1,3,5,8} Bước 2: k=3, so sánh x với k, x>k ta tìm kiếm x ở nửa sau {3,5,8} Bước 3: k=5, so sánh x với k, x=k ta tìm được x kết thúc.Dùng ngôn ngữ tựa Pascal: {Thuật toán áp dụng với dãy tăng dần}Procedure tìm kiếm nhị phân (x: Item, a1,a2,...,an: Item);Begin d := 1 {d là điểm đầu của đoạn tìm kiếm} c := n {c là điểm cuối của đoạn tìm kiếm} while (d <c) do begin m:= [(d+c)/2] if x>am then d:=m+1 else c := m-1 end if x = ai then kq := i else kq := 0{kq là vị trí của số hạng bằng x hoặc 0 nếu không tìm thấy x}End; 2.4. ĐỘ PHỨC TẠP CỦA THUẬT TOÁN 2.4.1 Khái niệm về độ phức tạp của một thuật toán Thước đo hiệu quả của một thuật toán là thời gian mà máy tính sử dụngđể giải bài toán theo thuật toán đang xét, khi các giá trị đầu vào có một kíchthước xác định. Một thước đo thứ hai là dung lượng bộ nhớ đòi hỏi để thựchiện thuật toán khi các giá trị đầu vào có kích thước xác định. Các vấn đề nhưthế liên quan đến độ phức tạp tính toán của một thuật toán. Sự phân tích thờigian cần thiết để giải một bài toán có kích thước đặc biệt nào đó liên quan đếnđộ phức tạp thời gian của thuật toán. Sự phân tích bộ nhớ cần thiết của máy 25
  • 7. Bài toán và thu t toán Nguy n Th Vinh - ĐHKHtính liên quan đến độ phức tạp không gian của thuật toán. Vệc xem xét độphức tạp thời gian và không gian của một thuật toán là một vấn đề rất thiết yếukhi các thuật toán được thực hiện. Biết một thuật toán sẽ đưa ra đáp số trongmột micro giây, trong một phút hoặc trong một tỉ năm, hiển nhiên là hết sứcquan trọng. Tương tự như vậy, dung lượng bộ nhớ đòi hỏi phải là khả dụng đểgiải một bài toán,vì vậy độ phức tạp không gian cũng cần phải tính đến.Vìviệc xem xét độ phức tạp không gian gắn liền với các cấu trúc dữ liệu đặc biệtđược dùng để thực hiện thuật toán nên ở đây ta sẽ tập trung xem xét độ phứctạp thời gian. Độ phức tạp thời gian của một thuật toán có thể được biểu diễn qua sốcác phép toán được dùng bởi thuật toán đó khi các giá trị đầu vào có một kíchthước xác định. Sở dĩ độ phức tạp thời gian được mô tả thông qua số các phéptoán đòi hỏi thay vì thời gian thực của máy tính là bởi vì các máy tính khácnhau thực hiện các phép tính sơ cấp trong những khoảng thời gian khác nhau.Hơn nữa, phân tích tất cả các phép toán thành các phép tính bit sơ cấp mà máytính sử dụng là điều rất phức tạp. Ví dụ: Xét thuật toán tìm số lớn nhất trong dãy n số a1, a2, ..., an. Có thểcoi kích thước của dữ liệu nhập là số lượng phần tử của dãy số, tức là n. Nếucoi mỗi lần so sánh hai số của thuật toán đòi hỏi một đơn vị thời gian (giâychẳng hạn) thì thời gian thực hiện thuật toán trong trường hợp xấu nhất là n-1giây. Với dãy 64 số, thời gian thực hiện thuật toán nhiều lắm là 63 giây. Tanói độ phức tạp là n-1 Ví dụ: Thuật toán về bài toán “Tháp Hà Nội” Bài toán “Tháp Hà Nội” như sau: Có ba cọc A, B, C bằng kim cương và64 cái đĩa bằng vàng các đĩa có đường kính đôi một khác nhau. Nguyên tắcchuyển đĩa là: mỗi lần chỉ chuyển một đĩa và không được chồng đĩa to lên trênđĩa nhỏ hơn nó. Ban đầu, cả 64 đĩa được đặt chồng lên nhau ở cột A; hai cộtB, C trống. Vấn đề là phải chuyển cả 64 đĩa đó từ cột A sang cột B lấy cột Clàm trung gian. Xét trò chơi với n đĩa ban đầu ở cọc A (cọc B và C trống). Gọi Sn là sốlần chuyển đĩa để chơi xong trò chơi với n đĩa. 26
  • 8. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH Nếu n=1 thì rõ ràng là S1=1. Nếu n>1 thì trước hết ta chuyển n-1 đĩa bên trên sang cọc B (giữ yênđĩa thứ n ở dưới cùng của cọc A). Số lần chuyển n-1 đĩa là Sn-1. Sau đó tachuyển đĩa thứ n từ cọc A sang cọc C. Cuối cùng, ta chuyển n-1 đĩa từ cọc Bsang cọc C (số lần chuyển là Sn-1). Như vậy, số lần chuyển n đĩa từ A sang C là: Sn=Sn-1+1+Sn=2Sn-1+1=2(2Sn-2+1)+1=22Sn-2+2+1=.....=2n-1S1+2n-2 +...+2+1=2n−1. Thuật toán về bài toán “Tháp Hà Nội” đòi hỏi 264−1 lần chuyển đĩa (xấpxỉ 18,4 tỉ tỉ lần). Nếu mỗi lần chuyển đĩa mất 1 giây thì thời gian thực hiệnthuật toán xấp xỉ 585 tỉ năm!. Ta nói độ phức tạp là 2n−1 Hai thí dụ trên cho thấy rằng: một thuật toán phải kết thúc sau một sốhữu hạn bước, nhưng nếu số hữu hạn này quá lớn thì thuật toán không thểthực hiện được trong thực tế. 2.4.2. So sánh độ phức tạp của các thuật toán Một bài toán thường có nhiều cách giải, có nhiều thuật toán để giải, cácthuật toán đó có độ phức tạp khác nhau. Xét bài toán: Tính giá trị của đa thức P(x)=anxn+an-1xn-1+ ... +a1x+a0 tại x0. Thuật toán 1: Procedure tính giá trị của đa thức (a0, a1, ..., an, x0: real); Begin S:=a0 for i:=1 to n S:=S+aix0i; End; {S là giá trị của đa thức P(x) tại x0} Chú ý rằng đa thức P(x) có thể viết dưới dạng: P(x)=(...((anx+an-1)x+an-2)x...)x+a0. Ta có thể tính P(x) theo thuật toán sau: 27
  • 9. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH Thuật toán 2: Procedure tính giá trị của đa thức (a0, a1, ..., an, x0: real); Begin P:=an for i:=1 to n P:=P.x0+an-i; End; {P là giá trị của đa thức P(x) tại x0} Ta hãy xét độ phức tạp của hai thuật toán trên. Đối với thuật toán 1: ở bước 2, phải thực hiện 1 phép nhân và 1 phépcộng với i=1; 2 phép nhân và 1 phép cộng với i=2, ..., n phép nhân và 1 phépcộng với i=n. Vậy số phép tính (nhân và cộng) mà thuật toán 1 đòi hỏi là: n(n + 1) n(n + 3) (1+1)+(2+1)+ ... +(n+1)= +n= . 2 2 Đối với thuật toán 2, bước 2 phải thực hiện n lần, mỗi lần đòi hỏi 2phép tính (nhân rồi cộng), do đó số phép tính (nhân và cộng) mà thuật toán 2đòi hỏi là 2n. Nếu coi thời gian thực hiện mỗi phép tính nhân và cộng là như nhau vàlà một đơn vị thời gian thì với mỗi n cho trước, thời gian thực hiện thuật toán1 là n(n+3)/2, còn thời gian thực hiện thuật toán 2 là 2n. Rõ ràng là thời gian thực hiện thuật toán 2 ít hơn so với thời gian thựchiện thuật toán 1. Hàm f1(n)=2n là hàm bậc nhất, tăng chậm hơn nhiều so vớihàm bậc hai f2(n)=n(n+3)/2. Ta nói rằng thuật toán 2 (có độ phức tạp là 2n) là thuật toán hữu hiệuhơn (hay nhanh hơn) so với thuật toán 1 (có độ phức tạp là n(n+3)/2). Để so sánh độ phức tạp của các thuật toán, điều tiện lợi là coi độ phứctạp của mỗi thuật toán như là cấp của hàm biểu hiện thời gian thực hiện thuậttoán ấy. Các hàm xét sau đây đều là hàm của biến số tự nhiên n>0. Định nghĩa 1: Ta nói hàm f(n) có cấp thấp hơn hay bằng hàm g(n) nếutồn tại hằng số C>0 và một số tự nhiên n0 sao cho 28
  • 10. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH |f(n)| ≤ C|g(n)| với mọi n≥n0. Ta viết f(n)=O(g(n)) và còn nói f(n) thoả mãn quan hệ big-O (o lớn) đốivới g(n). Theo định nghĩa này, hàm g(n) là một hàm đơn giản nhất có thể được,đại diện cho “sự biến thiên” của f(n). Khái niệm big-O đã được dùng trong toán học đã gần một thế kỷ nay.Trong tin học, nó được sử dụng rộng rãi để phân tích các thuật toán. Nhà toánhọc người Đức Paul Bachmann là người đầu tiên đưa ra khái niệm big-O vàonăm 1892. n(n + 3) Ví dụ: Hàm f(n)= là hàm bậc hai và hàm bậc hai đơn giản nhất 2là n2. Ta có: n(n + 3) n(n + 3) f(n)= =O(n2) vì ≤ n2 với mọi n≥3 (C=1, n0=3). 2 2 Một cách tổng quát, nếu f(n)=aknk+ak-1nk-1+ ... +a1n+a0 thì f(n)=O(nk).Thật vậy, với n>1, |f(n)|| ≤ |ak|nk+|ak-1|nk-1+ ... +|a1|n+|a0| = nk(|ak|+|ak-1|/n+ ... +|a1|/nk-1+a0/nk) ≤ nk(|ak|+|ak-1|+ ... +|a1|+a0). Điều này chứng tỏ |f(n)| ≤ Cnk với mọi n>1. Cho g(n)=3n+5nlog2n, ta có g(n)=O(nlog2n). Thật vậy, 3n+5nlog2n = n(3+5log2n) ≤ n(log2n+5log2n) = 6nlog2n với mọi n≥8 (C=6, n0=8). Mệnh đề: Cho f1(n)=O(g1(n)) và f2(n) là O(g2(n)). Khi đó (f1 + f2)(n) = O(max(|g1(n)|,|g2(n)|), (f1f2)(n) = O(g1(n)g2(n)). Chứng minh. Theo giả thiết, tồn tại C1, C2, n1, n2 sao cho |f1(n)| ≤ C1|g1(n)| và |f2(n)| ≤ C2|g2(n)| với mọi n > n1 và mọi n > n2.Do đó |(f1 + f2)(n)| = |f1(n) + f2(n)| ≤ |f1(n)| + |f2(n)| ≤ C1|g1(n)| + C2|g2(n)| ≤(C1+C2)g(n)với mọi n > n0=max(n1,n2), ở đâyC=C1+C2 và g(n)=max(|g1(n)| , |g2(n)|).|(f1f2)(n)| = |f1(n)||f2(n)| ≤ C1|g1(n)|C2|g2(n)| ≤ C1C2|(g1g2)(n)| với mọi n >n0=max(n1,n2). 29
  • 11. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH Định nghĩa 2: Nếu một thuật toán có độ phức tạp là f(n) vớif(n)=O(g(n)) thì ta cũng nói thuật toán có độ phức tạp O(g(n)). Nếu có hai thuật toán giải cùng một bài toán, thuật toán 1 có độ phứctạp O(g1(n)), thuật toán 2 có độ phức tạp O(g2(n)), mà g1(n) có cấp thấp hơng2(n), thì ta nói rằng thuật toán 1 hữu hiệu hơn (hay nhanh hơn) thuật toán 2. 2.4.3. Đánh giá độ phức tạp của một thuật toán 2.4.3.1. Thuật toán tìm kiếm tuyến tính Số các phép so sánh được dùng trong thuật toán này cũng sẽ được xemnhư thước đo độ phức tạp thời gian của nó. Ở mỗi một bước của vòng lặptrong thuật toán, có hai phép so sánh được thực hiện: một để xem đã tới cuốibảng chưa và một để so sánh phần tử x với một số hạng của bảng. Cuối cùngcòn một phép so sánh nữa làm ở ngoài vòng lặp. Do đó, nếu x=ai, thì đã có2i+1 phép so sánh được sử dụng. Số phép so sánh nhiều nhất, 2n+2, đòi hỏiphải được sử dụng khi phần tử x không có mặt trong bảng. Từ đó, thuật toántìm kiếm tuyến tính có độ phức tạp là O(n). 2.4.3.2. Thuật toán tìm kiếm nhị phân Để đơn giản, ta giả sử rằng có n=2k phần tử trong bảng liệt kê a1,a2,...,an,với k là số nguyên không âm (nếu n không phải là lũy thừa của 2, ta có thểxem bảng là một phần của bảng gồm 2k+1 phần tử, trong đó k là số nguyên nhỏnhất sao cho n < 2k+1). Ở mỗi giai đoạn của thuật toán vị trí của số hạng đầu tiên i và số hạngcuối cùng j của bảng con hạn chế tìm kiếm ở giai đoạn đó được so sánh đểxem bảng con này còn nhiều hơn một phần tử hay không. Nếu i < j, một phépso sánh sẽ được làm để xác định x có lớn hơn số hạng ở giữa của bảng con hạnchế hay không. Như vậy ở mỗi giai đoạn, có sử dụng hai phép so sánh. Khitrong bảng chỉ còn một phần tử, một phép so sánh sẽ cho chúng ta biết rằngkhông còn một phần tử nào thêm nữa và một phép so sánh nữa cho biết sốhạng đó có phải là x hay không. Tóm lại cần phải có nhiều nhất2k+2=2[log2n]+2 phép so sánh để thực hiện phép tìm kiếm nhị phân (nếu nkhông phải là lũy thừa của 2, bảng gốc sẽ được mở rộng tới bảng có 2k+1 phầntử, với k=[log2n] và sự tìm kiếm đòi hỏi phải thực hiện nhiều nhất 2[log2n]+2 30
  • 12. Bài toán và thu t toán Nguy n Th Vinh - ĐHKHphép so sánh). Do đó thuật toán tìm kiếm nhị phân có độ phức tạp là O(log2n).Từ sự phân tích ở trên suy ra rằng thuật toán tìm kiếm nhị phân, ngay cả trongtrường hợp xấu nhất, cũng hiệu quả hơn thuật toán tìm kiếm tuyến tính.Các thuật ngữ thường dùng cho độ phức tạp của một thuật toán Độ phức tạp Thuật ngữ O(1) Độ phức tạp hằng số O(logn) Độ phức tạp lôgarit O(n) Độ phức tạp tuyến tính O(nlogn) Độ phức tạp nlogn O(nb) Độ phức tạp đa thức O(bn) (b>1) Độ phức tạp hàm mũ O(n!) Độ phức tạp giai thừaThời gian máy tính được dùng bởi một thuật toán Kích Các phép tính bit được sử dụng thước n logn N nlogn n2 2n n! -9 -8 -8 -7 -6 10 3.10 s 10 s 3.10 s 10 s 10 s 3.10-3 s 102 7.10-9 s 10-7 s 7.10-7 s 10-5 s 4.1013năm * 103 1,0.10-8 s 10-6 s 1.10-5 s 10-3 s * * 104 1,3.10-8 s 10-5 s 1.10-4 s 10-1 s * * 105 1,7.10-8 s 10-4 s 2.10-3 s 10 s * * 106 2.10-8 s 10-3 s 2.10-2 s 17 phút * * 2.5. SỐ NGUYÊN VÀ THUẬT TOÁN 2.5.1. Thuật toán Euclide Phương pháp tính ước chung lớn nhất của hai số bằng cách dùng phântích các số nguyên đó ra thừa số nguyên tố là không hiệu quả. Lý do là ở chỗthời gian phải tiêu tốn cho sự phân tích đó. Dưới đây là phương pháp hiệu quảhơn để tìm ước số chung lớn nhất, gọi là thuật toán Euclide. Thuật toán nàyđã biết từ thời cổ đại. Nó mang tên nhà toán học cổ Hy lạp Euclide, người đã 31
  • 13. Bài toán và thu t toán Nguy n Th Vinh - ĐHKHmô tả thuật toán này trong cuốn sách “Những yếu tố” nổi tiếng của ông. Thuậttoán Euclide dựa vào 2 mệnh đề sau đây. Mệnh đề 1: Cho a và b là hai số nguyên và b≠0. Khi đó tồn tại duy nhấthai số nguyên q và r sao cho a = bq+r, 0 ≤ r < |b|. Trong đẳng thức trên, b được gọi là số chia, a được gọi là số bị chia, qđược gọi là thương số và r được gọi là số dư. Mệnh đề 2: Cho a = bq + r, trong đó a, b, q, r là các số nguyên. Khi đóUCLN(a,b) = UCLN(b,r). (Ở đây UCLN(a,b) để chỉ ước chung lớn nhất của a và b.) Giả sử a và b là hai số nguyên dương với a ≥ b. Đặt r0 = a và r1 = b.Bằng cách áp dụng liên tiếp thuật toán chia, ta tìm được: r0 = r1q1 + r2 0 ≤ r2 < r1 r1 = r2q2 + r3 0 ≤ r3 < r2 .................. rn-2 = rn-1qn-1 + rn 0 ≤ rn < rn-1 rn-1 = rnqn . Cuối cùng, số dư 0 sẽ xuất hiện trong dãy các phép chia liên tiếp, vì dãycác số dư a = r0 > r1 > r2 >... ≥ 0không thể chứa quá a số hạng được. Hơn nữa, từ Mệnh đề 2 ở trên ta suy ra: UCLN(a,b) = UCLN(r0,r1) = UCLN(r1,r2) = ... = UCLN(rn-1,rn) = rn.Do đó, ước chung lớn nhất là số dư khác không cuối cùng trong dãy các phépchia. Ví dụ: Dùng thuật toán Euclide tìm UCLN(414, 662). 662 = 441.1 + 248 414 = 248.1 + 166 248 = 166.1+ 82 166 = 82.2 + 2 82 = 2.41. Do đó, UCLN(414, 662) = 2. 32
  • 14. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH 2.5.2. Biểu diễn số trong các hệ đếm khác nhau 2.5.2.1. Biến đổi biểu diễn số ở hệ đếm khác sang hệ thập phân Cho số N trong hệ đếm cơ số b: N = (dn dn-1 dn-2 ... d1 d 0, d -1 d -2... d -m)b ( N = bdnbdn-1. . . bd0.bd-1bd-2. . . bd-m) Trước hết xét trường hợp N là nguyên. Để tìm biểu diễn của số nguyênN trong hệ đếm thập phân, ta tiến hành các bước sau: Bước 1. Viết N dưới dạng đa thức của cơ số b: N = dn bn + dn-1 bn-1 + dn-2 bn-2 +...+ d0b0 Bước 2. Tính giá trị đa thức. Trường hợp ngoài phần nguyên còn có phần phân thì ta tách phần nguyênvà phần phân. Mỗi phần được biến đổi riêng và sau đó hai kết quả được kết nốiđể có kết quả cần tìm. Ví dụ. 1110,1012 = ?10. Sau khi tách ra, ta có phần nguyên là 1110 và phần phân là 101. Với phần nguyên ta có: 11102 = 1 × 23 + 1 × 22 + 1 × 21 + 0 × 20 = 1410 Tương tự, với phần phân, ta có: 0,1012 = 1 × 2-1 + 0 × 2-2 + 1 × 2-3 = 0,5 + 0,125 = 0,62510. Vậy 1110,1012 = 14,62510. Một ví dụ khác, D3F,416 = ?10. Cũng thực hiện như trên, ta có: Phần nguyên: D3F16 = D × 162 + 3 × 161 + F × 160 = 13 × 16 × 16 + 3 × 16 + 15 × 1 = 3391. Phần phân: 0,416 = 4 x 16-1= 0,25 . Vậy, D3F,416 = 3391,2510. 2.5.2.2. Biến đổi biểu diễn số ở hệ thập phân sang hệ đếm cơ số khác Trước hết ta tách phần nguyên và phần phân rồi tiến hành biến đổichúng riêng biệt, sau đó ghép lại để có kết quả cần tìm. a) Biến đổi biểu diễn số nguyên Cho N là số tự nhiên. Ta viết N duới dạng đa thức: 33
  • 15. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH N = dn bn + dn-1 bn-1 + ... + d0 (1) Nhận xét rằng, 0 ≤ d0 < b. Do vậy, khi chia N cho b thì phần dư củaphép chia đó là d0 còn thương số N1 sẽ là: N1 = dn bn-1 + dn-1 bn-2 + ... + d1 (2) Tương tự, d1 chính là phần dư của phép chia N1 cho b. Gọi N2 làthương của phép chia đó. Quá trình chia như vậy được thực hiện liên tiếp và tasẽ lần lượt nhận được giá trị các di. Quá trình sẽ dừng lại khi nhận đượcthương số bằng 0. Để có biểu diễn cần tìm, các phần dư thu được cần sắp xếptheo thứ tự ngược lại. Ví dụ: 5210 = ?2 = ?16. Sau khi thực hiện theo cách trên ta có: 5210 = 1101002 và 5210 = 3416 b) Biến đổi biểu diễn phần phân Kí hiệu N là phần phân (phần sau dấu phẩy thập phân) của số N. Giả sửN’ viết dưới dạng đa thức của cơ số b như sau: N = d-1 b-1 + d-2 b-2 +... + d-m b-m (1) Nhân hai vế của (1) với b, ta thu được: N1 = d-1 + d-2 b-1 + ... + d-m b-(m-1) Ta nhận thấy d-1 chính là phần nguyên của kết quả phép nhân. Còn phầnphân của kết quả là: N2 = d-2 b-1 + ... + d-m b-(m-1) (2) Lặp lại phép nhân như trên đối với (2), ta thu được d-2 là phần nguyên.Thực hiện liên tiếp phép nhân theo cách trên, cuối cùng thu được dãy d-1 d-2d3..., trong đó 0 ≤ d-i < b. Ví dụ: 0,6787510 = ?2 Thực hiện các phép nhân theo cách trên, ta có kết quả: 0,6787510 = 0,101000001... 2 Cũng thực hiện theo cách tương tự ta có, ví dụ 0,843510 = 0,D7EF16. 2.5.2.3. Biến đổi biểu diễn số giữa hệ nhị phân và hệ Hexa Hệ nhị phân và hệ Hexa là hai hệ đếm thường dùng trong Tin học. Vì16 là luỹ thừa của 2 (16 = 24) nên việc biến đổi biểu diễn số giữa hai hệ đếm 34
  • 16. Bài toán và thu t toán Nguy n Th Vinh - ĐHKHđó được thực hiện rất dễ dàng. Để đổi biểu diễn số từ hệ nhị phân sang hệ 16ta áp dụng quy tắc thực hành sau:Gộp các chữ số nhị phân thành từng nhóm 4 chữ số về hai phía kể từ vị tríphân cách phần nguyên và phần phân.Thay mỗi nhóm 4 chữ số nhị phân bởi một kí tự tương ứng ở hệ đếm 16. Ví dụ: 1011100101,112 =?16 .Gộp thành từng nhóm bốn chữ số nhị phân: 0010 1110 0101,11002 Thay mỗi nhóm nhị phân bằng một kí tự hệ 16 tương ứng: 2, E, 5, C. Từ đó ta có: 1011100101,112 = 2E5,C16 Để biến đổi biểu diễn số ở hệ 16 sang biểu diễn số ở hệ nhị phân ta chỉcần thay từng kí tự ở hệ 16 bằng nhóm 4 kí tự tương ứng ở hệ nhị phân. Ví dụ : 3,D7EF16 = 0011,1101 0111 1110 11112. 2.6. THUẬT TOÁN ĐỆ QUY 2.6.1. Khái niệm đệ quy Đôi khi chúng ta có thể quy việc giải bài toán với tập các dữ liệu đầuvào xác định về việc giải cùng bài toán đó nhưng với các giá trị đầu vào nhỏhơn. Chẳng hạn, bài toán tìm UCLN của hai số a, b với a > b có thể rút gọn vềbài toán tìm ƯCLN của hai số nhỏ hơn, a mod b và b. Khi việc rút gọn nhưvậy thực hiện được thì lời giải bài toán ban đầu có thể tìm được bằng một dãycác phép rút gọn cho tới những trường hợp mà ta có thể dễ dàng nhận đượclời giải của bài toán. Ta sẽ thấy rằng các thuật toán rút gọn liên tiếp bài toánban đầu tới bài toán có dữ liệu đầu vào nhỏ hơn, được áp dụng trong một lớprất rộng các bài toán. Định nghĩa: Một thuật toán được gọi là đệ quy nếu nó giải bài toánbằng cách rút gọn liên tiếp bài toán ban đầu tới bài toán cũng như vậy nhưngcó dữ liệu đầu vào nhỏ hơn. 2.6.2. Một số ví dụ Ví dụ 1: Tìm thuật toán đệ quy tính giá trị an với a là số thực kháckhông và n là số nguyên không âm. 35
  • 17. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH Ta xây dựng thuật toán đệ quy nhờ định nghĩa đệ quy của an, đó làan+1=a.an với n>0 và khi n=0 thì a0=1. Vậy để tính an ta quy về các trường hợpcó số mũ n nhỏ hơn, cho tới khi n=0. Function power (a, n):Item; Begin if n = 0 then power := 1 else power := a * power(a,n-1) End; Ví dụ 2: Tìm thuật toán đệ quy để tính UCLN của hai số nguyên a,bkhông âm. Function UCLN (a,b) :Item; Begin if a=b then UCLN := a else if a>b then UCLN := UCLN (a-b,b) else UCLN:=UCLN(a,b-a) End; Ví dụ 3: Hãy biểu diễn thuật toán tìm kiếm tuyến tính như một thủ tụcđệ quy. Để tìm x trong dãy tìm kiếm a1,a2,...,an trong bước thứ i của thuật toán taso sánh x với ai. Nếu x bằng ai thì i là vị trí cần tìm, ngược lại thì việc tìmkiếm được quy về dãy có số phần tử ít hơn, cụ thể là dãy ai+1,...,an. Thuật toántìm kiếm có dạng thủ tục đệ quy như sau. Cho search (i,j,x) là thủ tục tìm số x trong dãy ai, ai+1,..., aj. Dữ liệu đầuvào là bộ ba (1,n,x). Thủ tục sẽ dừng khi số hạng đầu tiên của dãy còn lại là xhoặc là khi dãy còn lại chỉ có một phần tử khác x. Nếu x không là số hạng đầutiên và còn có các số hạng khác thì lại áp dụng thủ tục này, nhưng dãy tìmkiếm ít hơn một phần tử nhận được bằng cách xóa đi phần tử đầu tiên của dãytìm kiếm ở bước vừa qua. Procedure search (i,j,x); Begin if ai = x then loacation := i 36
  • 18. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH else if i = j then loacation := 0 else search (i+1,j,x) End; Ví dụ 4: Hãy xây dựng phiên bản đệ quy của thuật toán tìm kiếm nhịphân. Giả sử ta muốn định vị x trong dãy a1, a2, ..., an bằng tìm kiếm nhị phân.Trước tiên ta so sánh x với số hạng giữa a[(n+1)/2]. Nếu chúng bằng nhau thìthuật toán kết thúc, nếu không ta chuyển sang tìm kiếm trong dãy ngắn hơn,nửa đầu của dãy nếu x nhỏ hơn giá trị giữa của của dãy xuất phát, nửa sau nếungược lại. Như vậy ta rút gọn việc giải bài toán tìm kiếm về việc giải cũng bàitoán đó nhưng trong dãy tìm kiếm có độ dài lần lượt giảm đi một nửa. Procedure binary search (x,i,j); Begin m := [(i+j)/2]; if x = am then loacation := m else if (x < am and i < m) then binary search (x,i,m-1) else if (x > am and j > m) then binary search (x,m+1,j) else loacation := 0; End; 2.6.3. Đệ quy và lặp Một yêu cầu đặt ra cho chúng ta là với một bài toán nào đó thì khi nàodùng thủ tục đệ quy, khi nào dùng thủ tục lặp và thủ tục nào sẽ tối ưu hơn ta sẽtìm hiểu qua ví dụ tính n! với n là số nguyên dương đủ lớn và dãy sốFibonacci Hàm đệ quy Function factorial (n):Item; Begin if n = 1 then factorial := 1 else factorial:= n * factorial(n-1) End; 37
  • 19. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH Có cách khác tính hàm giai thừa của một số nguyên từ định nghĩa đệquy của nó. Thay cho việc lần lượt rút gọn việc tính toán cho các giá trị nhỏhơn, ta có thể xuất phát từ giá trị của hàm tại 1và lần lượt áp dụng định nghĩađệ quy để tìm giá trị của hàm tại các số nguyên lớn dần. Đó là thủ tục lặp. Thủ tục lặp Procedure iterative factorial (n) Begin gt := 1; for i := 1 to n do gt := i * gt; {gt= n!} End; Thông thường để tính một dãy các giá trị được định nghĩa bằng đệ quy,nếu dùng phương pháp lặp thì số các phép tính sẽ ít hơn là dùng thuật toán đệquy (trừ khi dùng các máy đệ quy chuyên dụng). Ta sẽ xem xét bài toán tínhsố hạng thứ n của dãy Fibonacci. Hàm đệ quy Function fibonacci (n):Item; Begin if n = 0 the fibonacci := 0 else if n = 1 then fibonacci := 1 else fibonacci := fibonacci(n - 1) + fibonacci(n - 2) End; Theo thuật toán này, để tìm fn ta biểu diễn fn = fn-1 + fn-2. Sau đó thay thếcả hai số này bằng tổng của hai số Fibonacci bậc thấp hơn, cứ tiếp tục như vậycho tới khi f0 và f1 xuất hiện thì được thay bằng các giá trị của chúng theo địnhnghĩa. Do đó để tính fn cần fn+1-1 phép cộng. Bây giờ ta sẽ tính các phép toán cần dùng để tính fn khi sử dụng phươngpháp lặp. Thủ tục này khởi tạo x là f0 = 0 và y là f1 = 1. Khi vòng lặp đượcduyệt qua tổng của x và y được gán cho biến phụ z. Sau đó x được gán giá trịcủa y và y được gán giá trị của z. Vậy sau khi đi qua vòng lặp lần 1, ta có x =f1 và y = f0 + f1 = f2. Khi qua vòng lặp lần n-1 thì x = fn-1. Như vậy chỉ có n – 1phép cộng được dùng để tìm fn khi n > 1. 38
  • 20. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH Thủ tục lặp Procedure Iterative fibonacci (n); Begin if n = 0 then a := 0 else begin a := 0 ; b := 1; for i := 1 to n - 1 begin c := a + b; a := b ; b := c;end; end; {c là số Fibonacci thứ n} End; Ta đã chỉ ra rằng số các phép toán dùng trong thuật toán đệ quy nhiềuhơn khi dùng phương pháp lặp. Tuy nhiên đôi khi người ta vẫn thích dùng thủtục đệ quy hơn ngay cả khi nó tỏ ra kém hiệu quả so với thủ tục lặp. Đặc biệt,có những bài toán chỉ có thể giải bằng thủ tục đệ quy mà không thể giải bằngthủ tục lặp. 39
  • 21. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH BÀI TẬP CHƯƠNG II Bài tập tính toán 2.1.1. Tìm một số nguyên n nhỏ nhất sao cho f(x) là O(xn) đối với các hàm f(x)tương ứng sau: a) f(x) = 2x3 + x2log x. b) f(x) = 2x3 + (log x)4. x4 + x2 +1 c) f(x) = x3 + 1 x 5 + 5 log x d) f(x) = . x4 +1 2.1.2. Cho một đánh giá big-O đối với các hàm cho dưới đây. Đối với hàm g(x)trong đánh giá f(x) là O(g(x)), hãy chọn hàm đơn giản có bậc thấp nhất. a) nlog(n2 + 1) + n2logn. b) (nlogn + 1)2 + (logn + 1)(n2 + 1). 2.1.3. Lập thuật toán ít nhất 2 thuật toán tính xn với x là một số thực và n là một sốnguyên. Đánh giá độ phức tạp của từng thuật toán. 2.1.4. Mô tả thuật toán chèn một số nguyên x vào vị trí thích hợp trong dãy các sốnguyên a1, a2, ..., an xếp theo thứ tự tăng dần. 2.1.5. Tìm thuật toán xác định vị trí gặp đầu tiên của phần tử lớn nhất trong bảngliệt kê các số nguyên, trong đó các số này không nhất thiết phải khác nhau. 2.1.6. Tìm thuật toán đảo ngược một dãy số nguyên gồm n số. Đánh giá độ phức tạpcủa thuật toán đó. 2.1.7. Xác định xem (2p - 1) có là số nguyên tố không đối với mỗi số nguyên tố(2<p<100) 2.1.8. Cho một số nguyên dương. Xây dựng thuật toán phân tích số đó ra thừa sốnguyên tố 2.1.9. Cho một dãy n số nguyên phân biệt. Dùng thuật toán tìm kiếm nhị phân đểxác định vị trí của một phần tử trong dãy đã cho. 2.1.10. Tìm một tập hợp gồm bốn số nguyên tố cùng nhau, sao cho không có hai sốnào trong chúng là nguyên tố cùng nhau 40
  • 22. Bài toán và thu t toán Nguy n Th Vinh - ĐHKH Bài tập trên máy tính 2.2.1. Cho một dãy gồm n số nguyên a1, a2, ..., an . Tìm số nguyên lớn nhất, nhỏ nhấttrong dãy đó 2.2.2. Cho một dãy gồm n số nguyên a1, a2, ..., an . Tìm số nguyên lớn thứ nhì trongdãy đó. Mở rộng bài toán cho trường hợp số lớn thứ K trong dãy. 2.2.3. Lập trình giải bài toán tháp Hà nội với số tầng là n (1<n<10) 2.2.4. Chuyển đổi một số từ hệ đếm cơ số 10 sang hệ đếm cơ số 2; cơ số 8; cơ số 16và ngược lại. 2.2.5. Cho một dãy gồm n số nguyên a1, a2, ..., an. Lập trình chuyển đổi k phần tửđầu dãy về cuối dãy Viết tiểu luận 2.3.1. Hãy sưu tầm các bài toán về tháp Hà nội, tháp Hà Nội vòng 2.3.2. Tìm hiểu những ứng dụng thực tiễn của thuật toán đệ quy 2.3.3. Sưu tầm các phương pháp dùng để mã hóa thông tin lấy ví dụ minh họa chomỗi phương pháp. 2.3.4. Mô tả hệ mã với khóa công khai được dùng như thế nào? cách mã hóa và giảimã một thông điệp trong cuộc sống 2.3.5. Mô tả thuật toán xử lí các số lớn một cách có hiệu quả. Cộng hai số lớn, nhânhai số lớn 41

×