SlideShare a Scribd company logo
1 of 12
Lý Văn Hiệp D08TCVT1




     Giới thiệu: Sự phát triển của internet băng thông rộng đang thúc đẩy mạnh mẽ sự
     phát triển của công nghệ đa truyền thông Multimedia. Các nguồn dữ liệu
     multimedia như âm thanh, hình ảnh, văn bản… có thể được truy cập và được phân
     phối nhanh hơn và rộng hơn.
     Xu thế này mang lại nhiều lợi ích cho người sở hữu các sản phẩm multimedia,
     nhưng cũng thách thức quyền sở hữu của chúng ta bởi vì hầu hết các dữ liệu
     multimedia được phân phối dưới các định dạng không bảo mật. Hiện nay, việc sao
     chép và phân phối lại bất hợp pháp các sản phẩm multimedia đang diễn ra liên tục
     không có kiểm soát. Khi ra pháp luật, để phân xử quyền sở hữu các sản phẩm
     multimedia là việc không dễ dàng nếu không có một cơ chế có thể đảm bảo tính toàn
     vẹn chân thực quyền tác giả. Trong bài báo này chúng tôi mô tả một phương
     pháp hiệu quả cho bảo vệ quyền trí tuệ và bản quyền tác giả cho các dữ liệu video nén
     MPEG-2, đó là thuật toán Watermarking thực hiện dấu một ảnh đơn sắc trên nền
     video số nén MPEG-2 trong miền DCT. Giải pháp Watermarking hiện hay ẩn đều
     có thể đạt được thông qua việc điều chỉnh một số tham số trong mô hình thuật
     toán này. Cuối cùng hiệu quả của phương pháp được đánh giá thông qua các kết
     quả mô phỏng trên máy tính.
          Summary: The growth of the wideband internet has boosted the growth of
     multimedia technologies. The sources of multimedia data such as audio, video, image,
     text…are able to be accessed and distributed faster and more widely. This trend
     brings many benefits to the owners of multimedia products, but also many threats
     to our copyrights because almost all multimedia data has been distributed in
     insecure formats. These days, the illegal duplication and redistribution of
     multimedia products is taking place continuously without control. Legal judgements
     about copyrights on multimedia products will be not easy if we do not have an
     effective method of checking the integrity and accuracy of the copyright. In this
     paper, we describe an effective method for the copyright of compressed video data
     MPEG-2, which is a watermarking algorithm hiding a grey image inside MPEG-2
     data in DCT domain. Visible watermarkings or invisible watermarkings can be
     achieved by adjusting some parameters in this model. Finally, the effectiveness of
     this method is evaluated by the results of computer simulations.



 I. ĐẶT VẤN ĐỀ
     MPEG (Moving Picture Expert Group) là một nhánh của ISO (International
 Standardization Organization) cho nén video/audio và các kỹ thuật liên quan trong các ứng dụng
 thương mại và công nghiệp. Các chuẩn nén nổi tiếng của MPEG là MPEG-1, MPEG-2, MPEG-




Làm Bài : Lý Văn Hiệp D08TCVT1
Lý Văn Hiệp D08TCVT1




 4. Các chuẩn mới như MPEG-9, MPEG-21 vẫn đang được phát triển. MPEG-1 được ứng dụng
 chính cho phân phối video với các đĩa nén video quang (VCD); MPEG-2 ứng dụng trong truyền
 hình độ phân giải cao HDTV quảng bá và phân phối movie/video chất lượng cao trong các đĩa
 video số (DVD). MPEG-4 là định dạng video có thể trao đổi luồng chính trên Internet bởi vì
 MPEG-4 có tốc độ nén cao và mềm dẻo hơn với tốc độ bit thấp. Các kỹ thuật chính liên quan
 đến các chuẩn MPEG là chuyển đổi không gian màu và tỷ lệ lấy mẫu màu, dự đoán và bù
 chuyển động dựa trên cơ sở khối, biến đổi cosin rời rạc (DCT), quét Zigzag và mã hóa thông tin
 entropy.
      Kỹ thuật Watermarking thực hiện nhúng dữ liệu mở rộng, được gọi là watermark, vào
 trong một bản tin. Tại phía thu, dữ liệu nhúng này có thể được nhận biết và tách lấy bằng một
 phương pháp thích hợp tương ứng. Việc phân loại watermarking có thể được xem xét theo nhiều
 khía cạnh, cụ thể là: nếu theo cảm nhận của con người thì nó được chia ra loại hiện và loại ẩn.
 Nếu theo độ mạnh của nó thì có thể chia ra loại mạnh và loại yếu. Theo các ứng dụng thì nó có
 thể là loại cơ sở nguồn hay đích. Theo loại tài liệu thì nó có thể là text, ảnh, âm thanh, video.
 Theo miền làm việc thì nó có thể là loại miền không gian hay miền tần số. Cả watermarking
 hiện và ẩn đều có thể được sử dụng cho bảo vệ bản quyền tác giả; thêm vào đó loại ẩn cũng hữu
 ích trong các ứng dụng bảo mật như chuyển đổi dấu và truyền thông tin mật. Loại watermarking
 mạnh có thể làm vô tác dụng các tấn công nhằm loại bỏ watermark. Một watermark có thể được
 nhúng vào trong text, hình ảnh, âm thanh hay video như dữ liệu thừa. Phụ thuộc vào các thuật
 toán nhúng mà các watermark có thể được giải tách chính xác như ban đầu hay không.

 II. KỸ THUẬT NÉN VIDEO MPEG-2
     Tất cả các chuẩn quốc tế hiện tại cho nén video như là MPEG-1,2,4, ITU-T H261, H263,
 H264 đều là các sơ đồ mã hóa lai [7]. Các sơ đồ này dựa trên các nguyên lý của dự đoán bù
 chuyển động và mã hóa chuyển đổi trên cơ sở khối. Trong phạm vi của bài báo sẽ giới thiệu
 chuẩn nén vid eo MPEG-2 (hình 2.1).




                         Hình 2.1. Mô hình sơ đồ khối bộ mã hóa MPEG-2
      Các khung mã hóa Intra (các khung I) được phân chia thành các khối 8x8 pixels. Các khối
 này tiếp theo được nén sử dụng DCT, lượng tử hóa (Q), quét zig-zag, mã hóa Entropy (sử dụng
 kỹ thuật mã hóa có độ dài từ mã thay đổi VLC). Các khung mã hóa Inter (các khung B và P) là




Làm Bài : Lý Văn Hiệp D08TCVT1
Lý Văn Hiệp D08TCVT1




 kết quả của bù chuyển động bằng cách trừ đi một dự đoán đã được bù chuyển động. Các khung
 dư (khung sai số) sau đó được chia thành các khối 8x8 pixel và được nén theo cách giống như
 với các khối của khung I.
     Biến đổi cosine rời rạc (DCT)
      Biến đổi cosine rời rạc là một công cụ toán học xử lý các tín hiệu như ảnh hay video. Nó sẽ
 chuyển đổi các tín hiệu từ miền không gian sang miền tần số và biến đổi ngược lại từ miền tần
 số quay trở lại miền không gian mà không gây tổn hao đến chất lượng. Lý do chọn biến đổi
 cosine cho xử lý ảnh số là: đầu tiên, nó có thể loại bỏ sự tương quan giữa các pixel ảnh trong
 miền không gian. Thứ hai là biến đổi cosine rời rạc yêu cầu ít sự phức tạp tính toán và tài
 nguyên hơn [1].
     Lượng tử hóa các hệ số DCT
      Sau khi biến đổi cosine rời rạc, sự tương quan giữa các pixel của một ảnh trong miền
 không gian đã được giải tương quan thành các tần số rời rạc khác nhau trong miền tần số. Do sự
 cảm nhận thị giác của con người là rất nhạy với hệ số DC và các tần số thấp, một phương pháp
 lượng tử hóa vô hướng được thiết kế cẩn thận có thể giảm sự dư thừa dữ liệu mà vẫn dữ được
 tính trung thực của ảnh.
     Quét zigzag các hệ số DCT.
       Sau khi biến đổi DCT ta thu được các khối 8x8 biểu diễn cho các hệ số tần số. Trong khối
 này thì các hệ số tần số thấp sẽ tụm lại ở góc cao phía trái của ma trận DCT. Quét zigzag sẽ sắp
 xếp lại thứ tự của ma trận để các hệ số được sắp xếp theo tần số theo thứ tự tăng dần.
     Mã hóa Entropy
      Sau DCT và lượng tử hóa là các thuật toán miền mã. Các thuật toán này thường được gọi là
 mã hóa Entropy, bao gồm mã hóa Huffman, mã hóa số học…, đây là phương pháp mã hóa
 không tổn hao. Ý tưởng cơ bản của mã hóa Entropy là các biểu tượng thường xuyên xuất hiện
 sẽ được mã hóa bằng các bít ngắn, trong khi đó các biểu tượng ít xuất hiện hơn sẽ được mã hóa
 bằng các bít dài hơn. Phương pháp này còn gọi là mã hóa có độ dài từ mã thay đổi (VLC), và
 một phương pháp cho hiệu quả cao là mã hóa Huffman. Điều này sẽ làm cho tốc độ bit của
 luồng giảm đáng kể.
     Ước lượng và bù chuyển động
      Nén video có thể đạt được với việc lấy mẫu không gian màu, loại bỏ các hệ số DCT tần số
 cao, lượng tử hóa, mã hóa không tổn hao, dự đoán và bù chuyển động trong miền thời gian.
 Chuẩn MPEG chấp nhận việc dự đoán và bù chuyển động dựa trên khối trong miền không gian.
 Thực tế, dự đoán và bù chuyển động cũng làm việc trong miền DCT vì các biến vị trí trong
 miền không gian có thể chuyển đổi với các biến tần số trong miền DCT.

 III. THUẬT TOÁN WATERMARKING CHO VIDEO MPEG-2
     Ý tưởng chung của Watermarking là nhúng một vài dữ liệu mở rộng vào trong một bản tin




Làm Bài : Lý Văn Hiệp D08TCVT1
Lý Văn Hiệp D08TCVT1




 chủ. Thông tin nhúng gọi là watermark và dữ liệu chủ gọi là vật mang. Các ứng dụng của
 Watermarking có thể là bảo vệ bản quyền, nhận thực, ẩn dữ liệu, các thông tin mật…
     Watermarking tại miền không gian
      Các thuật toán watermarking thế hệ đầu tiên làm việc trong miền không gian bởi vì nó ít
 yêu cầu phức tạp và đắt trong xử lý máy tính. Một phương pháp trong đó là mã hóa LSB: bit
 LSB của byte dữ liệu sẽ được sửa đổi để nhúng các watermark. Mã hóa LSB rất dễ bị bẻ vỡ vì
 nó chỉ thực hiện che phần LSB của các byte dữ liệu, vì vậy nó nhanh chóng được thay thế bằng
 các kỹ thuật khác[8].
     Watermarking tại miền DCT
      Chúng ta thấy rằng sau khi chuyển đổi miền làm việc từ miền không gian sang miền DCT,
 sự tương quan của các pixel không gian sẽ được giải tương quan thành các phần tần số rời rạc.
 Hệ số DC và tần số thấp của ma trận DCT sẽ quyết định các đặc tính tự nhiên nhất của một ảnh.
 Sau khi cắt xén các hệ số tần số cao, tính trung thực của ảnh vẫn còn đủ tốt cho sự cảm thụ thị
 giác con người thông qua biến đổi ngược IDCT. Vì vậy một phương pháp tự nhiên là nhúng một
 ma trận các hệ số DCT watermark vào một ma trận các hệ số DCT ảnh trong vùng tần số trung
 bình hay thấp hơn để đạt được watermark mạnh (hình 3.1).


               Các tần số thấp


            Các tần số trung bình
            cho watermarking



                Các tần số cao
                                    Hình 3.1. Nhúng một watermark
                                       ở vùng tần số trung bình
       Tính chất mạnh của watermarking DCT là nếu một kẻ tấn công cố gắng loại bỏ
 watermarking tại các tần số trung bình thì sẽ phá mất đi tính trung thực của ảnh, vì một vài chi
 tiết thu nhận là tại các tần số trung bình.
     Phương trình nhúng watermark [3, 4, 5, 6, 8]:
                                       Cw = αC(i, j) + βW(i, j)                            (3.1)
    Trong đó, Cw(i,j) là hệ số DCT (i,j) sau khi nhúng watermarking; và là các chỉ số độ
 mạnh watermark, các chỉ số này có thể xác định liệu watermark là ẩn hay hiện; C(i,j) là hệ số
 DCT ban đầu trước khi watermarking; W(i,j) là hệ số DCT watermark.
     Watermarking ẩn và watermarking hiện
      Watermarking ẩn tại miền DCT cũng có thể thực hiện được với phương trình watermarking
 (3.1). Chỉ bằng điều chỉnh các hệ số watermarking và [1, 5, 6, 8], watermark có thể trở lên
 ẩn hay hiện. Watermarking ẩn trong video được ứng dụng rất phổ biến trong video quảng bá. Để




Làm Bài : Lý Văn Hiệp D08TCVT1
Lý Văn Hiệp D08TCVT1




 thực hiện kỹ thuật này, một ma trận các hệ số 16x16 DCT sẽ được cộng trực tiếp với ma trận
 các hệ số 16x16 DCT ảnh như phương trình (3.1) [1, 4, 5] (hình 3.2).




                              Hình 3.2. Nhúng watermark tại ma trận các hệ số 16x16

      Không giống như nhúng watermark ở tần số trung bình, hệ số DC và tất cả hệ số AC của
 ma trận các hệ số DCT ảnh sẽ bị sửa đổi bởi việc nhúng watermark, vì kỹ thuật watermarking
 này cho kết quả là cảm nhận hữu hình các watermark đối với hệ thống thị giác con người. Có
 hai lựa chọn để nhúng watermark vào các khung của một đoạn video là thực hiện watermarking
 trước hay sau khi nén (hình 3.3).

                  Các khung        watermarking            Nén video                 Luồng bit
                    video                                                             MPEG

                               a. Watermarking trong miền chưa nén (trước khi nén)


                                                 Nén video
                  Các khung                                                      Luồng bit
                    video                                                        MPEG
                                            Watermarking

                                b. watermarking trong miền nén (trong khi nén)

                          Hình 3.3. Watermarking trong miền chưa nén và miền nén

      Để đạt được tính mạnh của nó thì thuật toán nhúng watermark tại miền DCT được lựa chọn
 (hình 3.4).


    Các khung                          C
  video đầu vào         DCT                                                      C
                                                                                             Các khung đã
                                            C W i, j = αC i, j + βW I, J                      được nhúng
      Ảnh                                                                                     watermark
   water mark           DCT            W


                                Hình 3.4. Sơ đồ khối phần tử watermarking


 IV. MÔ PHỎNG THUẬT TOÁN VÀ KẾT QUẢ
     Sử dụng công cụ MATLAB/Simulink[9] để mô phỏng các thuật toán và kiến trúc trên cơ




Làm Bài : Lý Văn Hiệp D08TCVT1
Lý Văn Hiệp D08TCVT1




 sở tập các khối chức năng. Công cụ MATLAB/Simulink hỗ trợ nhiều hàm xử lý ảnh và video,
 đó là: DCT/IDCT, SAD cho ước lượng chuyển động, xử lý khối, trễ (bộ đệm). Và một số công
 việc phải thực hiện thêm vào là: lượng tử hóa, quét zigzag, mã hóa entropy, watermarking. Mô
 hình watermarking cho video MPEG-2 được thể hiện ở hình vẽ 4.1




          a. Cấu trúc khối hệ thống thực hiện thuật toán Watermarking cho video nén MPEG-2




  1
                                                                                                  1




  2                                                                                           2


                                                                                              3


                                                               IP


                  b. Cấu trúc các khối bên trong bộ mã hóa trong cấu trúc tổng thể (hình a)
                    Hình 4.1. Mô hình hệ thống sử dụng công cụ Matlab/Simulink

      Quan sát hình vẽ 4.1b thì các khung video được nhúng watermark tại miền DCT (trong
 khối watermarking) trước khi được nén. Và chỉ có các khối Y là được nhúng watermark vì các
 lý do sau:
      - Ảnh watermark thường là các ảnh màu trắng đen hay xám, nên nó chỉ tác động vào độ
 chói (độ sáng) của ảnh.
      - Độ chói Y thì nhạy cảm hơn với cảm nhận thị giác của con người, do đó bất cứ sự chỉnh
 sửa tác động trái phép nào đều dễ dàng phát hiện vì vậy nó lý tưởng cho bảo vệ bản quyền.




Làm Bài : Lý Văn Hiệp D08TCVT1
Lý Văn Hiệp D08TCVT1




     - Để tránh quá nhiều dư thừa được cộng vào các khung, watermark không nên được nhúng
 vào Cb và Cr.
     Kết quả mô phỏng:
       Sử dụng đoạn video ‘akiyo.avi’ có độ phân giải 112x176, ảnh đơn sắc Watermark
 ‘GTVT112x176.tif’ có kích thước 112x176 pixels. Tỷ lệ nén đạt được trung bình 13.75 lần
 tương ứng với kết quả được thể hiện trên hình vẽ 4.2.




                   Hình 4.2. Kết quả mô phỏng khi sử dụng đoạn video ‘akiyo.avi’
                               và ảnh watermark ‘GTVT112x176.tif’
      Sử dụng đoạn video ‘akiyo.avi’ có độ phân giải 112x176, ảnh đơn sắc Watermark
 ‘GTVT48x80.tif’ có kích thước 48x80 pixels. Cùng hệ số α và ß như mô phỏng trên thì tỷ lệ nén
 đạt được trung bình 12.3 lần tương ứng với kết quả được thể hiện trên hình vẽ 4.3.




                   Hình 4.3. Kết quả mô phỏng khi sử dụng đoạn video ‘akiyo.avi’
                                 và ảnh watermark ‘GTVT48x80.tif’
     Tỷ số tín hiệu trên nhiễu đỉnh PSNR là một tham số quan trọng để đánh giá video sau mã
 hóa so với video trước khi mã hóa. Quan sát hình vẽ 4.4a ta thấy PSNR tham chiếu cho video
 gốc và video sau nén MPEG-2 không thực hiện watermarking đạt trung bình là 34,1 và đây là
 kết quả khá tốt cho nén video. Hình 4.4b cho kết quả PSNR giữa video gốc và video sau nén
 MPEG-2 có thực hiện nhúng watermark ảnh ‘GTVT112x176.tif’ (hình vẽ 4.4b) đạt giá trị trung
 bình là 22,03 và kết quả này nằm trong giới hạn chất lượng của một bộ nén video tổn hao [10].
 PSNR giữa video gốc và video sau nén MPEG-2 có nhúng watermark ‘GTVT40x80.tif’ kích
 thước nhỏ hơn (hình vẽ 4.4c) đạt trung bình là 19,23.




Làm Bài : Lý Văn Hiệp D08TCVT1
Lý Văn Hiệp D08TCVT1




                               34.5


                               34.4


                               34.3


                               34.2




                        PSNR
                               34.1


                                     34


                               33.9


                               33.8


                               33.7
                                          0       50    100      150     200    250    300
                                                               FRAMES
                                     a. PSNR giữa video gốc và video sau nén MPEG-2
                                            khi không thực hiện watermarking
                               22.12

                                    22.1

                               22.08

                               22.06

                               22.04
                        PSNR




                               22.02

                                     22

                               21.98

                               21.96

                               21.94
                                           0      50    100      150     200    250    300
                                                               FRAMES
                                           b. PSNR giữa video gốc và video sau nén MPEG-2
                                                có nhúng watermark ‘GTVT112x176.tif’
                                    19.7

                                    19.6

                                    19.5


                                    19.4

                                    19.3
                           P S NR




                                    19.2

                                    19.1


                                      19

                                    18.9


                                    18.8
                                              0    50    100      150     200    250    30
                                                                FRAMES
                                       c. PSNR giữa video gốc và video sau nén MPEG-2
                                             có nhúng watermark ‘GTVT40x80.tif’
             Hình 4.4. Kết quả tính toán PSNR giữa video gốc với video nén MPEG-2
    không thực hiện nhúng Watermark và có thực hiện nhúng watermark với cùng các hệ số α và ß




Làm Bài : Lý Văn Hiệp D08TCVT1
Lý Văn Hiệp D08TCVT1




Mpeg-2 được mở rộng dựa trên chuẩn Mpeg để hỗ trợ việc nén dữ liệu để truyền Video số
chất lượng cao. Để hiểu được tại sao nén Video là rất quan trọng, ta cần tìm hiểu băng
thông (Bandwidth) cần thiết để truyền các khung hình Video số không nén.



PAL (Phase Alternate Line) là chuẩn để truyền tín hiệu TV tuần tự (Analog) được sử dụng ở khá
nhiều nước trên thế giới. Khung hình TV dùng PAL không nén đòi hỏi băng thông rất lớn tới 216
Mbps, lớn hơn rất nhiều khả năng của truyền sóng radio. Một số nước dùng hệ thống Analog TV
là NTSC. Hệ thống này cung cấp các thông tin về màu sắc kém trung thực hơn với tỉ lệ truyền các
khung khác nhau. Tín hiệu NTSC không nén đòi hỏi dung lượng đường truyền thấp hơn không
đáng kể ở mức 168 Mbps. TV độ phân giải cao HDTV (High Definition TV) yêu cầu băng thông tối
thiểu là 1 Gbps.


Mpeg-2 cung cấp cách nén các tín hiệu Video số thành các mức có thể quản lý được. Khả năng
nén Video của Mpeg-2 liệt kê theo bảng sau:




Do chuẩn Mpeg-2 cung cấp khả năng nén rất cao bằng cách dùng các thuật toán tiêu chuẩn, nó
trở thành chuẩn cho TV số với các đặc tính:

+Nén Video tương thích với Mpeg-1.
+Chế độ Full-screen kết hợp với cải tiến chất lượng Video (cho TV và màn hình PC).
+Cải tiến mã hoá Audio (chất lượng cao, mono, stereo...).
+Truyền phối hợp nhiều thành phần.
+Các dịch vụ khác.

Các hệ thống sử dụng Mpeg-2 đang rất phát triển như: TV số, VoD, Digital Versatile Disc (DVD)...



Thuật toán nén Video Mpeg-2 đạt được khả năng nén cao nhờ lợi dụng sự dư thừa in thông tin
Video. Mpeg-2 loại bỏ cả dư thừa về không gian và dư thừa về thời gian trong các cảnh Video.


Dư thừa thời gian xuất hiện khi các khung Video liên tiếp hiển thị hình ảnh của những hình ảnh
giống nhau. Nó chứa các hình ảnh gần như không đổi hoặc thay đối rất nhỏ giữa các khung hình
liên tiếp. Dư thừa không gian xảy ra khi một phần của ảnh được tái tạo lại (với thay đổi không

Làm Bài : Lý Văn Hiệp D08TCVT1
Lý Văn Hiệp D08TCVT1



đáng kể) trong một khung Video.


Dữ liệu từ các Macroblock cần được mã hoá sẽ được đưa đến cả bộ trừ (Subtractor) và bộ đoán
chuyển động (Motion Estimator). Bộ đoán chuyển động sẽ so sánh các Macroblock mới được đưa
vào này với các Macroblock đã được đưa vào trước đó và được lưu lại dùng để tham khảo. Kết
quả là bộ đoán chuyển động sẽ tìm ra các Macroblock trong khung hình tham khảo gần giống nhất
với Macroblock mới này. Bộ đoán chuyển động sau đó sẽ tính toán Vector chuyển động (Motion
Vector), Vector này sẽ đặc trưng cho sự dịch chuyển theo cả hai chiều dọc và ngang của
Macroblcok mới cần mã hoá so với khung hình tham khảo. Lưu ý rằng Vector chuyển động có độ
phân giải bằng một nửa do thực hiện quét xen kẽ.




Bộ đoán chuyển động cũng đồng thời gửi các Macroblock tham khảo được gọi là các Macroblock
tiên đoán (Predicted Macroblock) tới bộ trừ để trừ với Macroblock mới cần mã hoá. Từ đó ta sẽ
được các sai số tiên đoán (Error Prediction) hoặc tín hiệu dư, chúng sẽ đặc trưng cho sự sai khác
giữa Macroblock cần tiên đoán và Macroblock thực tế cần mã hoá.


Tín hiệu dư hay sai số tiên đoán này sẽ được biến đổi DCT, các hệ số nhận được sau biến đổi
DCT sẽ được lượng tử hoá để làm giảm số lượng các bits cần truyền. Các hệ số này sẽ được
đưa tới bộ mã hoá Huffman, tại đây số bits đặc trưng cho các hệ số tiếp tục được làm giảm đi một
cách đáng kể. Dữ liệu từ đầu ra của mã hoá Huffman sẽ được kết hợp với Vector chuyển động và
các thông tin khác (thông tin về I, P, B-picture) để gửi tới bộ giải mã.


Đối với trường hợp P-picture, các hệ số DCT cũng được đưa đến bộ giải mã nội bộ (nằm ngay
trong bộ mã hoá). Tín hiệu dư hay sai số tiên đoán được biến đổi ngược lại dùng phép biến đổi
IDCT và được cộng thêm vào khung hình đứng trước để tạo nên khung hình tham khảo (tiên
đoán). Vì dữ liệu khung hình trong bộ mã hoá được giải mã luôn nhờ vào bộ giải mã nội bộ ngay
chính bên trong bộ mã hoá, do đó có thể thực hiện thay đổi thứ tự các khung hình và dùng các
phương pháp tiên đoán ở trên.

Quá trình khôi phục lại khung hình tại bộ giải mã là hoàn toàn ngược lại. Từ luồng dữ liệu nhận
được ở đầu vào, Vector chuyển động được tách ra và đưa vào bộ bù chuyển động (Motion
Compensator), các hệ số DCT được đưa vào bộ biến đổi ngược IDCT để biến tín hiệu từ miền tần
số thành tín hiệu ở miền không gian. Đối với P-picture và B-picture, Vector chuyển động sẽ được
kết hợp với các Macroblock tiên đoán để tạo thành các khung hình tham khảo.


Không cần thiết phải luôn nén mọi khung hình Video cùng một mức độ, một phần của Clip có thể
có độ dư thừa không gian thấp (ví dụ các hình ảnh phức tạp) trong khi đó các phần khác của Clip
lại có độ dư thừa thời gian thấp (ví dụ các cảnh chuyển động nhanh). Vì thế dữ liệu Video đương
nhiên sẽ ở các tỉ lệ nén (Bit rate) thay đổi trong khi việc truyền dữ liệu thường yêu cầu tốc độ cố
định. Chìa khoá để điều khiển tốc độ truyền là trật tự dữ liệu đã nén trong bộ đệm (Buffer).Việc
nén có thể được tiến hành với việc loại bỏ một vài thông tin đã được lựa chọn. Ảnh hưởng nhỏ
nhất đối với chất lượng toàn bộ khung hình có thể đạt được bằng cách bỏ bớt các thông tin chi

Làm Bài : Lý Văn Hiệp D08TCVT1
Lý Văn Hiệp D08TCVT1



tiết. Điều này đảm bảo giới hạn tỉ lệ nén dữ liệu trong khi chất lượng của khung hình suy giảm tối
thiểu.




Mpeg-2 bao gồm cơ chế nén trong một phạm vi rộng. Một bộ mã hoá với cơ chế nén phải phù
hợp với một hoặc đoạn cảnh riêng biệt. Nói chung bộ mã hoá rất phức tạp, nó phải lựa chọn được
cơ chế nén thích hợp nhất bởi vậy tăng chất lượng khung hình đối với tỉ lệ nén dữ liệu truyền. Bộ
giải mã Mpeg-2 cũng có nhiều kiểu, khả năng đa dạng và các lựa chọn khi kết nối.


Số lượng các Level và Profile được định nghĩa cho việc nén Video Mpeg-2. Hệ thống Mpeg-2
được phát triển trên một tập nào đó các Level và Profile:


+Profile: chất lượng của Video.
+Level: độ phân giải của Video.
Hệ thống cơ bản với tên MP@ML (Man Profile Man Level) nén dữ liệu Video từ 1-15 Mbps. Các
Level khác nhau như: High Level, High Level 1440, Low Level và các Profile như: Simple, SNR,
Spatial, 4:2:2 & High.

Các bộ giải mã điển hình:

+720 x 576 x 25 fps (PAL CCIR 601).
+352 x 576 x 25 fps (PAL Half-D1).
+720 x 480 x 30 fps (NTSC CCIR 601).
+352 x 480 x 30 fps (NTSC Half-D1).

Hầu hết các bộ giải mã đều hỗ trợ Mpeg-1:

+352 x 288 x 25 fps (PAL SIF).
+352 x 240 x 30 fps (NTSC SIF).

Chuẩn Mpeg-2 định nghĩa một sự phối hợp mã hoá Audio. Audio số có thể được mã hoá trong
các dạng mã hoá khác nhau ở các tỉ lệ nén khác nhau.

Mpeg-2 cũng cung cấp các hỗ trợ cho việc truyền dữ liệu. Mpeg-2 phân biệt hai kiểu dữ liệu:

+Service Information: thông tin về Video, Audio và Data truyền bởi Mpeg-2.
+Private Data: thông tin người sử dụng hoặc thiết bị thu.




Làm Bài : Lý Văn Hiệp D08TCVT1
Lý Văn Hiệp D08TCVT1




                         Học Viện bưu chính viễn thông

                                    Lớp D08TCVT1

                                        Bài Tập

                           KỸ THUẬT NÉN VIDEO MPEG-2
                                       Nhóm 3:


                                     Lý Văn Hiệp
                                     Lê Sỹ Hiệp
                                 Nguyễn Thị Thu Hoài
                                    Bùi Huy Hoàng
                                   Hoàng Tuấn Học
                                    Lê Quang Huy
                                  Hoàng Quốc Hùng
                                   Kiềng Minh Hùng
                                 Nguyễn Thanh Hùng




Làm Bài : Lý Văn Hiệp D08TCVT1

More Related Content

What's hot

trắc nghiệm ôn tập thông tin di động
trắc nghiệm ôn tập thông tin di độngtrắc nghiệm ôn tập thông tin di động
trắc nghiệm ôn tập thông tin di độngPTIT HCM
 
Chuyen giao trong gsm
Chuyen giao trong gsmChuyen giao trong gsm
Chuyen giao trong gsmLinh Dinh
 
Embedded system Design
Embedded system DesignEmbedded system Design
Embedded system DesignAJAL A J
 
[BTL] Cảm biến đo độ ẩm
[BTL] Cảm biến đo độ ẩm[BTL] Cảm biến đo độ ẩm
[BTL] Cảm biến đo độ ẩmHoàng Phạm
 
Đồ án điện tử Công nghệ nhận dạng đối tượng bằng sóng vô tuyến RFID - sdt/ ZA...
Đồ án điện tử Công nghệ nhận dạng đối tượng bằng sóng vô tuyến RFID - sdt/ ZA...Đồ án điện tử Công nghệ nhận dạng đối tượng bằng sóng vô tuyến RFID - sdt/ ZA...
Đồ án điện tử Công nghệ nhận dạng đối tượng bằng sóng vô tuyến RFID - sdt/ ZA...Viết thuê báo cáo thực tập giá rẻ
 
Chapter 3 gsm - part 1
Chapter 3   gsm - part 1Chapter 3   gsm - part 1
Chapter 3 gsm - part 1Đá Tảng
 
Các loại mã đường truyền và ứng dụng neptune
Các loại mã đường truyền và ứng dụng neptuneCác loại mã đường truyền và ứng dụng neptune
Các loại mã đường truyền và ứng dụng neptune給与 クレジット
 
Ask fsk-psk-qpsk-qam-modulation-demolation
Ask fsk-psk-qpsk-qam-modulation-demolationAsk fsk-psk-qpsk-qam-modulation-demolation
Ask fsk-psk-qpsk-qam-modulation-demolationLuân Thiên
 
Ccip tổng quan mpls
Ccip tổng quan mplsCcip tổng quan mpls
Ccip tổng quan mplsVNG
 
Báo cáo kĩ thuật phần mềm và ứng dụng
Báo cáo kĩ thuật phần mềm và ứng dụngBáo cáo kĩ thuật phần mềm và ứng dụng
Báo cáo kĩ thuật phần mềm và ứng dụngVượng Đặng
 
Ly thuyet da truy nhap va trai pho
Ly thuyet da truy nhap va trai phoLy thuyet da truy nhap va trai pho
Ly thuyet da truy nhap va trai phoQuangthuc Nguyen
 
Tong quan mang di dong
Tong quan mang di dongTong quan mang di dong
Tong quan mang di dongthuti
 
LUẬN VĂN THIẾT KẾ HỆ THỐNG NHÚNG VỚI VI ĐIỀU KHIỂN LÕI MỀM VÀ HỆ ĐIỀU HÀNH TR...
LUẬN VĂN THIẾT KẾ HỆ THỐNG NHÚNG VỚI VI ĐIỀU KHIỂN LÕI MỀM VÀ HỆ ĐIỀU HÀNH TR...LUẬN VĂN THIẾT KẾ HỆ THỐNG NHÚNG VỚI VI ĐIỀU KHIỂN LÕI MỀM VÀ HỆ ĐIỀU HÀNH TR...
LUẬN VĂN THIẾT KẾ HỆ THỐNG NHÚNG VỚI VI ĐIỀU KHIỂN LÕI MỀM VÀ HỆ ĐIỀU HÀNH TR...KhoTi1
 
Hệ thống mạng PSTN
Hệ thống mạng PSTNHệ thống mạng PSTN
Hệ thống mạng PSTNNTCOM Ltd
 
Erlang b table 1000 trunks
Erlang b table  1000 trunksErlang b table  1000 trunks
Erlang b table 1000 trunksHuynh MVT
 
Trắc nghiệm tối ưu nguyễn thiêm
Trắc nghiệm tối ưu  nguyễn thiêmTrắc nghiệm tối ưu  nguyễn thiêm
Trắc nghiệm tối ưu nguyễn thiêmPTIT HCM
 

What's hot (20)

Thi nghiem xlths
Thi nghiem xlthsThi nghiem xlths
Thi nghiem xlths
 
trắc nghiệm ôn tập thông tin di động
trắc nghiệm ôn tập thông tin di độngtrắc nghiệm ôn tập thông tin di động
trắc nghiệm ôn tập thông tin di động
 
Chuyen giao trong gsm
Chuyen giao trong gsmChuyen giao trong gsm
Chuyen giao trong gsm
 
Mã đường truyền
Mã đường truyềnMã đường truyền
Mã đường truyền
 
Embedded system Design
Embedded system DesignEmbedded system Design
Embedded system Design
 
[BTL] Cảm biến đo độ ẩm
[BTL] Cảm biến đo độ ẩm[BTL] Cảm biến đo độ ẩm
[BTL] Cảm biến đo độ ẩm
 
Đồ án điện tử Công nghệ nhận dạng đối tượng bằng sóng vô tuyến RFID - sdt/ ZA...
Đồ án điện tử Công nghệ nhận dạng đối tượng bằng sóng vô tuyến RFID - sdt/ ZA...Đồ án điện tử Công nghệ nhận dạng đối tượng bằng sóng vô tuyến RFID - sdt/ ZA...
Đồ án điện tử Công nghệ nhận dạng đối tượng bằng sóng vô tuyến RFID - sdt/ ZA...
 
Chapter 3 gsm - part 1
Chapter 3   gsm - part 1Chapter 3   gsm - part 1
Chapter 3 gsm - part 1
 
Các loại mã đường truyền và ứng dụng neptune
Các loại mã đường truyền và ứng dụng neptuneCác loại mã đường truyền và ứng dụng neptune
Các loại mã đường truyền và ứng dụng neptune
 
Ask fsk-psk-qpsk-qam-modulation-demolation
Ask fsk-psk-qpsk-qam-modulation-demolationAsk fsk-psk-qpsk-qam-modulation-demolation
Ask fsk-psk-qpsk-qam-modulation-demolation
 
Ccip tổng quan mpls
Ccip tổng quan mplsCcip tổng quan mpls
Ccip tổng quan mpls
 
Báo cáo kĩ thuật phần mềm và ứng dụng
Báo cáo kĩ thuật phần mềm và ứng dụngBáo cáo kĩ thuật phần mềm và ứng dụng
Báo cáo kĩ thuật phần mềm và ứng dụng
 
Ly thuyet da truy nhap va trai pho
Ly thuyet da truy nhap va trai phoLy thuyet da truy nhap va trai pho
Ly thuyet da truy nhap va trai pho
 
Tong quan mang di dong
Tong quan mang di dongTong quan mang di dong
Tong quan mang di dong
 
LUẬN VĂN THIẾT KẾ HỆ THỐNG NHÚNG VỚI VI ĐIỀU KHIỂN LÕI MỀM VÀ HỆ ĐIỀU HÀNH TR...
LUẬN VĂN THIẾT KẾ HỆ THỐNG NHÚNG VỚI VI ĐIỀU KHIỂN LÕI MỀM VÀ HỆ ĐIỀU HÀNH TR...LUẬN VĂN THIẾT KẾ HỆ THỐNG NHÚNG VỚI VI ĐIỀU KHIỂN LÕI MỀM VÀ HỆ ĐIỀU HÀNH TR...
LUẬN VĂN THIẾT KẾ HỆ THỐNG NHÚNG VỚI VI ĐIỀU KHIỂN LÕI MỀM VÀ HỆ ĐIỀU HÀNH TR...
 
Optisystem
OptisystemOptisystem
Optisystem
 
Hệ thống mạng PSTN
Hệ thống mạng PSTNHệ thống mạng PSTN
Hệ thống mạng PSTN
 
Erlang b table 1000 trunks
Erlang b table  1000 trunksErlang b table  1000 trunks
Erlang b table 1000 trunks
 
Tonghop wcdma
Tonghop wcdmaTonghop wcdma
Tonghop wcdma
 
Trắc nghiệm tối ưu nguyễn thiêm
Trắc nghiệm tối ưu  nguyễn thiêmTrắc nghiệm tối ưu  nguyễn thiêm
Trắc nghiệm tối ưu nguyễn thiêm
 

Viewers also liked

đề Cương xử lý âm thanh hình ảnh
đề Cương xử lý âm thanh hình ảnhđề Cương xử lý âm thanh hình ảnh
đề Cương xử lý âm thanh hình ảnhHải Dương
 
Cac chuan nen va ung dung truyen video tren mang internet
Cac chuan nen va ung dung truyen video tren mang internetCac chuan nen va ung dung truyen video tren mang internet
Cac chuan nen va ung dung truyen video tren mang internetNo Name
 
Chương 4: Hệ màu NTSC
Chương 4: Hệ màu NTSCChương 4: Hệ màu NTSC
Chương 4: Hệ màu NTSCNgananh Saodem
 
Tran van chien
Tran van chienTran van chien
Tran van chienvanliemtb
 
Chương 1: Dai cuong vo tuyen truyen hinh
Chương 1: Dai cuong vo tuyen truyen hinh Chương 1: Dai cuong vo tuyen truyen hinh
Chương 1: Dai cuong vo tuyen truyen hinh Ngananh Saodem
 
Images compression using huffman algorithm matlab
Images compression using huffman algorithm matlabImages compression using huffman algorithm matlab
Images compression using huffman algorithm matlabTan Hoang Luu
 
Xu ly am thanh va hinh anh
Xu ly am thanh va hinh anhXu ly am thanh va hinh anh
Xu ly am thanh va hinh anhCharles Luong
 
H.264 video standard
H.264 video standardH.264 video standard
H.264 video standardSajan Sahu
 
ứNg dụng phép biến đổi wavelet trong xử lý ảnh
ứNg dụng phép biến đổi wavelet trong xử lý ảnhứNg dụng phép biến đổi wavelet trong xử lý ảnh
ứNg dụng phép biến đổi wavelet trong xử lý ảnhThanh Hoa
 
Xử lý ảnh PTIT
Xử lý ảnh PTITXử lý ảnh PTIT
Xử lý ảnh PTITTran Tien
 
Xử lý ảnh theo phương pháp âm bản, nhị phân, hàm số mũ
Xử lý ảnh theo phương pháp âm bản, nhị phân, hàm số mũXử lý ảnh theo phương pháp âm bản, nhị phân, hàm số mũ
Xử lý ảnh theo phương pháp âm bản, nhị phân, hàm số mũPhan Khanh Toan
 
MPEG Compression Standards
MPEG Compression StandardsMPEG Compression Standards
MPEG Compression StandardsAjay
 
Lttt matlab chuong 5
Lttt matlab chuong 5Lttt matlab chuong 5
Lttt matlab chuong 5Hoa Cỏ May
 
Giai sach bai tap xstk dh ktqd chuong 1 full v1
Giai sach bai tap xstk dh ktqd chuong 1 full v1Giai sach bai tap xstk dh ktqd chuong 1 full v1
Giai sach bai tap xstk dh ktqd chuong 1 full v1Ngọc Ánh Nguyễn Thị
 
Giáo trình xử lý ảnh
Giáo trình xử lý ảnhGiáo trình xử lý ảnh
Giáo trình xử lý ảnhTùng Trần
 

Viewers also liked (19)

Chương iii
Chương iiiChương iii
Chương iii
 
đề Cương xử lý âm thanh hình ảnh
đề Cương xử lý âm thanh hình ảnhđề Cương xử lý âm thanh hình ảnh
đề Cương xử lý âm thanh hình ảnh
 
Cac chuan nen va ung dung truyen video tren mang internet
Cac chuan nen va ung dung truyen video tren mang internetCac chuan nen va ung dung truyen video tren mang internet
Cac chuan nen va ung dung truyen video tren mang internet
 
Iptv
IptvIptv
Iptv
 
Chương 4: Hệ màu NTSC
Chương 4: Hệ màu NTSCChương 4: Hệ màu NTSC
Chương 4: Hệ màu NTSC
 
Chg4 tham lam
Chg4 tham lamChg4 tham lam
Chg4 tham lam
 
Tran van chien
Tran van chienTran van chien
Tran van chien
 
Bao cao quang
Bao cao quangBao cao quang
Bao cao quang
 
Chương 1: Dai cuong vo tuyen truyen hinh
Chương 1: Dai cuong vo tuyen truyen hinh Chương 1: Dai cuong vo tuyen truyen hinh
Chương 1: Dai cuong vo tuyen truyen hinh
 
Images compression using huffman algorithm matlab
Images compression using huffman algorithm matlabImages compression using huffman algorithm matlab
Images compression using huffman algorithm matlab
 
Xu ly am thanh va hinh anh
Xu ly am thanh va hinh anhXu ly am thanh va hinh anh
Xu ly am thanh va hinh anh
 
H.264 video standard
H.264 video standardH.264 video standard
H.264 video standard
 
ứNg dụng phép biến đổi wavelet trong xử lý ảnh
ứNg dụng phép biến đổi wavelet trong xử lý ảnhứNg dụng phép biến đổi wavelet trong xử lý ảnh
ứNg dụng phép biến đổi wavelet trong xử lý ảnh
 
Xử lý ảnh PTIT
Xử lý ảnh PTITXử lý ảnh PTIT
Xử lý ảnh PTIT
 
Xử lý ảnh theo phương pháp âm bản, nhị phân, hàm số mũ
Xử lý ảnh theo phương pháp âm bản, nhị phân, hàm số mũXử lý ảnh theo phương pháp âm bản, nhị phân, hàm số mũ
Xử lý ảnh theo phương pháp âm bản, nhị phân, hàm số mũ
 
MPEG Compression Standards
MPEG Compression StandardsMPEG Compression Standards
MPEG Compression Standards
 
Lttt matlab chuong 5
Lttt matlab chuong 5Lttt matlab chuong 5
Lttt matlab chuong 5
 
Giai sach bai tap xstk dh ktqd chuong 1 full v1
Giai sach bai tap xstk dh ktqd chuong 1 full v1Giai sach bai tap xstk dh ktqd chuong 1 full v1
Giai sach bai tap xstk dh ktqd chuong 1 full v1
 
Giáo trình xử lý ảnh
Giáo trình xử lý ảnhGiáo trình xử lý ảnh
Giáo trình xử lý ảnh
 

Similar to Bai tap mpeg2

Tailieu.vncty.com bao cao-tong_ket_de_tai_nghi_dinh_thu_hop_tac_nghien_cuu_...
Tailieu.vncty.com   bao cao-tong_ket_de_tai_nghi_dinh_thu_hop_tac_nghien_cuu_...Tailieu.vncty.com   bao cao-tong_ket_de_tai_nghi_dinh_thu_hop_tac_nghien_cuu_...
Tailieu.vncty.com bao cao-tong_ket_de_tai_nghi_dinh_thu_hop_tac_nghien_cuu_...Trần Đức Anh
 
Quy hoach mang w cdma
Quy hoach mang w cdmaQuy hoach mang w cdma
Quy hoach mang w cdmamjnhtamhn
 
[TTDD] C4 letunghoa WCDMA.pdf
[TTDD] C4 letunghoa WCDMA.pdf[TTDD] C4 letunghoa WCDMA.pdf
[TTDD] C4 letunghoa WCDMA.pdfcQun22
 
Thuật toán D-Blast trong công nghệ Mimo.pdf
Thuật toán D-Blast trong công nghệ Mimo.pdfThuật toán D-Blast trong công nghệ Mimo.pdf
Thuật toán D-Blast trong công nghệ Mimo.pdfHanaTiti
 
Session Border Controller 12000
Session Border Controller 12000Session Border Controller 12000
Session Border Controller 12000Long Nguyen
 
giai-phap-an-ninh-trong-kien-truc-quan-tri-mang-snmp
giai-phap-an-ninh-trong-kien-truc-quan-tri-mang-snmpgiai-phap-an-ninh-trong-kien-truc-quan-tri-mang-snmp
giai-phap-an-ninh-trong-kien-truc-quan-tri-mang-snmpPham Huynh
 
Xu ly tin hieu am thanh và hình ảnh giảng dạy slide
Xu ly tin hieu am thanh và hình ảnh giảng dạy slideXu ly tin hieu am thanh và hình ảnh giảng dạy slide
Xu ly tin hieu am thanh và hình ảnh giảng dạy slidenovrain1
 
Giới thiệu chung về Streaming Video.docx
Giới thiệu chung về Streaming Video.docxGiới thiệu chung về Streaming Video.docx
Giới thiệu chung về Streaming Video.docxClipHot VN
 
Chương 6: Truyền hình số
Chương 6: Truyền hình sốChương 6: Truyền hình số
Chương 6: Truyền hình sốNgananh Saodem
 
Nhóm 9-khái-niệm-ims
Nhóm 9-khái-niệm-imsNhóm 9-khái-niệm-ims
Nhóm 9-khái-niệm-imsNhân Nhầm
 
Cac chuan nen ITU
Cac chuan nen ITUCac chuan nen ITU
Cac chuan nen ITUTrung Vi
 
Nghiên cứu mã sửa lỗi trong mạng cảm biến không dây 6814992.pdf
Nghiên cứu mã sửa lỗi trong mạng cảm biến không dây 6814992.pdfNghiên cứu mã sửa lỗi trong mạng cảm biến không dây 6814992.pdf
Nghiên cứu mã sửa lỗi trong mạng cảm biến không dây 6814992.pdfNuioKila
 
ung dung ky thuat mimo trong-lte
ung dung ky thuat mimo trong-lteung dung ky thuat mimo trong-lte
ung dung ky thuat mimo trong-ltePTIT HCM
 

Similar to Bai tap mpeg2 (20)

Hiệu năng hệ thống đa chặng phối hợp trên kênh Fading rayleigh
Hiệu năng hệ thống đa chặng phối hợp trên kênh Fading rayleigh Hiệu năng hệ thống đa chặng phối hợp trên kênh Fading rayleigh
Hiệu năng hệ thống đa chặng phối hợp trên kênh Fading rayleigh
 
Tailieu.vncty.com bao cao-tong_ket_de_tai_nghi_dinh_thu_hop_tac_nghien_cuu_...
Tailieu.vncty.com   bao cao-tong_ket_de_tai_nghi_dinh_thu_hop_tac_nghien_cuu_...Tailieu.vncty.com   bao cao-tong_ket_de_tai_nghi_dinh_thu_hop_tac_nghien_cuu_...
Tailieu.vncty.com bao cao-tong_ket_de_tai_nghi_dinh_thu_hop_tac_nghien_cuu_...
 
Quy hoach mang w cdma
Quy hoach mang w cdmaQuy hoach mang w cdma
Quy hoach mang w cdma
 
[TTDD] C4 letunghoa WCDMA.pdf
[TTDD] C4 letunghoa WCDMA.pdf[TTDD] C4 letunghoa WCDMA.pdf
[TTDD] C4 letunghoa WCDMA.pdf
 
Thuật toán D-Blast trong công nghệ Mimo.pdf
Thuật toán D-Blast trong công nghệ Mimo.pdfThuật toán D-Blast trong công nghệ Mimo.pdf
Thuật toán D-Blast trong công nghệ Mimo.pdf
 
Atm
AtmAtm
Atm
 
Session Border Controller 12000
Session Border Controller 12000Session Border Controller 12000
Session Border Controller 12000
 
Atm
AtmAtm
Atm
 
00050001334
0005000133400050001334
00050001334
 
giai-phap-an-ninh-trong-kien-truc-quan-tri-mang-snmp
giai-phap-an-ninh-trong-kien-truc-quan-tri-mang-snmpgiai-phap-an-ninh-trong-kien-truc-quan-tri-mang-snmp
giai-phap-an-ninh-trong-kien-truc-quan-tri-mang-snmp
 
Xu ly tin hieu am thanh và hình ảnh giảng dạy slide
Xu ly tin hieu am thanh và hình ảnh giảng dạy slideXu ly tin hieu am thanh và hình ảnh giảng dạy slide
Xu ly tin hieu am thanh và hình ảnh giảng dạy slide
 
Giới thiệu chung về Streaming Video.docx
Giới thiệu chung về Streaming Video.docxGiới thiệu chung về Streaming Video.docx
Giới thiệu chung về Streaming Video.docx
 
Hệ thống nhúng cho ứng dụng giải trí thời gian thực trên Android
Hệ thống nhúng cho ứng dụng giải trí thời gian thực trên AndroidHệ thống nhúng cho ứng dụng giải trí thời gian thực trên Android
Hệ thống nhúng cho ứng dụng giải trí thời gian thực trên Android
 
Luận văn: Phân tích bộ mã hóa video dùng cho mạng Sensor
Luận văn: Phân tích bộ mã hóa video dùng cho mạng SensorLuận văn: Phân tích bộ mã hóa video dùng cho mạng Sensor
Luận văn: Phân tích bộ mã hóa video dùng cho mạng Sensor
 
Chương 6: Truyền hình số
Chương 6: Truyền hình sốChương 6: Truyền hình số
Chương 6: Truyền hình số
 
Nhóm 9-khái-niệm-ims
Nhóm 9-khái-niệm-imsNhóm 9-khái-niệm-ims
Nhóm 9-khái-niệm-ims
 
Sdh
SdhSdh
Sdh
 
Cac chuan nen ITU
Cac chuan nen ITUCac chuan nen ITU
Cac chuan nen ITU
 
Nghiên cứu mã sửa lỗi trong mạng cảm biến không dây 6814992.pdf
Nghiên cứu mã sửa lỗi trong mạng cảm biến không dây 6814992.pdfNghiên cứu mã sửa lỗi trong mạng cảm biến không dây 6814992.pdf
Nghiên cứu mã sửa lỗi trong mạng cảm biến không dây 6814992.pdf
 
ung dung ky thuat mimo trong-lte
ung dung ky thuat mimo trong-lteung dung ky thuat mimo trong-lte
ung dung ky thuat mimo trong-lte
 

Bai tap mpeg2

  • 1. Lý Văn Hiệp D08TCVT1 Giới thiệu: Sự phát triển của internet băng thông rộng đang thúc đẩy mạnh mẽ sự phát triển của công nghệ đa truyền thông Multimedia. Các nguồn dữ liệu multimedia như âm thanh, hình ảnh, văn bản… có thể được truy cập và được phân phối nhanh hơn và rộng hơn. Xu thế này mang lại nhiều lợi ích cho người sở hữu các sản phẩm multimedia, nhưng cũng thách thức quyền sở hữu của chúng ta bởi vì hầu hết các dữ liệu multimedia được phân phối dưới các định dạng không bảo mật. Hiện nay, việc sao chép và phân phối lại bất hợp pháp các sản phẩm multimedia đang diễn ra liên tục không có kiểm soát. Khi ra pháp luật, để phân xử quyền sở hữu các sản phẩm multimedia là việc không dễ dàng nếu không có một cơ chế có thể đảm bảo tính toàn vẹn chân thực quyền tác giả. Trong bài báo này chúng tôi mô tả một phương pháp hiệu quả cho bảo vệ quyền trí tuệ và bản quyền tác giả cho các dữ liệu video nén MPEG-2, đó là thuật toán Watermarking thực hiện dấu một ảnh đơn sắc trên nền video số nén MPEG-2 trong miền DCT. Giải pháp Watermarking hiện hay ẩn đều có thể đạt được thông qua việc điều chỉnh một số tham số trong mô hình thuật toán này. Cuối cùng hiệu quả của phương pháp được đánh giá thông qua các kết quả mô phỏng trên máy tính. Summary: The growth of the wideband internet has boosted the growth of multimedia technologies. The sources of multimedia data such as audio, video, image, text…are able to be accessed and distributed faster and more widely. This trend brings many benefits to the owners of multimedia products, but also many threats to our copyrights because almost all multimedia data has been distributed in insecure formats. These days, the illegal duplication and redistribution of multimedia products is taking place continuously without control. Legal judgements about copyrights on multimedia products will be not easy if we do not have an effective method of checking the integrity and accuracy of the copyright. In this paper, we describe an effective method for the copyright of compressed video data MPEG-2, which is a watermarking algorithm hiding a grey image inside MPEG-2 data in DCT domain. Visible watermarkings or invisible watermarkings can be achieved by adjusting some parameters in this model. Finally, the effectiveness of this method is evaluated by the results of computer simulations. I. ĐẶT VẤN ĐỀ MPEG (Moving Picture Expert Group) là một nhánh của ISO (International Standardization Organization) cho nén video/audio và các kỹ thuật liên quan trong các ứng dụng thương mại và công nghiệp. Các chuẩn nén nổi tiếng của MPEG là MPEG-1, MPEG-2, MPEG- Làm Bài : Lý Văn Hiệp D08TCVT1
  • 2. Lý Văn Hiệp D08TCVT1 4. Các chuẩn mới như MPEG-9, MPEG-21 vẫn đang được phát triển. MPEG-1 được ứng dụng chính cho phân phối video với các đĩa nén video quang (VCD); MPEG-2 ứng dụng trong truyền hình độ phân giải cao HDTV quảng bá và phân phối movie/video chất lượng cao trong các đĩa video số (DVD). MPEG-4 là định dạng video có thể trao đổi luồng chính trên Internet bởi vì MPEG-4 có tốc độ nén cao và mềm dẻo hơn với tốc độ bit thấp. Các kỹ thuật chính liên quan đến các chuẩn MPEG là chuyển đổi không gian màu và tỷ lệ lấy mẫu màu, dự đoán và bù chuyển động dựa trên cơ sở khối, biến đổi cosin rời rạc (DCT), quét Zigzag và mã hóa thông tin entropy. Kỹ thuật Watermarking thực hiện nhúng dữ liệu mở rộng, được gọi là watermark, vào trong một bản tin. Tại phía thu, dữ liệu nhúng này có thể được nhận biết và tách lấy bằng một phương pháp thích hợp tương ứng. Việc phân loại watermarking có thể được xem xét theo nhiều khía cạnh, cụ thể là: nếu theo cảm nhận của con người thì nó được chia ra loại hiện và loại ẩn. Nếu theo độ mạnh của nó thì có thể chia ra loại mạnh và loại yếu. Theo các ứng dụng thì nó có thể là loại cơ sở nguồn hay đích. Theo loại tài liệu thì nó có thể là text, ảnh, âm thanh, video. Theo miền làm việc thì nó có thể là loại miền không gian hay miền tần số. Cả watermarking hiện và ẩn đều có thể được sử dụng cho bảo vệ bản quyền tác giả; thêm vào đó loại ẩn cũng hữu ích trong các ứng dụng bảo mật như chuyển đổi dấu và truyền thông tin mật. Loại watermarking mạnh có thể làm vô tác dụng các tấn công nhằm loại bỏ watermark. Một watermark có thể được nhúng vào trong text, hình ảnh, âm thanh hay video như dữ liệu thừa. Phụ thuộc vào các thuật toán nhúng mà các watermark có thể được giải tách chính xác như ban đầu hay không. II. KỸ THUẬT NÉN VIDEO MPEG-2 Tất cả các chuẩn quốc tế hiện tại cho nén video như là MPEG-1,2,4, ITU-T H261, H263, H264 đều là các sơ đồ mã hóa lai [7]. Các sơ đồ này dựa trên các nguyên lý của dự đoán bù chuyển động và mã hóa chuyển đổi trên cơ sở khối. Trong phạm vi của bài báo sẽ giới thiệu chuẩn nén vid eo MPEG-2 (hình 2.1). Hình 2.1. Mô hình sơ đồ khối bộ mã hóa MPEG-2 Các khung mã hóa Intra (các khung I) được phân chia thành các khối 8x8 pixels. Các khối này tiếp theo được nén sử dụng DCT, lượng tử hóa (Q), quét zig-zag, mã hóa Entropy (sử dụng kỹ thuật mã hóa có độ dài từ mã thay đổi VLC). Các khung mã hóa Inter (các khung B và P) là Làm Bài : Lý Văn Hiệp D08TCVT1
  • 3. Lý Văn Hiệp D08TCVT1 kết quả của bù chuyển động bằng cách trừ đi một dự đoán đã được bù chuyển động. Các khung dư (khung sai số) sau đó được chia thành các khối 8x8 pixel và được nén theo cách giống như với các khối của khung I. Biến đổi cosine rời rạc (DCT) Biến đổi cosine rời rạc là một công cụ toán học xử lý các tín hiệu như ảnh hay video. Nó sẽ chuyển đổi các tín hiệu từ miền không gian sang miền tần số và biến đổi ngược lại từ miền tần số quay trở lại miền không gian mà không gây tổn hao đến chất lượng. Lý do chọn biến đổi cosine cho xử lý ảnh số là: đầu tiên, nó có thể loại bỏ sự tương quan giữa các pixel ảnh trong miền không gian. Thứ hai là biến đổi cosine rời rạc yêu cầu ít sự phức tạp tính toán và tài nguyên hơn [1]. Lượng tử hóa các hệ số DCT Sau khi biến đổi cosine rời rạc, sự tương quan giữa các pixel của một ảnh trong miền không gian đã được giải tương quan thành các tần số rời rạc khác nhau trong miền tần số. Do sự cảm nhận thị giác của con người là rất nhạy với hệ số DC và các tần số thấp, một phương pháp lượng tử hóa vô hướng được thiết kế cẩn thận có thể giảm sự dư thừa dữ liệu mà vẫn dữ được tính trung thực của ảnh. Quét zigzag các hệ số DCT. Sau khi biến đổi DCT ta thu được các khối 8x8 biểu diễn cho các hệ số tần số. Trong khối này thì các hệ số tần số thấp sẽ tụm lại ở góc cao phía trái của ma trận DCT. Quét zigzag sẽ sắp xếp lại thứ tự của ma trận để các hệ số được sắp xếp theo tần số theo thứ tự tăng dần. Mã hóa Entropy Sau DCT và lượng tử hóa là các thuật toán miền mã. Các thuật toán này thường được gọi là mã hóa Entropy, bao gồm mã hóa Huffman, mã hóa số học…, đây là phương pháp mã hóa không tổn hao. Ý tưởng cơ bản của mã hóa Entropy là các biểu tượng thường xuyên xuất hiện sẽ được mã hóa bằng các bít ngắn, trong khi đó các biểu tượng ít xuất hiện hơn sẽ được mã hóa bằng các bít dài hơn. Phương pháp này còn gọi là mã hóa có độ dài từ mã thay đổi (VLC), và một phương pháp cho hiệu quả cao là mã hóa Huffman. Điều này sẽ làm cho tốc độ bit của luồng giảm đáng kể. Ước lượng và bù chuyển động Nén video có thể đạt được với việc lấy mẫu không gian màu, loại bỏ các hệ số DCT tần số cao, lượng tử hóa, mã hóa không tổn hao, dự đoán và bù chuyển động trong miền thời gian. Chuẩn MPEG chấp nhận việc dự đoán và bù chuyển động dựa trên khối trong miền không gian. Thực tế, dự đoán và bù chuyển động cũng làm việc trong miền DCT vì các biến vị trí trong miền không gian có thể chuyển đổi với các biến tần số trong miền DCT. III. THUẬT TOÁN WATERMARKING CHO VIDEO MPEG-2 Ý tưởng chung của Watermarking là nhúng một vài dữ liệu mở rộng vào trong một bản tin Làm Bài : Lý Văn Hiệp D08TCVT1
  • 4. Lý Văn Hiệp D08TCVT1 chủ. Thông tin nhúng gọi là watermark và dữ liệu chủ gọi là vật mang. Các ứng dụng của Watermarking có thể là bảo vệ bản quyền, nhận thực, ẩn dữ liệu, các thông tin mật… Watermarking tại miền không gian Các thuật toán watermarking thế hệ đầu tiên làm việc trong miền không gian bởi vì nó ít yêu cầu phức tạp và đắt trong xử lý máy tính. Một phương pháp trong đó là mã hóa LSB: bit LSB của byte dữ liệu sẽ được sửa đổi để nhúng các watermark. Mã hóa LSB rất dễ bị bẻ vỡ vì nó chỉ thực hiện che phần LSB của các byte dữ liệu, vì vậy nó nhanh chóng được thay thế bằng các kỹ thuật khác[8]. Watermarking tại miền DCT Chúng ta thấy rằng sau khi chuyển đổi miền làm việc từ miền không gian sang miền DCT, sự tương quan của các pixel không gian sẽ được giải tương quan thành các phần tần số rời rạc. Hệ số DC và tần số thấp của ma trận DCT sẽ quyết định các đặc tính tự nhiên nhất của một ảnh. Sau khi cắt xén các hệ số tần số cao, tính trung thực của ảnh vẫn còn đủ tốt cho sự cảm thụ thị giác con người thông qua biến đổi ngược IDCT. Vì vậy một phương pháp tự nhiên là nhúng một ma trận các hệ số DCT watermark vào một ma trận các hệ số DCT ảnh trong vùng tần số trung bình hay thấp hơn để đạt được watermark mạnh (hình 3.1). Các tần số thấp Các tần số trung bình cho watermarking Các tần số cao Hình 3.1. Nhúng một watermark ở vùng tần số trung bình Tính chất mạnh của watermarking DCT là nếu một kẻ tấn công cố gắng loại bỏ watermarking tại các tần số trung bình thì sẽ phá mất đi tính trung thực của ảnh, vì một vài chi tiết thu nhận là tại các tần số trung bình. Phương trình nhúng watermark [3, 4, 5, 6, 8]: Cw = αC(i, j) + βW(i, j) (3.1) Trong đó, Cw(i,j) là hệ số DCT (i,j) sau khi nhúng watermarking; và là các chỉ số độ mạnh watermark, các chỉ số này có thể xác định liệu watermark là ẩn hay hiện; C(i,j) là hệ số DCT ban đầu trước khi watermarking; W(i,j) là hệ số DCT watermark. Watermarking ẩn và watermarking hiện Watermarking ẩn tại miền DCT cũng có thể thực hiện được với phương trình watermarking (3.1). Chỉ bằng điều chỉnh các hệ số watermarking và [1, 5, 6, 8], watermark có thể trở lên ẩn hay hiện. Watermarking ẩn trong video được ứng dụng rất phổ biến trong video quảng bá. Để Làm Bài : Lý Văn Hiệp D08TCVT1
  • 5. Lý Văn Hiệp D08TCVT1 thực hiện kỹ thuật này, một ma trận các hệ số 16x16 DCT sẽ được cộng trực tiếp với ma trận các hệ số 16x16 DCT ảnh như phương trình (3.1) [1, 4, 5] (hình 3.2). Hình 3.2. Nhúng watermark tại ma trận các hệ số 16x16 Không giống như nhúng watermark ở tần số trung bình, hệ số DC và tất cả hệ số AC của ma trận các hệ số DCT ảnh sẽ bị sửa đổi bởi việc nhúng watermark, vì kỹ thuật watermarking này cho kết quả là cảm nhận hữu hình các watermark đối với hệ thống thị giác con người. Có hai lựa chọn để nhúng watermark vào các khung của một đoạn video là thực hiện watermarking trước hay sau khi nén (hình 3.3). Các khung watermarking Nén video Luồng bit video MPEG a. Watermarking trong miền chưa nén (trước khi nén) Nén video Các khung Luồng bit video MPEG Watermarking b. watermarking trong miền nén (trong khi nén) Hình 3.3. Watermarking trong miền chưa nén và miền nén Để đạt được tính mạnh của nó thì thuật toán nhúng watermark tại miền DCT được lựa chọn (hình 3.4). Các khung C video đầu vào DCT C Các khung đã C W i, j = αC i, j + βW I, J được nhúng Ảnh watermark water mark DCT W Hình 3.4. Sơ đồ khối phần tử watermarking IV. MÔ PHỎNG THUẬT TOÁN VÀ KẾT QUẢ Sử dụng công cụ MATLAB/Simulink[9] để mô phỏng các thuật toán và kiến trúc trên cơ Làm Bài : Lý Văn Hiệp D08TCVT1
  • 6. Lý Văn Hiệp D08TCVT1 sở tập các khối chức năng. Công cụ MATLAB/Simulink hỗ trợ nhiều hàm xử lý ảnh và video, đó là: DCT/IDCT, SAD cho ước lượng chuyển động, xử lý khối, trễ (bộ đệm). Và một số công việc phải thực hiện thêm vào là: lượng tử hóa, quét zigzag, mã hóa entropy, watermarking. Mô hình watermarking cho video MPEG-2 được thể hiện ở hình vẽ 4.1 a. Cấu trúc khối hệ thống thực hiện thuật toán Watermarking cho video nén MPEG-2 1 1 2 2 3 IP b. Cấu trúc các khối bên trong bộ mã hóa trong cấu trúc tổng thể (hình a) Hình 4.1. Mô hình hệ thống sử dụng công cụ Matlab/Simulink Quan sát hình vẽ 4.1b thì các khung video được nhúng watermark tại miền DCT (trong khối watermarking) trước khi được nén. Và chỉ có các khối Y là được nhúng watermark vì các lý do sau: - Ảnh watermark thường là các ảnh màu trắng đen hay xám, nên nó chỉ tác động vào độ chói (độ sáng) của ảnh. - Độ chói Y thì nhạy cảm hơn với cảm nhận thị giác của con người, do đó bất cứ sự chỉnh sửa tác động trái phép nào đều dễ dàng phát hiện vì vậy nó lý tưởng cho bảo vệ bản quyền. Làm Bài : Lý Văn Hiệp D08TCVT1
  • 7. Lý Văn Hiệp D08TCVT1 - Để tránh quá nhiều dư thừa được cộng vào các khung, watermark không nên được nhúng vào Cb và Cr. Kết quả mô phỏng:  Sử dụng đoạn video ‘akiyo.avi’ có độ phân giải 112x176, ảnh đơn sắc Watermark ‘GTVT112x176.tif’ có kích thước 112x176 pixels. Tỷ lệ nén đạt được trung bình 13.75 lần tương ứng với kết quả được thể hiện trên hình vẽ 4.2. Hình 4.2. Kết quả mô phỏng khi sử dụng đoạn video ‘akiyo.avi’ và ảnh watermark ‘GTVT112x176.tif’ Sử dụng đoạn video ‘akiyo.avi’ có độ phân giải 112x176, ảnh đơn sắc Watermark ‘GTVT48x80.tif’ có kích thước 48x80 pixels. Cùng hệ số α và ß như mô phỏng trên thì tỷ lệ nén đạt được trung bình 12.3 lần tương ứng với kết quả được thể hiện trên hình vẽ 4.3. Hình 4.3. Kết quả mô phỏng khi sử dụng đoạn video ‘akiyo.avi’ và ảnh watermark ‘GTVT48x80.tif’ Tỷ số tín hiệu trên nhiễu đỉnh PSNR là một tham số quan trọng để đánh giá video sau mã hóa so với video trước khi mã hóa. Quan sát hình vẽ 4.4a ta thấy PSNR tham chiếu cho video gốc và video sau nén MPEG-2 không thực hiện watermarking đạt trung bình là 34,1 và đây là kết quả khá tốt cho nén video. Hình 4.4b cho kết quả PSNR giữa video gốc và video sau nén MPEG-2 có thực hiện nhúng watermark ảnh ‘GTVT112x176.tif’ (hình vẽ 4.4b) đạt giá trị trung bình là 22,03 và kết quả này nằm trong giới hạn chất lượng của một bộ nén video tổn hao [10]. PSNR giữa video gốc và video sau nén MPEG-2 có nhúng watermark ‘GTVT40x80.tif’ kích thước nhỏ hơn (hình vẽ 4.4c) đạt trung bình là 19,23. Làm Bài : Lý Văn Hiệp D08TCVT1
  • 8. Lý Văn Hiệp D08TCVT1 34.5 34.4 34.3 34.2 PSNR 34.1 34 33.9 33.8 33.7 0 50 100 150 200 250 300 FRAMES a. PSNR giữa video gốc và video sau nén MPEG-2 khi không thực hiện watermarking 22.12 22.1 22.08 22.06 22.04 PSNR 22.02 22 21.98 21.96 21.94 0 50 100 150 200 250 300 FRAMES b. PSNR giữa video gốc và video sau nén MPEG-2 có nhúng watermark ‘GTVT112x176.tif’ 19.7 19.6 19.5 19.4 19.3 P S NR 19.2 19.1 19 18.9 18.8 0 50 100 150 200 250 30 FRAMES c. PSNR giữa video gốc và video sau nén MPEG-2 có nhúng watermark ‘GTVT40x80.tif’ Hình 4.4. Kết quả tính toán PSNR giữa video gốc với video nén MPEG-2 không thực hiện nhúng Watermark và có thực hiện nhúng watermark với cùng các hệ số α và ß Làm Bài : Lý Văn Hiệp D08TCVT1
  • 9. Lý Văn Hiệp D08TCVT1 Mpeg-2 được mở rộng dựa trên chuẩn Mpeg để hỗ trợ việc nén dữ liệu để truyền Video số chất lượng cao. Để hiểu được tại sao nén Video là rất quan trọng, ta cần tìm hiểu băng thông (Bandwidth) cần thiết để truyền các khung hình Video số không nén. PAL (Phase Alternate Line) là chuẩn để truyền tín hiệu TV tuần tự (Analog) được sử dụng ở khá nhiều nước trên thế giới. Khung hình TV dùng PAL không nén đòi hỏi băng thông rất lớn tới 216 Mbps, lớn hơn rất nhiều khả năng của truyền sóng radio. Một số nước dùng hệ thống Analog TV là NTSC. Hệ thống này cung cấp các thông tin về màu sắc kém trung thực hơn với tỉ lệ truyền các khung khác nhau. Tín hiệu NTSC không nén đòi hỏi dung lượng đường truyền thấp hơn không đáng kể ở mức 168 Mbps. TV độ phân giải cao HDTV (High Definition TV) yêu cầu băng thông tối thiểu là 1 Gbps. Mpeg-2 cung cấp cách nén các tín hiệu Video số thành các mức có thể quản lý được. Khả năng nén Video của Mpeg-2 liệt kê theo bảng sau: Do chuẩn Mpeg-2 cung cấp khả năng nén rất cao bằng cách dùng các thuật toán tiêu chuẩn, nó trở thành chuẩn cho TV số với các đặc tính: +Nén Video tương thích với Mpeg-1. +Chế độ Full-screen kết hợp với cải tiến chất lượng Video (cho TV và màn hình PC). +Cải tiến mã hoá Audio (chất lượng cao, mono, stereo...). +Truyền phối hợp nhiều thành phần. +Các dịch vụ khác. Các hệ thống sử dụng Mpeg-2 đang rất phát triển như: TV số, VoD, Digital Versatile Disc (DVD)... Thuật toán nén Video Mpeg-2 đạt được khả năng nén cao nhờ lợi dụng sự dư thừa in thông tin Video. Mpeg-2 loại bỏ cả dư thừa về không gian và dư thừa về thời gian trong các cảnh Video. Dư thừa thời gian xuất hiện khi các khung Video liên tiếp hiển thị hình ảnh của những hình ảnh giống nhau. Nó chứa các hình ảnh gần như không đổi hoặc thay đối rất nhỏ giữa các khung hình liên tiếp. Dư thừa không gian xảy ra khi một phần của ảnh được tái tạo lại (với thay đổi không Làm Bài : Lý Văn Hiệp D08TCVT1
  • 10. Lý Văn Hiệp D08TCVT1 đáng kể) trong một khung Video. Dữ liệu từ các Macroblock cần được mã hoá sẽ được đưa đến cả bộ trừ (Subtractor) và bộ đoán chuyển động (Motion Estimator). Bộ đoán chuyển động sẽ so sánh các Macroblock mới được đưa vào này với các Macroblock đã được đưa vào trước đó và được lưu lại dùng để tham khảo. Kết quả là bộ đoán chuyển động sẽ tìm ra các Macroblock trong khung hình tham khảo gần giống nhất với Macroblock mới này. Bộ đoán chuyển động sau đó sẽ tính toán Vector chuyển động (Motion Vector), Vector này sẽ đặc trưng cho sự dịch chuyển theo cả hai chiều dọc và ngang của Macroblcok mới cần mã hoá so với khung hình tham khảo. Lưu ý rằng Vector chuyển động có độ phân giải bằng một nửa do thực hiện quét xen kẽ. Bộ đoán chuyển động cũng đồng thời gửi các Macroblock tham khảo được gọi là các Macroblock tiên đoán (Predicted Macroblock) tới bộ trừ để trừ với Macroblock mới cần mã hoá. Từ đó ta sẽ được các sai số tiên đoán (Error Prediction) hoặc tín hiệu dư, chúng sẽ đặc trưng cho sự sai khác giữa Macroblock cần tiên đoán và Macroblock thực tế cần mã hoá. Tín hiệu dư hay sai số tiên đoán này sẽ được biến đổi DCT, các hệ số nhận được sau biến đổi DCT sẽ được lượng tử hoá để làm giảm số lượng các bits cần truyền. Các hệ số này sẽ được đưa tới bộ mã hoá Huffman, tại đây số bits đặc trưng cho các hệ số tiếp tục được làm giảm đi một cách đáng kể. Dữ liệu từ đầu ra của mã hoá Huffman sẽ được kết hợp với Vector chuyển động và các thông tin khác (thông tin về I, P, B-picture) để gửi tới bộ giải mã. Đối với trường hợp P-picture, các hệ số DCT cũng được đưa đến bộ giải mã nội bộ (nằm ngay trong bộ mã hoá). Tín hiệu dư hay sai số tiên đoán được biến đổi ngược lại dùng phép biến đổi IDCT và được cộng thêm vào khung hình đứng trước để tạo nên khung hình tham khảo (tiên đoán). Vì dữ liệu khung hình trong bộ mã hoá được giải mã luôn nhờ vào bộ giải mã nội bộ ngay chính bên trong bộ mã hoá, do đó có thể thực hiện thay đổi thứ tự các khung hình và dùng các phương pháp tiên đoán ở trên. Quá trình khôi phục lại khung hình tại bộ giải mã là hoàn toàn ngược lại. Từ luồng dữ liệu nhận được ở đầu vào, Vector chuyển động được tách ra và đưa vào bộ bù chuyển động (Motion Compensator), các hệ số DCT được đưa vào bộ biến đổi ngược IDCT để biến tín hiệu từ miền tần số thành tín hiệu ở miền không gian. Đối với P-picture và B-picture, Vector chuyển động sẽ được kết hợp với các Macroblock tiên đoán để tạo thành các khung hình tham khảo. Không cần thiết phải luôn nén mọi khung hình Video cùng một mức độ, một phần của Clip có thể có độ dư thừa không gian thấp (ví dụ các hình ảnh phức tạp) trong khi đó các phần khác của Clip lại có độ dư thừa thời gian thấp (ví dụ các cảnh chuyển động nhanh). Vì thế dữ liệu Video đương nhiên sẽ ở các tỉ lệ nén (Bit rate) thay đổi trong khi việc truyền dữ liệu thường yêu cầu tốc độ cố định. Chìa khoá để điều khiển tốc độ truyền là trật tự dữ liệu đã nén trong bộ đệm (Buffer).Việc nén có thể được tiến hành với việc loại bỏ một vài thông tin đã được lựa chọn. Ảnh hưởng nhỏ nhất đối với chất lượng toàn bộ khung hình có thể đạt được bằng cách bỏ bớt các thông tin chi Làm Bài : Lý Văn Hiệp D08TCVT1
  • 11. Lý Văn Hiệp D08TCVT1 tiết. Điều này đảm bảo giới hạn tỉ lệ nén dữ liệu trong khi chất lượng của khung hình suy giảm tối thiểu. Mpeg-2 bao gồm cơ chế nén trong một phạm vi rộng. Một bộ mã hoá với cơ chế nén phải phù hợp với một hoặc đoạn cảnh riêng biệt. Nói chung bộ mã hoá rất phức tạp, nó phải lựa chọn được cơ chế nén thích hợp nhất bởi vậy tăng chất lượng khung hình đối với tỉ lệ nén dữ liệu truyền. Bộ giải mã Mpeg-2 cũng có nhiều kiểu, khả năng đa dạng và các lựa chọn khi kết nối. Số lượng các Level và Profile được định nghĩa cho việc nén Video Mpeg-2. Hệ thống Mpeg-2 được phát triển trên một tập nào đó các Level và Profile: +Profile: chất lượng của Video. +Level: độ phân giải của Video. Hệ thống cơ bản với tên MP@ML (Man Profile Man Level) nén dữ liệu Video từ 1-15 Mbps. Các Level khác nhau như: High Level, High Level 1440, Low Level và các Profile như: Simple, SNR, Spatial, 4:2:2 & High. Các bộ giải mã điển hình: +720 x 576 x 25 fps (PAL CCIR 601). +352 x 576 x 25 fps (PAL Half-D1). +720 x 480 x 30 fps (NTSC CCIR 601). +352 x 480 x 30 fps (NTSC Half-D1). Hầu hết các bộ giải mã đều hỗ trợ Mpeg-1: +352 x 288 x 25 fps (PAL SIF). +352 x 240 x 30 fps (NTSC SIF). Chuẩn Mpeg-2 định nghĩa một sự phối hợp mã hoá Audio. Audio số có thể được mã hoá trong các dạng mã hoá khác nhau ở các tỉ lệ nén khác nhau. Mpeg-2 cũng cung cấp các hỗ trợ cho việc truyền dữ liệu. Mpeg-2 phân biệt hai kiểu dữ liệu: +Service Information: thông tin về Video, Audio và Data truyền bởi Mpeg-2. +Private Data: thông tin người sử dụng hoặc thiết bị thu. Làm Bài : Lý Văn Hiệp D08TCVT1
  • 12. Lý Văn Hiệp D08TCVT1 Học Viện bưu chính viễn thông Lớp D08TCVT1 Bài Tập KỸ THUẬT NÉN VIDEO MPEG-2 Nhóm 3: Lý Văn Hiệp Lê Sỹ Hiệp Nguyễn Thị Thu Hoài Bùi Huy Hoàng Hoàng Tuấn Học Lê Quang Huy Hoàng Quốc Hùng Kiềng Minh Hùng Nguyễn Thanh Hùng Làm Bài : Lý Văn Hiệp D08TCVT1