More Related Content Similar to Motion picture experts group
Similar to Motion picture experts group (20) Motion picture experts group1. Motion Picture Experts Group
活動圖像專家組織
•MPEG-1
•MPEG-2
•MPEG-4
•MPEG-7
•MPEG-21
0992961_ 張哲膺
0992962_ 陳文一
0992964_ 徐彥瑜
2. MPEG1
MPEG-1 是 MPEG 組織制定的第一個視訊和音訊破壞性壓縮標準。
MPEG 委員會把 MPEG-1 定義為 “在存儲媒體上儲存和擷取動畫和
音訊
的標準”。它以 525 或 625 的解析度和 1.5mbps (兆位元 / 每秒)的資料
密度
壓縮電影。
MPEG-1 是為 CD 光盤介質定製的視頻和音頻壓縮格式。
MPEG-1 採用了塊方式的運動補償、離散餘弦變換( DCT )、量化等
技術,並為 1.2Mbps 傳輸速率進行了優化。 MPEG-1 隨後被 Video CD
採
用作為核心技術。
MPEG-1 的輸出質量大約和傳統錄像機 VCR ,信號質量相當,這也許
是 Video CD 在發達國家未獲成功的原因。
3. 數據結構和壓縮模式
MPEG-1 可以按照分層的概念來理解,一個 MPEG-1 視頻序列,包含多
個 GOP ,每個 GOP 包含多個幀,每個幀包含多個 slice 。
影格是 MPEG-1 的一個重要基本元素,一個影格就是一個完整的顯示圖
像。影格的種類有四種:
I- 圖像/影格(節點編碼圖像, intra coded picture )參考圖像,相當於一個固定
像,且獨立於其它的圖像類型。每個圖像群組由此類型的圖像開始。編碼時獨立編
碼,僅適用幀內編碼技術,因而解碼時不參考其他幀,類似 JPEG 編碼。
P- 圖像/影格(預測編碼圖像, predictive coded picture )包含先前的或 P- 畫
格的
差異資訊。編碼時使用運動補償和運動估計,採前向估計,參考之前的 I- 幀或者
P-
幀去預測該 P 格。
B- 圖像/影格(前後預測編碼圖像, bidirectionally predictive coded pictures )包
含先前的 I 或 P- 畫格的差異資訊。編碼也使用運動補償和運動估計,預估採用前向
估計、後向估計或是雙向估計,主要參考前面的或者後面的 I 格或者 P 格。
D- 圖像/影格(指示編碼圖像, DC direct coded picture )用於快速進帶。僅由
DC
4. MPEG- 1 :廣泛的應用在 VCD 的製作和一些網路短片製作的應用上
,
可以說 99% 的 VCD 都是用 MPEG1 格式壓縮的,而我們目前習慣
的
MP3 ,並不是 MPEG-3 ,而是 MPEG 1 layer 3 ,屬於 MPEG 1 中
的音
效部分,但是因為音質欠佳,並不用於標準 VCD (標準 VCD 使用
MPEG 1 layer 2 )。
MPEG 1 的像質等同於 VHS ,存儲媒體為 CD-ROM ,影片解析度
320×240 畫素,音質極接近 CD ,固定位元率為 1.2Mbps 。
該標準分三個部分:
1. 系統:控制將視訊、音效位元流結合為統一的位元流。
2. 視頻:基於 H.261 和 JPEG 。
3. 音頻:基於 MUSICAM 技術。
5. MPEG2
MPEG - 2 解決相結合的一個或多個基本碼流的視頻和音頻,以及其他數
據為單個或多個數據流是適合儲存或傳輸。 這是指定的兩種形式:節目
流和傳輸流。 每一個不同的優化設置的應用程序如圖。
6. 該節目流是類似於 MPEG - 1 系統的多重。 它的結果相結合的一個或多
個 Packetised 基本流( PES )的,其中有一個共同的時間基準,到一
個
流。 該節目流是專為使用在相對無錯的環境和適合的應用,這涉及軟件
處理。 節目流數據包可能會相對變大篇幅。
MPEG - 2 是一個向後兼容多聲道擴展了 MPEG - 1 音頻標準。
7. MPEG - 2 數字存儲媒體命令和控制(帝斯曼 - CC )是規範的一組協
議,提供具體的控制功能來管理和操作 MPEG - 1 和 MPEG – 2 的碼流
。
MPEG - 2 將成為規範的多聲道音頻編碼算法不約束為向後兼容的
MPEG
- 1 音頻。
MPEG - 2 ,原計劃進行編碼的視頻時,輸入樣本為 10 位。 這部分工作
之後,停止很明顯,沒有足夠的興趣,從行業這樣的標準。
8. MPEG4
MPEG-4 是整合現有視訊壓縮優點而發展的一套多媒體壓縮標準。
此標準具有 1. 物件式( Object-based )編碼
2. 抗錯式( Error-resilience )編碼
使其在應用上可針對不同的環境、不同的使用者之需求提供一個最適合
的品質。
1. 素材 (content) 的重覆使用性 (reusability)
2. 適合網際網路上的應用
3. 使用者和素材間的互動性
傳統的視訊壓縮技術皆是以一張畫面為壓縮的單位,而 MPEG-4 則將畫
面再切割成更小的單位,以物件( Object )為壓縮的單位,因此原本是
一張張畫面的視訊序列被分割成數個以物件為主的視訊序列。
9. 實例說明 MPEG4 描述場景 (scene) 的方法
1. 在一個已知的座標系下將 media object 放置在任何位置
2. 改變 media object 的外型
3. 編組 (group) 數個 media object 成為一個新的 / 複合 (compound) 的
media
object
4. 在一個 media object 上加入串流資料 , 例如加入聲音 , 移動材質 , 移
動參
數 (animation parameter)
5. 和使用者互動 ( 改變視角 , 聲音的聆聽位置 )
10. 抗錯式( Error-resilience )編碼 :
(1) 再同步標記 (2) 資料分隔 (3) 可反向可變長度編碼 (4) 檔頭延伸碼
再同步標記 :
藉著再同步標記我們可以將 MPEG-4 視訊位元流分為一個個長度大至相同的視
訊
封包( Video Packet ; VP ),每一個視訊封包裡包含了連續整數個 MB ,其結
構
如下圖所示。其中 MB No. 是該視訊封包的數個 MB 中第一個 MB 的編號, QP
是量
化參數( Quantization Parameter ),而每一個 MB 的移動向量和 DCT 資料則
混合
編碼緊接在後。
資料分隔
MPEG-4 的資料分隔工具在移動向量和 DCT 資料之間加入了一個獨特的移動邊
界
標記( Motion Boundary Marker ; MBM ),將這兩種不同性質的資料分隔開
來,如下圖,當 DCT 資料發生錯誤時,則表示可以正確的偵測到 MBM ,故
MBM
之前的資料包括移動向量部份仍然是正確無誤的,因此只需將 DCT 資料捨棄,
移
動向量依舊可以正常使用於移動補償。
11. 可反向可變長度編碼( RVLC )
RVLC 是一種特殊的可變長度編碼( Variable Length Coding ; VLC ),它的碼
字
藉由增加一些特定的字首( Prefix )和字尾( Suffix )使其能夠從反方向來解碼
,
下表列出一個簡單的例子。因此當解碼端以正方向解碼發現錯誤時,可以先找
到下一個再同步標記,然後往回解碼直到它偵測到錯誤,經由這種雙方向的解
碼,除了可以保留原來會被捨棄的資料外,還可以準確的顯示出錯誤發生的位
置,如圖所示。 RVLC 通常與資料分隔一起使用,以得到最大效益。
檔頭延伸碼( HEC )
MPEG-4 使用了一種叫做 HEC 的技術,在每個視訊封包中,設有 1-bit 長的
HEC 欄
位,如圖,當這個欄位設為 1 時,則表示這個視訊封包的檔頭除了放在原有
的位置外,還會在視訊封包中另一個地方再複製一份,故一旦無法正確讀取原有
12. MPEG7
介紹 :
MPEG-7 意欲提供補全功能給早先 MPEG 標準,代表關於內容,不是
內
容的信息 ( 「位關於位」 ) 。 這種功能是多媒體美滿描述的標準化。
MPEG-7 可以獨立其他 MPEG 標準使用描述甚而附有一部模式電影。
宗旨 :
• 提供一個快速和高效率搜尋,過濾和美滿的證明方法。
• 描述主題關於內容 ( 低級特徵、結構、模型、收藏等等 ) 。
• 標註一個大應用範圍。
MPEG-7 成交的視聽信息是:
• 音頻、聲音、錄影、圖像、圖表和 3D 模型
• 通知關於怎樣對象在場面被結合。
• 獨立在描述和信息之間。
13. 使用以下工具:
形容標誌 (d) : 它是語法上和語義地被定義的特點的表示法。 它可能是一個
獨
特的對象是由幾個形容標誌描述的。
描述計劃 (DS) : 指定結構,并且聯繫的語義學在它的組分之間,這些組分可
以
是形容標誌 (d) 或描述計劃 (DS) 。
描述定義語言 (DDL) : 它根據用於的 XML 語言定義結構聯繫在形容標誌之間。
它允許描述計劃的創作和修改並且新的形容標誌 (d) 的創作。
系統工具: 這些工具應付 binarization 、同步、形容標誌運輸和存貯。 它也處
理
知識產權 保護。
MPEG-7 應用
有將受益於 MPEG-7 標準的許多應用和應用領域。 幾個應用程序實例是:
數字式圖書館 : 圖像或錄影編目,音樂字典。
多媒體名址服務:黃頁。
廣播媒介選擇: 射頻信道,電視頻道。
多媒體編輯: 個人化的電子通訊社,媒介創作。
安全部門: 交通控制,生產鏈子…
14. 文化服務: 藝術畫廊,博物館…
教育應用。
生物醫學的應用。
“
多媒體框架” (Multimedia Framework) 這一概念在 1999 年 10 月 MPEG 會
議上提出的初衷。 隨後,這個新的工作方向被確定為 MPEG-21 。
MPEG-21 的主要研究目標是:討論是否需要和如何將協議、標準、技術
等不同的組件有機地結合起來,討論是否需要新的規範,以及討論在具
備上述兩個條件的前提下如何將不同的標準集成在一起。
MPEG-21 可以描述成一些關鍵技術的集成,這些技術可以通過訪問全球
網絡和設備實現對多媒體資源的透明和增強地使用。 其主要功能包括內
容創建、內容產品、內容髮布、內容消耗和使用、內容表示、知識產權
管理和保護、內容識別和描述、財政管理、用戶的隱私權、終端和網絡
資源抽取以及事件報告等等。
MPEG21
15. MPEG-21 多媒體框架標準包括如下用戶需求:
(1) 內容傳送和價值交換的安全性
(2) 數字項的理解
(3) 內容的個性化
(4) 價值鏈中的商業規則
(5) 兼容實體的 * 作
(6) 其它多媒體框架的引入
(7) 對 MPEG 之外標準的兼容和支持
(8) 一般規則的遵從
(9)MPEG-21 標準功能及各個部分通信性能的測試
(10) 價值鏈中媒體數據的增強使用
(11) 用戶隱私的保護
(12) 數據項完整性的保證
(13) 內容與交易的跟蹤
(14) 商業處理過程視圖的提供
(15) 通用商業內容處理庫標準的提供
(16) 長線投資時商業與技術獨立發展的考慮
(17) 用戶權利的保護,包括:服務的可靠性、債務與保險、損失與破壞、付
費處理與風險防範等
(18) 新商業模型的建立和使用