MPEG-4
出典: フリー百科事典『ウィキペディア(Wikipedia)』
MPEG-4(えむぺぐふぉー、ISO/IEC 14496)は、動画・音声全般をデジタルデータとして扱うための規格のことである。MPEG-1やMPEG-2と同様、システム、ビジュアル(MPEG-1/-2ではビデオと呼ぶ)、オーディオ、ファイルフォーマットの各技術から構成される。しかしながら、一般的には「MPEG-4」と呼ぶ場合、動画の符号化方式を記述したビジュアル部分だけを指すことが多い。
規格が広範なことが「MPEG-4とは何か」という説明を難しくさせている上に、ビジュアル、あるいはファイルフォーマットの一部の規格を利用したものも単に「MPEG-4です」と説明されることが多く、使われ方、意味のとられ方が混乱している用語でもある。
なお、規格化を行っているMoving Picture Experts GroupではMPEG-4を最後の動画/音声符号化の規格とする意向であり、現在では3次元コンピュータグラフィクスや音声合成などを含む大変広範な規格になっている。MPEG技術は、各技術毎にパート(Part)と呼ばれる規格が作成され、技術が採用/規格化されるたびにパートが増える。最近H.264がMPEG-4 Part 10 AVCとして規格化されるなど、現在もなお追加・拡張が継続されている規格である。
目次 |
[編集] 技術の概要
[編集] 動画像符号化
現在のところ、MPEG-4で規定される動画像符号化方式には、1999年に最初の規格が確定したPart 2方式と、2003年に規格化されたPart 10方式の2つがある。この2つを区別するため、前者は単にMPEG-4もしくはMPEG-4ビジュアルと呼ばれ、後者はMPEG-4 AVCと呼ばれる。
MPEG-4技術は通常、符号化技術として紹介されるが、実際に規格化されているのは復号技術のみであり、復号可能な符号化データを、どのように符号化するかについては規格化されていない。
[編集] MPEG-4 (Part 2)
MPEG-1ではビデオCD、MPEG-2では放送やHDTVでの使用を想定しているのに対して、MPEG-4では低ビットレートでの使用にまで用途を拡大することを目標として規格化が開始された。符号化技術としては先に規格化が進んでいたH.263をベースに幾つかのツールを追加した構成になっている。H.263との相違点は、フレーム間予測におけるBフレームの採用、DCT係数のAC/DC予測の導入、などが挙げられる。
このビジュアル技術自体も、エラー耐性技術のほか、任意形状技術やスプライト符号化技術、顔画像の動きを符号化するフェース(Face)符号化技術、スケーラビリティ技術などを盛り込んだ巨大なものであったが、現在ではエラー耐性技術のほかは殆ど使用されていない。
圧縮アルゴリズムの基本原理は、MPEG-1、MPEG-2、H.263などと基本的には同様であり、空間変換やフレーム間予測、量子化、エントロピー符号化を採用している。
[編集] 空間変換
MPEG4では、空間変換に離散コサイン変換が用いられる。8×8画素のブロックを単位として、原画像もしくはフレーム間予測の予測誤差画像のDCT係数を求め、その係数を量子化している。
[編集] フレーム間予測
フレーム間予測において参照フレームとして指定できるフレームは、Iフレーム, Pフレーム、Bフレームが存在する。Pフレームでは時間軸で前方のフレーム1枚の画像を利用して符号化を行うが、Bフレームでは前方・後方2枚の画像を利用して符号化を行う。
[編集] 1/4画素精度動き補償
動き補償の精度としては1/2画素精度まで基本的に利用可能である。MPEG-4 ASP(Advanced Simple Profile)では、1/4画素精度動き補償も採用している。
[編集] AC/DC予測
空間変換で得られたDCT係数に対して、さらに係数の最上列ないし最左列の係数から予測を行って情報量を削減する技術が導入されている。
DC予測とは、隣接した「左MBと左上MBのDC成分の変化量」と「左上MBと上MBのDC成分の変化量」を比較して、より傾きの小さい方向から現在のMBのDC成分を予測する手法である。この方法を用いることによって、相関の高い画素からの予測を行うことが可能であるため、圧縮率の向上が期待できる。
AC予測とは、フレーム間予測を用いずに符号化される画素ブロックについて、単純に離散コサイン変換(DCT)の係数を量子化して符号化するのではなく、DCT係数行列のうち最上列ないし最左行の値について、上ないし左の隣接ブロックの値との差分を符号化することによって符号量を削減する方式である。予測の方向の決定については、DC予測での予測方向に従う。 この予測方式は、後にH.263でもAnnex Iとして採用された。
DC予測は必ず使用しなければならず、AC予測は使用有無をヘッダで切り替えることが可能である。
[編集] エントロピー符号化
ハフマン符号をベースとした可変長符号化(VLC; Variable Length Coding)が採用されている。
[編集] MPEG-4 AVC (Part 10)
Part 2では、規格範囲が拡散しすぎてしまったという反省のもと、通常の動画像の圧縮効率を追求するという方針のもと開発が進められた(Part 2では使用されることがなかったフェース技術やスケーラブル技術は範囲から外されている)。ITU-Tと共同で規格化したものでありH.264と同じもの。H.264/AVCとも呼ばれる。詳細はH.264ページを参照のこと。
[編集] 音声符号化 (オーディオ、Part 3)
MPEG-4の音声符号化技術では、CELP符号化やAAC、TwinVQなどが採用されている。
[編集] システム (Part 1)
マルチメディアデータをファイルや記録メディアに保存したり、ネットワーク上で伝送するには、動画と音声毎に別々に符号化した符号化データの統合(多重化)と同期のための仕組みが必要となる。この多重化方式を規定するものがシステムである。なお、システムによって多重化される以前の動画像や音声のバイナリデータをエレメンタリストリーム(ES: Elementary Stream)と呼ぶ。
動画像と音声のエレメンタリストリームを多重化するという目的においては、MPEG-1やMPEG-2のシステムに近いといえるが、MPEG-4についてはオブジェクト符号化という概念があるという点で異なる。MPEG-4においては、オーディオ、ビジュアル(ビデオ)のデータは各1つのオブジェクトとして扱われ、これらのオブジェクトを多重化・同期するのがシステムの役割である。なお、MPEG-4の動画像(ビジュアルおよびAVC)や音声のエレメンタリストリームの多重化には、MPEG-4システムの他にMPEG-2トランスポートストリーム(MPEG-2 TS)を用いることも可能であり、地上デジタルテレビジョン放送の1セグメント放送ではAVCとAACの伝送にMPEG-2 TSが用いられる。
さらに、複数のオブジェクトを組み合わせて扱うことを可能にするためのシーン記述のための仕様として、VRML97をベースとしたBIFS(Binary Format for Scenes)が規定されている。例えば、人物や背景の動画および音声をそれぞれ別個のオブジェクトとして符号化し、それらを重ね合わせて表示したり、ユーザが任意にオブジェクトを動かしたりできるようなアプリケーションを作ることが可能である。しかし、このようなオブジェクト符号化は、一般向けに実用化されていないのが現状である。
オブジェクト符号化の概念の導入やBIFSなどにより、MPEG-4システムの内容が肥大化してしまったため、ファイルフォーマット(MP4)に関しては後述のPart 14として独立して規定されている。ちなみに、ネットワーク上での伝送に関しては、Part 8およびRFC 3640で規定されている。
なお、バイナリフォーマットであるBIFSを容易に扱えるようにするため、XML準拠の記述形式として、Extensible MPEG-4 Textual Format in XML (XMT)がPart 11で規定されている。
[編集] ファイルフォーマット (Part 12,14)
マルチメディアデータをファイルに記録するには、動画像と音声のエレメンタリストリームを多重化する必要があるが、後で再生する際に早送りや編集を容易にするためにフレーム単位でアクセスできるように、データを区分けして、さらにアクセス用管理データを付加する方が便利である。MPEG-4では、そのためのファイルフォーマットとしてMP4ファイルフォーマットを規定している。
音声の場合には、ファイルフォーマットに格納せず、符号化データをそのまま使用することもある。MPEG-1などで規定されたMP3はこの例である。
MP4ファイルフォーマットはアップルコンピュータのQuickTimeのファイルフォーマットをベースに開発されている。QuickTimeファイルフォーマットで採用されているファイル構造は、さまざまな動画像や音声のエレメンタリストリームを柔軟に多重化可能となっており、汎用的なファイルフォーマットとしてISOベースメディアファイルフォーマット(Part 12)に採用された。このPart 12からMPEG-4用のファイルフォーマットとして派生したものがMP4ファイルフォーマットである。詳細は、MP4ページ参照。
[編集] プロファイル、レベル
ビジュアル、オーディオ共その規格内において、プロファイルとレベルと呼ばれる概念が規定されている。プロファイルとは使用できるツールを示すものであり、レベルとは使用できるパラメータの範囲を規定するものである。例えば、MPEG-4 Part 2では、シンプルプロファイル(SP)、アドバンスドシンプルプロファイル(ASP)、メインプロファイル (MP)などが規定されそれぞれ使用可能なツールが異なる。MPEG-4 AVCでは、ベースラインプロファイル、メインプロファイル、拡張(Extended)プロファイルの3種類が規定されており、今後ハイプロファイルなどが新たに追加される予定である。レベルは数値で示される。通常、プロファイルとレベルを合わせて、SP@L3(シンプルプロファイルレベル3)などと表現される。
[編集] 歴史
1999年に規格化された直後から、動画像を長時間記録する用途でデジタルカメラの一機能として使用された。当初は、ファイルフォーマットが規格化されていなかったため、マイクロソフト社のASFファイルフォーマットが使用された。近年では、第三世代携帯電話の動画フォーマットとして採用され、PDAを含めてモバイルで見る動画フォーマットの主流になりつつある。特にiPodやPSPがこのフォーマットに対応したことを機に爆発的に普及している。これらの動画符号化技術は、現状MPEG-4 Part 2であるが、2005年後半からは、MPEG-4 AVCも使用されることが確実視されている。
放送や通信分野においては、ライセンスの問題もあり主だった利用例も少なかったが、MPEG-4 AVC (H.264)が地上波デジタル放送の携帯端末向け(1セグメント)放送での採用、Blu-ray DiscやHD DVDのビデオ・コーデックとして承認、などされており、応用例は増えていく見込みである。
[編集] 利用例
[編集] 3GPP/3GPP2動画フォーマット
第三世代携帯電話の業界団体である3GPPと3GPP2は、MMSにMPEG-4技術を採用している。なお、同じファイルフォーマットをサポートした第二世代携帯電話端末も存在する。
を使用している。解像度はQCIF(Sub-QCIF)などに限定されているが、一部端末ではQVGAなども利用可能。
[編集] DivX
パソコンで動画を扱う際によく使われるDivXやXviDはMPEG-4 Visual (Video) の技術を利用したものである。これらを利用した映像をAVIの箱(コンテナ)に収めたものは一部のDVDプレーヤー等で再生に対応している。
- (DivX + MP3).avi
[編集] メモリーカード規格
メモリーカードによっては、動画像のアプリケーションフォーマットを規定しているものがある。そのうち、SDメモリーカードのSD-Video規格やメモリースティックのメモリースティックビデオフォーマットにMPEG-4技術が採用されている。(前者はASF形式、後者はMP4を採用している。)
[編集] Part
先にも述べたように、MPEG-4規格自体は、動画・音声全般を扱う多様なマルチメディア符号化フォーマットである。以下に示す多数のPartに分かれて標準化されており、現在もなお拡張仕様が継続検討されている。
- Part 1 (ISO/IEC 14496-1): システム(各メディアの統合・同期、BIFSなど)
- Part 2 (ISO/IEC 14496-2): ビジュアル。動画像符号化技術
- Part 3 (ISO/IEC 14496-3): オーディオ。音声符号化技術
- Part 4 (ISO/IEC 14496-4): 妥当性テスト
- Part 5 (ISO/IEC 14496-5): 参照ソフトウェア
- Part 6 (ISO/IEC 14496-6): Delivery Multimedia Integration Framework (DMIF) (各メディアの多重化伝送に関するインタフェースなどの規定)
- Part 7 (ISO/IEC 14496-7): 最適化ソフトウェア (処理の高速化やエラー耐性などの応用に関する検証に用いられる)
- Part 8 (ISO/IEC 14496-8): MPEG-4コンテンツのIPネットワーク上の伝送
- Part 9 (ISO/IEC 14496-9): 参照ハードウェア記述
- Part 10 (ISO/IEC 14496-10): Advanced Video Coding (AVC) ⇒ H.264
- Part 11 (ISO/IEC 14496-11): シーン記述とアプリケーションエンジン
- Part 12 (ISO/IEC 14496-12): ISOメディアフォーマット (MP4フォーマット、JPEG 2000のJP2フォーマットで用いられている、QuickTimeベースのファイルフォーマット)
- Part 13 (ISO/IEC 14496-13): Intellectual Property Management and Protection (IPMP) (知的財産権の保護技術に関する規定)
- Part 14 (ISO/IEC 14496-14): MP4ファイルフォーマット
- Part 15 (ISO/IEC 14496-15): AVCファイルフォーマット (H.264/MPEG-4 AVCに関するMP4ファイルフォーマットの拡張)
- Part 16 (ISO/IEC 14496-16): Animation Framework eXtension (AFX) (主に3次元グラフィクスに関する規定)
- Part 18 (ISO/IEC 14496-18): フォントの圧縮とストリーミング
[編集] 関連項目
[編集] 外部リンク
圧縮フォーマット |
動画ファイルフォーマット |
ISO/IEC: MPEG-1 | MPEG-2 | MPEG-4 | MPEG-4/AVC (H.264) | ITU-T: H.261 | H.262 | H.263 | H.264 SMPTE: VC-1 その他: VP7 | RealVideo | WMV | Indeo | MJPEG | Theora | Dirac | Flash Video | DivX |
音声ファイルフォーマット |
ISO/IEC MPEG: MPEG-1 Layer III (MP3) | MPEG-1 Layer II | AAC | HE-AAC ITU-T: G.711 | G.722 | G.722.1 | G.722.2 | G.723 | G.723.1 | G.726 | G.728 | G.729 | G.729a その他: WavPack | FLAC | TTA | Monkey's Audio | iLBC | RealAudio | WMA | SHN | Speex | Musepack | Vorbis | ATRAC | AC-3|Cwav |
画像ファイルフォーマット |
ISO/IEC/ITU-T: JPEG | JPEG 2000 | JPEG-LS | JBIG | JBIG2 その他: GIF | PNG | TIFF | PCX | TGA | BMP | HD Photo | ILBM |
マルチメディアコンテナフォーマット |
AU | AIFF | WAV | NUT | MXF | Matroska | Ogg | Ogg Media | MP4 | QuickTime | RealMedia | AVI | ASF | 3GP |