MPEG-2
Fra Wikipedia, den frie encyklopædi
MPEG-2 er en standard, udgivet af MPEG, til kodning af lyd- og billedestrømme og er oprindeligt tænkt til kodning af videostrømme i 4-10 Mbit/s.
MPEG-2 var oprindeligt tænkt til at indeholde 10 dele, men del 7 og 8 er trukket tilbage:
- Systems
- Video
- Audio
- Conformance testing
- Software simulation
- Extensions for Digital Storage Media Command and Control (DSM-CC)
- Advanced Audio Coding (AAC) (tilbagetrukket)
- Video with 10 bit input sampling (aldrig udviklet, pga. manglende interesse)
- Extension for real time interface for systems decoders
- Conformance extensions for DSM-CC
Den vigtigste forskel mellem MPEG-1 og MPEG-2 ligger i billededelen. Hvor MPEG-1 kun arbejder med I- og P-rammer, introducerede MPEG-2 B-rammer. Se nedenfor for en beskrivelse af de forskellige rammetyper.
Indholdsfortegnelse |
[redigér] Video
MPEG-2 udnytter flere kodningsteknikker til at opnå komprimering af en videostrøm:
- Temporal redundans
- Transformation til frekvensdomænet
- Reducering af farveopløsningen
- Kvantisering
- Entropikodning
[redigér] Temporal redundans
De fleste videostrømme indeholder en meget stor mængde temporal redundans, dvs. der er en meget stor lighed mellem de enkelte rammer i videostrømmen. Dette udnyttes i MPEG-2 ved at kode forskellen mellem rammer, istedet for at kode hver enkelt ramme for sig.
Det er dog ikke blot den rå forskel mellem enkelte rammer, der kan kodes. MPEG-2 giver mulighed for at beskrive bevægelser i videostrømmen, og dermed yderligere at kunne udnytte temporal redundans, når videostrømmen indeholder bevægelse.
I MPEG-2 kan bevægelse i billedet angives på makroblok-niveau. En makroblok er en blok på 16x16 billedepunkter, og bevægelsen vil angive hvordan hver blok har "bevæget sig" mellem to rammer i strømmen.
[redigér] Transformation til frekvensdomænet
Et billede, hvilket en ramme i en videostrøm kan opfattes som, indholder væsentligt mere redundans, hvis dette transformeres til frekvensdomænet.
Transformation til frekvensdomænet kan opfattes som en slags statistik analyse af billedet: Istedet for at angive hvert punkts farve eller lysintensitet, vil den resulterende datastrøm indeholde generel information om fordelingen af farver, eller lysstyrker, i billedet.
Transformationen foregår på blok-niveau (ikke at forveksle med en makroblok). En blok består af 8x8 billedepunkter. MPEG-2 bruger en Diskret Cosinus Transformation (DCT) til at transformere til frekvensdomænet.
Da transformationen til og fra frekvensdomænet uafværgeligt vil resultere i afrundingsfejl, især pga. forskelle i implementationen af transformationer til kodning of afkodning, er transformationen den første årsag til afvigelser mellem den oprindelige videostrøm og den afkodede strøm.
[redigér] Reducering af farveopløsning
Det menneskelige øje er væsentligt mere følsom over for lysintensitet, end for farveforskelle. Dette kan udnyttes i MPEG-2 ved at reducere mængden af farveinformation i videostrømmen. Derfor arbejder MPEG-2 ikke med billeder i RGB-format, men i YCrCb-format, dvs. istedet for at hvert punkt beskrives ved dets komposition af tre grundfarver, beskrives punktet ud fra dets lysintensitet (Y) og dets farve (Cr, Cb).
Der er en række forskellige måder at begrænse mængden af farveinformation i et billede:
- 4:4:4 - Fuld farveopløsning
- 4:2:2 - Kun hvert andet punkt indeholder farveinformation
- 4:1:1 og 4:2:0 - Kun hvert fjerde punkt indeholder farveinformation
[redigér] Kvantisering
Istedet for at gemme den fulde information efter transformation til frekvensdomænet, gemmes afrundede værdier. Dette foregår rent praktisk ved at bruge en kvantiseringsmatrix, som gemmes én gang i videostrømmen. Resten af strømmen kan så referere til denne matrix, fremfor at gemme de faktiske kvantiseringsværdier.
[redigér] Entropikodning
Det sidste trin i kompression opnås ved at foretage en entropikodning kvantiseringsværdierne.
ISO/IEC
MPEG-1 • MPEG-2 • MPEG-4 • MPEG-4/AVC |
ITU-T
H.261 • H.262 • H.263 • H.264 |
Andre
AVS • Bink • Dirac • Indeo • MJPEG • RealVideo • VC-1 • Theora • VP6 • VP7 • WMV |
Lydkompressionsformater:
ISO/IEC MPEG
MPEG-1 Layer III (MP3) • MPEG-1 Layer II • AAC • HE-AAC |
ITU-T
G.711 • G.722 • G.722.1 • G.722.2 • G.723 • G.723.1 • G.726 • G.728 • G.729 • G.729.1 • G.729a |
Andre
AC3 • ATRAC • FLAC • iLBC • Monkey's Audio • Musepack • RealAudio • SHN • Speex • Vorbis • WavPack • WMA |
Billedkompressionsformater:
ISO/IEC/ITU-T
JPEG • JPEG 2000 • JPEG-LS • JBIG • JBIG2 |
Andre
BMP • GIF • ILBM • PCX • PNG • TGA • TIFF • WMP |
Containerformater:
General
3GP • ASF • AVI • FLV • Matroska • MP4 • MXF • NUT • Ogg • Ogg Media • QuickTime • RealMedia |
Kun lyd
AIFF • AIFC • AU • WAV |