MPEG-1 Audio Layer 2 (MP2) ist ein auch als Musicam bekanntes und von der Moving Picture Experts Group standardisiertes Verfahren zur Audiodatenkompression von digitalen Audiodaten. Die Abkürzung wird auch als Dateierweiterung für Dateien, die Audiodaten dieses Typs beinhalten, genutzt.
Während es im PC- und Internet-Bereich im Wesentlichen durch MP3 abgelöst wurde, verbleibt es als dominanter Standard für digitalen Rundfunk als Teil der DAB- und DVB-Standards. Es kommt außerdem vereinzelt bei der DVD zum Einsatz.
Aus MPEG-1 Audio Layer 2 hervorgegangen ist das freie, im audiophilen Bereich beliebte Musepack.
Für Details und eine kurze historische Einführung in MP2, siehe MP3.
Inhaltsverzeichnis |
Am Eingang liegt ein unkomprimiertes mit 48 kHz abgetastetes und mit 16 Bit quantisiertes Audiosignal an. Dieses wird dann in 32 Teilbänder à 750 Hz aufgeteilt, um eine Schwäche des menschlichen Ohres auszunutzen und dadurch Bandbreite zu sparen. Man kann jetzt nämlich pro Teilband sogenannte Skalenfaktoren bestimmen, die den höchsten Schalldruckpegel (also den lautesten Ton) in diesem Teilband beschreiben. Treten einige Millisekunden vor oder nach dem lauten Ton leisere Töne auf, brauchen diese nicht mitcodiert zu werden. Man kann sie also löschen, da aufgrund der zeitlichen Verdeckung das menschliche Ohr nicht in der Lage ist, diese leiseren Töne wahrzunehmen. Es muss nur der laute Ton übertragen werden.
FFT mit 1024 Abtastwerten
Außerdem macht MP2 sich den Simultanverdeckungseffekt zunutze, indem das Eingangssignal mit einer FFT (fast fourier transformation) transformiert und dann 1024-mal abgetastet wird. Da das Ursprungssignal eine Abtastfrequenz von 48 kHz hat, kann nach dem Abtasttheorem die maximale Bandbreite des Signals 24 kHz sein. Bei 1024 Abtastwerten bedeutet das, dass alle 20 Hz das FFT-Signal abgetastet wird. Nun kann man mit Hilfe des psychoakustischen Modells herausfinden, ob ein lauter Ton einen leiseren Ton aus dem selben oder einem der benachbarten Teilbänder verdeckt (Mithörschwelle). Wenn dies der Fall ist, brauchen die leisen Töne nicht mitkodiert zu werden. Dadurch ergibt sich für jedes Teilband eine unterschiedliche Quantisierung, da im einfachsten Fall Teilbänder ja auch ganz verdeckt werden können und dadurch die Quantisierung für solch ein Teilband dann 0 Bit beträgt. Natürlich muss hier auch die zeitliche Verdeckung von Signalen mit berücksichtigt werden.
Im letzten Schritt werden die Nutzdaten (z.B. Musik) noch einem sogenannten Bit-Packing unterzogen und anschließend mit Zusatzdaten versehen, die z.B. den Lautstärkeverlauf oder die verwendete Anzahl von Bits enthalten.
siehe Hauptartikel MPEG-2 Multichannel