Mpeg Layer 3

MPEG Layer 3


• Historisches zu MP3

MPEG Layer 3, im folgenden kurz MP3 genannt, beschreibt einen inzwischen weit verbreiteten Standard zur Kompression von digitalen Audiosignalen. Entwickelt wurde dieses Verfahren seit 1987 am Fraunhofer - Institut in Erlangen (IIS) in Kooperation mit der dort ansässigen Universität im Rahmen des sogenannten EUREKA - Projektes. Ziel war es dabei, die ursprünglich relativ hohe Datenrate eines Audio - PCM - Signals, beispielsweise der CD mit mehr als 1,4 MBit/s, drastisch zu reduzieren. Entgegen den vorausgegangenen, einfacheren Kompressionsverfahren MPEG Layer 2 und Layer - 1 war hier nicht die verfügbare Rechenleistung, sondern der erreichbare Kompressionsfaktor Entwicklungsschwerpunkt. Mit diesem Ziel vor Augen ließ sich die Kompressionsrate von ursprünglich 1:4 auf 1:10 bis 1:12 ohne merkliche Qualitätseinbuße steigern. So kann beispielsweise der komprimierte Audiostrom einer CD in Echtzeit über eine 128 kBit/s schnellen ISDN - Leitung übertragen werden. Ursprünglich für den Einsatz bei Videokonferenzen und im Digitalfernsehen (DVB) vorgesehen, setzte es sich zur Übertragung von Livereportagen und später im Internet durch.

• Vergleich mit existierenden Systemen

Dabei ist die nahezu verlustlose Kompression digitaler Audiodaten an sich nicht neu. So verwendete beispielsweise die inzwischen schon wieder historische digitale Kompaktkassette (DCC) von Philips eine Audiokomprimierung nach MPEG Layer 1, wodurch es möglich war, den auf ein Viertel reduzierten Datenstrom auf einer speziellen Kassette in der üblichen Längsaufzeichnung zu speichern. Ähnliches gilt für die von Sony entwickelte MiniDisc, bei der jedoch eine nicht MPEG - konformes Komprimierungsverfahren mit einem Faktor von rund 1:5 verwendet wird.

• Grundgedanke hinter MP3

Nun stellt sich die Frage, wie diese Komprimierungsverfahren und damit letztendlich das abwärtskompatible MP3 funktionieren. Gemeinsam ist allen Verfahren, dass die zur Datenreduktion psychoakustische Phänomene ausnutzen, also Unzulänglichkeiten des menschlichen Gehörs - im Unterschied zu reinen Sprachkompressionsverfahren, wie sie beispielsweise in gängigen Mobiltelefonen zu einer noch wirksameren Kompression herangezogen werden. Maßgeblich ausgenutzt wird bei den MPEG - Verfahren der sogenannte Verdeckungseffekt, der prinzipiell in zwei Formen auftritt. Dem Menschen ist es nicht möglich zwei frequenzmäßig benachbarte Töne mit einem gewissen Pegelunterschied aufzulösen, wobei der leisere Ton nicht wahrgenommen wird und somit nicht explizit mit übertragen werden muss. Ferner existiert noch ein zeitlicher Verdeckungseffekt, was zur Folge hat, dass unmittelbar vor und hinter einem überdurchschnittlich lauten Ton die leiseren Passagen nicht wahrgenommen werden. Diese Effekte legen es nahe, verschiedene Teilbereiche des wiedergegebenen Frequenzspektrums je nach aktuellen Anforderungen unterschiedlich genau pegelmäßig aufzulösen, d.h. zu quantisieren, wobei ohnehin nicht hörbare Signalteile schlicht im Rauschen durch die Quantisierung mit wenigen Bits versinken,

• technische Eigenschaften von MP3

Der Grundgedanke ist maßgeblich für die Kompression mit MPEG Layer 1 und alle folgenden. Hier wird durch eine Filterbank das Signal in 32 Teilbänder aufgespalten, wobei nach Normierung der verschiedenen Pegel in den Teilbändern mittels der Skalenfaktoren jedes Teilband einzeln mit einer dynamischen veränderlichen Auflösung zwischen 2 und 15 Bit (ursprünglich 16 Bit) quantisiert wird. Die dazu erforderliche dynamische Bitzuweisung für die Teilbänder erfolgt an Hand eines psychoakustischen Modells im Kodierer. Die hierfür erforderliche, möglichst präzise Auflösung des Spektrums wird mittels einer schnellten Fouriertransformation (FFT) periodisch aus dem unkodierten Signal gewonnen. Zusammen mit den bereits errechneten Skalenfaktoren kann so die dynamische Bitzuweisung erfolgen. Abschließend werden all angefallenen Bits zusammen mit weiteren Steuerinformationen gemultiplext und rahmenweise ausgegeben. Der dabei in dem wenige 100 Bytes lange Rahmen enthaltene Header dient unter anderem zur Synchronisation auf den fortlaufenden Datenstrom, falls beispielsweise der Dekodiervorgang mitten in einem MP3 - Stück beginnt.
Um eine weitere Steigerung der Kompression ohne merkliche Qualitätseinbußen zu erzielen, müssen die Eigenschaften des psychoakostischen Modells bei erhöhter Rechenleistung auch besser genutzt werden. Dies führt bei MPEG Layer 2 zu längeren Blöcken, die innerhalb eines Zyklus ausgewertet werden. Die neue Blocklänge von 36 anstatt 12 PCM - Abtastwerten hat dabei zur Folge, dass die zeitlichen Verdeckungseffekte innerhalb eines Blockes nicht mehr unberücksichtigt bleiben dürfen, so dass es notwendig wird, je nach Signal mehrere zeitlich aufeinanderfolgende Skalierungsfaktoren innerhalb eines Blockes zu verwenden. Hierzu erfolgt bei Layer 2 eine dynamische Zuweisung dieser Faktoren zu den verschiedenen Teilbändern. Zudem arbeitet die FTT zur Speisung des psychoakustischen Modells nun mit einer doppelten Auflösung, um eine genauere Abschätzung der notwendigen Quantisierungsstufen zu ermitteln. Hochfrequente Signalteile werden gezielt mit weniger Quantisierungsabstufung behandelt, da hier die Signalenergie viel geringer ist - womit sich im Zusammenhang mit dem Packen der kodierten Bits die Datenrate weiter reduzieren lässt.
Um schließlich von dem bisher erreichten Kompressionsfaktor von acht auf zwölf zu kommen, erfolgt bei MPEG Layer 3 eine weitere Verfeinerung der Kompression, indem nun nicht mehr in 32, sondern 576 nicht gleichbreite Teilbänder aufgespalten wird. Anschließen wird in Anlehnung an das menschliche Gehör nicht mehr linear quantisiert, sondern nach entsprechenden Kennlinien. Zu guter Letzt sorgt eine Huffman - Kodierung, wie sie beispielsweise auch bei Packprogrammen verwendet wird, für eine Unterdrückung redundanter Bits im Datenstrom. Natürlich ist auch mit diesem Aufwand keine bitgenaue Reproduktion der Original - Audio - Daten möglich, wie sie HiFi - Puristen gerne verlangen.

• Probleme in der Praxis

Auf den ersten Blick, klingt dieses System auch sehr gut (beinahe CD - Qualität), doch bei genauerem Analysieren kann man Störungen erkennen, die vor allem bei filigranem Musikmaterial fatal sind. Hört man hingegen lautstarken Pop oder Techno, so fällt das kaum ins Gewicht, denn selbst Bitraten kleiner als 128 kBit/s sind hier akzeptabel. Anders ist dies bei Musik, die überwiegend auf Instrumenten entsteht, beispielsweise Klassik oder Jazz. Da kann die Musikreduzierung den Musikgenuß stark trüben. Aus diesem Grund ist bei hohem Qualitätsanspruch auch eine hohe Bitrate zu wählen.
Besonders wichtig ist auch, dass wenn die zu wandelnden Audiodaten an sich schon Störgeräusche enthalten, dann kann es passieren, dass diese durch das MP3 - Verfahren noch stärker stören als zuvor. In diesem Fall muss man vorher das Ausgangsmaterial so störungsfrei wie möglich aufzunehmen.
Gerade bei Klassik - oder Liveaufnahmen machen Nebengeräusche den großen Unterschied zu im Tonstudio erstellten Stücken aus. Nach dem Enkodieren in MP3 sind diese Geräusche jedoch bis zur Unkenntlichkeit verzerrt. Dann kommen sie auch negativ zur Geltung, da sie nicht mehr als Nebengeräusche identifiziert werden können.
Ein weiteres Problem für anspruchsvolle Musikfans ist, dass bei MP3 ein Großteil der Rauminformationen verloren geht. Auch Musikmaterial, das mit hoher Bitrate umgewandelt ist, macht es schwer, zwischen vorne und hinten zu unterscheiden, selbst wenn dies auf der Original - CD problemlos möglich ist.

• Legalität von MP3

Da MP3 das übertragen von ganzen Liedern über das Internet möglich gemacht hat, stellt sich nun auch die Frage, inwiefern das Gesetz dies zulässt. Zuerst wäre hier zu sagen, dass MP3 einfach nur ein Dateiformat ist, welches Audiodateien unter geringem Platzbedarf speichert. Ist man Besitzer einer Original - CD, so kann man die einzelnen Tracks in MP3 Stücke verwandeln. Das Weitergeben oder Publizieren im Internet ist dagegen nicht gestattet. Auch ist der Download von MP3 - Material, welches urheberrechtlich geschützt ist strikt verboten. Trotzdem gibt es auch Dienste, wie beispielsweise MP3.com, die MP3s öffentlich zugänglich machen können, da sie über Lizenzen der einzelnen Künstler verfügen. Andere "illegale" Seiten sehen das Herunterladen von MP3s nicht als verfassungswidrig an, wenn sie innerhalb von 24 Stunden wieder von der Festplatte entfernt werden, also quasi nur als Hörprobe verwendet werden.

1178 Worte in "deutsch"  als "hilfreich"  bewertet