W ostatnich latach widać bardzo duży wzrost użytkowników kin domowych, którzy chcą mieć dźwięk przestrzenny, skoro mają już odpowiedni do tego sprzęt. Chodzi
tutaj nie tylko o filmy, ale także o samą muzykę, której można by posłuchać wielokanałowo. Format MP3 to format stratnej kompresji dźwięku opierający się na zmodyfikowanej dyskretnej transformacie cosinusowej i używający modelu psychoakustycznego. MP3 przez ponad 10 lat MP3 było niemalże synonimem dźwięku stereo (nie-wielokanałowego).
Na przeciw tym wymaganiom wychodzi format MP3 Sorround. Jest to rozszerzony format MP3 stworzony przez twórców tego formatu pozwalający na zapis formatu 5.1, a także w przyszłości 7.1, 10.2 itd.. Zapisywane są dwa kanały tak jak w zwykłym formacie mp3, a informacja potrzebna do wygenerowania dodatkowych kanałów jest zapisana w tagach mp3. Dzięki temu rozwiązaniu mp3 można odtwarzać jako zwykłe stereo na odtwarzaczach sprzętowych. Zapisanie dodatkowych kanałów zajmuje mało miejsca (ponieważ zapisywana jest informacja jak z dwóch kanałów wygenerować inne). Podstawą działania formatu MP3 Sorround jest kodowanie BCC. Jest to ogólna koncepcja opisu parametrycznego dźwięku przestrzennego. Kodowanie pozwala na przesłanie pojedynczego kanału mono i za pomocą dodatkowych informacji rozszerzenie go na dźwięk przestrzenny.
Wejściowych kanały audio są sumowane do pojedynczego kanału wyjściowego – downmix. W równoległym procesie informacje opisujące przestrzenność wielu kanałów są zapisywane jako informacja poboczna BCC. Obydwie informacje są następnie przesyłane do odbiornika. Po stronie odbiornika dekoder BCC generuje wielokanałowy sygnał wyjściowy z sumy sygnału oraz informacji o podziale kanałów. BCC oferuje kodowanie wielu kanałów do jednego – monofonicznego. W przypadku odsłuchu danego pliku/strumienia zakodowanego w BCC na sprzęcie nie obsługującym dekodowania BCC dostajemy zwykły dźwięk mono. Wiadomo, że w dzisiejszym świecie najpopularniejszym jest format stereo. Kodowanie BCC oraz chęć utrzymania stereo jako podstawy przysporzyły się do powstania MP3 Surround. Algorytm podobny do BCC tworzy dźwięk wielokanałowy w odbiorniku, korzystając z informacji otrzymanej z pliku stereo (oczywiście z odpowiednimi informacjami o przestrzenności). Algorytm ten zwiększa funkcjonalność BCC, aby móc przesyłać więcej niż jeden kanał audio.
Schemat na slajdzie 7. przedstawia ogólny zarys działania kodera MP3 Surround w przypadku kodowania sygnału wielokanałowego 3/2. W pierwszym kroku dwukanałowy mix stereo (Lc, Rc) jest tworzony z nagrania wielokanałowego poprzez procesor do downmixingu lub przez podobny sposób. W rezultacie otrzymujemy zgodny mix ze zwykłym MP3. W tym samym czasie zbiór parametrów przestrzennych (ICLD, ICTD, ICC) jest pobierana z sygnału wielokanałowego. Parametry te są kodowane jako dodatkowe dane dodawane do strumienia bitowego MP3. Kolejny schemat ilustruje dekoder używany w formacie MP3 Surround. Strumień bitowy MP3 Surround jest dekodowany do kompatybilnego mixu stereo, który w tym momencie jest już gotowy do prezentacji dwukanałowej (słuchawki, głośniki). Ten proces jest oparty o MPEG-1, dlatego też każdy istniejący odtwarzacz mp3 może to zrobić i odtworzyć zwykły format mp3 stereo. Dekoder MP3 Surround wykrywa obecność zakodowanej informacji o dźwięku przestrzennym i jeżeli jest to możliwe rozszerza odkodowany już dźwięk stereo do wielokanałowej formy dzięki dekoderowi typu BCC.
Problemem jest zmixowanie wielu kanałów do dźwięku stereo tak, aby oddawał on w pełni to co zostało nagrane. Częstą praktyką jest odgrywanie dźwięku z tylnych głośników w przednich razem z przednim mixem. Niestety przez to, że tylni miks jest często inaczej nagrywany odsłuch takiego sygnału sprawia, że pogarsza się możliwość lokalizacji instrumentów w nagraniu. Istnieją różne sposoby na rozwiązanie tego problemu – miksowanie ręczne, zaawansowane miksy automatyczne. Innym sposobem jest wykorzystanie kodera MP3 Surround w sposób przedstawiony na schemacie. Czyli zakodowanie miksu z dwóch różnych ścieżek wejściowych – stereo oraz wielokanałowej. Niestety nie wszystkie sygnały zostaną później odpowiednio zdekodowany np. nagranie pojedynczego instrumentu. Ciągle trwają badania nad tym jak jednocześnie zmiksować dźwięk przestrzenny oraz stereo, aby każdy z nich brzmiał dobrze.
MP3 Surround daje spore możliwości wykorzystania, dzięki zapewnieniu kompatybilności wstecznej z oryginalnym formatem MP3 – dzięki temu możemy słuchać tych samych utworów na odtwarzaczach stereo oraz obsługujących dźwięk przestrzenny. Dzięki dobrej jakości przy małej rozdzielczości można wykorzystywać go w radiach internetowych i serwisach muzycznych.
–
Dla czytelników mojego kanału RSS – z powodu problemów z zawieszaniem przez prezentację przeglądarki poprzedni wpis został wycofany i opublikowany na nowo.

11 marca 2010 o 21:47
Jestem ciekawy jak wygląda ten surround w mp3 w porównaniu do surrounda w bezstratnej kompresji. Testowałeś może?
11 marca 2010 o 21:52
Niestety nie miałem takiej okazji, do tego trzeba mieć też odpowiednio skonfigurowany system 5.1 żeby to usłyszeć ;)
12 marca 2010 o 01:01
A i pewnie na nic by mi się to zdało z moim niesamowicie wyczulonym słuchem… :P
Innych niż empirycznych metod sprawdzenia tego nie ma?
24 marca 2010 o 13:43
http://asset.soup.io/asset/0728/3231_d8cf.gif
21 kwietnia 2010 o 22:55
Jakiś czas temu ściągnąłem trochę mp3 surround z tej strony http://www.all4mp3.com/Listenmp3Surround.aspx i szczerze mówiąc to słychać wspaniale:) Efekt 5.1 jest znakomity i naprawdę jestem pełen podziwu jak panowie z laboratoriów Fraunhofera zmieścili to wszystko w przeciętnie wielkościowych plikach mp3. Muzyka z gatunku ambient i dark ambient prezentuje się wyśmienicie. To nowy wymiar cyfrowej muzyki i mam nadzieję, że będzie rozwijany.