Krótki kurs (p)reparowania nagrań
 
Celem niniejszego opracowania jest przybliżenie czynności związanych z archiwizacją starych (i najczęściej wartościowych) nagrań muzycznych. Dodatkowo pojawią się elementy remasteringu sygnału. Z góry zaznaczam, że nie mam wykształcenia w kierunku cyfrowej elektroakustyki, a to co robię ma na celu zachęcenie wielu posiadaczy ciekawych nagrań do prezentacji ich w Internecie i tym samym zapobiegnie utracie wielu ciekawych dokumentów.

    Opracowanie podzieliłem na następujące części:



Sprzęt elektroniczny
Co do sprzętu to chyba nie trzeba dużo mówić. Wiadomo, można zakupić drogie urządzenia, ale często wystarczą te, które już mamy.

Karta dźwiękowa - powinna być 16-bitowa, jeśli ktoś ma większą rozdzielczość przetworników - świetnie. Midi nie jest potrzebne.
Istotnymi parametrami są odstęp sygnał-szum i poziom zniekształceń. Jeśli nie jesteś profesjonalistą, SB 128 wystarczy w zupełności.

Magnetofon - jeśli chodzi o magnetofon kasetowy, najlepiej używać decka 'dobrej firmy' (brak reklamy). Chodzi oczywiście o szumy, jakie generuje sam magnetofon. Źle ustawiony skos głowicy może wprowadzać przesunięcia fazy, co szczególnie odbija się w konwersji do mono i kompresji mp3.

Kable - nie muszą być złote, ale im lepsze, tym mniejsze zakłócenia. Długość też nie powinna być duża

Komputer:
PC200 wystarczy, aby dokonać akwizycji. Wolny i niezdefragmentowany dysk może powodować 'ubytki' w nagraniu. Częstotliwość procesora ma wpływ na czas operacji na materiale, co istotne jest przy remasteringu - nie tyle chodzi o czas wykonania, co o możliwość testowania ustawień w czasie rzeczywistym; dotyczy to żyłowania parametrów i ich zmiany w trakcie testów.  Z doświadczeń wynika, że 600 MHz jest już całkiem wystarczającą prędkością.

Podłączenie:
wyjście liniowe magnetofonu łączymy z wejściem liniowym karty. Uwaga: należy wyłączyć wszelkie buzzery karty dźw. typu sprzętowe pogłosy, filtry, etc.


Software
System:
Naszej idei pasowałaby najlepiej idea systemu Linux, jednakże XWave jeszcze nie spełnia naszych oczekiwań. Pozostajemy zdani na łaskę systemów Windows, które są stworzone min. do prac multimedialnych. Jeśli chodzi o darmowe wersje Windows, polecam triale 120-dniowe.

Program:
Na rynku pojawiło się kilka programów oferujących interesujące nas funkcje. Oczywiście, nic za darmo. Istnieją natomiast ich wersje shareware, z czego możemy skorzystać. Niewątpliwie należałoby zwrócić uwage na dwa popularne programy: Sound Forge i Cool Edit. Producent tego pierwszego jest bardzo krwiożerczy ($) i nie udostępnia ciekawych triali. W przypadku Cool Edit jest inaczej. Program jest dystrybuowany w różnych wersjach funkcjonalnych. Najlepsza jest wersja Pro (fesional). Jeśli zaś chodzi o shareware to z serwisu Tucows można ściągnąć wersję demo profesional. Jest naprawdę dobra, gdyby nie to, ze nie można zapisywać efektów do pliku (schowek też jest 'kodowany'). Na szczęście w sieci znajdziecie poprzednie wersje programu, np. Cool 1.53 których ograniczenia shareware są mniej restrykcyjne -  użytkownik ma prawo wybrać dwie dowolne grupy funkcjonalności przed uruchomieniem aplikacji.  Dlatego też w dalszych rozważaniach  będę opierał się o ten program.


Akwizycja nagrania
Po zestawieniu aparatury możemy przystąpić do akwizycji nagrania. Realizuje się to przez nagranie próbki wav: tworzymy nowy plik wav, najlepiej 44 kHz 16 bit stereo. Istotne są następujące uwagi:

- należy wyłączyć wszelkie niepotrzebne urządzenia, stanowiące potencjalne zakłócenia, czyli wyciszyć midi, odłączyć sprzętowy korektor, dsp;
- unikać korzystania z dodatkowych urządzeń generujących zakłócenia poprzez obciążanie magistrali; oprócz szumów może powodować utratę fragmentów nagrania;

WYSTEROWANIE SYGNAŁU:
- sygnał nie może być za cichy - tonie wówczas w szumach karty dźw.;
- sygnał nie może być przesterowany - wprowadza to bowiem bardzo nieprzyjemne zniekształcenia

Proponuje dobrać tak głośność, by sygnał oscylował nieco powyżej poziomu -3dB i ani razu nie osiągnął 0 dB. W programie  Cool Edit  pojawia się w tym drugim przypadku czerwony znacznik.


Znacznik przesterowania podczas nagrywania

Omawiany efekt ma następującą interpretację graficzną:

Wyraźne są 'spłaszczenia' fali.

Całość materiału najlepiej nagrać jako jeden plik. W przypadku zamiaru remasteringu warto nagrać dodatkowe kilkusekundowe próbki szumu zarówno sprzętu (magnetofon, karta muz.) jak i taśmy.


Remastering nagrania
Pracę nad materiałem należałoby zacząć od usunięcia szumów z orginału. W tym celu możemy użyć następujących funkcji programu Cool Edit:
1. usuwanie syczenia (taśmy, magnetofonu)
2. usuwanie stałego zakłócenia

Ideą niżej opisanych operacji  jest utworzenie profilu częstotliwościowego szumu i redukcja wszystkich częstotliwości w  nagraniu znajdujących się poniżej opracowanego profilu (korzystając z FFT a następnie z IFTT). Więcej na ten temat można znaleźć np. w archiwalnych nagraniach czasopisma 'Software' oraz oczywiście w bibliotekach naukowych.

Ad . 1
Aby usunać syczenie należy zaznaczyć przykładowy fragment nie zawierający sygnałów, które mają pozostać. Z menu należy wywołać 'Hiss Reduction' i pobrać charakterystyki 'syku'. Do tego służy klawisz 'Get noise floor'. Okno zamknąć. Następnie należy zaznaczyć obszar, z którego bedzie zniekształcenie usuwane i przy pomocy opcji 'Preview' dobierać tak parametry, by jak najwięcej szumu usunąć i nie wprowadzić żadnych zniekształceń. Pomocna przy tym jest opcja 'Keep only noise' - odsłuchiwanie wycinanego szumu. Dźwięk ten nie powinien zawierać żadnych zależności od materiału muzycznego; nie powinno w nim być śladów wokalu (szczególnie przesterowanego) ani cichych odgłosów perkusji (talerze, werbel). Czysty, jednostajny szum przy 'Keep only noise' oznacza niezmieniony materiał muzyczny. Oczywiście, zdarza się, że wtedy w nagraniu pojawią się inne zniekształcenia, wcześniej nie zauważone. Narzędzie to ma pewne wady, które są słyszalne w przypadku utworów o dużej dynamice. Doskonale się natoniast nadaje do nagrań z koncertów punkrockowych.

Ad. 2
Narzędziem o wiekszych możliwościach jest funkcja 'Noise reduction'. Pozwala ona na dokładniejsze i bardziej wyrafinowane usuwanie zniekształceń stałych. Podobnie jak w poprzednim przypadku należy na początku przygotować fragment szumu (najlepiej pow. 5 s) i wyciągnąć z niego profil. Następnie, korzystając z opcji podglądu 'Preview' dobierać tak parametry, aby osiągnąć odpowiedni efekt. Przepisu tutaj raczej nie ma; czasem niezly efekt daje dwukrotne przetworzenie materiału niewiele różniącym się filtrem, problemem też jest wybór pomiędzy stopniem odszumienia a wprowadzanymi zniekształceniami. Oczywiście tych ostatnich jak najmniej! Warto natomiast zwrócić uwagę na:
- rozmiar ramki obliczeń - rożnica między 4096 a 16384 próbkami jest jak między mp3 a orginałem, czasem nawet większa;
- parametrami 'Smoothing amount' i 'Transition width' - zauważalne przy utworach o dużej dynamice (głośności oczywiście)

...

Odtwarzanie uszkodzonych fragmentów

Często nagrania na taśmach doznają miejscowych zniekształceń spowodowanych przemagnesowaniem czy pogięciem taśmy. Objawia się to najczęściej chwilowym spadkiem głośności odtwarzanego materiału. W przypadku całkowitego lub znacznego zaniku sygnału cudów niestety nie osiągniemy. W pozostałych przypadkach możemy zmniejszyć nieprzyjemny efekt. W tym celu należy zaznaczyć fragment objęty zciszeniem i zgłośnić korzystając z obwiedni dla fragmentu (amplify - envelope). Następnie, jeżeli program na to pozwala, tak dopasowywać obwiednię, aby uzyskać najlepszy efekt używając podsłuchu.

Zdarza się, że zniekształcenie obejmuje tylko jeden kanał, wówczas można skorzystać z sysgnału drugiego kanału. Istotne jest dopasowanie obwiedni wstawki (przy różniących się głośnościach) i unikaniu nienaturalnych skoków (wychodzi przy kompresji).
Nieunikalne skoki wygładzić.


Usuwanie trzasków

Usuwanie trzasków polega na ich detekcji i aproksymacją zniszczonego fragmentu sygnałami sąsiednimi. Trzask na wykresie (sygnału w czasie) przypomina skok - jest to najczęściej duży, nienaturalny jak na fale dźwiękowe, wzrost i spadek amplitudy w małej jednostce czasu, przypominający deltę Diraca. Cool Edit posiada narzędzie do usuwania trzasków (Click/pop eliminator).

Usuwanie 'bulgotów'

Taśmy magnetofonowe mają tendencje do bycia wciąganymi lub gniecionymi przez magnetofony. Dotyka to najczęściej początków i końców nośnika. W odsłuchiwanym materiale pojawia się wówczas łomot lub bulgot. Prostą receptą na jego usunięcie jest filtracja dolnozaporowa, np -20 dB na częstotliwości do 120 Hz. Nagrania poczynione 'Kasprzakiem' nie schodzą poniżej tej częstotliwości, więc filtracja nie niszczy interesującego sygnału.


Kompresja pliku dżwiękowego
Zanim przejdę do kompresji pliku dźwiękowego chciałbym wytłumaczyć, ze w niniejszym opracowaniu pojęcie to nazywam w skrócie kompresja. Istnieje jeszcze bowiem kompresja sygnału, polegająca na zmianie (kompresji) dynamiki nagrania. Przydaje się ona w przygotowywaniu materiału o wysokiej dynamice (np. z próby, 80 dB) do odtworzenia na sprzęcie dla mało wymagających (max 50 dB). Zachowuje ona dźwięki ciche nie przesterowywując głośnych. Jej sztandarowym zastosowaniem jest format Dolby (R).

Jeśli chcesz zamieścić swoje nagrania w Internecie, powinieneś je skompresować do postaci, która będzie atrakcyjna dla połączonych przez 56 kbps... Niewątpliwie największe pole do popisu daje format mp3. Dla własnych potrzeb można wybierać duży strumień, np. 256, przy nagraniach z nieuregulowaną dynamiką 128 kbps nie wystarczy. Dobre efekty daje zastosowanie zmiennego strumienia (VBR) - kompresor sam wybiera dla każdej ramki strumień przy zachowaniu odpowiedniej jakości. Godnym uwagi jest tutaj freeware'owy lame.
Więcej na ten temat znajdziesz tutaj: r3mix.
Starsze nagrania często nie wykorzystują efektywnie wysokich częstotliwości więc w trakcie kompresji można ograniczyć się do 22 kHz. Pozwoli to albo obniżyć dwukrotnie rozmiar pliku albo zwiększyć dokładność opisu ramki, czyli wierności sygnału. Opcja mono jest głównie przeznaczona dla utworów, które w orginale były monofoniczne. Rownież redukuje rozmiar pliku dwukrotnie. Nagrania stereofoniczne mogą natomiast zmienić głębię (subtelne odczucie), przyciszyć wysokie częstotliwości  (uśrednianie kanałów jako filtr dolnoprzepustowy) czy wprowadzić zniekształcenia przy przesnunięciach fazy pomiędzy kanałami (skos głowicy magnetofonu). Mimo tych problemów warto spróbować wersji monofonicznych, często daje to dobre efekty.

Stopien kompresji nie zawsze jest wyznacznikem jakości nagrania; spotkałem się bowiem w sieci z nagraniami 32 kbps o wiekszej użyteczności niż inne, kodowane strumieniem 256 kbps. Radziłbym unikać strumieni 112 i 160 kbps

Opisanie pliku w ID3 tagu niewątpliwie ułatwi innym identyfikację utworu i pozwoli mu przetrwać niejedno sprzątanie na twardym dysku.




Informacje dodatkowe


Strona znajduje się na serwerach:
 http://www.w-matni.mirage.com.pl/pioro/mp3/
 http://student.uci.agh.edu.pl/~pioro/mp3

Podziekowania:
Panek (ciekawe nagrania juz od 10 lat ...), greg-k (net).


03.09.2001
(C) 2001, Piórak,  pioro@student.uci.agh.edu.pl