W pracy nakreślono problem identyfikacji koderów MP3 oraz urządzeń rejestrujących na podstawie analizy nagrań fonicznych poddanych stratnej kompresji. Zaproponowana metoda może być wykorzystana jako wsparcie dla innych rozwiązań służących do wykrywania podwójnej kompresji oraz detekcji nieciągłości. Prezentowane podejście polega na statystycznej analizie zmiennych pozyskanych bezpośrednio ze strumienia danych MP3 i stanowiących nieodłączne parametry kompresji. Wyznaczone wektory składające się z 46 cech zostały użyte jako sekwencje treningowe liniowej analizy dyskryminacyjnej (LDA), jednego z najpopularniejszych algorytmów uczenia maszynowego z nadzorem. Skuteczność metody identyfikacji koderów MP3 oraz urządzeń rejestrujących została przetestowana na specjalnie przygotowanej w tym celu bazie nagrań muzycznych składającej się z blisko miliona plików MP3. Wyniki badań zostały omówione w kontekście wpływu parametrów kompresji na możliwość detekcji fałszerstw w cyfrowych nagraniach fonicznych.
The paper outlines the problem of identification of MP3 encoders and recording devices based on the analysis of audio recordings subjected to lossy datę compression. The proposed method can be used as a support for other solutions used to detect double compression and discontinuities. The approach is based on the statistical analysis of the variables obtained directly from the MP3 data stream and constitute an inherent element of compression performance. Designated vectors consisting of 46 features were used as training sequences of linear discriminant analysis (LDA), one of the most popular supervised machinę learning algorithms. The effectiveness of this algorithms for the identification of MP3 encoders and recording equipment was tested on a musie database consisting of nearly one million MP3 files, specially prepared for this purpose. The results of the research were discussed in the context of the influence of compression parameters on the ability to detect falsification in digital audio recordings.