Detail práce
Lossless Encoding of Signals from Microphone Array
Bezeztrátové kódování zvuku je stále důležitější pro správnou archivaci a uchování zvuku v původní podobě. Pro dosažení dobrého kompresního poměru se na původní zvuk často aplikují techniky bezztrátového kódování, jako je lineární predikce a Riceho kódování, aby se minimalizovala jeho entropie a zachoval se původní signál s bitovou přesností se zmenšenou velikostí. Tato práce zkoumá možnosti efektivního kódování vícekanálového zvuku způsobem, který využívá podobnosti mezi více kanály za účelem dosažení lepších kompresních poměrů. Tato práce také hlouběji zkoumá techniky používané FLAC-em a zároveň poskytuje řešení několika problémů, které FLAC neřeší.
bezeztrátové kódování řeči, bezeztrátové kódování zvuku, lineární predikce, adaptivní Riceho kódování, dekorelace, zpracování zvuku, dynamické kódování zvuku
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
- What happens to the passive down-mix (d_MID in eq. 4.9) if the two input channels, s_L and s_R, have opposite phase, i.e. effectively cancelling each other? How do you deal with this problem in your codec?
- In Fig. 4.14 the "m" parameter seems toggling. Would smoothing or interpolation help?
- On page 23 you state that the entropy rises when the input signals are re-scaled to the same energy level. Can you explain how is it possible? I'd expect the exact opposite, i.e. lower energy of the residual signal and, consequently, also lower entropy.
Bartík Vladimír, Ing., Ph.D. (UIFS FIT VUT), člen
Češka Milan, doc. RNDr., Ph.D. (UITS FIT VUT), člen
Jaroš Jiří, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Orság Filip, Ing., Ph.D. (UITS FIT VUT), člen
@bachelorsthesis{FITBT24799, author = "Adri\'{a}n K\'{a}lazi", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Lossless Encoding of Signals from Microphone Array", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2022, location = "Brno, CZ", language = "english", url = "https://www.fit.vut.cz/study/thesis/24799/" }