MPEG-1 lag 1, 2 og lag 3



Like dokumenter
MPEG-1 lag 1, 2 og lag 3

MPEG-1 lag 1, 2 og lag 3

MPEG-1 lag 1, 2 og lag 3

mobiltelefon, DAB og itunes

EKSAMEN I FAG TTT4110 Informasjons- og signalteori. Norsk tekst på oddetalls-sider. (English text on even numbered pages.)

Sampling, kvantisering og lagring av lyd

Tema nr 2: Analog eller digital, kontinuerlig eller diskret. Eksempel på ulike båndbredder. Frekvensinnhold og båndbredde. Analog

Analog. INF 1040 Sampling, kvantisering og lagring av lyd. Kontinuerlig. Digital

mobiltelefon, DAB og itunes

INF 1040 Sampling, kvantisering og lagring av lyd

Analog. INF 1040 Sampling, kvantisering og lagring av lyd. Kontinuerlig. Digital

INF 1040 høsten 2008: Oppgavesett 9 Sampling og kvantisering av lyd (kapittel 11)

INF 1040 Sampling, kvantisering og lagring av lyd

Repetisjon: Sampling. Repetisjon: Diskretisering. Repetisjon: Diskret vs kontinuerlig. Forelesning, 12.februar 2004

8/24/2009. INF3470 Digital signalbehandling Introduksjon Sverre Holm

Dynamic Programming Longest Common Subsequence. Class 27

7.3 Samplerate-konvertering

KROPPEN LEDER STRØM. Sett en finger på hvert av kontaktpunktene på modellen. Da får du et lydsignal.

Trigonometric Substitution

Vekeplan 4. Trinn. Måndag Tysdag Onsdag Torsdag Fredag AB CD AB CD AB CD AB CD AB CD. Norsk Matte Symjing Ute Norsk Matte M&H Norsk

Slope-Intercept Formula


Kap 7: Digital it prosessering av analoge signaler

WMA eller MP3 Val av kvalitet

Dagens temaer. Endelig lengde data. Tema. Time 11: Diskret Fourier Transform, del 2. Spektral glatting pga endelig lengde data.

Analog. INF 1040 Sampling, kvantisering og lagring av lyd. Kontinuerlig. Digital

INF3470/4470 Digital signalbehandling. Introduksjon Sverre Holm

Exercise 1: Phase Splitter DC Operation

Physical origin of the Gouy phase shift by Simin Feng, Herbert G. Winful Opt. Lett. 26, (2001)

7.3 Samplerate-konvertering

Mathematics 114Q Integration Practice Problems SOLUTIONS. = 1 8 (x2 +5x) 8 + C. [u = x 2 +5x] = 1 11 (3 x)11 + C. [u =3 x] = 2 (7x + 9)3/2

Endelig ikke-røyker for Kvinner! (Norwegian Edition)

Lektor 2 for Stovner VGS 12. februar 2013

A taxonomy of texture models

Unit Relational Algebra 1 1. Relational Algebra 1. Unit 3.3

Transformanalyse. Jan Egil Kirkebø. Universitetet i Oslo 17./23. september 2019

UNIVERSITETET I OSLO

Introduksjon til lyd. Det ytre øret. Fra lydbølger til nerveimpulser. INF Digital representasjon : Introduksjon til lyd.

STE 6146 Digital signalbehandling. Løsningsforslag til eksamen avholdt

EKSAMEN I FAG TTT4110 Informasjons- og signalteori. Norsk tekst på oddetalls-sider. ( English text on even numbered pages.)

6DPSOLQJ DY NRQWLQXHUOLJH VLJQDOHU

MÅLING OG VURDERING AV TEKSTUR I VEGOVERFLATER OG KOPLING TIL STØY

KONTINUASONSEKSAMEN I FAG SIE2010 Informasjons- og signalteori

Lydkoding mobiltelefon, DAB, itunes,

INF3470/4470 Digital signalbehandling. Introduksjon

Moving Objects. We need to move our objects in 3D space.

UNIVERSITETET I OSLO

PSY 1002 Statistikk og metode. Frode Svartdal April 2016

1.1 ØRETS ANATOMI OG FYSIOLOGI. Grunnleggende innføring i hvordan øret er bygd opp og hvordan det tekniske systemet gjør at vi kan oppfatte lyd

PATIENCE TÅLMODIGHET. Is the ability to wait for something. Det trenger vi når vi må vente på noe

Tidsdomene analyse (kap 3 del 1)

STØTTEMATERIALE TIL FORELESNINGENE OM SKATT

Forkunnskapskrav. Hva handler kurset om. Kontaktinformasjon. Kurset er beregnet på en student som kan

Sampling ved Nyquist-raten

UNIVERSITETET I OSLO

The Good, the Bad, the Ugly. gy Fra vinyl til høyoppløst digitallyd. Sverre Holm November 2018

Lyd. Litt praktisk informasjon. Litt fysikk. Lyd som en funksjon av tid. Husk øretelefoner på øvelsestimene denne uken og en stund framover.

Repetisjon: Eksempel. Repetisjon: Aliasing. Oversikt, 26.februar Gitt. Alle signaler. Ettersom. vil alle kontinuerlig-tid signaler.

PARABOLSPEIL. Still deg bak krysset

INF3470/4470 Digital signalbehandling. Introduksjon Sverre Holm

pdf

Uke 10: Diskret Fourier Transform, II

HØGSKOLEN I NARVIK - SIVILINGENIØRUTDANNINGEN

FFT. Prosessering i frekvensdomenet. Digital signalprosessering Øyvind Brandtsegg

Public roadmap for information management, governance and exchange SINTEF

Hjelpemidler: D Ingen trykte eller håndskrevne hjelpemidler tillatt. Bestemt, enkel kalkulator tillatt.

WMA. grp 5. dig3800. Del 1

Lydproduksjon. t.no. ww ww.hin. Forelesning 6 Signaler Digital audioteknologi MMT205 - F6 1

Medisinsk statistikk, KLH3004 Dmf, NTNU Styrke- og utvalgsberegning

EKSAMEN I FAG TTT4110 Informasjons- og signalteori. Norsk tekst på oddetalls-sider. ( English text on even numbered pages.)

Taylor Swift «Mean» Klassemøtet

Det aktive øret i støyen eller det intelligente øret

Utregning av en konvolusjonssum

Konvolusjon og filtrering og frevensanalyse av signaler

HINT- Hearing in Noise Test

Kritisk lesning og skriving To sider av samme sak? Geir Jacobsen. Institutt for samfunnsmedisin. Kritisk lesning. Med en glidende overgang vil denne

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Databases 1. Extended Relational Algebra

REMOVE CONTENTS FROM BOX. VERIFY ALL PARTS ARE PRESENT READ INSTRUCTIONS CAREFULLY BEFORE STARTING INSTALLATION

Hvordan føre reiseregninger i Unit4 Business World Forfatter:

Kunnskapsinfrastruktur for forskningsdata i Norge

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

C13 Kokstad. Svar på spørsmål til kvalifikasjonsfasen. Answers to question in the pre-qualification phase For English: See page 4 and forward

Dialogkveld 03. mars Mobbing i barnehagen

Tidsdomene analyse (kap 3 del 2)

Løsningsforslag til kapittel 11 sampling, kvantisering og lagring av lyd

Det fysiske laget, del 2

Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

UNIVERSITETET I OSLO

LØSNINGSFORSLAG TIL EKSAMEN STE 6219 Digital signalbehandling

Han Ola of Han Per: A Norwegian-American Comic Strip/En Norsk-amerikansk tegneserie (Skrifter. Serie B, LXIX)

MID-TERM EXAM TDT4258 MICROCONTROLLER SYSTEM DESIGN. Wednesday 3 th Mars Time:

Tidsdomene analyse (kap 3 del 2)

Tor Halmrast Sjefingeniør, akustiker: Musikkrom

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Introduksjon til lyd

TUSEN TAKK! BUTIKKEN MIN! ...alt jeg ber om er.. Maren Finn dette og mer i. ... finn meg på nett! Grafiske lisenser.

2003/05-001: Dynamics / Dynamikk

Transkript:

MPEG-1 lag 1, 2 og lag 3 Sverre Holm INSTITUTT FOR INFORMATIKK August 2009-1

MPEG audiokoding Motivasjon for de fleste kapitlene i Manolakis, Ingle: Applied Digital Signal Processing: Theory and Practice. INSTITUTT FOR INFORMATIKK August 2009-2

Digital representation of Sounds Pulse Coded Modulation (PCM) 110 1 Kvantiserings nivåer 011 0.8 010 0.6 001 0.4 000 111 110 101 Tid Diskretisert variabel 0.2 0-0.2-0.4 16 bit 4 bit 16 bit kvantisering gir 2*2*2* 2 = 2 16 = 65 536 nivåer Ved 44100 samples per sek, blir bitraten: 16*44100 = 705 600 bits/s = halv CD-rate -0.6-0.8-1 -1-0.8-0.6-0.4-0.2 0 0.2 0.4 0.6 0.8 1 Kontinuerlig variabel INSTITUTT FOR INFORMATIKK August 2009-3

Beethovens 5. symfoni 16 bit kvantisering 2 16 = 65536 nivåer 4 bits kvantisering 2 4 =16 nivåer 0.15 Bethovens 9., samplet med 44.1 khz 0.1 0.05 16 bit kvantisering 4 bit kvantisering 0 Amplitude -0.05-0.1-0.15-0.2-0.25-0.3 0 20 40 60 80 100 120 Tid INSTITUTT FOR INFORMATIKK August 2009-4

Hvorfor høres det så ille ut? Problem: Bare noen få kvantiseringsnivåer => for stor avrundingsfeil. Ofte at signalet settes til null da nivået var lavere enn laveste kvantiseringsnivå Kvantisering og sampling: Kap 15: Finite Wordlength Effects INSTITUTT FOR INFORMATIKK August 2009-5

Stasjonæritet - tidsinvarians = Egenskaper varierer ikke med tiden, Kap 3: Discrete-time signals and Systems Forutsettes i det meste av analyser Tale er korttids stasjonær, dvs bare over ca 20 ms, Endres 1/20e-3=50 ganger pr sekund Ca 18 sek = 900 * 20 ms INSTITUTT FOR INFORMATIKK August 2009-7

Direktesampling (PCM) KILDE Unngå aliasing i samplingen LP- FILTER LP- FILTER Bruk nok bit til å få liten nok kvantiseringsfeil A/D BITSTRØM D/A KODER DEKODER INSTITUTT FOR INFORMATIKK August 2009-8

Bitrater CD: 44.1 * 2 * 16 = 1.411 Mbit/s 4 bit: 25% => 350 kbit/s låter forferdelig MP3, AAC etc: 128 kbit/s ~ CD/12 Hva er det lure trikset? INSTITUTT FOR INFORMATIKK August 2009-9

MPEG-1 Audio Psychoacoustics in sound compression How do we hear? Digital representation of sounds Sound compression Psychoacoustics Masking Adaptive quantization Bit allocation Filterbanks 110 011 010 001 000 111 110 101 Tid INSTITUTT FOR INFORMATIKK August 2009-10

Øret 1. Tinning 2. Øregang 3. Ytre øre 4. Trommehinne 5. Ovale vindu 6. Hammeren 7. Ambolt 8. Stigbøylen 9. Bueganger 10. Sneglehuset 11. Hørselnerve 12. Øretrompeten Wikimedia Commons INSTITUTT FOR INFORMATIKK August 2009-11

The Ear INSTITUTT FOR INFORMATIKK August 2009-12

The frequency filters of the ear: Mapping frequency to a location Unwound cochlea Kap 4: Fourier Representation of Signals INSTITUTT FOR INFORMATIKK August 2009-13

Threshold for audible sounds Reference 0 db: Kap 4: Fourier 20 μpa = 2 10-5 N/m 2 Representation of Signals INSTITUTT FOR INFORMATIKK August 2009-14

Filterbank Approach Encoding Source LPfilter A/D BIT STREAM FILTERBANK Scaling Scaling Scaling Quantize Quantize Quantize MUX BIT STREAM PSYCHOACOUSTIC ANALYSIS BIT ALLOCATION Kap 5: Transform Analysis of LTI Systems INSTITUTT FOR INFORMATIKK August 2009-15

Decoding is much simpler BIT STREAM Scaling Scaling Scaling FILTERBANK INSTITUTT FOR INFORMATIKK August 2009-16 D/A LPfilter Kap 3: Discrete-time Signals and Systems: Linearity Kap 5: Transform Analysis of LTI Systems: Inverse systems

Filterbanks in MPEG-1 audio layer 1-3 Kap 5: Transform Analysis of LTI Systems Kap 10: Design of FIR Filters Polyphase filterbank 32 subbands, e.g. bw 44100/2/32 = 689 Hz 512 tap FIR-filters 80 adds and mults per output Equal width Not perfect reconstruction Frequency overlap Kap 3: The z-transform INSTITUTT FOR INFORMATIKK August 2009-17

What is this Psychoacoustics that is used in the Encoder? Kap 8: The Discrete Fourier Transform: Fourier Analysis of Signals INSTITUTT FOR INFORMATIKK August 2009-23

Masking We do not hear all sounds. 1. Absolute threshold of hearing: 2. Masking: One sound is inaudible in the presence of another sound. 1. Simultaneous masking Noise Masking Tone Tone Masking Noise Noise Masking Noise 2. Nonsimultaneous masking Pre masking (2 ms) Post masking (100 ms) INSTITUTT FOR INFORMATIKK August 2009-24

Noise Masking Tone Filtered Noise Tone 1, 820 Hz Tone 2, 410 Hz Noise Noise Center 410 Hz 5 db below noise 5 db below noise + + Width 111 Hz Tone 1 Tone 2 Not masked Masked You can not hear a sinusoid that lies in the same critical band as a filtered noise if the sound pressure level is below a certain threshold. This effect also stretches out beyond the critical band. INSTITUTT FOR INFORMATIKK August 2009-25

Tone Masking Noise Filtered Noise Center 1 khz Width 162 Hz 15 db below Tone 1, 2 khz Tone 2, 1 khz Noise + Tone 1 Not masked Noise + Tone 2 Masked You can not hear a filtered noise that lies in the same critical band as a sinusoid if the sound pressure level is below a certain threshold. This effect also stretches out beyond the critical band. INSTITUTT FOR INFORMATIKK August 2009-26

Exploit Masking If a sound is masked we can t hear it. Do a frequency analysis of the signal and find the masking threshold. Put the quantization noise under the masking threshold and we won t hear the quantization. Kap 8: The Discrete Fourier Transform: Fourier Analysis of Signals INSTITUTT FOR INFORMATIKK August 2009-27

Bit Allocation and Masking The masking threshold in each subband gives the Just Noticeable Distortion (JND) limit for that band. Bits are assigned to subbands so that the quantization noise falls below or as little over the JND as possible. Then the Signal to Quantization noise Ratio (SQR) falls below JND INSTITUTT FOR INFORMATIKK August 2009-31

Castanets and Guitar 22050 Hz INSTITUTT FOR INFORMATIKK August 2009-32

Bit allocation with 2 bits per sample 22050 Hz INSTITUTT FOR INFORMATIKK August 2009-33

Bit allocation with 4 bits per sample 22050 Hz INSTITUTT FOR INFORMATIKK August 2009-34

Kapitler i læreboka MP3-koding 1 Introduction Praktiske eksempler som mp1/mp3 2 Discrete-time Signals and Systems Musikk og talesignal Linearitet: kan dele i frekvensbånd, behandle for seg og så sette sammen igjen Tidsinvarians gjelder bare over kort tid for musikk og tale. Differanseligninger: FIR filtre 3 The z-transform Analyse av filter i filterbanken: nøkkel til filterdesign 4 Fourier Representation of Signals Frekvensdomene er sentralt i modell av hørsel 5 Transform Analysis of LTI Systems Frekvensselektive filtre: båndpassfiltre Inverse systemer: kan dele i bånd i koder og addere sammen igjen i dekoder 6 Sampling of Continuous-time Signals Sampling og samplingsrater 7 The Discrete Fourier Transform Frekvensanalyse av signaler 8 Computation of the Discrete Fourier Transform INSTITUTT FOR INFORMATIKK August 2009-43 Fast Fourier Transform (FFT) brukes i estimering av spektrum i koder. Må estimere korttidsspektrum for å gjøre adaptiv bittildeling 9 Structures for Discrete-Time Systems Filterstrukturer, effektiv implementasjon av filterbank i koder og dekoder 10 Design of FIR Filters. Hvordan finne koeffisienter til bp-filtrene i filterbanken? 12 Multirate Signal Processing Multirate system: Hvert delfilter kan nedsamples pga bare 1/32 av total båndbredde => trenger bare 1/32 samplerate per filter 15 Finite Word Length Effects A/D-analyse: kvantiseringsstøy