MPEG-1 lag 1, 2 og lag 3

Like dokumenter
MPEG-1 lag 1, 2 og lag 3

MPEG-1 lag 1, 2 og lag 3

MPEG-1 lag 1, 2 og lag 3

mobiltelefon, DAB og itunes

INF 1040 Sampling, kvantisering og lagring av lyd

Tema nr 2: Analog eller digital, kontinuerlig eller diskret. Eksempel på ulike båndbredder. Frekvensinnhold og båndbredde. Analog

INF 1040 høsten 2008: Oppgavesett 9 Sampling og kvantisering av lyd (kapittel 11)

INF 1040 Sampling, kvantisering og lagring av lyd

Sampling, kvantisering og lagring av lyd

EKSAMEN I FAG TTT4110 Informasjons- og signalteori. Norsk tekst på oddetalls-sider. (English text on even numbered pages.)

mobiltelefon, DAB og itunes

Repetisjon: Sampling. Repetisjon: Diskretisering. Repetisjon: Diskret vs kontinuerlig. Forelesning, 12.februar 2004

1.1 ØRETS ANATOMI OG FYSIOLOGI. Grunnleggende innføring i hvordan øret er bygd opp og hvordan det tekniske systemet gjør at vi kan oppfatte lyd

Analog. INF 1040 Sampling, kvantisering og lagring av lyd. Kontinuerlig. Digital

INF3470/4470 Digital signalbehandling. Introduksjon Sverre Holm

FFT. Prosessering i frekvensdomenet. Digital signalprosessering Øyvind Brandtsegg

7.3 Samplerate-konvertering

Unit Relational Algebra 1 1. Relational Algebra 1. Unit 3.3

INF3470/4470 Digital signalbehandling. Introduksjon

Kap 7: Digital it prosessering av analoge signaler


WMA eller MP3 Val av kvalitet

Det fysiske laget, del 2

Lyd. Litt praktisk informasjon. Litt fysikk. Lyd som en funksjon av tid. Husk øretelefoner på øvelsestimene denne uken og en stund framover.

Dagens temaer. Endelig lengde data. Tema. Time 11: Diskret Fourier Transform, del 2. Spektral glatting pga endelig lengde data.

KROPPEN LEDER STRØM. Sett en finger på hvert av kontaktpunktene på modellen. Da får du et lydsignal.

EKSAMEN I FAG TTT4110 Informasjons- og signalteori. Norsk tekst på oddetalls-sider. ( English text on even numbered pages.)

Lydkoding mobiltelefon, DAB, itunes,

Slope-Intercept Formula

UNIVERSITETET I OSLO

Uke 10: Diskret Fourier Transform, II

Hjelpemidler: D Ingen trykte eller håndskrevne hjelpemidler tillatt. Bestemt, enkel kalkulator tillatt.

01 Laplace og Z-transformasjon av en forsinket firkant puls.

Sampling av bilder. Romlig oppløsning, eksempler. INF Ukens temaer. Hovedsakelig fra kap. 2.4 i DIP

Hjelpemidler: D Ingen trykte eller håndskrevne hjelpemidler tillatt. Bestemt, enkel kalkulator tillatt.

Dynamic Programming Longest Common Subsequence. Class 27

The Good, the Bad, the Ugly. gy Fra vinyl til høyoppløst digitallyd. Sverre Holm November 2018

IIR filterdesign Sverre Holm

Transformanalyse. Jan Egil Kirkebø. Universitetet i Oslo 17./23. september 2019

303d Signalmodellering: Gated sinus a) Finn tidsfunksjonen y(t) b) Utfør en Laplace transformasjon og finn Y(s)

Mathematics 114Q Integration Practice Problems SOLUTIONS. = 1 8 (x2 +5x) 8 + C. [u = x 2 +5x] = 1 11 (3 x)11 + C. [u =3 x] = 2 (7x + 9)3/2

Lektor 2 for Stovner VGS 12. februar 2013

UNIVERSITETET I OSLO

Det aktive øret i støyen eller det intelligente øret

Forelesning, 23.februar INF2400 Sampling II. Øyvind Ryan. Februar 2006

Forelesning, 17.februar INF2400 Sampling II. Øyvind Ryan. Februar 2005

pdf

Endelig ikke-røyker for Kvinner! (Norwegian Edition)

Digital sampling og analog estetikk

INF3470/4470 Digital signalbehandling. Introduksjon Sverre Holm

Et hørselsproblem (1)

STØTTEMATERIALE TIL FORELESNINGENE OM SKATT

Uke 9: Diskret Fourier Transform, I

STE 6146 Digital signalbehandling. Løsningsforslag til eksamen avholdt

PARABOLSPEIL. Still deg bak krysset

Exercise 1: Phase Splitter DC Operation

Hvordan føre reiseregninger i Unit4 Business World Forfatter:

Løsningsforslag til kapittel 11 sampling, kvantisering og lagring av lyd

Lyd og video på nettsider

HONSEL process monitoring

INF Digital representasjon : Introduksjon til lyd

Elektronisk innlevering/electronic solution for submission:

Tidsdomene analyse (kap 3 del 1)

Oppdag Discover hørselen your hearing. Informasjon om hørselstap

Moving Objects. We need to move our objects in 3D space.

Digitalisering av lyd

Trigonometric Substitution

Temaer i dag. Mer om romlig oppløsning. Optisk avbildning. INF 2310 Digital bildebehandling

Databases 1. Extended Relational Algebra

Repetisjon: Eksempel. Repetisjon: Aliasing. Oversikt, 26.februar Gitt. Alle signaler. Ettersom. vil alle kontinuerlig-tid signaler.

UNIVERSITETET I OSLO

Physical origin of the Gouy phase shift by Simin Feng, Herbert G. Winful Opt. Lett. 26, (2001)

Aliasing: Aliasfrekvensene. Forelesning 19.februar Nyquist-Shannons samplingsteorem

IIR filterdesign Sverre Holm

Vekeplan 4. Trinn. Måndag Tysdag Onsdag Torsdag Fredag AB CD AB CD AB CD AB CD AB CD. Norsk Matte Symjing Ute Norsk Matte M&H Norsk

INF3470/4470 Digital signalbehandling. Repetisjon

LØSNINGSFORSLAG TIL SIGNALBEHANDLING 1 JUNI 2010

PSY 1002 Statistikk og metode. Frode Svartdal April 2016

I kunstverdenen er glitch art en relativ ny kunstform som er basert på de uventede resultatene av digitale feil. - WIKIPEDIA

Introduksjon til lyd. Litt praktisk informasjon. Fra lydbølger til nerveimpulser. Det ytre øret

VELKOMMEN INN I DITT NYE TV-UNIVERS. Foto: Jens Haugen / ANTI

LØSNINGSFORSLAG TIL EKSAMEN STE 6219 Digital signalbehandling

Han Ola of Han Per: A Norwegian-American Comic Strip/En Norsk-amerikansk tegneserie (Skrifter. Serie B, LXIX)

Hvor mye teoretisk kunnskap har du tilegnet deg på dette emnet? (1 = ingen, 5 = mye)

Transkript:

MPEG-1 lag 1, 2 og lag 3 Sverre Holm INSTITUTT FOR INFORMATIKK August 2009-1

MPEG audiokoding Motivasjon for de fleste kapitlene i Ambardar, Digital signal processing: A Modern Introduction, Thomson, 2007. INSTITUTT FOR INFORMATIKK August 2009-2

Digital it representation ti of Sounds Pulse Coded Modulation (PCM) 110 1 011 010 001 000 111 110 101 Tid Dis skretisert variabe el 0.8 0.6 0.4 0.2 0-0.2-0.4 Kvantiserings nivåer 16 bit 4 bit 16 bit kvantisering gir 2*2*2* 2 = 2 16 = 65 536 nivåer Ved 44100 samples per sek, blir bitraten: -0.6-0.8-1 -1-0.8-0.6-0.4-0.2 0 0.2 0.4 0.6 0.8 1 Kontinuerlig variabel 16*44100 = 705 600 bits/s = halv CD-rate INSTITUTT FOR INFORMATIKK August 2009-3

Beethovens 5. symfoni 16 bit kvantisering i 4 bits kvantisering i 2 16 = 65536 nivåer 2 4 =16 nivåer 0.15 Bethovens 9., samplet med 44.1 khz 0.1 0.05 16 bit kvantisering 4 bit kvantisering 0 Amplitud de -0.05-0.1-0.15-0.2 02-0.25-0.3 0 20 40 60 80 100 120 Tid INSTITUTT FOR INFORMATIKK August 2009-4

Hvorfor høres det så ille ut? Problem: Bare noen få kvantiseringsnivåer => for stor avrundingsfeil. Ofte at signalet settes til null da nivået var lavere enn laveste kvantiseringsnivå Kvantisering og sampling: Kap 7: Digital i lbehandling av analoge signaler Mulig løsning: Skaler blokker av data slik at maximumsverdien alltid utnytter tt hele dynamikkområdet til kvantisereren Kostnad: Må sende over skalafaktorer NICAM, Near Instantaneous Companded Audio Multiplex: format for digital lyd over analog TV. Blokklengde 32 samples, 3 bit pr blokk sideinfo. Stereo kodes med 10 av 14 bit ved samplingsrate 32 khz => 728 kbit/s. Variant av adaptiv differensiell puls kode modulasjon INSTITUTT FOR INFORMATIKK August 2009-5

Stasjonæritet t - tidsinvariansi i = Egenskaper varierer ikke med tiden, kap 3: Tids-domene analyse Forutsettes id det meste av analyser Tale er korttids stasjonær, dvs bare over ca 20 ms, Endres 1/20e-3=50 ganger pr sekund Ca 18 sek = 900 * 20 ms INSTITUTT FOR INFORMATIKK August 2009-6

Direktesampling (PCM) KILDE Unngå aliasing i samplingen LP- FILTER LP- FILTER Bruk nok bit til å få liten nok kvantiseringsfeil A/D BITSTRØM D/A KODER DEKODER INSTITUTT FOR INFORMATIKK August 2009-7

Bitratert CD: 44.1 * 2 * 16 = 1.411 Mbit/s 4 bit: 25% => 350 kbit/s låter forferdelig MP3, AAC etc: 128 kbit/s ~ CD/12 Hva er det lure trikset? INSTITUTT FOR INFORMATIKK August 2009-8

MPEG-1 Audio Psychoacoustics in sound compression How do we hear? Digital representation of sounds Sound compression Psychoacoustics Masking 110 011 Adaptive quantization 010 Bit allocation Filterbanks 001 000 111 110 101 Tid INSTITUTT FOR INFORMATIKK August 2009-9

Øret 1. Tinning 2. Øregang 3. Ytre øre 4. Trommehinne 5. Ovale vindu 6. Hammeren 7. Ambolt 8. Stigbøylen 9. Bueganger 10. Sneglehuset 11. Hørselnerve 12. Øretrompeten Wikimedia Commons INSTITUTT FOR INFORMATIKK August 2009-10

The Ear INSTITUTT FOR INFORMATIKK August 2009-11

The frequency filters of the ear: Mapping frequency to a location Unwound cochlea Kap 5: Frekvensanalyse INSTITUTT FOR INFORMATIKK August 2009-12

Threshold for audible sounds Reference 0 db: 20 μpa = 2 10-5 N/m 2 Kap 5: Frekvensanalyse INSTITUTT FOR INFORMATIKK August 2009-13

Filterbank Approach Encoding LP- Source filter A/D Kap 5: Frekvens- analyse BIT STREAM FI ILTERB BANK Scaling Scaling Scaling PSYCHOACOUSTIC ANALYSIS Quantize Quantize Quantize BIT ALLOCATION MUX BIT STREAM INSTITUTT FOR INFORMATIKK August 2009-14

Decoding is much simpler BIT STREAM Scaling Scaling Scaling FILTE ERBAN NK D/A LP- filter Kap 3: Tidsdomene systemer: linearitet Kap 3: Inverse systemer INSTITUTT FOR INFORMATIKK August 2009-15

Filterbanks in MPEG-1 audio layer 1-3 Kap 5: Frekvens- analyse av systemer Kap 6: Digitale filtre Kap 10: FIR Filterdesign Polyphase filterbank Equal width 32 subbands, e.g. bw Not perfect reconstruction 44100/2/32 = 689 Hz Frequency overlap 512 tap FIR-filters 80 adds and mults per output Kap 4: z-transform INSTITUTT FOR INFORMATIKK August 2009-16

What is this Psychoacoustics that is used in the Encoder? Kap 8: Diskret Fourier Transform; Estimering av effektspektrum INSTITUTT FOR INFORMATIKK August 2009-22

Masking We do not hear all sounds. 1. Absolute threshold h of fhearing: 2. Masking: One sound is inaudible in the presence of another sound. 1. Simultaneous masking Noise Masking Tone Tone Masking Noise Noise Masking Noise 2. Nonsimultaneous masking Pre masking (2 ms) Post masking (100 ms) INSTITUTT FOR INFORMATIKK August 2009-23

Noise Masking Tone Filtered Noise Center 410 Hz Width 111 Hz Tone 1, 820 Hz Tone 2, 410 Hz Noise 5 db below noise 5 db below noise + Tone 1 Noise + Tone 2 Not masked Masked You can not hear a sinusoid that lies in the same critical band as a filtered noise if the sound pressure level is below a certain threshold. This effect also stretches out beyond the critical band. INSTITUTT FOR INFORMATIKK August 2009-24

Tone Masking Noise Filtered Noise Center 1 khz Width 162 Hz 15 db below Tone 1, 2 khz Tone 2, 1 khz Noise + Tone 1 Not masked Noise + Tone 2 Masked You can not hear a filtered noise that lies in the same critical band as a sinusoid if the sound pressure level is below a certain threshold. This effect also stretches out beyond the critical band. INSTITUTT FOR INFORMATIKK August 2009-25

Exploit Masking If a sound is masked we can t hear it. Make a frequency analysis of the signal and find the masking threshold. Put the quantization noise under the masking threshold and we won t hear the quantization. Kap 8: DFT, Fast Fourier transform, Estimering av effektspektrum INSTITUTT FOR INFORMATIKK August 2009-26

Bit Allocation and Masking The masking threshold in each subband gives the Just Noticeable Distortion (JND) limit for that band. Bits are assigned to subbands so that the quantization noise falls below or as little over the JND as possible. Then the Signal to Quantization noise Ratio (SQR) falls below JND INSTITUTT FOR INFORMATIKK August 2009-30

Castanets and Guitar 22050 Hz INSTITUTT FOR INFORMATIKK August 2009-31

Bit allocation with 2 bits per sample 22050 Hz INSTITUTT FOR INFORMATIKK August 2009-32

Bit allocation with 4 bits per sample 22050 Hz INSTITUTT FOR INFORMATIKK August 2009-33

Kapitler i læreboka MP3-koding 1 Overview Praktiske eksempler som mp1/mp3 2 Discrete Signals Musikk og talesignal 3 Time-Domain Analysis Linearitet: kan dele i frekvensbånd, behandle for seg og så sette sammen igjen Tidsinvarians gjelder bare over kort tid for musikk og tale. Differanseligninger: FIR filtre 4 z-transform Analysis Analyse av filter i filterbanken: nøkkel til å få til filterdesign 5 Frequency Domain Analysis Frekvensdomene er sentralt i modell av hørsel Frekvensselektive filtre: båndpassfiltre Inverse systemer: kan dele i bånd i koder og addere sammen igjen i dekoder 6 Filter Concepts Filterstrukturer, hvordan implementere filterbank i koder og dekoder 7 Digital Processing of Analog Signals A/D-analyse: kvantiseringsstøy ved direkte sampling Mutirate system: Hvert delfilter kan nedsamples pga bare 1/32 av total t båndbredde dd => trenger bare 1/32 samplerate per filter 8 The Discrete Fourier Transform and Its Applications. 9 Design of IIR Filters. Frekvensanalyse av signaler FFT brukes i estimering av spektrum i koder. Må estimere korttidsspektrum for å gjøre adaptiv bittildeling 10 Design of FIR Filters. Hvordan finne koeffisienter til bp-filtrene i filterbanken? 11 MATLAB Examples A Useful Concepts from Analog Theory INSTITUTT FOR INFORMATIKK August 2009-42