Lektor 2 for Stovner VGS 12. februar 2013 Født i Sandefjord for 54 år siden Døpt Bjørn Aarseth Utdannet elektronikkingeniør Ansatt i NRK i 1981 5. september 2004 = halve livet i NRK! Interesser: musikk og elektronikk 1
Begynte med tekn. vedlikehold Deretter lab/utvikling av analog/digital lydelektronikk Nå: Rådgiver i NRKs Teknologidivisjon Medlem i EBU Pool of Experts På samvittigheten: Alltid Klassisk Alltid Nyheter OBT-studio ( Svisj mm) Akkurat nå: HD og 5.1 i NRK TV Digitalisering av Platearkivet DAB, DVB-T og DRM. Internasjonalt arbeid (EBU) Loudness normalisering av NRKs produksjon I fysikkpensumet i videregående skole, omhandler ett læreplanmål lydsampling i kurset Fysikk 2 i 3.klasse. Læreplanmål lyder: "Gjøre rede for sampling og digital behandling av lyd" I denne sammenhengen hadde det vært fint om elevene kunne få se dette utført i praksis. 2
Hvorfor? 04.04.2013 3
0,3-2,5 3,5 0,01 0,123 12-0,073 4
3-25 35 0,1 1,23 120-0,73 desibel, symbol db, lik 1/10 bel. bel, symbol B, enhet for logaritmen (med 10 som grunntall) til forholdet mellom to effekter. Navn etter A.G. Bell. Mest brukt er desibel (db) (1B = 10 db), for måling av lydstyrke. Ørets smertegrense er 130 db. http://www.caplex.no/web/articleview.aspx?id=9301704 5
Viktig! db er en effektdefinisjon! Eksempler: db 10 log 10 P1 P 0 P 1 P 1 P 1 P 1 P 2 0 P 0 0,5 P 10 P 0 0 0dB 3dB 3dB 10dB 6
Ohms lov: U = R I Effektloven: P = U I I kombinasjon: P = U 2 /R = I 2 R Altså: Ikke no mystisk! U R I og P U I P U R 2 db 10 log Eksempler: P / R 2 1 1 10 10 log10 20 log 2 10 P0 U0 / R U U U U 1 1 1 1 U U 2 0 0,5 10 U 0 U U 0 0 U U 1 0 0dB 6dB 6dB 20dB 7
e n 4 k T B N R Eksempel: 50 ohm dyn. mik. e n = 0,13µV = 135 dbu med 60 db gain: 75 dbu med + 22dBu som klippenivå: DR = 97 db med +4 dbu som nom. maks.: SNR = 79 db k = 1.38 10 23 J/K 8
Vi lar lyd, bilde og andre signal bli representert av en analog størrelse, f.eks. en elektrisk spenning. Med analog menes en likeverdig størrelse. Matematisk beskrivelse: Signalet er kontinuerlig i tid og amplitude Signalet eksisterer for alle tidspunkter og alle nivåer Vi lar lyd, bilde og andre signal bli representert ved en strøm av tall. Disse tallene representerer et utsnitt av signalet for noen enkelte tidspunkt og noen enkelte nivåer. Matematisk beskrivelse: Signalet er diskret i tid og amplitude. Signalet eksisterer kun i enkelte tidspunkter, representert ved et et endelig antall tallverdier. 9
Nivå Nivå 04.04.2013 ANALOG Tid DIGITAL 0 1 0 0 1 0 1 1 0 0 1 0 1 1 1 0 Tid Støy og forvrengning av signalet adderes i hvert ledd signalet passerer: Lagring ( konservering ) av signalet reduserer kvaliteten. Kopier blir dårligere enn orginalen. Overføring over lange avstander medfører redusert kvalitet. Jo lengre avstand, desto dårligere kvalitet. Signalkvaliteten er avhengig av mediet 10
Digital betyr at signalet overføres eller lagres på numerisk form, altså som tall. Den eneste degraderingen av signalets kvalitet skjer normalt ved konvertering (mellom analog og digital og vice versa). Signalet er mer robust Vi kan overføre, lagre og kopier så mange generasjoner vi vil uten degradering. Signalkvalitet er uavhengig av medie. Digital gir nye muligheter Signalet kan behandles og manipuleres med på helt nye måter. Eks: Ikke-lineær og ikke-destruktiv redigering Vi er i DATA VERDEN!! Alt kan lagres Billig billig billig billig 11
[V] +5 0 1 0 1 1 0 1 Tid [V] +5 0 1 0 1 1 0 1 Tid 12
[V] +5 0 1 0 1 1 0 1 Tid [V] Reklokking +5 0 1 0 1 1 0 1 Tid Kostbare store bokser med stort effektforbruk? Det var før, det... Nå er det mye billigere! Innfører alltid forsinkelse Må synkroniseres Krever ny måleteknikk og nye metoder for evaluering av kvalitet (eks.: MPEG Audio) Feil blir mer fatale/uopprettelige Ny teknologi krever opplæring 13
Vi teller på fingrene. Røyksignaler er en av de tidligste kjente anvendelser av digital ( diskret ) teknikk Morse er den første elektriske anvendelse av digitalteknikk I moderne tid assosieres digital med data-teknikk og binære tall Et bit er et siffer med binærtall Binær = to-tall systemet Et bit kan ha verdien 0 eller 1 14
1 bit = 2 mulige verdier 2 bit = 4 mulige verdier 3 bit = 8 mulige verdier. Og dette er riktig? En BYTE består av 8 bit 8 bit = 2 8 = 256 variasjoner En byte kan for eksempel beskrive en bokstav 15
Overføringshastighet måles normalt i bit pr. sekund ISDN har to 64 kb/s (kilobit pr. sekund) kanaler Stereolyd i CD-kvalitet er ca. 1,5 Mb/s Seriedigital video (SD-SDI) er 270 Mb/s Lagringskapasitet måles normalt i antall byte En CD rommer ca. 700 MB (megabyte) En DVD rommer fra 4,7 GB (gigabyte) En normalt stor harddisk rommer 1 TB Digitalisering av lyd innfører to fundamentale begrensninger på lydkvaliteten: Sampling begrenser oppløsning i tid/frekvens Kvantisering begrenser lydens dynamikkområde 16
33 17
Nivå 04.04.2013 Lavpass filter Sample & Hold A/D konverter ANALOG db A DIGITAL f D 101101001 Hindrer folding Sampler Kvantiserer D/A konverter Sample & Hold Lavpass filter DIGITAL D db ANALOG 101101001 A f "Deglitcher" Rekonstruksjon Sampling av et signal betyr å ta ut punktprøver med jevne mellomrom i tid. Tid Sample periode 18
Nivå Nivå Nivå Nivå Nivå Nivå 04.04.2013 Jo høyere samplingsfrekvens, desto flere detaljer kommer med: Tid Sample periode Tid Sample periode A Tid Sample periode Signalet samples, holdes og til slutt lavpassfiltreres Nyquist: ingen informasjon med frekvens under fs/2 har gått tapt Eventuell informasjon over fs/2 gir frekvensspeiling B C D Sample periode Sample periode Tid Tid Tid 19
Amplitude Amplitude Amplitude Amplitude Amplitude Amplitude Amplitude Amplitude 04.04.2013 Tid Frekvens Lavpass filter Tid Frekvens Sampling i tid og frekvens (a) Inngangssignal etter LP-filter (c) Sampling signalet Tid fs/2 fs 2fs (b) Frekvensspekter til inngangssignal Frekvens fs/2 fs 2fs (d) Frekvensspekter til samplingssignalet Tid fs/2 fs 2fs Frekvens (e) Samplet inngangssignalet (f) Frekvensspekter til inngangssignalet Lavpass filter Tid Frekvens fs/2 fs 2fs (g) Utgangssignal etter LP-filter (h) Frekvensspekter til utgangssignal In order to be able to reconstruct a signal, the sampling frequency must be at least twice the frequency of the signal being sampled Harold Nyquist (1928) Denne minimum samplefrekvensen kalles Nyquist frekvensen 20
Nyquist teoremet sier at vi må ha en sample frekvens som er minst det dobbelte av øverste signalfrekvens. - Eksempel: f S ca. 10X signalfrekvens: Innsignal Ts Tinn Når frekvensen til signalet som samples er større enn halve samplingsfrekvensen oppstår frekvensspeiling. Eksempel: signalfrekvens nær samplefrekvens: Innsignal Utsignal Tinn Ts 21
4 khz tone samplet med 32 khz Pilene markerer retningen til signalet, økes innfrekvensen så flytter komponentene seg i pilenes retning. 100k 96k 92k 68k 64k 60k 36k 32k 28k 16k 4k Nivå fs/2 fs 2fs 3fs frekvens 12 khz tone samplet med 32 khz Pilene markerer retningen til signalet, økes innfrekvensen så flytter komponentene seg i pilenes retning. 108k 96k 84k 76k 64k 52k 44k 32k 20k 16k 12k Nivå fs/2 fs 2fs 3fs frekvens 22
Sampling i frekvensplanet 20 khz tone samplet med 32 khz Pilene markerer retningen til signalet, økes innfrekvensen så flytter komponentene seg i pilenes retning. 116k 108k 96k 84k 76k 64k 52k 44k 32k 20k 16k 12k Nivå fs/2 fs 2fs 3fs frekvens Sampling i frekvensplanet Lydsignal hvor frekvensinnholdet er begrenset til under fs/2 Det er ingen overlapping mellom det opprinnelige lydsignalet og speilingene Nivå fs/2 fs 2fs 3fs frekvens 23
Sampling i frekvensplanet Lydsignal hvor frekvensinnholdet ikke er begrenset til under fs/2 Det er stor overlapping mellom det opprinnelige lydsignalet og speilingene Nivå fs/2 fs 2fs 3fs frekvens Samplefrekvensen må være minst 2X ønsket øvre signalfrekvens Synkronisering mot kanal Telenettet Video Andre hensyn Filtersteilhet Varispeed Bitrate (pris!) Kompatibilitet... 24
Synkron med telenettet (4 x 8 khz) Ønsket båndbredde er 15 khz (FM) Bitrate ønskes så lav som mulig (pris) Eksempler NICAM NRK s gamle programlinjenett Long Play modus på DAT MP3 på lav bitrate Ønsket båndbredde = 20 khz Synkron med PAL: 3 sampler pr. linje aktiv video PAL: 50 x 294 x 3 = 44100 Am. S/H: 60 x 245 x 3 = 44100 (44,056 khz p.g.a NTSC) NTSC reduserer delbildefrekvensen med en promille... Eksempler: CD, DAT og MD avspilling 25
Ønsket båndbredde = 20 khz Telesynkron (6 x 8 khz) Slake filtre for høy lydkvalitet Mulighet for varispeed +/- 12,5 % uten plagsom frekvensspeiling Eksempler: Digital video med embedded audio DAB, DVB, DVD, BluRay Lineær kvantisering betyr at alle kvantseringsintervaller er like store Hvert kvantiseringsnivå representeres av en unik digital kode Antallet bit bestemmer oppløsningen Med n bit deles det analoge dynamikkområdet opp i 2 n kvantiseringsnivåer: 8 bit gir 256 kvantiseringsnivåer 16 bit gir 65356 kvantiseringsnivåer 26
Lineær kvantisering Q = størrelsen på et kvantiseringsintervall Jo flere bit, desto mindre blir Q Kvantiseringsfeilen er maks +/- Q/2, min 0 Kvantiseringsfeilen for hvert enkelt sample blir tilfeldig dersom innfrekvens og samplefrekvens er ukorrelert (= alltid!) Tilfeldige signal oppfattes som støy. Feilen kalles derfor kvantiseringsstøy 3 bit kvantisering av et signal Q 111 110 101 100 011 010 001 000 feil 27
Med 1 bit får vi kun to kvantiseringsnivåer. Øker vi til 2 bit får vi fire kvantiserings-nivåer, kvantiseringsfeilen er halvert Øker vi til 3 bit får vi åtte kvantiserings-nivåer, kvantiseringsfeilen halveres igjen Halvering av et nivå = reduksjon på 6 db Altså: hvert bit gir ca. 6 db dynamikk Eksakt: SNR = 6,02 x N + 1,78 db Uten dither: SNR = 6,02 x N + 1,78 db 14 bit 16 bit = 86 db = 98 db 20 bit = 122 db 24 bit = 146 db Dither reduserer disse tallene noe Noise shaping gir subjektivt bedre SNR 28
Wave filformat = subset av Microsoft s RIFF spesifikasjon for lagring av multimedia filer RIFF = Resource Interchange File Format En RIFF fil starter med en header etterfulgt av en rekke data chunks 29
A chunk is a fragment of information which is used in many multimedia formats, such as PNG, MP3, AVI etc http://en.wikipedia.org/wiki/chunk_(information) Chunk-baserte filformater har åpen ende Tre ulike chunk er i WAV: RIFF fmt data start på filen beskrivelse av innhold lyddata 30
Introduksjon til digital signalbehandling = DSP Nivået til et signal på digital form endres ved å multiplisere alle sampler med en konstant (forsterknings-) faktor. Miksing av signaler på digital form foregår ved addisjon. Filtrering og alle andre funksjoner gjøres ved å kombinere addisjon og multiplikasjon. 31
Addisjon på desimal og binær form: Desimal 1 5 + 1 1 = 2 6 Binær 1 1 1 1 + 1 0 1 1 = 1 1 0 1 0 Addisjon på desimal, binær og heksadesimal form: Desimal Binær Hexadesimal 2 3 + 7 2 = 9 6 6 7 3 1 1 1 0 + 1 0 1 1 0 1 = 1 1 1 1 0 0 1 1 0 0 0 1 1 1 0 0 1 1 E D + 2 = 3 C C 7 3 32
To tall multipliseres ved venstre skift og gjentatt addisjon. Små tall: Desimal 12 x 13 = 3 6 + = 1 1 2 5 6 Binær 1 1 0 0 x 1 1 1 1 0 0 1 0 = 0 0 0 0 1 1 0 0 + 1 1 0 0 = 1 0 0 1 1 1 0 0 To tall multipliseres ved venstre skift og gjentatt addisjon. Større tall: Desimal Binær 1 5 7 x 2 2 2 = 1 0 0 1 1 1 0 1 x 1 1 0 1 1 1 1 0 = 3 1 4 0 0 0 0 0 0 0 0 3 1 4 1 0 0 1 1 1 0 1 + 3 1 4 1 0 0 1 1 1 0 1 = 3 4 8 5 4 1 0 0 1 1 1 0 1 1 0 0 1 1 1 0 1 0 0 0 0 0 0 0 0 1 0 0 1 1 1 0 1 + 1 0 0 1 1 1 0 1 = 1 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 33
Addisjon og multiplikasjon av digitale signal gir flere bit ut enn hva vi putter inn. Adderes to 16 bits ord fås ett 17 bits ord. Adderes mange 16 bits ord blir svaret større. Addisjon av 40 kanaler á 16 bit gir 22 bit til svar Multipliseres et n bits ord med en m bits koeffisient fås ett m+n ord. Et 16 bits ord som fades med 12 bit forsterkningsfaktor: 16+12=28 bit til svar Addisjon og multiplikasjon av digitale signal gir flere bit ut enn hva vi putter inn. Hvis svaret trunkeres vil vi få akkumulert avrundingsfeil. Ved trunkering forsvinner også dither som er lagt til signalet for å gjøre kvantiseringsprosessen lineær. DSP for audio benytter som regel 32 bit ordlengde for å unngå trunkering. 34
35
36
37
38
39
40