Parameter-estimering estimering og CosmoMC

Like dokumenter
AST5220 forelesning 1 Litt praktisk CMB-analyse

AST5220 forelesning 1 Litt praktisk CMB-analyse

AST1010 En kosmisk reise. Forelesning 19: Kosmologi

AST1010 En kosmisk reise. Forelesning 20: Kosmologi, del 2

AST1010 En kosmisk reise

AST1010 En kosmisk reise

Analyse av fire-års COBE-DMR data

AST1010 En kosmisk reise. Forelesning 20: Kosmologi, del 2

AST1010 En kosmisk reise. Forelesning 19: Kosmologi, del I

AST1010 En kosmisk reise. Astronomiske avstander v=vsl-jncjak0. Forelesning 20: Kosmologi, del I

Oppgaver i CMB-analyse. 1 Oppgave 1 Power spektra og CAMB

AST1010 En kosmisk reise

AST1010 En kosmisk reise

Mer om Markov modeller

AST1010 En kosmisk reise

AST1010 En kosmisk reise

Universets inflasjonsfase i lys av BICEP2-observasjonene

STK juni 2016

Egil Lillestøll, Lillestøl,, CERN & Univ. i Bergen,

EKSAMEN I TMA4300 BEREGNINGSKREVENDE STATISTIKK Torsdag 16 Mai, 2013

Forelesning 7: Store talls lov, sentralgrenseteoremet. Jo Thori Lind

Europas nye kosmologiske verktøykasse Bo Andersen Norsk Romsenter

AST1010 En kosmisk reise. De viktigste punktene i dag: Elektromagnetisk bølge 1/23/2017. Forelesning 4: Elektromagnetisk stråling

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE

Fasit for tilleggsoppgaver

Kapittel 2: Hendelser

Ikke lineære likninger

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Kapittel 3: Studieopplegg

Histogramprosessering

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

MAT-INF 2360: Obligatorisk oppgave 3. Løsningsforslag

UNIVERSITETET I OSLO

Oppsummering av STK2120. Geir Storvik

Biseksjonsmetoden. biseksjonsmetode. Den første og enkleste iterativ metode for ikke lineære likninger er den så kalt

EKSAMEN I NUMERISK LINEÆR ALGEBRA (TMA4205)

UNIVERSITETET I OSLO

Noen presiseringer mhp Diskret Fourier Transform. Relevant for oblig 1.

Oppgave 1: Terningsutfall På en kubisk terning er det 1/6 sannsynlighet for hver type utfall fra 1 til 6. Ved to terninger, er utfallene antatt

Akkurat den samme begrunnelsen som vi brukte med variabelen X 2. "Jeg bruker internett mye mer på i-phone nå enn det jeg gjorde før på mobilen.

Experiment Norwegian (Norway) Hoppende frø - En modell for faseoverganger og ustabilitet (10 poeng)

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

UNIVERSITETET I OSLO Matematisk Institutt

TMA4240 Statistikk H2010 (20)

TMA4240 Statistikk Høst 2016

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).

Par-copula konstruksjoner: Et fleksibelt verktøy for å modellere multivariat avhengighet

TMA4240 Statistikk H2010

Bioberegninger - notat 4: Mer om sannsynlighetsmaksimering

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Forelesning 8 STK3100/4100

UNIVERSITETET I OSLO Det matematisk naturvitenskapelige fakultet

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Modell, Cold Dark Matter, Normal text - click to edit

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Notat 6 - ST februar 2005

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk

Modifisering av Black & Scholes opsjonsprising ved bruk av NIG-fordelingen

STK Oppsummering

FY2045/TFY4250 Kvantemekanikk I, løsning øving 13 1 LØSNING ØVING 13. V (x, t) = xf (t) = xf 0 e t2 /τ 2.

AST1010 En kosmisk reise

En (reell) funksjon f fra en (reell) mengde D er en regel som til hvert element x D tilordner en unik verdi y = f (x).

AST1010 En kosmisk reise. Forelesning 4: Fysikken i astrofysikk, del 1

ST0202 Statistikk for samfunnsvitere

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Kapittel 4.4: Forventning og varians til stokastiske variable

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

AST1010 En kosmisk reise

ÅMA110 Sannsynlighetsregning med statistikk, våren

VELKOMMEN TIL INTERNATIONAL MASTERCLASSES 2017 FYSISK INSTITUTT, UNIVERSITETET I OSLO

Notat 4 - ST februar 2005

ST0103 Brukerkurs i statistikk Høsten Momentestimatoren og sannsynlighetsmaksimeringsestimatoren

Seksjon 1.3 Tetthetskurver og normalfordelingen

Histogrammetoder. Lars Aurdal Norsk regnesentral. Histogrammetoder p.1/91

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

AST1010 En kosmisk reise. Forelesning 4: Elektromagnetisk stråling

Fysikk og virkelighetsoppfatning

Notat 3 - ST februar 2005

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

AST1010 En kosmisk reise. Forelesning 18: Galakser og galaksehoper

UNIVERSITETET I OSLO

HØGSKOLEN I STAVANGER

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

Svarte hull kaster lys over galaksedannelse

Eksamensoppgave i TMA4295 Statistisk inferens

AST1010 En kosmisk reise. Forelesning 13: Sola

Statistikk og dataanalyse

Eksamensoppgave i ST0103 Brukerkurs i statistikk

AST1010 En kosmisk reise

AST1010 En kosmisk reise. Innhold 10/19/15. Forelesning 18: Galakser og galaksehoper

Jakten på universets kjempelinser

MAT-INF 2360: Obligatorisk oppgave 3

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

EksameniASTlolo 13 mai2

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2018

Transkript:

AST5220 forelesning 2 Parameter-estimering estimering og CosmoMC Hans Kristian Eriksen 24. januar 2007

Plan for andre forelesning Første time introduksjon til parameter-estimering: estimering: Eksempler på fysiske effekter som påvirker power spekteret Markov Chain Monte Carlo og CosmoMC Eksempel: Lineær parameter-tilpasning tilpasning Mer generelt: Maximum likelihood Markov Chain Monte Carlo (MCMC) Andre time praktiske eksempler CosmoMC fra CMB-spektrum til kosmologi Parameter-filer Resultat-filer Hvordan kjøre jobber på Titan Batch script Submitte jobber Hvordan følge med på hva som skjer under kjøring

Noen fysiske effekter som påvirker CMB-spekteret

Oversikt over CMB-spekteret 10 4 Lyd-bølger Power spectrum 10 3 10 2 Inflasjon Initial-betingelser Geometri Baryoner Konsistens-sjekk Diffusjon 10 1 10 100 1000 Multipole moment, l

Hoved-idé 1: Gravitasjon vs. trykk Det tidlige univers var fylt av baryonsk materie (gule kuler) og fotoner (rød fjær) som vekselvirket i et gravitasjons-potensial satt opp av mørk materie (blå) Materie-konsentrasjoner tiltrekker hverandre pga. gravitasjon Men når tettheten øker, så øker også trykket frastøtning

Hoved-idé 1: Gravitasjon vs. trykk Universet består av et helt landskap av potensial-brønner og -topper Baryon-foton foton-plasmaet oscillerer i dette potensial-landskapet landskapet Lyd-bølger propagerer gjennom universet Baryon-tettheten korresponderer direkte til CMB-temperatur Områder med høy tetthet blir varme flekker i et CMB-kart Områder med lav tetthet blir kalde flekker i et CMB-kart

Hoved-idé 2: Horisonten og akustikk

Hoved-idé 2: Horisonten og akustikk 4 Density contrast, ρ/ρ (10-5 ) 2 0-2 Hvis horisonten er mye mindre enn bølge-lengden, skjer ingenting! -4 0 2 4 6 8 10 Distance (arbitrary units) Fourier-dekomponér tetthets-feltet, og se på en enkelt mode Husk fra AST4220: Horisonten er så langt lyset går siden Big Bang Gravitasjon kan kun virke innenfor en radius på ~ct~

Hoved-idé 2: Horisonten og akustikk 4 Density contrast, ρ/ρ (10-5 ) 2 0-2 Hvis horisonten er mye større enn bølge-lengden, begynner moden å oscillere! ct -4 0 2 4 6 8 10 Distance (arbitrary units) Fourier-dekomponér tetthets-feltet, og se på en enkelt mode Husk fra AST4220: Horisonten er så langt lyset går siden Big Bang Gravitasjon kan kun virke innenfor en radius på ~ct~

Hoved-idé 2: Horisonten og akustikk 6 4 2 0 5 Dekompresjon Dekompresjon Kompresjon Dekompresjon Kompresjon Kompresjon Snitt-tetthet Snitt-tetthet Kompresjon Snitt-tetthet Kompresjon 3 Kompresjon Kompresjon 1 Struktur-løst Struktur-løst Struktur-løst Struktur-løst Snitt-tetthet Kompresjon Dekompresjon Snitt-tetthet Snitt-tetthet Snitt-tetthet Power spectrum, Cl l(l+1)/2π (103 µk 2 ) Struktur-løst 0 1000 2000 3000 Multipole moment, l Multipole moment, l Inflasjon setter opp et flatt spektrum av fluktuasjoner Rett etter inflasjon er horisonten liten Bare små skalaer begynner å prosesseres Tiden går, g og større og større skalaer begynner å oscillere Så,, en dag inntreffer rekombinasjon, og CMB-bildet fryses fryses

Hoved-idé 2: Horisonten og akustikk 8 Power spectrum (10 3 µk 2 ) 7 6 5 4 3 2 1 Uprosessert En kompresjon En dekompresjon To kompresjoner To dekompresjoner 0 500 1000 1500 Multipole moment, l Spørsmål: Hva kan disse fluktuasjonene fortelle oss om prosessene som virker i universet?

Inflasjon fra lave l-er Størrelsen til horisonten ved rekombinasjon er omtrent 2 2 på himmelen i dag Fra forrige time husker vi at dette tilsvarer multipoler l ~ 180 / 2 2 ~ 100 Skalaer større enn disse er bare svakt prosessert av gravitasjon og trykk CMB-feltet påp l < 50 er et direkte bilde av fluktuasjonene fra inflasjon! Noen forutsigelser fra inflasjon: Fluktuasjonen skal være Gaussiske og isotrope Spekteret skal være nesten skala-invariant Det bør ikke være noen karakteristisk skala Fluktuasjonene skal være like sterke på alle skalaer (dvs. flatt spektrum) De passende parameterne for å beskrive initial-betingelsene fra inflasjon er en amplitude A en helnings-parameter (tilt) n s, som bør være nær 1 Ved å tilpasse en rett linje til (log-)spekteret for l mindre enn 50, får vi et direkte estimat av A og n s! Mer eller mindre: log C l = n s log (l( / l 0 ) + A

Rommets geometri fra første topp Ifølge GR propagerer lys langs geodeter i rommet I flatt rom er dette rette linjer I åpne rom divergerer geodetene I lukkede rom konvergerer geodetene

Rommets geometri fra første topp Avstand til siste spredningsflate Horisont Anta at vi kjenner: størrelsen til horisonten ved rekombinasjon Flatt Lukket Åpent Gitt av plasmaets egenskaper (trykk, tetthet etc.) avstanden til siste spredningsflate Gitt av universets ekspansjons-historie Universets geometri er da gitt ved horisontens vinkel-størrelse Første akustiske topp er en standard-målestokk for horisontens størrelse Hvis første topp ligger ved l ~220, så er universet flatt Hvis første topp ligger ved l > 220, så er universet åpent Hvis første topp ligger ved l < 220, så er universet lukket

Rommets geometri fra første topp Lav tetthet Høy tetthet

Baryon-tettheten fra øvrige topper Baryon-tettheten kan måles svært nøyaktig fra høyere-ordens topper Idé: Mer baryoner innbærer tyngre lodd 1. Loddet faller dypere 2. Hvis det er lite baryoner, så påvirker de ikke gravitasjons-potensialet Symmetriske oscillasjoner omkring likevekts-tilstand tilstand 3. Hvis det er mye baryoner, så øker de potensialet ved kompresjoner Kompresjoner sterkere enn dekompresjoner Men power spekteret bryr seg ikke om tegn! Første og tredje topp sterkere enn andre og fjerde!

Baryoner fra øvrige topper Mye baryoner Lite baryoner

Eksponentiell dempning ved høye l er 10 4 Power spectrum 10 3 10 2 10 1 10 100 1000 Multipole moment, l Høye l er tilsvarer fysisk veldig små skalaer De opprinnelige fluktuasjonene fra inflasjon blir vasket ut av fotonf oton-diffusjon Power spekteret dempes eksponentielt med l Den nøyaktige dempnings-raten avhenger av alle kosmologiske parametere

Eksponentiell dempning ved høye l er Høye l er tilsvarer fysisk veldig små skalaer De opprinnelige fluktuasjonene fra inflasjon blir vasket ut av fotonf oton-diffusjon Power spekteret dempes eksponentielt med l Den nøyaktige dempnings-raten avhenger av alle kosmologiske parametere Eksempel: Høy baryon-tetthet kort fri veilengde for fotoner mindre diffusjon Høy-l-spekteret gir oss en konsistens-sjekk sjekk påp andre parameter-estimater estimater

Oppsummering av hoved-effekter effekter Den kosmiske bakgrunns-strålingen strålingen ble dannet da temperaturen i universet falt under 3000 K, omtrent 380,000 år etter Big Bang Gass-dynamikken påp den tiden bestemmer egenskapene til CMB- fluktuasjonene Hoved-effekter effekter som påvirker p CMB-spekteret: Inflasjon amplitude og tilt til første f fluktuasjoner Gravitasjon vs. strålingstrykk Høy y baryon-tetthet Foton-diffusjon påp små skalaer lyd-bølger lger akustiske topper tungt lodd i bølgeneb sterke kompresjoner odde topper sterkere enn partall-topper topper eksponentiell dempning påp høye l er Mange andre effekter også,, men generelt mer komplisert og mindre intuitive... Poeng: Koder som CAMB kan benytter slik informasjon til å beregne power spekteret for gitte kosmologiske parametere Vi kan gjøre parameter-estimering estimering ved å tilpasse CAMB-kurver til observasjoner!

Parameter-estimering estimering og Markov Chain Monte Carlo

Målinger av CMB-spekteret Hvordan finne de parameterne og modellen som best beskriver dataene?

Eksempel: Lineær modell Start med en enkel modell: d= ax+ b+ ² d er obsverte data a og b er parametere vi ønsker å estimere ε er Gaussisk støy y med null gjennomsnitt, og σ 2 varians 20 Y 15 10 Modell: a = 1 b = 2 σ = 3 5 0 0 2 4 6 8 10 X

Eksempel: Lineær modell Vanlig kriterium for best-fit justér de frie parameterne slik at kvadrat-avviket avviket blir minimalisert: Dette garanterer at ingen observerte punkter blir liggende altfor r langt borte fra den tilpassede funksjonen, dersom modellen er korrekt Løsning finnes ved å derivere χ 2 med hensyn påp a og b,, og løse l systemet: 20 Y 15 10 5 Modell: a = 1 b = 2 σ = 3 Estimat: a = 0.76 b = 3.62 0 0 2 4 6 8 10 X

Generelt: Maximum likelihood χ-tilpasning er et spesial-tilfelle av maximum-likelihood likelihood-estimeringestimering Likelihooden er generelt definert som funksjonen der de frie parameterne er θ,, mens dataene d holdes fast Eksempel: Sannsynlighets-distribusjonen for en gaussisk variabel er Siden logaritmen er en monotont økende funksjon, sås er maximum- likelihood-løsningen er gitt ved

Posterior-distribusjonen Vi er ikke bare interessert i de mest sannsynlige parameter-verdiene, men også usikkerhetene i disse. Mer generelt, vi er interessert i (posterior-) ) distribusjonen Posterior-distribusjon = = Sannsynlighets-fordelingen for parametere gitt data Likelihood = = Fordeling for data gitt parametere Kjenner vi posterioren, vet vi alt som dataene forteller oss om parameterne Best-fit parametere = maksimum posterior Usikkerheter = 68% konfidensintervaller Posterior distribution Posterior distribution 0.002 0.0015 0.001 0.0005 0.002 0.0015 0.001 0.0005 0 0 1000 2000 3000 4000 Power spectrum, C l (µk 2 ) 0 intervaller 0 1000 2000 3000 4000 Power spectrum, C l (µk 2 )

Bayes teorem Hvordan beregne posterior-distribusjonen? Bayes teorem sier at Likelihood Prior Posterior-distribusjonen Evidens Posterior = Hva vet vi om parameterne etter eksperimentet? Likelihood = Hva sier de nåværende dataene om parameterne? Prior = Hva trodde vi om parameterne før vi gjorde eksperimentet? erimentet? Evidens = Hvor godt passer dataene til modellen, integrert overo parametere? (Merk: Avhenger ikke av de frie parameterne!) Dette gir den numeriske oppskriften på hvordan beregne posterioren en Men hvordan beregne den algoritmisk?

Metode 1: Grid-beregning 0.5 Probability distribution 0.4 0.3 0.2 0.1 Exact distribution Grid distribution 0-4 -2 0 2 4 Variate Hvis antall parametere er mindre eller lik fire: Beregn et grid Gir en regulær funksjon som er enkel å jobbe med Svært enkel algoritme Problem: Antall grid-punkter øker eksponentielt med antall parametere! Eksempel: 100 punkter i to parametere = 100 2 = 10,000 evalueringer Eksempel: 100 punkter i seks parametere = 100 6 = 100 milliarder evalueringer!

0.5 Metode 2: Sampling Probability distribution 0.4 0.3 0.2 0.1 Exact distribution Sampled distribution 0-4 -2 0 2 4 Variate Anta at det er mulig å trekke samples fra I så fall, produser f.eks. 100,000 samples, og lag et histogram! Dette histogrammet konvergerer mot med antall samples Fordel: Mesteparten av beregnings-kostnadene tilbringes nær toppen til distribusjonen. Men hvordan trekker man fra kompliserte, ikke-standard distribusjoner?

Sampling ved Markov Chain Monte Carlo (MCMC) MCMC = en veldig enkel metode for å sample fra vilkårlinge distribusjoner Metropolis-algoritmen: 1. Velg en overgangs-regel regel fra ett punkt til et annet Eks: θ i+1 = θ i + N(0,σ 2 ) 2. Velg et start-punkt 3. Foreslå et nytt punkt ifølge regel 4. Flytt til foreslått punkt med sannsynlighet 5. Iterér 3 and 4

CosmoMC Dagens kosmologiske standard-sampler sampler heter CosmoMC, skrevet av Antony Lewis Denne koden består av flere deler: En Metropolis-sampler sampler som beskrevet på forrige slide Brukeren velger hvilke kosmologiske parametere som skal inkluderes es Overgangsregelen er en multivariat Gaussisk distribusjon CAMB Oversetter foreslåtte kosmologiske parametere til spektrum Likelihood-koder koder produsert av forskjellige eksperimentelle grupper CMB-data: WMAP, BOOMERanG, Acbar, CBI... Stor-skala skala-strukturer: strukturer: 2dF, SDSS Priors fra andre eksperimenter, som Hubble-konstanten, universets alder etc. Etter typisk ett døgns kjøre-tid på ~8 prosessorer får man ut posterior- distribusjonen for de gitte parameterne og data-settene

Eksempel: Amplitude og tilt fra CosmoMC 500 3.2 Marginalized posterior 400 300 200 100 Amplitude, A 3.1 3 2.9 0 2.8 2.9 3 3.1 3.2 Amplitude, A Kjøring av CosmoMC med WMAP-data alene, med standard seks-parameter parameter- modell,, {Ω{ b, Ω cdm, h, n s, A, τ} Kjede for 1000 {n{ s, A} samples Distribusjonen fås f s ved å lage et 2D histogram fra disse Marginale distribusjoner for n s og A individuelt fås f s ved å lage 1D histogrammer fra de samme samplene. Marginalized posterior 2.8 2.7 0.9 0.95 1 1.05 Spectral index, n s 0.9 0.95 1 1.05 Spectral index, n s

Oppsummering Kosmologiske parametere påvirker CMB-power spekteret Ved å tilpasse CAMB-type spektra til observerte data, kan vi rekonstruere disse parameterne Målet for analysen er sannsynlighets-distribusjonen Dette kalles posterior-distribusjonen Posterioren er gitt ved Bayes teorem, For å kartlegge denne funksjonen bruker man i dag Markov Chain Monte Carlo-metoder Den mest brukte koden innen kosmologi i dag er CosmoMC