AST5220 forelesning 2 Parameter-estimering estimering og CosmoMC Hans Kristian Eriksen 24. januar 2007
Plan for andre forelesning Første time introduksjon til parameter-estimering: estimering: Eksempler på fysiske effekter som påvirker power spekteret Markov Chain Monte Carlo og CosmoMC Eksempel: Lineær parameter-tilpasning tilpasning Mer generelt: Maximum likelihood Markov Chain Monte Carlo (MCMC) Andre time praktiske eksempler CosmoMC fra CMB-spektrum til kosmologi Parameter-filer Resultat-filer Hvordan kjøre jobber på Titan Batch script Submitte jobber Hvordan følge med på hva som skjer under kjøring
Noen fysiske effekter som påvirker CMB-spekteret
Oversikt over CMB-spekteret 10 4 Lyd-bølger Power spectrum 10 3 10 2 Inflasjon Initial-betingelser Geometri Baryoner Konsistens-sjekk Diffusjon 10 1 10 100 1000 Multipole moment, l
Hoved-idé 1: Gravitasjon vs. trykk Det tidlige univers var fylt av baryonsk materie (gule kuler) og fotoner (rød fjær) som vekselvirket i et gravitasjons-potensial satt opp av mørk materie (blå) Materie-konsentrasjoner tiltrekker hverandre pga. gravitasjon Men når tettheten øker, så øker også trykket frastøtning
Hoved-idé 1: Gravitasjon vs. trykk Universet består av et helt landskap av potensial-brønner og -topper Baryon-foton foton-plasmaet oscillerer i dette potensial-landskapet landskapet Lyd-bølger propagerer gjennom universet Baryon-tettheten korresponderer direkte til CMB-temperatur Områder med høy tetthet blir varme flekker i et CMB-kart Områder med lav tetthet blir kalde flekker i et CMB-kart
Hoved-idé 2: Horisonten og akustikk
Hoved-idé 2: Horisonten og akustikk 4 Density contrast, ρ/ρ (10-5 ) 2 0-2 Hvis horisonten er mye mindre enn bølge-lengden, skjer ingenting! -4 0 2 4 6 8 10 Distance (arbitrary units) Fourier-dekomponér tetthets-feltet, og se på en enkelt mode Husk fra AST4220: Horisonten er så langt lyset går siden Big Bang Gravitasjon kan kun virke innenfor en radius på ~ct~
Hoved-idé 2: Horisonten og akustikk 4 Density contrast, ρ/ρ (10-5 ) 2 0-2 Hvis horisonten er mye større enn bølge-lengden, begynner moden å oscillere! ct -4 0 2 4 6 8 10 Distance (arbitrary units) Fourier-dekomponér tetthets-feltet, og se på en enkelt mode Husk fra AST4220: Horisonten er så langt lyset går siden Big Bang Gravitasjon kan kun virke innenfor en radius på ~ct~
Hoved-idé 2: Horisonten og akustikk 6 4 2 0 5 Dekompresjon Dekompresjon Kompresjon Dekompresjon Kompresjon Kompresjon Snitt-tetthet Snitt-tetthet Kompresjon Snitt-tetthet Kompresjon 3 Kompresjon Kompresjon 1 Struktur-løst Struktur-løst Struktur-løst Struktur-løst Snitt-tetthet Kompresjon Dekompresjon Snitt-tetthet Snitt-tetthet Snitt-tetthet Power spectrum, Cl l(l+1)/2π (103 µk 2 ) Struktur-løst 0 1000 2000 3000 Multipole moment, l Multipole moment, l Inflasjon setter opp et flatt spektrum av fluktuasjoner Rett etter inflasjon er horisonten liten Bare små skalaer begynner å prosesseres Tiden går, g og større og større skalaer begynner å oscillere Så,, en dag inntreffer rekombinasjon, og CMB-bildet fryses fryses
Hoved-idé 2: Horisonten og akustikk 8 Power spectrum (10 3 µk 2 ) 7 6 5 4 3 2 1 Uprosessert En kompresjon En dekompresjon To kompresjoner To dekompresjoner 0 500 1000 1500 Multipole moment, l Spørsmål: Hva kan disse fluktuasjonene fortelle oss om prosessene som virker i universet?
Inflasjon fra lave l-er Størrelsen til horisonten ved rekombinasjon er omtrent 2 2 på himmelen i dag Fra forrige time husker vi at dette tilsvarer multipoler l ~ 180 / 2 2 ~ 100 Skalaer større enn disse er bare svakt prosessert av gravitasjon og trykk CMB-feltet påp l < 50 er et direkte bilde av fluktuasjonene fra inflasjon! Noen forutsigelser fra inflasjon: Fluktuasjonen skal være Gaussiske og isotrope Spekteret skal være nesten skala-invariant Det bør ikke være noen karakteristisk skala Fluktuasjonene skal være like sterke på alle skalaer (dvs. flatt spektrum) De passende parameterne for å beskrive initial-betingelsene fra inflasjon er en amplitude A en helnings-parameter (tilt) n s, som bør være nær 1 Ved å tilpasse en rett linje til (log-)spekteret for l mindre enn 50, får vi et direkte estimat av A og n s! Mer eller mindre: log C l = n s log (l( / l 0 ) + A
Rommets geometri fra første topp Ifølge GR propagerer lys langs geodeter i rommet I flatt rom er dette rette linjer I åpne rom divergerer geodetene I lukkede rom konvergerer geodetene
Rommets geometri fra første topp Avstand til siste spredningsflate Horisont Anta at vi kjenner: størrelsen til horisonten ved rekombinasjon Flatt Lukket Åpent Gitt av plasmaets egenskaper (trykk, tetthet etc.) avstanden til siste spredningsflate Gitt av universets ekspansjons-historie Universets geometri er da gitt ved horisontens vinkel-størrelse Første akustiske topp er en standard-målestokk for horisontens størrelse Hvis første topp ligger ved l ~220, så er universet flatt Hvis første topp ligger ved l > 220, så er universet åpent Hvis første topp ligger ved l < 220, så er universet lukket
Rommets geometri fra første topp Lav tetthet Høy tetthet
Baryon-tettheten fra øvrige topper Baryon-tettheten kan måles svært nøyaktig fra høyere-ordens topper Idé: Mer baryoner innbærer tyngre lodd 1. Loddet faller dypere 2. Hvis det er lite baryoner, så påvirker de ikke gravitasjons-potensialet Symmetriske oscillasjoner omkring likevekts-tilstand tilstand 3. Hvis det er mye baryoner, så øker de potensialet ved kompresjoner Kompresjoner sterkere enn dekompresjoner Men power spekteret bryr seg ikke om tegn! Første og tredje topp sterkere enn andre og fjerde!
Baryoner fra øvrige topper Mye baryoner Lite baryoner
Eksponentiell dempning ved høye l er 10 4 Power spectrum 10 3 10 2 10 1 10 100 1000 Multipole moment, l Høye l er tilsvarer fysisk veldig små skalaer De opprinnelige fluktuasjonene fra inflasjon blir vasket ut av fotonf oton-diffusjon Power spekteret dempes eksponentielt med l Den nøyaktige dempnings-raten avhenger av alle kosmologiske parametere
Eksponentiell dempning ved høye l er Høye l er tilsvarer fysisk veldig små skalaer De opprinnelige fluktuasjonene fra inflasjon blir vasket ut av fotonf oton-diffusjon Power spekteret dempes eksponentielt med l Den nøyaktige dempnings-raten avhenger av alle kosmologiske parametere Eksempel: Høy baryon-tetthet kort fri veilengde for fotoner mindre diffusjon Høy-l-spekteret gir oss en konsistens-sjekk sjekk påp andre parameter-estimater estimater
Oppsummering av hoved-effekter effekter Den kosmiske bakgrunns-strålingen strålingen ble dannet da temperaturen i universet falt under 3000 K, omtrent 380,000 år etter Big Bang Gass-dynamikken påp den tiden bestemmer egenskapene til CMB- fluktuasjonene Hoved-effekter effekter som påvirker p CMB-spekteret: Inflasjon amplitude og tilt til første f fluktuasjoner Gravitasjon vs. strålingstrykk Høy y baryon-tetthet Foton-diffusjon påp små skalaer lyd-bølger lger akustiske topper tungt lodd i bølgeneb sterke kompresjoner odde topper sterkere enn partall-topper topper eksponentiell dempning påp høye l er Mange andre effekter også,, men generelt mer komplisert og mindre intuitive... Poeng: Koder som CAMB kan benytter slik informasjon til å beregne power spekteret for gitte kosmologiske parametere Vi kan gjøre parameter-estimering estimering ved å tilpasse CAMB-kurver til observasjoner!
Parameter-estimering estimering og Markov Chain Monte Carlo
Målinger av CMB-spekteret Hvordan finne de parameterne og modellen som best beskriver dataene?
Eksempel: Lineær modell Start med en enkel modell: d= ax+ b+ ² d er obsverte data a og b er parametere vi ønsker å estimere ε er Gaussisk støy y med null gjennomsnitt, og σ 2 varians 20 Y 15 10 Modell: a = 1 b = 2 σ = 3 5 0 0 2 4 6 8 10 X
Eksempel: Lineær modell Vanlig kriterium for best-fit justér de frie parameterne slik at kvadrat-avviket avviket blir minimalisert: Dette garanterer at ingen observerte punkter blir liggende altfor r langt borte fra den tilpassede funksjonen, dersom modellen er korrekt Løsning finnes ved å derivere χ 2 med hensyn påp a og b,, og løse l systemet: 20 Y 15 10 5 Modell: a = 1 b = 2 σ = 3 Estimat: a = 0.76 b = 3.62 0 0 2 4 6 8 10 X
Generelt: Maximum likelihood χ-tilpasning er et spesial-tilfelle av maximum-likelihood likelihood-estimeringestimering Likelihooden er generelt definert som funksjonen der de frie parameterne er θ,, mens dataene d holdes fast Eksempel: Sannsynlighets-distribusjonen for en gaussisk variabel er Siden logaritmen er en monotont økende funksjon, sås er maximum- likelihood-løsningen er gitt ved
Posterior-distribusjonen Vi er ikke bare interessert i de mest sannsynlige parameter-verdiene, men også usikkerhetene i disse. Mer generelt, vi er interessert i (posterior-) ) distribusjonen Posterior-distribusjon = = Sannsynlighets-fordelingen for parametere gitt data Likelihood = = Fordeling for data gitt parametere Kjenner vi posterioren, vet vi alt som dataene forteller oss om parameterne Best-fit parametere = maksimum posterior Usikkerheter = 68% konfidensintervaller Posterior distribution Posterior distribution 0.002 0.0015 0.001 0.0005 0.002 0.0015 0.001 0.0005 0 0 1000 2000 3000 4000 Power spectrum, C l (µk 2 ) 0 intervaller 0 1000 2000 3000 4000 Power spectrum, C l (µk 2 )
Bayes teorem Hvordan beregne posterior-distribusjonen? Bayes teorem sier at Likelihood Prior Posterior-distribusjonen Evidens Posterior = Hva vet vi om parameterne etter eksperimentet? Likelihood = Hva sier de nåværende dataene om parameterne? Prior = Hva trodde vi om parameterne før vi gjorde eksperimentet? erimentet? Evidens = Hvor godt passer dataene til modellen, integrert overo parametere? (Merk: Avhenger ikke av de frie parameterne!) Dette gir den numeriske oppskriften på hvordan beregne posterioren en Men hvordan beregne den algoritmisk?
Metode 1: Grid-beregning 0.5 Probability distribution 0.4 0.3 0.2 0.1 Exact distribution Grid distribution 0-4 -2 0 2 4 Variate Hvis antall parametere er mindre eller lik fire: Beregn et grid Gir en regulær funksjon som er enkel å jobbe med Svært enkel algoritme Problem: Antall grid-punkter øker eksponentielt med antall parametere! Eksempel: 100 punkter i to parametere = 100 2 = 10,000 evalueringer Eksempel: 100 punkter i seks parametere = 100 6 = 100 milliarder evalueringer!
0.5 Metode 2: Sampling Probability distribution 0.4 0.3 0.2 0.1 Exact distribution Sampled distribution 0-4 -2 0 2 4 Variate Anta at det er mulig å trekke samples fra I så fall, produser f.eks. 100,000 samples, og lag et histogram! Dette histogrammet konvergerer mot med antall samples Fordel: Mesteparten av beregnings-kostnadene tilbringes nær toppen til distribusjonen. Men hvordan trekker man fra kompliserte, ikke-standard distribusjoner?
Sampling ved Markov Chain Monte Carlo (MCMC) MCMC = en veldig enkel metode for å sample fra vilkårlinge distribusjoner Metropolis-algoritmen: 1. Velg en overgangs-regel regel fra ett punkt til et annet Eks: θ i+1 = θ i + N(0,σ 2 ) 2. Velg et start-punkt 3. Foreslå et nytt punkt ifølge regel 4. Flytt til foreslått punkt med sannsynlighet 5. Iterér 3 and 4
CosmoMC Dagens kosmologiske standard-sampler sampler heter CosmoMC, skrevet av Antony Lewis Denne koden består av flere deler: En Metropolis-sampler sampler som beskrevet på forrige slide Brukeren velger hvilke kosmologiske parametere som skal inkluderes es Overgangsregelen er en multivariat Gaussisk distribusjon CAMB Oversetter foreslåtte kosmologiske parametere til spektrum Likelihood-koder koder produsert av forskjellige eksperimentelle grupper CMB-data: WMAP, BOOMERanG, Acbar, CBI... Stor-skala skala-strukturer: strukturer: 2dF, SDSS Priors fra andre eksperimenter, som Hubble-konstanten, universets alder etc. Etter typisk ett døgns kjøre-tid på ~8 prosessorer får man ut posterior- distribusjonen for de gitte parameterne og data-settene
Eksempel: Amplitude og tilt fra CosmoMC 500 3.2 Marginalized posterior 400 300 200 100 Amplitude, A 3.1 3 2.9 0 2.8 2.9 3 3.1 3.2 Amplitude, A Kjøring av CosmoMC med WMAP-data alene, med standard seks-parameter parameter- modell,, {Ω{ b, Ω cdm, h, n s, A, τ} Kjede for 1000 {n{ s, A} samples Distribusjonen fås f s ved å lage et 2D histogram fra disse Marginale distribusjoner for n s og A individuelt fås f s ved å lage 1D histogrammer fra de samme samplene. Marginalized posterior 2.8 2.7 0.9 0.95 1 1.05 Spectral index, n s 0.9 0.95 1 1.05 Spectral index, n s
Oppsummering Kosmologiske parametere påvirker CMB-power spekteret Ved å tilpasse CAMB-type spektra til observerte data, kan vi rekonstruere disse parameterne Målet for analysen er sannsynlighets-distribusjonen Dette kalles posterior-distribusjonen Posterioren er gitt ved Bayes teorem, For å kartlegge denne funksjonen bruker man i dag Markov Chain Monte Carlo-metoder Den mest brukte koden innen kosmologi i dag er CosmoMC