Mer om Markov modeller

Størrelse: px
Begynne med side:

Download "Mer om Markov modeller"

Transkript

1 Høyere ordens Markov modeller Mer om Markov modeller p h mnr = Pr( Y j+ 3 = ah Y j+ 2 = am, Y j+ 1 = an, Y j = a : r For en k-te ordens Markov modell som modellerer en DNA prosess vil det være 3*4 k mulige overgangssannsynligheter som alle må estimeres. Med andre ord for k > 2 vil vi trenger et stort treningsdatasett for å finne troverdige estimater for alle overgangssannsynlighetene. ) Hvordan vil vi teste om en Markovmodell av orden k beskriver dataene bedre enn en av orden k-1? Sammenlikne maksimum likelihooden til både modellen under nullhypotesen (dvs. orden k-1) og modellen under den alternative hypotesen (dvs. orden k) Anja Bråthen Kristoffersen 1 Anja Bråthen Kristoffersen 2-2logλ statistikk Når den alternative modellen avhenger av parametere som ikke er definert i modellen under nullhypotesen. Krever at modellen under nullhypotesen er en undermodell av modellen under den alternative hypotesen (dvs. ved å sette en eller flere parametere lik null i den alternative-modellen får vi null-modellen). Vi sier da at modellene er nøstet. Hvor ( log L ( θ ; X ) log L ( X )) 2log λ = 2 A A θ; L ( θ X ) = P( X ; θ ) P( X ; θ ) K P( X ; θ ) ; 1 2 n Hvis nullhypotesen er sann, hypotesene er nøstede, parametrene ligger i et oppgitt intervall, likelihoodfunksjonen tar alle verdier likelihoodfunksjonen er deriverbare 2 vil -2logλ asymptotisk være χ -fordelt med antall frihetsgrader lik forskjellen i antall parametere i den alternative-modellen og i null-modellen. Dermed vil vårt eksempel hvor null-modellen har 3*4 k-1 parametere og den alternative modellen har 3*4 k parametere få 3*4 k -3*4 k-1 = 9*4 k-1 frihetsgrader. Anja Bråthen Kristoffersen 3 Anja Bråthen Kristoffersen 4

2 Litt repetisjon om Markov kjede Med stasjonær fordeling mener vi at fordelingen ikke har endret seg mellom tid t og t+1. Dvs.: evt. ϕ j ϕ = j s k = 1 ϕ p k kj ϕ = ϕp, j = 1,2, K, s. hvor er sannsynligheten for å være i tilstand j. Uniform stasjonær fordeling Hvis den stasjonære fordelingen til en første ordens Markov kjede er uniform vil overgangssannsynligheten i hver kolonne av overgangsmatrisen summeres til 1. Dermed vil alle elementene i siste rad kunne bestemmes av foregående elementer. Fra før vet vi at alle elementene i en rad må summeres til 1. Dvs. vi må alltid gå fra en tilstand til en av tilstandene i utfallsrommet. Alle elementene i siste kolonne kan alltid bestemmes av elementene i de andre kolonnene. Anja Bråthen Kristoffersen 5 Anja Bråthen Kristoffersen 6 Aperiodisk Irreduserbar Det finnes ingen t > 1 slik at hvis vi er i en tilstand i ved tid t kan vi ikke komme til tilstanden i igjen før ved tid t+t eller t+2t eller 3t osv. Eksempel på periodisk Markov kjede: P = I dette eksemplet er t = Generelt kan vi anta at alle Markov kjeder innen bioinformatikk er aperiodisk. Du kan komme fra alle mulige utfall til alle andre utfall i løp av et endelig antall steg. Eksempel Irreduserbar: reduserbar:.8 P = P = Anja Bråthen Kristoffersen 7 Anja Bråthen Kristoffersen 8

3 Test for uniform stasjonær fordeling Hvis vi har testet og slått fast hypotesen om at dataene følger en Markov kjede, vil neste spørsmål være om den stasjonære fordelingen til Markov kjeden er uniform. Vi vil her konsentrere oss om første ordens Markov kjeder, men teorien kan utvides til høyere ordens Markov kjeder. Anja Bråthen Kristoffersen 9 For å teste om dataene kommer fra en uniform fordeling bruker vi hypotesetesting. Hypotese 1: den stasjonære fordelingen er ikke uniform Hypotese 2: den stasjonære fordelingen er uniform Vi vet at under hypotesen 1 vil siste kolonne være bestemt av de andre overgangssannsynlighetene mens under hypotesen 2 vil både siste rad og siste kolonne vil være bestemt av de andre overgangssannsynlighetene. Hvilken av hypotesene skal vi velge som null hypotese? For å bruke -2logλ statistikk må null hypotesen være nøstet inn i den alternative hypotesen, dvs. den alternative hypotesen må inneholde samme parametere som null hypotesen, men den må i tillegg ha enda flere parametere. Dermed kan vi tilpasse dataene til modellene fra begge hypotesene og vi kan teste om 2log λ = 2( log LA ( θ A; X ) log L ( θ; X )) 2 følger en χ -fordeling med antall frihetsgrader lik forskjellen mellom antall parametere i de to modellene. Anja Bråthen Kristoffersen 1 Eksempel: Test om en Markov kjede som modellerer en DNA sekvens er uniform? Null hypotesen, uniform modell: både siste rad og siste kolonne summeres til 1, dermed vil vi ha 9 frie parametere som må tilpasses fra dataene. Alternativ hypotese, ikke uniform modell: bare siste kolonne summers til 1, dermed vil vi ha 12 frie parametere som må tilpasses fra dataene. 2-2logλ statistikk vil være χ - fordelt med 3 frihetsgrader. MCMC: Markov Chain Monte Carlo Brukes mye både for å beregne og optimalisere forskjellige ting. Simulerer fra en Markov kjede for å finne stasjonær fordeling for spørsmålet som vil studeres. Vi skal se på en MCMC algoritmer Hastings Metropolis algoritmen Anja Bråthen Kristoffersen 11 Anja Bråthen Kristoffersen 12

4 Eksempel Anta at du ønsker å beregne E(Y). Hvis det eksisterer en enkel måte å generere mange observasjoner Y 1, Y 2,, Y n slik at de har samme fordeling som Y vil loven for store tall fortelle at hvis n er stor nok så vil E 1 n n Y i i= 1 ( Y ) = Anja Bråthen Kristoffersen 13 For enkle problemer vil det være enkelt å generere mange variable fra samme fordeling. Men når ting blir mer komplisert vil det kunne være vanskelig å generere iid data. Her kommer MCMC inn. Markov Chain Monte Carlo er en mer sofistikert metode som også baserer seg på loven om store tall. Anta at du fortsatt ønsker å finne en approksimasjon for E(Y). Anta videre at du har en algoritme som kan generere etterfølgende tilstander X 1, X 2,, X n fra en Markov kjede i et utfallsrom χ med stasjonær fordeling ϕ og at det finnes en funksjon f : χ R slik at: E Y = f ( x) ϕ( x) som en estimator på E(Y) brukes da: ( ) x χ n E( Y ) = f ( X j ) j= 1 Anja Bråthen Kristoffersen 14 MCMC Bruker det fakta at en markov kjede med utfallene s 1, s 2, s 3,,s n har (minst) en stasjonær fordeling φ 1, φ 2, φ 3,,φ n. Når en genererer fra en markov kjede over lengre tid vil den andelen tid markov kjeden befinner seg i tilstand s k være tilnærmet φ k. Ved å generere lenge fra en Markov kjede vil en finne en tilnærming til den stasjonære fordelingen φ. Idee Lag en Markov kjede hvor tilstandsrommet består av parametrene i den statistiske modellen, og slik at den stasjonære fordelingen er posteriori fordelingen til parametrene Generer lenge fra Markov kjeden, ta bort starten, slik at vi kun ser på den delen hvor kjeden har kommet til den stasjonære fordelingen. Anja Bråthen Kristoffersen 15 Anja Bråthen Kristoffersen 16

5 Eksempel Fylogeni Modellvalg Ønsker å skape livets tre på bakgrunn av: DNA sekvenser RNA sekvenser proteinsekvenser Vi har sett på noen modeller for evolusjon: Kimuras 2 parameter modell Juckes Cantor modellen Enda finnes det mange flere modeller. HVILKEN SKAL VI VELGE, HVORDAN SKAL VI GJØRE MODELLSELEKSJON? Anja Bråthen Kristoffersen 17 Anja Bråthen Kristoffersen 18 Mange trær Ikke rotete trær: Rotete trær: Klassiske angrepsmåter Neighbour joining Maximum parsimony Maximum likelihood Anja Bråthen Kristoffersen 19 Anja Bråthen Kristoffersen 2

6 Neighbour joining Baserer seg på en matrise med avstander mellom sekvensene Rask Bygger ikke på noen evolusjonær modell, men avstandene beregnes fra sammenstilling av sekvensene. Gjør en dårlig jobb når den evolusjonære avstanden er stor. Maximum parsimony Minimerer antall mutasjoner i treet. Rask Bygger ikke på noen evolusjonær modell Gjør det bra for individer som evolusjonært er nær hverandre (alle individene er nesten like nære). Anja Bråthen Kristoffersen 21 Anja Bråthen Kristoffersen 22 Maximum likelihood Konfidens Statistisk veldig robust Veldig treg Bygger på en evolusjonær modell Trenger metodikk for å løse optimerings problemer Har kun et datasett. Hvordan finner vi konfidens? BOOTSTRAPPING Dvs. vi sampler fra datasettet med tilbakelegging til vi får et datasett som er like stort som det vi hadde. Dette må gjøres på en fornuftig måte slik at strukturen i dataene blir beholdt. Fører til enormt mye mer data som må bearbeides. Anja Bråthen Kristoffersen 23 Anja Bråthen Kristoffersen 24

7 Anja Bråthen Kristoffersen 25 Anja Bråthen Kristoffersen 26 Moderne angrepsmåte: Bayesiansk statistikk Bayes formula Likelihood: Hva er sannsynligheten for å observere dataene gitt en modell/teori Bayesian inference: Hva er sannsynligheten for at modellen/teorien er riktig gitt de observerte dataene? Prior fordeling Likelihood Pr( T ) Pr( D T ) Pr( T D) = Pr( D) P(D T) P(T D) Posterior fordeling Sannsynlighet for dataene Anja Bråthen Kristoffersen 27 Anja Bråthen Kristoffersen 28

8 Bayesisk inferens sammenliknet med maksimum likelihood Spørsmål: Hva er sannsynligheten for at en tilfeldig trekt terning er biased? Terningeksemplet fortsetter En terning trekkes og kastes to ganger. Resultatet på kastene er 4 og 6, er terningen rettferdig? Maksimum likelihood framgangsmåte: Svar: 1/(1+9)=.1 Pr(bias) =.1 er en prior. Konklusjon: terningen er biased. Anja Bråthen Kristoffersen 29 Anja Bråthen Kristoffersen 3 Terningeksemplet fortsetter Terningeksemplet konklusjon Bayesiansk inferens framgangsmåte: Dermed har sannsynligheten for at terningen er biased forandret seg fra.1 til.179. Men den er fortsatt mest sannsynlig rettferdig. Eksemplet var for lite for at maksimum likelihood metoden ville blitt brukt. Derfor er sammenlikningen urettferdig Forsøket viser hvor mye prioren har å si for bayesiansk statistikk (spesielt for små datasett). Her var prioren lett å finne, normalt er dette mye vanskeligere Anja Bråthen Kristoffersen 31 Anja Bråthen Kristoffersen 32

9 Prior Spørsmål: Vanligvis har vi ingen prior fordeling. Hva gjør vi da? Svar: Bruk en flat eller nesten flat fordeling som prior. To eksempler hvor prior fordelingen er flat mens posteriori fordelingen er smalere. Hva trenger prior i vårt fylogeni eksempel? 2n-3 grenlengde parametere Parametrene som symboliserer relativ substitusjonsrate Parametrene som symboliserer heterogenetirate. Frekvensen av nukleotidene Tretopologi Anja Bråthen Kristoffersen 33 Anja Bråthen Kristoffersen 34 Hvordan beregne Bayesiansk inferens? Ved hjelp av Markov Chain Monte Carlo (MCMC) algoritme. MCMC algoritme for vårt fylogeni eksempel Start med et tilfeldig tre og parametere. For hver iterasjon se på (tilfeldig valgt) enten Ny tre topologi eller Nye verdier på parametrene Hvis det nye treet har større posteriori sannsynlighet (π ny ) enn eksisterende tre (π eksisterende ) aksepter å skift tre Hvis nytt tre har lavere sannsynlighet enn eksisterende aksepter nytt tre med sannsynlighet π ny / π eksisterende For hver k-te iterasjon lag treet og parametrene Etter n iterasjoner, summeres resultatene i histogrammer. Beregn gjennomsnitt, 95 % intervaller på parametrene osv. Anja Bråthen Kristoffersen 35 Anja Bråthen Kristoffersen 36

10 MCMC regler for robot gange Mer enn et minimum For å unngå å bli sittende fast i et minimum: MCMCMC Anja Bråthen Kristoffersen 37 Anja Bråthen Kristoffersen 38 MCMCMC (Metropolis Coupled Markov Chain Monte Carlo) Iterer flere kjeder samtidig, men hvor en er heated (hovedkjeden). De kalde kjedene brukes til å sample rommet, for hver generasjon kan to kjeder bytte verdier. Hvordan trekke konklusjoner? Hvilket tre er korrekt? Sorter de oppnådde trærne etter sannsynlighet, velg mulige trær helt til den kumulative sannsynligheten er.95 Hva er verdien tilparameter p? Lag et histogram over oppnådde verdier for p, finn et 95% intervall Anja Bråthen Kristoffersen 39 Anja Bråthen Kristoffersen 4

11 Hvordan trekke konklusjoner? Er gruppen G av arter helt sikkert relatert (dvs. tilhører de helt sikkert samme gren)? Tell hvor mange av de trærne som er generert som mener at gruppen G av arter er relatert. Hvis artene i 74% av trærne tilhører samme gren sies de å være relatert med 74% sannsynlighet. Eksempel: 1 genererte trær, gruppen G av arter på samme gren i av dem: Pr( G tilhører samme gren ) = 74,695% Problemer MCMC krever at det gjøres mange iterasjoner. Teorien stemmer kun når antall iterasjoner går mot uendelig. Hvor mange er mange nok? Hvor avhengig er modellen vi laget av antakelser? Hvor avhengig er vi av prioren? Hvordan sjekke at resultatet er fornuftig. Kan det i det hele tatt valideres? Anja Bråthen Kristoffersen 41 Anja Bråthen Kristoffersen 42 MCMC vinner stadig flere tilhengere Teknikken er kjapp Den sikrer et tolkbart resultat Flere og flere tar MCMC i bruk uten helt å skjønne hva som gjøres. Vår jobb er å være kritisk, kan denne metoden brukes på vårt spørsmål! HUSK vi får alltid et resultat, men vil resultatet være troverdig? Anja Bråthen Kristoffersen 43

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK2120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 6. juni 2011. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 11 Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale begreper

Detaljer

Statistikk og dataanalyse

Statistikk og dataanalyse Njål Foldnes, Steffen Grønneberg og Gudmund Horn Hermansen Statistikk og dataanalyse En moderne innføring Kapitteloversikt del 1 INTRODUKSJON TIL STATISTIKK Kapittel 1 Populasjon og utvalg 19 Kapittel

Detaljer

i x i

i x i TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 11, blokk II Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale

Detaljer

EKSAMEN I TMA4300 BEREGNINGSKREVENDE STATISTIKK Torsdag 16 Mai, 2013

EKSAMEN I TMA4300 BEREGNINGSKREVENDE STATISTIKK Torsdag 16 Mai, 2013 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side av 5 Kontakt: Jo Eidsvik 9747 EKSAMEN I TMA43 BEREGNINGSKREVENDE STATISTIKK Torsdag 6 Mai, 3 Tilatte hjelpemiddel: Gult

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 11: Anvendelser av kjikvadratfordelingen: Kjikvadrattester Situasjon: Et tilfeldig utvalg av n individer er trukket

Detaljer

Notat 3 - ST februar 2005

Notat 3 - ST februar 2005 Notat 3 - ST1301 1. februar 2005 1 Simulering fra modell Når vi skal analysere et gitt konkret innsamlet datasett vil vi gjøre dette med utgangspunkt i en statistisk modell. Vi kan si at en slik statistisk

Detaljer

Testobservator for kjikvadrattester

Testobservator for kjikvadrattester ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 11: Anvendelser av kjikvadratfordelingen: Kjikvadrattester Situasjon: t tilfeldig utvalg av n individer er trukket

Detaljer

STK Oppsummering

STK Oppsummering STK1100 - Oppsummering Geir Storvik 6. Mai 2014 STK1100 Tre temaer Deskriptiv/beskrivende statistikk Sannsynlighetsteori Statistisk inferens Sannsynlighetsregning Hva Matematisk verktøy for å studere tilfeldigheter

Detaljer

Bootstrapping og simulering Tilleggslitteratur for STK1100

Bootstrapping og simulering Tilleggslitteratur for STK1100 Bootstrapping og simulering Tilleggslitteratur for STK1100 Geir Storvik April 2014 (oppdatert April 2016) 1 Introduksjon Simulering av tilfeldige variable (stokastisk simulering) er et nyttig verktøy innenfor

Detaljer

TMA4240 Statistikk H2010 (20)

TMA4240 Statistikk H2010 (20) TMA4240 Statistikk H2010 (20) 10.5: Ett normalfordelt utvalg, kjent varians (repetisjon) 10.4: P-verdi 10.6: Konfidensintervall vs. hypotesetest 10.7: Ett normalfordelt utvalg, ukjent varians Mette Langaas

Detaljer

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2 Besvar alle oppgavene. Hver deloppgave har lik vekt. Oppgave I En kommune skal bygge ny idrettshall og vurderer to entreprenører, A og B. Begge gir samme pristilbud, men kommunen er bekymret for forsinkelser.

Detaljer

BLAST. Blast. Noen mulige sammenstilling av CHAEFAP og CAETP. Evolusjonær basis for sekvenssammenstilling. Sekvenssammenstilling og statistikken brukt

BLAST. Blast. Noen mulige sammenstilling av CHAEFAP og CAETP. Evolusjonær basis for sekvenssammenstilling. Sekvenssammenstilling og statistikken brukt Blast BLAST Sekvenssammenstilling og statistikken brukt Finner best mulig sammenstilling(er), evt. finner veldig gode sammenstillinger. Kan teoretisk unngå å finne beste sammenstilling. Avgjør om sammenstillingen

Detaljer

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast) Diskret sannsynlighetsfordeling (kap 1.1-1.6) Oversikt Utfallsrom (sample space) Sannsynlighetsfordeling Forventning (expectation), E(X), populasjonsgjennomsnitt Bruk av figurer og histogram Binomialfordelingen

Detaljer

Løsningsforslag oblig 1 STK1110 høsten 2014

Løsningsforslag oblig 1 STK1110 høsten 2014 Løsningsforslag oblig STK høsten 4 Oppgave I forbindelse med en studie av antioksidanter og antocyanider, ble innholdet av antocyan i 5 beger med blåbær målt. De målte verdiene var (i mg per gram): 55

Detaljer

Kort overblikk over kurset sålangt

Kort overblikk over kurset sålangt Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente

Detaljer

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005. SOS112 Kvantitativ metode Krysstabellanalyse (forts.) Forelesningsnotater 9. forelesning høsten 25 4. Statistisk generalisering Per Arne Tufte Eksempel: Hypoteser Eksempel: observerte frekvenser (O) Hvordan

Detaljer

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem MAT400 PROSJEKTOPPGAVE: Statistikk i S2 Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem 20. mai 205 Innhold. Stokastisk Variabel.. Stokastiske variable som funksjoner 3 2. Forventningsverdi

Detaljer

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Eksamen desember 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet

Detaljer

Punktestimator. STK Bootstrapping og simulering - Kap 7 og eget notat. Bootstrapping - eksempel Hovedide: Siden λ er ukjent, bruk ˆλ:

Punktestimator. STK Bootstrapping og simulering - Kap 7 og eget notat. Bootstrapping - eksempel Hovedide: Siden λ er ukjent, bruk ˆλ: Punktestimator STK00 - Bootstrapping og simulering - Kap 7 og eget notat Geir Storvik 8. april 206 Trekke ut informasjon om parametre fra data x,..., x n Parameter av interesse: θ Punktestimator: Observator,

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 9 Løsningsskisse Oppgave 1 a) Vi lar her Y være antall fugler som kolliderer med vindmølla i løpet av den gitte

Detaljer

MAT-INF 2360: Obligatorisk oppgave 3. Løsningsforslag

MAT-INF 2360: Obligatorisk oppgave 3. Løsningsforslag MAT-INF 2360: Obligatorisk oppgave 3. Løsningsforslag I kapittel 9 i kompendiet forklarte vi at maximum-likelihood er en av de viktige anvendelsene av ikke-lineær optimering. Vi skal se litt mer på hva

Detaljer

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger Intro til hypotesetesting Analyse av kontinuerlige data 21. april 2005 Tron Anders Moger Seksjon for medisinsk statistikk, UIO 1 Repetisjon fra i går: Normalfordelingen Variasjon i målinger kan ofte beskrives

Detaljer

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser. ÅMA1 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 0, s. 1 (Det tas forbehold om feil i løsningsforslaget.) a) Gjennomsnitt: x = 1 Emp. standardavvik: Median: 1 (1.33 + 1.) = 1.35

Detaljer

Løsningsforslag øving 8, ST1301

Løsningsforslag øving 8, ST1301 Løsningsforslag øving 8, ST3 Oppgave Hva gjør følgende funksjon? Hvilken fordeling har variabelen n som returneres som funksjonsverdi? Forklar hvorfor. Forutsett at to enkle positive tall blir oppgitt

Detaljer

Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner

Detaljer

Kapittel 3: Studieopplegg

Kapittel 3: Studieopplegg Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig

Detaljer

Bioberegninger - notat 4: Mer om sannsynlighetsmaksimering

Bioberegninger - notat 4: Mer om sannsynlighetsmaksimering Bioberegninger - notat 4: Mer om sannsynlighetsmaksimering 8. mars 2004 1 Kort om Newton s metode i flere dimensjoner Newton s metode kan generaliseres til å løse sett av n ligninger med n ukjente. Skal

Detaljer

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk Snøtetthet Notat for TMA424/TMA4245 Statistikk Institutt for matematiske fag, NTNU 5. august 22 I forbindelse med varsling av om, klimaforskning og særlig kraftproduksjon er det viktig å kunne anslå hvor

Detaljer

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - Fornuftig verdi Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.

Detaljer

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Analysere en observator for å finne ut noe om korresponderende

Detaljer

STK juni 2016

STK juni 2016 Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6

Detaljer

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Eksamen desember 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlege stokastiske variabelen X ha fordelingsfunksjon (sannsynstettleik

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Å analysere en utvalgsobservator for å trekke slutninger

Detaljer

Kapittel 9 og 10: Hypotesetesting

Kapittel 9 og 10: Hypotesetesting Kapittel 9 og 1: Hypotesetesting Hypotesetesting er en standard vitenskapelig fremgangsmåte for å sjekke påstander. Generell problemstilling: Basert på informasjonen i data fra et tilfeldig utvalg ønsker

Detaljer

DEL 1 GRUNNLEGGENDE STATISTIKK

DEL 1 GRUNNLEGGENDE STATISTIKK INNHOLD 1 INNLEDNING 15 1.1 Parallelle verdener........................... 18 1.2 Telle gunstige.............................. 20 1.3 Regneverktøy og webstøtte....................... 22 1.4 Oppgaver................................

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II I denne øvingen skal vi fokusere på hypotesetesting. Vi ønsker å gi dere

Detaljer

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering TMA4245 Statistikk Kapittel 8.1-8.5. Kapittel 9.1-9.3+9.15 Turid.Follestad@math.ntnu.no p.1/21 Har sett

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 101 Innføring i statistikk og sannsynlighetsregning. Eksamensdag: Mandag 30. november 1992. Tid for eksamen: 09.00 15.00.

Detaljer

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6) TMA4245 Statistikk Vår 212 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving 4 blokk II Løsningsskisse Oppgave 1 4 personer spurt. Hvis mellom 22 og 26 personer svarer

Detaljer

i=1 t i +80t 0 i=1 t i = 9816.

i=1 t i +80t 0 i=1 t i = 9816. Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Jo Eidsvik 901 27 472 EKSAMEN I FAG SIF5075 LEVETIDSANALYSE Torsdag 22. mai 2003 Tid:

Detaljer

Testobservator for kjikvadrattester

Testobservator for kjikvadrattester ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 11: Anvendelser av kjikvadratfordelingen: Kjikvadrattester Situasjon: Et tilfeldig utvalg av n individer er trukket

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis

Detaljer

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

Første sett med obligatoriske oppgaver i STK1110 høsten 2015 Første sett med obligatoriske oppgaver i STK1110 høsten 2015 Dette er det første obligatoriske oppgavesettet i STK1110 høsten 2015. Oppgavesettet består av fire oppgaver. Du må bruke Matematisk institutts

Detaljer

Oppsummering av STK2120. Geir Storvik

Oppsummering av STK2120. Geir Storvik Oppsummering av STK2120 Geir Storvik Vår 2011 Hovedtemaer Generelle inferensmetoder Spesielle modeller/metoder Bruk av R Vil ikke bli testet på kommandoer, men må forstå generelle utskrifter Generelle

Detaljer

Rekursiv blokkoppdatering av Isingmodellen

Rekursiv blokkoppdatering av Isingmodellen Rekursiv blokkoppdatering av Isingmodellen Bjarne Sæther Master i fysikk og matematikk Oppgaven levert: August 2006 Hovedveileder: Håkon Tjelmeland, MATH Norges teknisk-naturvitenskapelige universitet

Detaljer

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen Diskret sannsynlighetsfordeling (kap 1.1-1.6) Oversikt Utfallsrom (sample space) Sannsynlighetsfordeling Forventning (expectation), E(, populasjonsgjennomsnitt Bruk av figurer og histogram Binomialfordelingen

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer

Detaljer

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner

Detaljer

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Høst 2007 TMA4240 Statistikk Høst 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b4 Løsningsskisse Oppgave 1 Eksamen juni 1999, oppgave 3 av 3 a) µ populasjonsgjennomsnitt,

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland a, Sara Martino b Tlf: a 48 22 18 96, b 99 40 33 30 Eksamensdato: 30. november 2017 Eksamenstid

Detaljer

Inferens i regresjon

Inferens i regresjon Strategi som er fulgt hittil: Inferens i regresjon Deskriptiv analyse og dataanalyse først. Analyse av en variabel før studie av samvariasjon. Emne for dette kapittel er inferens når det er en respons

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon Bo Lindqvist Institutt for matematiske fag 2 Kap. 9: Inferens om én populasjon Statistisk inferens har som mål å tolke/analysere

Detaljer

6.2 Signifikanstester

6.2 Signifikanstester 6.2 Signifikanstester Konfidensintervaller er nyttige når vi ønsker å estimere en populasjonsparameter Signifikanstester er nyttige dersom vi ønsker å teste en hypotese om en parameter i en populasjon

Detaljer

Kap. 6.1: Fordelingen til en observator og stok. simulering

Kap. 6.1: Fordelingen til en observator og stok. simulering Kap. 6.1: Fordelingen til en observator og stok. simulering Data, observatorer og relaterte fordelinger. Stokastisk simulering. Illustrasjon: - Sammenligning av jury bedømmelser i idrett. Fra data til

Detaljer

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen Høgskolen i Telemark Institutt for økonomi og informatikk FORMELSAMLING 6005 Statistikk I Til bruk ved eksamen Per Chr. Hagen . Sannsynlighetsregning. Regneregler Komplementsetningen: Addisjonssetningen:

Detaljer

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2. Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

Medisinsk statistikk Del I høsten 2009:

Medisinsk statistikk Del I høsten 2009: Medisinsk statistikk Del I høsten 2009: Kontinuerlige sannsynlighetsfordelinger Pål Romundstad Beregning av sannsynlighet i en binomisk forsøksrekke generelt Sannsynligheten for at suksess intreffer X

Detaljer

Fasit for tilleggsoppgaver

Fasit for tilleggsoppgaver Fasit for tilleggsoppgaver Uke 5 Oppgave: Gitt en rekke med observasjoner x i (i = 1,, 3,, n), definerer vi variansen til x i som gjennomsnittlig kvadratavvik fra gjennomsnittet, m.a.o. Var(x i ) = (x

Detaljer

Introduksjon til inferens

Introduksjon til inferens Introduksjon til inferens Hittil: Populasjon der verdien til et individ/enhet beskrives med en fordeling. Her inngår vanligvis ukjente parametre, μ, p,... Enkelt tilfeldig utvalg (SRS), observator p =

Detaljer

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind ECON2130 - Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger Jo Thori Lind j.t.lind@econ.uio.no Oversikt 1. Betinget sannsynlighet 2. Stokastiske variable 3. Forventning og varians 4. Regneregler

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Det er to populasjoner som vi ønsker å sammenligne. Vi trekker da et utvalg

Detaljer

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis μ 1 og μ. Vi trekker da ett utvalg fra hver populasjon. ST00 Statistikk for

Detaljer

Bootstrapping og stokatisk simulering Tilleggslitteratur for STK1100

Bootstrapping og stokatisk simulering Tilleggslitteratur for STK1100 Bootstrapping og stokatisk simulering Tilleggslitteratur for STK1100 Geir Storvik April 014 1 Introduksjon Simulering av tilfeldige variable (stokastisk simulering) er et nyttig verktøy innenfor statistikk

Detaljer

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån. http://unstats.un.org/unsd/wsd/

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån. http://unstats.un.org/unsd/wsd/ Verdens statistikk-dag http://unstats.un.org/unsd/wsd/ Signifikanstester Ønsker å teste hypotese om populasjon Bruker data til å teste hypotese Typisk prosedyre Beregn sannsynlighet for utfall av observator

Detaljer

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist 975 89 418 EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Fredag 26. mai 2006

Detaljer

Eksamensoppgave i TMA4295 Statistisk inferens

Eksamensoppgave i TMA4295 Statistisk inferens Institutt for matematiske fag Eksamensoppgave i TMA4295 Statistisk inferens Faglig kontakt under eksamen: Vaclav Slimacek Tlf: 942 96 313 Eksamensdato: Tirsdag 2. desember 2014 Eksamenstid (fra til): 09:00-13:00

Detaljer

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk Institutt for matematiske fag Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk Fagleg kontakt under eksamen: Gunnar Taraldsen a, Torstein Fjeldstad b Tlf: a 464 32 506, b 962 09 710 Eksamensdato: 23

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,

Detaljer

BIO 1000 LAB-ØVELSE 3

BIO 1000 LAB-ØVELSE 3 Navn: Parti: Journalen leveres senest tirsdag 4. oktober 2005 i kassen utenfor labben. BIO 1000 LAB-ØVELSE 3 Fylogenetisk analyse 27. september 2005 Faglig ansvarlig: Hovedansvarlig for lab-øvelsen: Øystein

Detaljer

Verdens statistikk-dag.

Verdens statistikk-dag. Verdens statistikk-dag http://unstats.un.org/unsd/wsd/ Signifikanstester Ønsker å teste hypotese om populasjon Bruker data til å teste hypotese Typisk prosedyre Beregn sannsynlighet for utfall av observator

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2. Eksamensdag: Tirsdag 2. juni 2009. Tid for eksamen: 14.30 17.30. Oppgavesettet

Detaljer

MAT-INF 2360: Obligatorisk oppgave 3

MAT-INF 2360: Obligatorisk oppgave 3 8. april, 2013 MAT-INF 2360: Obligatorisk oppgave 3 Innleveringsfrist: 2/5-2013, kl. 14:30 Informasjon Den skriftlige besvarelsen skal leveres i obligkassa som står i gangen utenfor ekspedisjonen i 7.

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1100 Statistiske metoder og dataanalyse 1 - Løsningsforslag Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30

Detaljer

Bootstrapping og simulering

Bootstrapping og simulering Bootstrapping og simulering Tilleggslitteratur for STK1100 Geir Storvik April 2014 1 Introduksjon Simulering av tilfeldige variable (stokastisk simulering) er et nyttig verktøy innenfor statistikk, men

Detaljer

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må OPPGAVEHEFTE I STK000 TIL KAPITTEL 7 Regneoppgaver til kapittel 7 Oppgave Anta at man har resultatet av et randomisert forsøk med to grupper, og observerer fra gruppe, mens man observerer X,, X,2,, X,n

Detaljer

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Øvelsesoppgave i: ECON30- Statistikk Dato for utlevering: 5.03.06 Dato for innlevering: 05.04.06 innen kl. 5:00 Innleveringssted: Ekspedisjonen i. etasje ES hus

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk Eksamensdag: Torsdag 2. desember 2010. Tid for eksamen: 09.00 13.00. Oppgavesettet er på

Detaljer

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) TMA440 Statistikk H010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,

Detaljer

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>. 1 ECON130: EKSAMEN 014 VÅR - UTSATT PRØVE TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variason i vanskelighetsgrad. Svarene er gitt i >. Oppgave 1 Fra en eldre

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

TMA4240 Statistikk H2010 (19)

TMA4240 Statistikk H2010 (19) TMA4240 Statistikk H2010 (19) Hypotesetesting 10.1-10.3: Generelt om statistiske hypoteser 10.5: Ett normalfordelt utvalg Mette Langaas Foreleses mandag 25.oktober, 2010 2 Estimering og hypotesetesting

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

Parameter-estimering estimering og CosmoMC

Parameter-estimering estimering og CosmoMC AST5220 forelesning 2 Parameter-estimering estimering og CosmoMC Hans Kristian Eriksen 24. januar 2007 Plan for andre forelesning Første time introduksjon til parameter-estimering: estimering: Eksempler

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806

Detaljer

EKSAMEN I FAG TMA4240 STATISTIKK

EKSAMEN I FAG TMA4240 STATISTIKK Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglige kontakter under eksamen: Jo Eidsvik 90127472 Arild Brandrud Næss 99538294 EKSAMEN I FAG TMA4240 STATISTIKK

Detaljer

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Utsatt eksamen i: ECON2130 - Statistikk 1 Eksamensdag: 19.06.2014 Tid for eksamen: kl. 09:00 12:00 Oppgavesettet er på 4 sider UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Tillatte hjelpemidler: Alle trykte

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST0 Innføring i statistikk og sannsynlighetsregning. Eksamensdag: Torsdag 9. mai 994. Tid for eksamen: 09.00 5.00. Oppgavesettet

Detaljer

Matematisk statistikk og stokastiske prosesser B, høsten 2006 Løsninger til oppgavesett 5, s. 1. Oppgave 1

Matematisk statistikk og stokastiske prosesser B, høsten 2006 Løsninger til oppgavesett 5, s. 1. Oppgave 1 Matematisk statistikk og stokastiske prosesser B, høsten 2006 Løsninger til oppgavesett 5, s AR2-modell: Oppgave X t φ X t φ 2 X t 2 Z t Antas å være kausal slik at X t ψ j Z t j er ukorrelert med Z t+,

Detaljer

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1 ECON 130 EKSAMEN 005 VÅR SENSORVEILEDNING Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom , Oppgave 1 I denne oppgaven kan du anta at

Detaljer

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0 Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir

Detaljer

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU Forelesing 27 Oppsummering Torstein Fjeldstad Institutt for matematiske fag, NTNU 18.04.2018 I dag Lineær regresjon (sjekk av modellantagelser) Praktisk informasjon Andre statistikk-kurs Oversikt over

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Inferens om varians og standardavvik for ett normalfordelt utvalg (9.4) Inferens om variansen til en normalfordelt populasjon

Detaljer

INF5820 Natural Language Processing - NLP. H2009 Jan Tore Lønning

INF5820 Natural Language Processing - NLP. H2009 Jan Tore Lønning INF5820 Natural Language Processing - NLP H2009 jtl@ifi.uio.no HMM Tagging INF5830 Lecture 3 Sep. 7 2009 Today More simple statistics, J&M sec 4.2: Product rule, Chain rule Notation, Stochastic variable

Detaljer