Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Størrelse: px
Begynne med side:

Download "Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans"

Transkript

1 Denne uken: kap : Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

2 VG 25/9 2011

3 Statistisk inferens Mål: Trekke konklusjoner fra data Tidligere har vi undersøkt data og trukket uformelle konklusjoner Formell statistisk inferens: Basere konklusjoner på sannsynlighetsberegninger Tar hensyn til usikkerhet/variasjon

4 Tilfeldig plassering av trær? Statistisk analyse: Så mye klustring/sammenklumping (eller enda mer) vil kun skje i 4% av tilfeller med tilfeldig plassering Observert mønster er altså svært usannsynlig med tilfeldig plassering Konkluderer at det er klustring, og ikke tilfeldig plassering

5 Effektiv ny medisin? Gir ny medisin til 20 pasienter, 12 viser bedring av tilstand Gir placebo til 20 andre pasienter, 8 viser bedring av tilstand Er den nye medisinen mer effektiv enn placebo? Kanskje, men en forskjell som den observerte, eller større, mellom resultatene for de to gruppene vil skje i 20% av slike forsøk bare pga tilfeldig variasjon En effekt som så lett kan skje bare ved tilfeldighet er ikke overbevisende nok til å konkludere at den nye medisinen er bedre enn placebo

6 Formell statistisk inferens To viktige metoder Konfidensintervall Signifikanstester Basert på fordeling til observator Krever sannsynlighetsmodell for dataene Statistisk inferens baserer seg på at dataene kommer fra et tilfeldig utvalg eller et randomisert eksperiment Viktig å huske på!

7 Kap. 6: Kjent σ Hensikten i dag er å beskrive tankegangen bak statistisk inferens Vi skal se på noen enkle metoder for statistisk inferens, som krever en urealistisk antagelse: at vi kjenner det teoretiske standardavviket σ Fra og med kap. 7 og utover vil vi se på mer realistiske metoder som kan brukes for de fleste typer av data vi har sett på tidligere

8 SAT-poeng: 6.1 Konfidensintervall Dersom poeng for individene i populasjonen er N(μ,σ)- fordelt, vet vi at gjennomsnittet er N(μ,σ/ n)-fordelt Antar at vi vet at σ=100. For n=500 er da σ/ n= regelen: er i [μ-2σ/ n,μ+2σ/ n] = [μ-9,μ+9] med ca 95% sannsynlighet

9 Konfidensintervall SAT-poeng: Dersom peng for individene i populasjonen er N(μ,σ)-fordelt, vet vi at gjennomsnittet er N(μ,σ/ n)-fordelt Antar at vi vet at σ=100. For n=500 er da σ/ n= regelen: er i [μ-2σ/ n,μ+2σ/ n] = [μ-9,μ+9] med ca 95% sannsynlighet Å si at er 9 poeng fra μ er det samme som å si at μ er 9 poeng fra I 95% av utvalg vil den sanne verdien av μ ligge i intervallet [ -9, +9] [ -9, +9] er et 95% konfidensintervall for μ

10 Konfidensintervall: Tolkning SAT-poeng: [ -9, +9] er et 95% konfidensintervall for μ Observerer et utvalg med n=500 der =461 Vi er 95% sikre (confident) på at den ukjente forventningen μ ligger i intervallet [ 461-9, ] = [452, 470] Vi vet ikke om vårt utvalg er et av de 95% av utvalgene som har konfidensintervall som fanger μ, eller om det er et av de 5% av utvalgene som har konfidensintervall som ikke fanger μ Utsagnet «Vi er 95% sikre (confident) på at den ukjente forventningen μ ligger i intervallet [452, 470]» betyr at vi kom frem til dette intervallet ved å bruke en metode som gir korrekt resultat i 95% av tilfellene

11 25 utvalg gir 25 forskjellige konfidensintervall, ett dekker ikke μ. Dersom vi tok veldig mange slike utvalg vil 95% av dem gi intervall som dekker den ukjente parameteren μ

12 Konfidensintervall og konfidensnivå Man kan velge konfidensnivået, 99, 95 og 90 % er det vanligste. I SAT-eksempelet var 95%-intervallet ± 9 Generelt konfidensintervall: Estimat ± feilmargin Estimat: Senter i intervall Feilmargin: Presisjon av estimat Feilmarginen avhenger av konfidensnivå regelen: er i [μ-3σ,μ+3σ] med ca 99.7% sannsynlighet

13 Konfidensintervall og konfidensnivå Generelt konfidensintervall: Estimat ± feilmargin Estimat: Senter i intervall Feilmarginen avhenger av konfidensnivå regel: er i [μ-3σ,μ+3σ] med 99.7% sannsynlighet er i [μ-3σ,μ+3σ] er ekvivalent med at μ er i [ -3σ, +3σ] μ i [ -3σ, +3σ] i 99.7% av utvalg [ -3σ, +3σ] er et 99.7% konfidensintervall for μ Høyere konfidensnivå gir større intervall (større feilmargin) Konfidensnivå C (95/99.7): Sannsynlighet for at intervallet inneholder sann parameter

14 Konfidensnivå for forventning Normalfordelte data: x er eksakt N(μ,σ/ n)-fordelt Sentralgrenseteorem for store utvalg: x er tilnærmet N(μ,σ/ n)- fordelt Vi så at vi kunne finne et omtrentlig konfidensintervall for μ ved å bruke regelen Skal nå se hvordan vi lager mer presise konfidensintervall for μ Må starte med å finne feilmarginene for et bestemt konfidensnivå C Går veien om standard normalfordeling: Da kan vi finne generelle feilmarginer som alltid kan brukes for konfidensnivå C når gjennomsnittet x er normalfordelt

15 Konfidensnivå for forventning Når Z er N(0,1)-fordelt: Velg z* slik at arealet under kurven mellom -z* og z* er C, dvs P(-z*<Z <z*)=c For tre verdier av C (fra nederste rad i Table D):

16 Konfidensintervall x er N(μ,σ/ n)-fordelt, dvs (x -μ)/(σ/ n) er N(0,1)-fordelt Fant z* slik at P(-z*<Z <z*)=c når Z er N(0,1)-fordelt P(-z* < (x -μ)/(σ/ n) < z*) = C P(-z*σ/ n < x -μ< z*σ/ n) = C P( x-z*σ/ n < μ < x +z*σ/ n) = C Konfidensintervall for μ med nivå C: [x-z*σ/ n, x+z*σ/ n] Feilmargin m=z*σ/ n

17

18 Konfidensintervall: Eksempel I en undersøkelse ble et utvalg på 1280 tidligere studenter spurt om hvor stort studielån de hadde Gjennomsnittet x var $18900 og standardavviket s var $49000 Klart skjev fordeling, men pga stort utvalg er x tilnærmet normalfordelt Ukjent teoretisk populasjons-standardavvik σ, men later som om det er kjent lik det observerte standardavviket s, dvs x er tilnærmet N(μ,σ/ 1280)-fordelt, med σ=$ Ønsker å lage et 95%-konfidensintervall for den ukjente forventningen μ Vet at z*=1.960 for C=95%

19 Konfidensintervall: Eksempel I en undersøkelse ble et utvalg på 1280 tidligere studenter spurt om hvor stort studielån de hadde x er tilnærmet N(μ,σ)-fordelt, med σ=$49000 Vet at z*=1.960 for C=95% Feilmarginen er m=z*σ/ n=1.960*49000/ 1280=2684, avrunder til m=2700 (fordi x er angitt i hele $100) 95%-konfidensintervall for den ukjente forventningen μ er x +/- m = $ /- $2700 = $[16200, 21600] Vi er 95% sikre på at den ukjente forventningen μ ligger mellom $16200 og $21600

20 Generell form Konfidensintervall [x -z*σ/ n, x +z*σ/ n] Generell formel for utvalgsestimater som er normalfordelte (eller tilnærmet normalfordelte)

21 Hvordan oppfører konfidensintervallene seg? Feilmargin m=z*σ/ n Avhenger av z* (som avhenger av C): Kan redusere m med mindre C Typisk C=95% (90% og 99% brukes også) σ: Kan redusere m med data med mindre variasjon n: Kan redusere m med flere målinger

22 Betydning av C (z*) 99% og 95% konfidensintervaller for samme utvalsgsstørrelsen (n=1280)

23 Betydning av n 95% konfidensintervall for to ulike verdier av utvalsgsstørrelsen n (later som om studielånsundersøkelsen var gjort for et utvalg på n=320 istedet for de virkelige n=1280)

24 Valg av utvalgsstørrelse Design av eksperiment med bestemt feilmargin m: Ønsker feilmargin m med konfidens C C gir deg verdien av z* Velg utvalgsstørrelse n slik at m=z*σ/ n Det vil si velg n=(z*σ/m) 2 Eksempel:

25 Noen forsiktighetsregler Data bør være fra et enkelt randomisert utvalg (SRS) av populasjonen Viktig med uavhengige observasjoner fra populasjonen Andre, korrigerte formler for mer kompliserte design Følsomt for uteliggere Lite robust for små n (bør ha n>15) når data ikke er normalfordelte Må kjenne σ. Senere skal vi se på hva vi gjør når σ er ukjent Hvis n stor, kan vi bruke [x -z*s/ n, x +z*s/ n] (som da er et tilnærmet konfidensintervall for μ)

26 6.2 Signifikanstester Konfidensintervaller er nyttige når vi ønsker å estimere en populasjonsparameter Signifikanstester er nyttige dersom vi ønsker å teste en hypotese om en parameter i en populasjon Bruker observerte data til å teste hypotesen om populasjonen Typisk prosedyre Beregn sannsynlighet for observert utfall av observator (eller noe mer ekstremt) gitt antatt hypotese Hvis sannsynlighet liten, forkast hypotese

27 Eksempel studietlån Gjennomsnittlig studielån: x 1 =$21200 ved private college x 2 =$17100 ved offentlige college Forskjell $4100, reell eller tilfeldig? P(Forskjell mellom x 1 og x , gitt at det ikke er noen forskjell mellom forventningene i populasjonen) =0.17 Ganske høy sannsynlighet, altså ikke så veldig overraskende resultat, data gir ikke grunnlag for å påstå at det er forskjeller i lånenivå

28

29 Eksempel studielån Gjennomsnittlig studielån Forskjell $7500 i 1997 er x 1 =$11400 i 2002 er x 2 =$18900 P(Forskjell mellom x 1 og x , gitt at det ikke er noen forskjell mellom forventningene i populasjonen) = Data gir grunnlag for å forkaste hypotese om at det ikke er forskjeller i lånenivå

30

31 Hovedtrinn Spørsmål: Forskjell mellom nivåer (forventninger) Ser om data er kompatibel med hypotesen om at det ikke er noen forskjell Hvis ikke overraskende forskjell (eks. sanns. 0.17) Ikke grunnlag i data for å påstå at det er en forskjell Hvis overraskende stor forskjell (eks. sanns ) Forkast antagelse om ingen forskjell

32 Hypoteser Null-hypotese H 0 Påstand som ønskes testet Typisk: Ingen effekt / ingen forskjell Eks. H 0 : μ = μ 1 μ 2 = 0, eventuelt μ 1 = μ 2 Signifikanstest Designet for å angi bevisstyrke mot H 0 Alternativ hypotese H a Det er en effekt / forskjell Eks. H a : μ 0 eventuelt μ 1 μ 2 NB: Hypoteser er alltid utsagn/antagelser om populasjoner (eller modeller), ikke et spesielt utfall. Derfor må H 0 og H a alltid formuleres utifra de ukjente populasjonsparametrene

33 Hypoteser Fordi H a utrykker effekten vi ønsker å finne ut om er tilstede, er det lurt å starte med å formulere H a og deretter sette opp H 0 som utsagnet om at den ønskede effekten ikke er tilstede Å formulere H a er ofte den vanskeligste oppgaven. Spesielt er det ofte ikke opplagt om denne skal være ensidig (f.eks. H a : μ>0) eller tosidig (f.eks. H a : μ 0) uttrykker om parameteren er forskjellig fra nullhypotese-verdien i en bestemt retning eller ikke Man får ikke lov til å se på data for å formulere H a (juks!) Dersom man ikke har god begrunnelse på forhånd om retning på effekten, skal man velge tosidig H a.

34 Baserer test på en observator som estimerer parameteren vi er interessert i (ofte den samme som vi ville brukt til et konfidensintervall for parameteren) Eks.: x 1 -x 2 estimerer μ = μ 1 -μ 2 Testobservator Verdier langt fra parameterverdi spesifisert av H 0 gir bevis mot H 0 H a angir hvilken retning som teller: Ensidig H a : μ 1 >μ 2 angir at vi må ha stor x 1 -x 2 som bevis mot H 0 Ensidig H a : μ 1 <μ 2 angir at vi må ha liten x 1 -x 2 som bevis mot H 0 Tosidig H a : μ μ 2 angir at vi må ha stor x 1 -x 2 som bevis mot H 0

35 Standardisert test-observator For å undersøke hvor langt estimatet er fra parameterverdien spesifisert av H 0, standardiserer vi estimatet

36 Eksempel studielån Forskjell på de ukjente, sanne forventningene til størrelse på lån ved private og offentlige college? H 0 : Det er ingen forskjell i de sanne forventningene H a : Det er en forskjell i de sanne forventningene Dvs: H 0 : μ 1 = μ 2 mot H a :μ 1 μ 2 (tosidig alternativ) H 0 : μ 1 - μ 2 =0 mot H a :μ 1 -μ 2 0 Estimat for μ 1 - μ 2 : x 1-x 2 (= 4100) Store verdier av både positive og negative forskjeller, dvs store verdier av absolouttverdien x 1-x 2 teller som bevis mot H 0. Her: σ x 1-x 2 =3000 (skal se senere hvordan denne beregnes) Standardiserer (gitt μ 1 - μ 2 =0): z=(4100-0)/3000 = 1.37

37 Signifikanstest: P-verdi P-verdi: Sannsynligheten for at et utfall er like ekstremt eller mer ekstremt enn faktisk utfall (beregnet ved å anta at parameterverdien gitt av H 0 er sann) Ekstremt: Lang fra hva vi ville forvente hvis H 0 var sann. Retning på hva som regnes som ekstremt: Bestemmes av H a og H 0 Liten P-verdi: Sterkt bevis mot H 0

38 Eksempel studielån Forskjell mellom private og offentlige college? H 0 : μ 1 - μ 2 =0 mot H a :μ 1 -μ 2 0 Estimat for μ 1 - μ 2 : x 1-x 2 (= 4100) Ekstremt: Langt fra hva vi ville forvente hvis H 0 var sann, dvs både positive og negative forskjeller like store eller større enn observert verdi av x 1 -x 2, dvs like store eller større enn observert verdi av absolouttverdien x 1 -x 2 Standardiserer: z=(4100-0)/3000 = 1.37 Ekstremt: Like store eller større enn observert verdi av absolouttverdien x 1-x 2, som betyr like store eller større enn observert verdi av z Z tilnærmet N(0,1): P-verdi = P( Z >1.37) = P(Z<-1.37) + P(Z>1.37) = =

39

40 Hvordan konkludere? Statistisk signifikans Forkaster H 0 når P-verdi er liten nok Signifikansnivå α: Grenseverdi for når vi forkaster Forkaster når P-verdi α Resultatene er signifikante på nivå α (P-verdi α) Ikke grunnlag for å forkaste når P-verdi>α Typisk: α=0.05 (eller 0.01) Signifikant betyr at bevisene mot nullhypotesen oppfyller standarden satt av α. Typisk utsagn er «Resultatene er signifikante (P < 0.05)»

41 Signifikanstest 1. Formuler H 0 og H a 2. Beregn test-observator 3. Finn P-verdi 4. Formuler en konklusjon NB: Bruker ofte datamaskin til å finne P-verdi, men en datamaskin Kan ikke formulere H 0 og H a Kan ikke tolke P-verdien for deg Kan ikke bedømme om forutsetningene for å bruke testen er oppfylt

42 Eksempel studielån Forskjell mellom private og offentlige college? H 0 : μ 1 - μ 2 =0 mot H a :μ 1 -μ 2 0 Estimat for μ 1 - μ 2 : x 1-x 2 (= 4100) Standardiserer: z=(4100-0)/3000 = 1.37 Z tilnærmet N(0,1): P-verdi = P( Z >1.37) = P(Z<-1.37) + P(Z>1.37) = = Eksempel på tolkning og konklusjon: Det er 17% sjanse for å observere en forskjell like ekstrem eller mer ekstrem som den observerte forskjellen på $4100 hvis den sanne populasjons-forskjellen mellom forventningene er 0. P-verdien sier oss altså at det observerte utfallet ikke er spesielt ekstremt. Vi kan si at de observerte dataene ikke gir grunnlag for å konkludere at det er en forskjell i forventet studielån mellom private og offentlige skoler

43 Eksempel studielån Økning i størrelsen på studielån fra 1997 til 2002? H 0 : μ 2 - μ 1 =0 mot ensidig H a :μ 2 -μ 1 >0, Estimat for μ 2 - μ 1 : x 2-x 1 (= 7500) Her: σ x 1-x 2 =1900 (skal se senere hvordan denne beregnes) Standardiserer: z=(7500-0)/3000 = 3.95 Z tilnærmet N(0,1): P-verdi = P(Z> 3.95) = Eksempel på tolkning og konklusjon: Det er en 4 til sjanse for å observere en forskjell like stor eller større som den observerte forskjellen på $7500 hvis den sanne populasjonsforskjellen mellom forventningene er 0. P-verdien sier oss altså at det observerte utfallet er ekstremt sjeldent. Vi konkluderer at de observerte dataene gir grunnlag for å konkludere at nullhypotesen er feil. Dataene viser tydelig at forventet studielån har økt mellom 1997 og 2002 (P<0.001)

44 Tester for populasjonsforventning H 0 :μ=μ 0 Data: x 1,...,x n Estimator for μ: x Testobservator: z=(x - μ 0 )/σ x =(x - μ 0 )/(σ n)

45

46 Eksempel: Blodtrykk National Center for Health Statistics rapporterer: Blodtrykk menn (alder 35-44) har μ=128, σ=15 Bedriftslege ønsker å undersøke: Har mannlige toppledere (alder 35-44) i bedriften annerledes forventet blodtrykk enn den generelle populasjonen av menn på samme alder? Målinger av blodtrykket til 72 toppledere x = Bedriftslegen har ingen grunn til å anta noen retning på forskjellen H 0 :μ=128, H a :μ 128 z=( )/(15/ 72)=-1.09 P-verdi = 2P(Z )= 2P(Z 1.09) = 2(1-P(Z <1.09) ) = 2( )=0.2758

47

48 Eksempel: Blodtrykk P-verdi = Tolkning og konklusjon: Et SRS med n=27 fra den den generelle populasjonen av menn på samme alder vil 27% av gangene gi et gjennomsnittlig blodtrykk like langt eller lenger fra 128 som det observerte x= Den observerte x gir altså ikke bevis for at topplederene er annerledes enn andre menn på samme alder. Ingen grunn til å forkaste H 0

49 To-sidige tester og konfidensintervall Konfidensintervall med konfidens C: [x -z*σ/ n, x +z*σ/ n] Verdier av μ utenfor intervall er ikke kompatible med data Mulig test-prosedyre: Forkaste H 0 hvis μ 0 ikke i konfidensintervall

50 Kan vises: Ekvivalent med signifikanstest En tosidig signifikanstest med nivå α som forkaster H 0 :μ=μ 0 er ekvivalent med at μ 0 faller utenfor konfidensintervallet for μ med nivå C=(1-α)% Noen ganger enklere å konstruere konfidensintervaller

51 Eksempel: To-sidige tester og konfidensintervall Analyse av konsentrasjonen av farmasøytisk produkt. Ikke presis målemetode, repeterte analyser av samme prøve vil gi litt forskjellig svar.konsentrasjon N(μ,σ=0.0068)-fordelt Laboratoriet har blitt spurt om å evaluere en påstand om at konsentrasjonen i en prøve er 0.86% H 0 :μ=0.86 H a : μ 0.86 Tre målinger av prøven ga resultatene , og x = z=( )/(0.0068/ 3)=-4.99 P=2P(Z> ) <

52 Eksempel: To-sidige tester og konfidensintervall Analyse av konsentrasjonen av farmasøytisk produkt. Ikke presis målemetode, repeterte analyser av samme prøve vil gi litt forskjellig svar.konsentrasjon N(μ,σ=0.0068)-fordelt Laboratoriet har blitt spurt om å evaluere en påstand om at konsentrasjonen i en prøve er 0.86% H 0 :μ=0.86 H a : μ 0.86 Tre målinger av prøven ga resultatene , og x = z=( )/(0.0068/ 3)= %-konfidensintervall (C=99% gir z*=2.576): x +/- z*σ/ n = [0.8303,0.8505]

53

54 P-verdier mot fast nivå α To mulige måter å rapportere: Hvis P-verdi < α, H 0 er forkastet på nivå α Angi P-verdi direkte Testing farmasøytisk produkt: Konsentrasjon N(μ,σ=0.0068) H 0 :μ=0.86 H a : μ 0.86 Observasjoner , , x = z=( )/(0.0068/ 3)=-4.99 P=2P(Z> )= Signifikant på 0.05 nivå, 0.01 nivå, nivå P-verdi: Laveste signifikansnivå som gir forkastning.

55

56 6.3 Bruk og misbruk av tester Utføre test enkelt (software) Bruke test vanskeligere Kun gyldig under visse forutsetninger Konfidensnivå: Ingen klar grense, vanlig å rapportere P-verdi Forkastning H 0 : Forskjell statistisk signifikant Forskjell kan være liten (hvis n stor) Ingen forkastning behøver ikke bety H 0 er sann Ofte mulig å gjøre mange mulige tester P-verdi relatert til å gjøre en test Hvis mange tester må justeringer gjøres

57 Testing av korrelasjon To variable, H 0 : Ingen korrelasjon 400 observasjoner, r=0.1 Statistisk signifikant med α=0.05 Variasjon forklart av annen variabel: r 2 =0.01

58 Hiv-behandling Behandlingsgruppe og kontrollgruppe Insidensrateforhold I: Forhold mellom rate i behandlingsgruppe i forhold til kontrollgruppe H 0 : I=1 95% konfidensintervall [0.63,1.58] Ikke nok data til å konkludere Kan både gi forbedringer og forverre!

59 Genomiske eksperimenter Ønsker å finne gen som forklarer sykdom Mange titusener mulige gener Kan utføre test på hvert gen tester, α=0.05 Forventer 500 tester vil være signifikante kun pga. tilfeldigheter! Forskning: Hvordan behandle mange tester simultant

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner

Detaljer

6.2 Signifikanstester

6.2 Signifikanstester 6.2 Signifikanstester Konfidensintervaller er nyttige når vi ønsker å estimere en populasjonsparameter Signifikanstester er nyttige dersom vi ønsker å teste en hypotese om en parameter i en populasjon

Detaljer

Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner

Detaljer

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån. http://unstats.un.org/unsd/wsd/

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån. http://unstats.un.org/unsd/wsd/ Verdens statistikk-dag http://unstats.un.org/unsd/wsd/ Signifikanstester Ønsker å teste hypotese om populasjon Bruker data til å teste hypotese Typisk prosedyre Beregn sannsynlighet for utfall av observator

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Å analysere en utvalgsobservator for å trekke slutninger

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Analysere en observator for å finne ut noe om korresponderende

Detaljer

Kapittel 7: Inferens for forventningerukjent standardavvik

Kapittel 7: Inferens for forventningerukjent standardavvik Kapittel 7: Inferens for forventningerukjent standardavvik 7.1: Inferens for forventningen i en populasjon 7.2: Inferens for å sammenligne to forventninger 7.1 Inferens for forventningen i en populasjon

Detaljer

Econ 2130 uke 16 (HG)

Econ 2130 uke 16 (HG) Econ 213 uke 16 (HG) Hypotesetesting I Løvås: 6.4.1 6, 6.5.1-2 1 Testing av µ i uid modellen (situasjon I Z-test ). Grunnbegreper. Eksempel. En lege står overfor følgende problemstilling. Standardbehandling

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp. ÅMA Sannsynlighetsregning med statistikk, våren 8 Kp. 6 Hypotesetesting Hypotesetesting (kp. 6) Tre deler av faget/kurset:. Beskrivende statistikk. Sannsynlighetsteori, sannsynlighetsregning 3. Statistisk

Detaljer

Utvalgsfordelinger (Kapittel 5)

Utvalgsfordelinger (Kapittel 5) Utvalgsfordelinger (Kapittel 5) Oversikt pensum, fortid og fremtid Eksplorativ data-analyse (Kap 1, 2) Hvordan produsere data (Kap 3) Sannsynlighetsteori (Kap 4) Utvalgsfordelinger til observatorer (Kap

Detaljer

Kapittel 7: Inferens for forventningerukjent standardavvik

Kapittel 7: Inferens for forventningerukjent standardavvik Kapittel 7: Inferens for forventningerukjent standardavvik 7.1: Inferens for forventningen i en populasjon 7.: Inferens for å sammenligne to forventninger 7.1 Inferens for forventningen i en populasjon

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ... ÅMA Sannsynlighetsregning med statistikk, våren 6 Kp. 6 (kp. 6)... Begrep: nullhypotese alternativhypotese ensidig, tosidig teststørrelse (testobservator) nullfordeling kritisk verdi, forkastningsområde

Detaljer

Hypotesetesting av λ og p. p verdi.

Hypotesetesting av λ og p. p verdi. Forelesning 7, kapittel 6 Hypotesetesting av λ og p. p verdi. Det som gjøres i denne forelesningen er nær opptil det vi gjorde da vi konstruerte z test for µ, og styrkefunksjon for denne. I tillegg til

Detaljer

i x i

i x i TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 11, blokk II Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale

Detaljer

Kapittel 9 og 10: Hypotesetesting

Kapittel 9 og 10: Hypotesetesting Kapittel 9 og 1: ypotesetesting ypotesetesting er en standard vitenskapelig fremgangsmåte for å sjekke påstander. Generell problemstilling: Basert på informasjonen i data fra et tilfeldig utvalg ønsker

Detaljer

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere 2 Inferens om varians og standardavvik for ett normalfordelt utvalg (9.4) Inferens om variansen til en normalfordelt populasjon bruker kjikvadrat-fordelingen ( chi-square distribution ) (der kji er den

Detaljer

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk ÅMA Sannsynlighetsregning med statistikk, våren 2 Kp. 6 Hypotesetesting Hypotesetesting (kp. 6) Tre deler av faget/kurset:. Beskrivende statistikk 2. Sannsynlighetsteori, sannsynlighetsregning 3. Statistisk

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 11 Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale begreper

Detaljer

Utvalgsfordelinger (Kapittel 5)

Utvalgsfordelinger (Kapittel 5) Utvalgsfordelinger (Kapittel 5) Observator En observator er en funksjon av data for mange individer, for eksempel Gjennomsnitt Andel Stigningstall i regresjonslinje En observator er en tilfeldig variabel

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon Bo Lindqvist Institutt for matematiske fag 2 Kap. 9: Inferens om én populasjon Statistisk inferens har som mål å tolke/analysere

Detaljer

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis μ 1 og μ. Vi trekker da ett utvalg fra hver populasjon. ST00 Statistikk for

Detaljer

Kapittel 10: Hypotesetesting

Kapittel 10: Hypotesetesting Kapittel 10: Hypotesetesting TMA445 Statistikk 10.1, 10., 10.3: Introduksjon, 10.5, 10.6, 10.7: Test for µ i normalfordeling, 10.4: p-verdi Turid.Follestad@math.ntnu.no p.1/19 Estimering og hypotesetesting

Detaljer

7.2 Sammenligning av to forventinger

7.2 Sammenligning av to forventinger 7.2 Sammenligning av to forventinger To-utvalgs z-observator To-utvalgs t-prosedyrer To-utvalgs t-tester To-utvalgs t-konfidensintervall Robusthet To-utvalgs t-prosedyrerår variansene er like Sammenlikning

Detaljer

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0 Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir

Detaljer

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må OPPGAVEHEFTE I STK000 TIL KAPITTEL 7 Regneoppgaver til kapittel 7 Oppgave Anta at man har resultatet av et randomisert forsøk med to grupper, og observerer fra gruppe, mens man observerer X,, X,2,, X,n

Detaljer

Seksjon 1.3 Tetthetskurver og normalfordelingen

Seksjon 1.3 Tetthetskurver og normalfordelingen Seksjon 1.3 Tetthetskurver og normalfordelingen Har sett på ulike metoder for å plotte eller oppsummere data Vil nå starte på hvordan beskrive data ved modeller Hovedmetode er tetthetskurver Tetthetskurver

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 9-10 (oversikt): Inferens om én og to populasjoner

ST0202 Statistikk for samfunnsvitere Kapittel 9-10 (oversikt): Inferens om én og to populasjoner ST0202 Statistikk for samfunnsvitere Kapittel 9-10 (oversikt): Inferens om én og to populasjoner Bo Lindqvist Institutt for matematiske fag 2 Inferens med EN populasjon 3 Oppgave: H2002 # 3 I følge Nielsen

Detaljer

Seksjon 1.3 Tetthetskurver og normalfordelingen

Seksjon 1.3 Tetthetskurver og normalfordelingen Seksjon 1.3 Tetthetskurver og normalfordelingen Har sett på ulike metoder for å plotte eller oppsummere data ved tall Vil nå starte på hvordan beskrive data ved modeller Hovedmetode er tetthetskurver Tetthetskurver

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 8: Introduksjon til statistisk inferens

ST0202 Statistikk for samfunnsvitere Kapittel 8: Introduksjon til statistisk inferens ST0202 Statistikk for samfunnsvitere Kapittel 8: Introduksjon til statistisk inferens Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens har som mål å tolke/analysere

Detaljer

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2. Sensurveiledning Ped 3001 h12 Oppgave 1 Er det sammenheng mellom støtte fra venner og selvaktelse hos ungdom? Dette spørsmålet ønsket en forsker å undersøke. Han samlet data på 9. klassingers opplevde

Detaljer

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar 2013. Skrevet av Stian Lydersen 16 januar 2013

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar 2013. Skrevet av Stian Lydersen 16 januar 2013 1 Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar 013. Skrevet av Stian Lydersen 16 januar 013 Vi antar at vårt utvalg er et tilfeldig og representativt utvalg for

Detaljer

Bivariate analyser. Analyse av sammenhengen mellom to variabler. H 0 : Ingen sammenheng H 1 : Sammenheng

Bivariate analyser. Analyse av sammenhengen mellom to variabler. H 0 : Ingen sammenheng H 1 : Sammenheng Bivariate analyser Analyse av sammenhengen mellom to variabler H : Ingen sammenheng H 1 : Sammenheng Hvis den ene variabelen er kategorisk er en slik analyse det samme som å sammenligne grupper. Ulike

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer. Utvalgsfordelinger Vi har sett at utvalgsfordelinger til en statistikk (observator) er fordelingen av verdiene statistikken tar ved mange gjenttatte utvalg av samme størrelse fra samme populasjon. Utvalg

Detaljer

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6) TMA4245 Statistikk Vår 212 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving 4 blokk II Løsningsskisse Oppgave 1 4 personer spurt. Hvis mellom 22 og 26 personer svarer

Detaljer

Kort overblikk over kurset sålangt

Kort overblikk over kurset sålangt Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente

Detaljer

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y Statistiske metoder 1 høsten 004. Løsningsforslag Oppgave 1: a) Begge normalplottene gir punkter som ligger omtrent på ei rett linje så antagelsen om normalfordeling ser ut til å holde. Konfidensintervall

Detaljer

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1 ECON 0 EKSAMEN 004 VÅR SENSORVEILEDNING Oppgaven består av 0 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom

Detaljer

10.1 Enkel lineær regresjon Multippel regresjon

10.1 Enkel lineær regresjon Multippel regresjon Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel

Detaljer

Estimering og hypotesetesting

Estimering og hypotesetesting Kapittel 10 Ett- og toutvalgs hypotesetesting TMA4240 H2006: Eirik Mo 2 Estimering og hypotesetesting Fenomen Bilkjøring Høyden til studenter Spørsmål Hvor stor andel av studentene synes de er flinkere

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 27. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

QED 1 7. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

QED 1 7. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode QED 1 7 Matematikk for grunnskolelærerutdanningen Bind 2 Fasit kapittel 4 Statistikk og kvantitativ metode Kapittel 4 Oppgave 1 La være antall øyne på terningen. a) Vi får følgende sannsynlighetsfordeling

Detaljer

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - Fornuftig verdi Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.

Detaljer

Frivillig respons utvalg

Frivillig respons utvalg Design av utvalg Andel college-studenter som er konservative? Andel ungdom som ser tv-reklame om ny sportssykkel? Gjennomsnittelig inntekt i en populasjon? Ønsker informasjon om stor populasjon Tid, kostnad:

Detaljer

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

Oppgaver til Studentveiledning 3 MET 3431 Statistikk Oppgaver til Studentveiledning 3 MET 3431 Statistikk 24. april 2012 kl 17.15-20.15 i B2 Handelshøyskolen BI 2 Oppgaver 1. Eksamensoppgaver: Eksamen 01/06/2011: Oppgave 1-7. Eksamensoppgaven fra 06/2011

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 13: Lineær korrelasjons- og regresjonsanalyse Kap. 13.1-13.3: Lineær korrelasjonsanalyse. Disse avsnitt er ikke pensum,

Detaljer

+ S2 Y ) 2. = 6.737 6 (avrundet nedover til nærmeste heltall) n Y 1

+ S2 Y ) 2. = 6.737 6 (avrundet nedover til nærmeste heltall) n Y 1 Løsningsforslag for: MOT10 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 6. november 007 TILLATTE HJELPEMIDLER: Kalkulator: HP0S, Casio FX8 eller TI-0 Tabeller og formler i statistikk (Tapir forlag) MERKNADER:

Detaljer

TMA4240 Statistikk 2014

TMA4240 Statistikk 2014 TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 12, blokk II Oppgave 1 På ein av vegane inn til Trondheim er UP interessert i å måle effekten

Detaljer

Inferens i regresjon

Inferens i regresjon Strategi som er fulgt hittil: Inferens i regresjon Deskriptiv analyse og dataanalyse først. Analyse av en variabel før studie av samvariasjon. Emne for dette kapittel er inferens når det er en respons

Detaljer

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer. Utvalgsfordelinger Vi har sett at utvalgsfordelinger til en observator er fordelingen av verdiene observatoren tar ved mange gjenttatte utvalg av samme størrelse fra samme populasjon. Utvalg er en tilfeldig

Detaljer

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005. SOS112 Kvantitativ metode Krysstabellanalyse (forts.) Forelesningsnotater 9. forelesning høsten 25 4. Statistisk generalisering Per Arne Tufte Eksempel: Hypoteser Eksempel: observerte frekvenser (O) Hvordan

Detaljer

1 10-2: Korrelasjon. 2 10-3: Regresjon

1 10-2: Korrelasjon. 2 10-3: Regresjon 1 10-2: Korrelasjon 2 10-3: Regresjon Example Krysser y-aksen i 1: b 0 = 1 Stiger med 2 hver gang x øker med 1: b 1 = 2 Formelen til linja er derfor y = 1 + 2x Eksempel Example Vi lar fem personer se en

Detaljer

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai 2006. SENSURFRIST: 16. juni 2006. KLASSE: HIS 04 07. TID: kl. 8.00 13.00.

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai 2006. SENSURFRIST: 16. juni 2006. KLASSE: HIS 04 07. TID: kl. 8.00 13.00. KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. BtG207 EKSAMENSDATO: 26. mai 2006. SENSURFRIST: 16. juni 2006. KLASSE: HIS 04 07. TID: kl. 8.00 13.00. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II I denne øvingen skal vi fokusere på hypotesetesting. Vi ønsker å gi dere

Detaljer

Løsningsforslag til obligatorisk oppgave i ECON 2130

Løsningsforslag til obligatorisk oppgave i ECON 2130 Andreas Mhre April 15 Løsningsforslag til obligatorisk oppgave i ECON 13 Oppgave 1: E(XY) = E(X(Z X)) Setter inn Y = Z - X E(XY) = E(XZ X ) E(XY) = E(XZ) E(X ) E(XY) = - E(X ) X og Z er uavhengige, så

Detaljer

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler STK1000 Uke 36, 2016. Studentene forventes å lese Ch 1.4 (+ 3.1-3.3 + 3.5) i læreboka (MMC). Tetthetskurver Eksempel: Drivstofforbruk hos 32 biler Fra histogram til tetthetskurver Anta at vi har kontinuerlige

Detaljer

Estimering og hypotesetesting

Estimering og hypotesetesting Kapittel 10 Ett- og toutvalgs hypotesetesting TMA4245 V2007: Eirik Mo 2 Estimering og hypotesetesting Fenomen Bilkjøring Høyden til studenter Spørsmål Hvor stor andel av studentene synes de er flinkere

Detaljer

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34) ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. s. 34 Oppgave.1 Situasjon betraktes som 7 Bernoulliforsøk; Suksess: dyr velger belønning 1, motsatt fiasko. P suksess = p;

Detaljer

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister. ECON230: EKSAMEN 20 VÅR - UTSATT PRØVE 2 TALLSVAR. Oppgave Da Anne var på besøk i Roma, fikk hun raskt problemer med språket. Anne snakker engelsk, men ikke italiensk, og kun av 5 italienere behersker

Detaljer

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Håvard Rue 73 59 35 20 Håkon Tjelmeland 73 59 35 20 Bjørn Kåre Hegstad 73 59 35 20

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner Bo Lindqvist Institutt for matematiske fag 2 Kapittel 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to

Detaljer

Mer om hypotesetesting

Mer om hypotesetesting Mer om hypotesetesting I underkapittel 36 i læreboka gir vi en kort innføring i tankegangen ved hypotesetesting Vi gir her en grundigere framstilling av temaet Problemstilling Vi forklarer problemstillingen

Detaljer

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger Fordelinger, mer om sentralmål og variasjonsmål Tron Anders Moger 20. april 2005 1 Forrige gang: Så på et eksempel med data over medisinerstudenter Lærte hvordan man skulle få oversikt over dataene ved

Detaljer

Kapittel 4.4: Forventning og varians til stokastiske variable

Kapittel 4.4: Forventning og varians til stokastiske variable Kapittel 4.4: Forventning og varians til stokastiske variable Forventning og varians til stokastiske variable Histogrammer for observerte data: Sannsynlighets-histogrammer og tetthetskurver for stokastiske

Detaljer

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene 1 Sec 3-2: Hvordan beskrive senteret i dataene 2 Sec 3-3: Hvordan beskrive spredningen i dataene Todeling av statistikk Deskriptiv statistikk Oppsummering og beskrivelse av den stikkprøven du har. Statistisk

Detaljer

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode Sensorveiledning: skoleeksamen i SOS1120 - Kvantitativ metode Tirsdag 30. mai 2016 (4 timer) Poenggivning og karakter I del 1 gis det ett poeng for hvert riktige svar. Ubesvart eller feil svar gis 0 poeng.

Detaljer

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 7 Bokmål Faglig kontakt under eksamen: Bo Lindqvist, tlf. 97589418 EKSAMEN ST00 STATISTIKK FOR SAMFUNNSVITERE Torsdag

Detaljer

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio) Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio) Beskrive fordelinger (sentraltendens, variasjon og form): Observasjon y i Sentraltendens

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1000 Innføring i anvendt statistikk Eksamensdag: Onsdag 12. oktober 2016 Tid for eksamen: 10.00 12.00 Oppgavesettet er på

Detaljer

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamen i: ECON30 Statistikk UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamensdag: 03.06.06 Sensur kunngjøres: 4.06.06 Tid for eksamen: kl. 09:00 :00 Oppgavesettet er på 5 sider Tillatte hjelpemidler:

Detaljer

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling Wilcoxon Signed-Rank Test I uke, bruker vi Z test eller t-test for hypotesen H:, og begge tester er basert på forutsetningen om normalfordeling

Detaljer

QED 5 10. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

QED 5 10. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode QED 5 10 Matematikk for grunnskolelærerutdanningen Bind 2 Fasit kapittel 4 Statistikk og kvantitativ metode Kapittel 4 Oppgave 1. La x være antall øyne på terningen. a) Vi får følgende sannsynlighetsfordeling

Detaljer

Skoleeksamen i SOS Kvantitativ metode

Skoleeksamen i SOS Kvantitativ metode Skoleeksamen i SOS1120 - Kvantitativ metode Hjelpemidler Ordbok Alle typer kalkulatorer Tirsdag 30. mai 2017 (4 timer) Lærerbok (det er mulig mulig å ha med en annen, tilsvarende pensumbok, som erstatning

Detaljer

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002 Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002 Oppgave 1 a) En god estimator er forventningsrett og har liten varians. Vi tester forventningsretthet: E[ˆµ] E[Y ] µ E[ µ] E[ 1 2 X + 1 2 Y ] 1 2 E[X]

Detaljer

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1 ECON 130 EKSAMEN 005 VÅR SENSORVEILEDNING Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom , Oppgave 1 I denne oppgaven kan du anta at

Detaljer

b) Hva er sannsynligheten for at re tilfeldig utvalgte bilmotorer alle har en levetid på minst 17 år?

b) Hva er sannsynligheten for at re tilfeldig utvalgte bilmotorer alle har en levetid på minst 17 år? Oppgave 1 Levetiden T til en bestemt type bilmotor er normalfordelt med forventning µ = 15 år og standardavvik σ = 3 år. a) Vis at sannsynligheten for at en tilfeldig utvalgt bilmotor har en levetid på

Detaljer

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 = 3.6080.

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 = 3.6080. EKSAMEN I: MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 28. FEBRUAR 2005 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV 4 OPPGAVER PÅ

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger Intro til hypotesetesting Analyse av kontinuerlige data 21. april 2005 Tron Anders Moger Seksjon for medisinsk statistikk, UIO 1 Repetisjon fra i går: Normalfordelingen Variasjon i målinger kan ofte beskrives

Detaljer

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 21. april Bjørn H. Auestad Oppsummering våren

Detaljer

1 8-1: Oversikt. 2 8-2: Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

1 8-1: Oversikt. 2 8-2: Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet 1 8-1: Oversikt 2 8-2: Grunnleggende hypotesetesting 3 Section 8-3: Å teste påstander om andeler 4 Section 8-5: Teste en påstand om gjennomsnittet Definisjoner Hypotese En hypotese er en påstand om noe

Detaljer

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Deleksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 10. oktober 2012. Tid for eksamen: 15:00 17:00. Oppgavesettet

Detaljer

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG AVDELING FOR MAT- OG MEDISINSK TEKNOLOGI Matteknologisk utdanning Kandidatnr: Eksamensdato:

Detaljer

b) i) Finn sannsynligheten for at nøyaktig 2 av 120 slike firmaer går konkurs.

b) i) Finn sannsynligheten for at nøyaktig 2 av 120 slike firmaer går konkurs. Eksamen i: MET 040 Statistikk for økonomer Eksamensdag: 31 Mai 2007 Tid for eksamen: 09.00-13.00 Oppgavesettet er på 4 sider. Tillatte hjelpemidler: Alle trykte eller egenskrevne hjelpemidler og kalkulator.

Detaljer

Oppgaver til Studentveiledning I MET 3431 Statistikk

Oppgaver til Studentveiledning I MET 3431 Statistikk Oppgaver til Studentveiledning I MET 3431 Statistikk 20. mars 2012 kl 17.15-20.15 i B2 Handelshøyskolen BI 2 Oppgaver 1. Konfidensintervaller Vi ser på inntekten til en tilfeldig valgt person (i tusen

Detaljer

Kapittel 4.3: Tilfeldige/stokastiske variable

Kapittel 4.3: Tilfeldige/stokastiske variable Kapittel 4.3: Tilfeldige/stokastiske variable Litt repetisjon: Sannsynlighetsteori Stokastisk forsøk og sannsynlighet Tilfeldig fenomen Individuelle utfall er usikre, men likevel et regulært mønster for

Detaljer

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 12 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK Onsdag

Detaljer

Løsningsforslag Til Statlab 5

Løsningsforslag Til Statlab 5 Løsningsforslag Til Statlab 5 Jimmy Paul September 6, 007 Oppgave 8.1 Vi skal se på ukentlige forbruk av søtsaker blant barn i et visst område. En pilotstudie gir at standardavviket til det ukentige forbruket

Detaljer

Løsningsforlag statistikk, FO242N, AMMT, HiST 2.årskurs, 7. desember 2006 side 1 ( av 8) LØSNINGSFORSLAG

Løsningsforlag statistikk, FO242N, AMMT, HiST 2.årskurs, 7. desember 2006 side 1 ( av 8) LØSNINGSFORSLAG Løsningsforlag statistikk, FO4N, AMMT, HiST.årskurs, 7. desember 006 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG AVDELING FOR MAT- OG MEDISINSK TEKNOLOGI Matteknologisk utdanning Kandidatnr:

Detaljer

(b) På slutten av dagen legger sekretæren inn all innsamlet informasjon i en ny JMP datafil. Hvor mange rader og søyler(kolonner) har datafila?

(b) På slutten av dagen legger sekretæren inn all innsamlet informasjon i en ny JMP datafil. Hvor mange rader og søyler(kolonner) har datafila? Institutt for samfunnsøkonomi Skriftlig eksamen i: MET 34311 Statistikk Eksamensdato: 01.06.11, kl. 09.00-14.00 Tillatte hjelpemidler: Alle + BI-definert eksamenskalkulator : TEXAS INTRUMENTS BA II Plus

Detaljer

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering TMA4245 Statistikk Kapittel 8.1-8.5. Kapittel 9.1-9.3+9.15 Turid.Follestad@math.ntnu.no p.1/21 Har sett

Detaljer

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

Oppgaver til Studentveiledning 4 MET 3431 Statistikk Oppgaver til Studentveiledning 4 MET 3431 Statistikk 8. mai 2012 kl 17.15-20.15 i B2 Handelshøyskolen BI 2 Oppgaver 1. Eksamensoppgaver: Eksamen 22/11/2011: Oppgave 1-7. Eksamensoppgaven fra 11/2011 er

Detaljer

Kapittel 3. Datainnsamling Dataproduksjon

Kapittel 3. Datainnsamling Dataproduksjon Kapittel 3 Datainnsamling Dataproduksjon Produsere/samle data Kap 1: Utforske og analysere gitte data for en variabel ved hjelp av grafer og tall Kap 2: Analysere sammenhenger mellom gitte data for to

Detaljer

Forskningsmetoder i menneske-maskin interaksjon

Forskningsmetoder i menneske-maskin interaksjon Forskningsmetoder i menneske-maskin interaksjon Kapittel 2- Eksperimentell forskning Oversikt Typer atferdsforskning Forskningshypoteser Grunnleggende om eksperimentell forskning Signifikanstesting Begrensninger

Detaljer

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte Hypotesetesting. 10 og fore- Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte for å undersøke hypoteser (påstander) knyttet til parametre i sannsynlighetsfordelinger.

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1110 FASIT. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider. Vedlegg: Tillatte

Detaljer

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl. 10.00-12.00

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl. 10.00-12.00 MASTER I IDRETTSVITENSKAP 2014/2016 Individuell skriftlig eksamen i STA 400- Statistikk Fredag 13. mars 2015 kl. 10.00-12.00 Hjelpemidler: kalkulator Eksamensoppgaven består av 10 sider inkludert forsiden

Detaljer