Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Størrelse: px
Begynne med side:

Download "Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans"

Transkript

1 Denne uken: kap : Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

2 VG 25/9 2011

3 Statistisk inferens Mål: Trekke konklusjoner fra data Tidligere har vi undersøkt data og trukket uformelle konklusjoner Formell statistisk inferens: Basere konklusjoner på sannsynlighetsberegninger Tar hensyn til usikkerhet/variasjon

4 Tilfeldig plassering av trær? Statistisk analyse: Så mye klustring/sammenklumping (eller enda mer) vil kun skje i 4% av tilfeller med tilfeldig plassering Observert mønster er altså svært usannsynlig med tilfeldig plassering Konkluderer at det er klustring, og ikke tilfeldig plassering

5 Effektiv ny medisin? Gir ny medisin til 20 pasienter, 12 viser bedring av tilstand Gir placebo til 20 andre pasienter, 8 viser bedring av tilstand Er den nye medisinen mer effektiv enn placebo? Kanskje, men en forskjell som den observerte, eller større, mellom resultatene for de to gruppene vil skje i 20% av slike forsøk bare pga tilfeldig variasjon En effekt som så lett kan skje bare ved tilfeldighet er ikke overbevisende nok til å konkludere at den nye medisinen er bedre enn placebo

6 Formell statistisk inferens To viktige metoder Konfidensintervall Signifikanstester Basert på fordeling til observator Krever sannsynlighetsmodell for dataene Statistisk inferens baserer seg på at dataene kommer fra et tilfeldig utvalg eller et randomisert eksperiment Viktig å huske på!

7 Kap. 6: Kjent σ Hensikten i dag er å beskrive tankegangen bak statistisk inferens Vi skal se på noen enkle metoder for statistisk inferens, som krever en urealistisk antagelse: at vi kjenner det teoretiske standardavviket σ Fra og med kap. 7 og utover vil vi se på mer realistiske metoder som kan brukes for de fleste typer av data vi har sett på tidligere

8 SAT-poeng: 6.1 Konfidensintervall Dersom poeng for individene i populasjonen er N(μ,σ)- fordelt, vet vi at gjennomsnittet er N(μ,σ/ n)-fordelt Antar at vi vet at σ=100. For n=500 er da σ/ n= regelen: er i [μ-2σ/ n,μ+2σ/ n] = [μ-9,μ+9] med ca 95% sannsynlighet

9 Konfidensintervall SAT-poeng: Dersom peng for individene i populasjonen er N(μ,σ)-fordelt, vet vi at gjennomsnittet er N(μ,σ/ n)-fordelt Antar at vi vet at σ=100. For n=500 er da σ/ n= regelen: er i [μ-2σ/ n,μ+2σ/ n] = [μ-9,μ+9] med ca 95% sannsynlighet Å si at er 9 poeng fra μ er det samme som å si at μ er 9 poeng fra I 95% av utvalg vil den sanne verdien av μ ligge i intervallet [ -9, +9] [ -9, +9] er et 95% konfidensintervall for μ

10 Konfidensintervall: Tolkning SAT-poeng: [ -9, +9] er et 95% konfidensintervall for μ Observerer et utvalg med n=500 der =461 Vi er 95% sikre (confident) på at den ukjente forventningen μ ligger i intervallet [ 461-9, ] = [452, 470] Vi vet ikke om vårt utvalg er et av de 95% av utvalgene som har konfidensintervall som fanger μ, eller om det er et av de 5% av utvalgene som har konfidensintervall som ikke fanger μ Utsagnet «Vi er 95% sikre (confident) på at den ukjente forventningen μ ligger i intervallet [452, 470]» betyr at vi kom frem til dette intervallet ved å bruke en metode som gir korrekt resultat i 95% av tilfellene

11 25 utvalg gir 25 forskjellige konfidensintervall, ett dekker ikke μ. Dersom vi tok veldig mange slike utvalg vil 95% av dem gi intervall som dekker den ukjente parameteren μ

12 Konfidensintervall og konfidensnivå Man kan velge konfidensnivået, 99, 95 og 90 % er det vanligste. I SAT-eksempelet var 95%-intervallet ± 9 Generelt konfidensintervall: Estimat ± feilmargin Estimat: Senter i intervall Feilmargin: Presisjon av estimat Feilmarginen avhenger av konfidensnivå regelen: er i [μ-3σ,μ+3σ] med ca 99.7% sannsynlighet

13 Konfidensintervall og konfidensnivå Generelt konfidensintervall: Estimat ± feilmargin Estimat: Senter i intervall Feilmarginen avhenger av konfidensnivå regel: er i [μ-3σ,μ+3σ] med 99.7% sannsynlighet er i [μ-3σ,μ+3σ] er ekvivalent med at μ er i [ -3σ, +3σ] μ i [ -3σ, +3σ] i 99.7% av utvalg [ -3σ, +3σ] er et 99.7% konfidensintervall for μ Høyere konfidensnivå gir større intervall (større feilmargin) Konfidensnivå C (95/99.7): Sannsynlighet for at intervallet inneholder sann parameter

14 Konfidensnivå for forventning Normalfordelte data: x er eksakt N(μ,σ/ n)-fordelt Sentralgrenseteorem for store utvalg: x er tilnærmet N(μ,σ/ n)- fordelt Vi så at vi kunne finne et omtrentlig konfidensintervall for μ ved å bruke regelen Skal nå se hvordan vi lager mer presise konfidensintervall for μ Må starte med å finne feilmarginene for et bestemt konfidensnivå C Går veien om standard normalfordeling: Da kan vi finne generelle feilmarginer som alltid kan brukes for konfidensnivå C når gjennomsnittet x er normalfordelt

15 Konfidensnivå for forventning Når Z er N(0,1)-fordelt: Velg z* slik at arealet under kurven mellom -z* og z* er C, dvs P(-z*<Z <z*)=c For tre verdier av C (fra nederste rad i Table D):

16 Konfidensintervall x er N(μ,σ/ n)-fordelt, dvs (x -μ)/(σ/ n) er N(0,1)-fordelt Fant z* slik at P(-z*<Z <z*)=c når Z er N(0,1)-fordelt P(-z* < (x -μ)/(σ/ n) < z*) = C P(-z*σ/ n < x -μ< z*σ/ n) = C P( x-z*σ/ n < μ < x +z*σ/ n) = C Konfidensintervall for μ med nivå C: [x-z*σ/ n, x+z*σ/ n] Feilmargin m=z*σ/ n

17

18 Konfidensintervall: Eksempel I en undersøkelse ble et utvalg på 1280 tidligere studenter spurt om hvor stort studielån de hadde Gjennomsnittet x var $18900 og standardavviket s var $49000 Klart skjev fordeling, men pga stort utvalg er x tilnærmet normalfordelt Ukjent teoretisk populasjons-standardavvik σ, men later som om det er kjent lik det observerte standardavviket s, dvs x er tilnærmet N(μ,σ/ 1280)-fordelt, med σ=$ Ønsker å lage et 95%-konfidensintervall for den ukjente forventningen μ Vet at z*=1.960 for C=95%

19 Konfidensintervall: Eksempel I en undersøkelse ble et utvalg på 1280 tidligere studenter spurt om hvor stort studielån de hadde x er tilnærmet N(μ,σ)-fordelt, med σ=$49000 Vet at z*=1.960 for C=95% Feilmarginen er m=z*σ/ n=1.960*49000/ 1280=2684, avrunder til m=2700 (fordi x er angitt i hele $100) 95%-konfidensintervall for den ukjente forventningen μ er x +/- m = $ /- $2700 = $[16200, 21600] Vi er 95% sikre på at den ukjente forventningen μ ligger mellom $16200 og $21600

20 Generell form Konfidensintervall [x -z*σ/ n, x +z*σ/ n] Generell formel for utvalgsestimater som er normalfordelte (eller tilnærmet normalfordelte)

21 Hvordan oppfører konfidensintervallene seg? Feilmargin m=z*σ/ n Avhenger av z* (som avhenger av C): Kan redusere m med mindre C Typisk C=95% (90% og 99% brukes også) σ: Kan redusere m med data med mindre variasjon n: Kan redusere m med flere målinger

22 Betydning av C (z*) 99% og 95% konfidensintervaller for samme utvalsgsstørrelsen (n=1280)

23 Betydning av n 95% konfidensintervall for to ulike verdier av utvalsgsstørrelsen n (later som om studielånsundersøkelsen var gjort for et utvalg på n=320 istedet for de virkelige n=1280)

24 Valg av utvalgsstørrelse Design av eksperiment med bestemt feilmargin m: Ønsker feilmargin m med konfidens C C gir deg verdien av z* Velg utvalgsstørrelse n slik at m=z*σ/ n Det vil si velg n=(z*σ/m) 2 Eksempel:

25 Noen forsiktighetsregler Data bør være fra et enkelt randomisert utvalg (SRS) av populasjonen Viktig med uavhengige observasjoner fra populasjonen Andre, korrigerte formler for mer kompliserte design Følsomt for uteliggere Lite robust for små n (bør ha n>15) når data ikke er normalfordelte Må kjenne σ. Senere skal vi se på hva vi gjør når σ er ukjent Hvis n stor, kan vi bruke [x -z*s/ n, x +z*s/ n] (som da er et tilnærmet konfidensintervall for μ)

26 6.2 Signifikanstester Konfidensintervaller er nyttige når vi ønsker å estimere en populasjonsparameter Signifikanstester er nyttige dersom vi ønsker å teste en hypotese om en parameter i en populasjon Bruker observerte data til å teste hypotesen om populasjonen Typisk prosedyre Beregn sannsynlighet for observert utfall av observator (eller noe mer ekstremt) gitt antatt hypotese Hvis sannsynlighet liten, forkast hypotese

27 Eksempel studietlån Gjennomsnittlig studielån: x 1 =$21200 ved private college x 2 =$17100 ved offentlige college Forskjell $4100, reell eller tilfeldig? P(Forskjell mellom x 1 og x , gitt at det ikke er noen forskjell mellom forventningene i populasjonen) =0.17 Ganske høy sannsynlighet, altså ikke så veldig overraskende resultat, data gir ikke grunnlag for å påstå at det er forskjeller i lånenivå

28

29 Eksempel studielån Gjennomsnittlig studielån Forskjell $7500 i 1997 er x 1 =$11400 i 2002 er x 2 =$18900 P(Forskjell mellom x 1 og x , gitt at det ikke er noen forskjell mellom forventningene i populasjonen) = Data gir grunnlag for å forkaste hypotese om at det ikke er forskjeller i lånenivå

30

31 Hovedtrinn Spørsmål: Forskjell mellom nivåer (forventninger) Ser om data er kompatibel med hypotesen om at det ikke er noen forskjell Hvis ikke overraskende forskjell (eks. sanns. 0.17) Ikke grunnlag i data for å påstå at det er en forskjell Hvis overraskende stor forskjell (eks. sanns ) Forkast antagelse om ingen forskjell

32 Hypoteser Null-hypotese H 0 Påstand som ønskes testet Typisk: Ingen effekt / ingen forskjell Eks. H 0 : μ = μ 1 μ 2 = 0, eventuelt μ 1 = μ 2 Signifikanstest Designet for å angi bevisstyrke mot H 0 Alternativ hypotese H a Det er en effekt / forskjell Eks. H a : μ 0 eventuelt μ 1 μ 2 NB: Hypoteser er alltid utsagn/antagelser om populasjoner (eller modeller), ikke et spesielt utfall. Derfor må H 0 og H a alltid formuleres utifra de ukjente populasjonsparametrene

33 Hypoteser Fordi H a utrykker effekten vi ønsker å finne ut om er tilstede, er det lurt å starte med å formulere H a og deretter sette opp H 0 som utsagnet om at den ønskede effekten ikke er tilstede Å formulere H a er ofte den vanskeligste oppgaven. Spesielt er det ofte ikke opplagt om denne skal være ensidig (f.eks. H a : μ>0) eller tosidig (f.eks. H a : μ 0) uttrykker om parameteren er forskjellig fra nullhypotese-verdien i en bestemt retning eller ikke Man får ikke lov til å se på data for å formulere H a (juks!) Dersom man ikke har god begrunnelse på forhånd om retning på effekten, skal man velge tosidig H a.

34 Baserer test på en observator som estimerer parameteren vi er interessert i (ofte den samme som vi ville brukt til et konfidensintervall for parameteren) Eks.: x 1 -x 2 estimerer μ = μ 1 -μ 2 Testobservator Verdier langt fra parameterverdi spesifisert av H 0 gir bevis mot H 0 H a angir hvilken retning som teller: Ensidig H a : μ 1 >μ 2 angir at vi må ha stor x 1 -x 2 som bevis mot H 0 Ensidig H a : μ 1 <μ 2 angir at vi må ha liten x 1 -x 2 som bevis mot H 0 Tosidig H a : μ μ 2 angir at vi må ha stor x 1 -x 2 som bevis mot H 0

35 Standardisert test-observator For å undersøke hvor langt estimatet er fra parameterverdien spesifisert av H 0, standardiserer vi estimatet

36 Eksempel studielån Forskjell på de ukjente, sanne forventningene til størrelse på lån ved private og offentlige college? H 0 : Det er ingen forskjell i de sanne forventningene H a : Det er en forskjell i de sanne forventningene Dvs: H 0 : μ 1 = μ 2 mot H a :μ 1 μ 2 (tosidig alternativ) H 0 : μ 1 - μ 2 =0 mot H a :μ 1 -μ 2 0 Estimat for μ 1 - μ 2 : x 1-x 2 (= 4100) Store verdier av både positive og negative forskjeller, dvs store verdier av absolouttverdien x 1-x 2 teller som bevis mot H 0. Her: σ x 1-x 2 =3000 (skal se senere hvordan denne beregnes) Standardiserer (gitt μ 1 - μ 2 =0): z=(4100-0)/3000 = 1.37

37 Signifikanstest: P-verdi P-verdi: Sannsynligheten for at et utfall er like ekstremt eller mer ekstremt enn faktisk utfall (beregnet ved å anta at parameterverdien gitt av H 0 er sann) Ekstremt: Lang fra hva vi ville forvente hvis H 0 var sann. Retning på hva som regnes som ekstremt: Bestemmes av H a og H 0 Liten P-verdi: Sterkt bevis mot H 0

38 Eksempel studielån Forskjell mellom private og offentlige college? H 0 : μ 1 - μ 2 =0 mot H a :μ 1 -μ 2 0 Estimat for μ 1 - μ 2 : x 1-x 2 (= 4100) Ekstremt: Langt fra hva vi ville forvente hvis H 0 var sann, dvs både positive og negative forskjeller like store eller større enn observert verdi av x 1 -x 2, dvs like store eller større enn observert verdi av absolouttverdien x 1 -x 2 Standardiserer: z=(4100-0)/3000 = 1.37 Ekstremt: Like store eller større enn observert verdi av absolouttverdien x 1-x 2, som betyr like store eller større enn observert verdi av z Z tilnærmet N(0,1): P-verdi = P( Z >1.37) = P(Z<-1.37) + P(Z>1.37) = =

39

40 Hvordan konkludere? Statistisk signifikans Forkaster H 0 når P-verdi er liten nok Signifikansnivå α: Grenseverdi for når vi forkaster Forkaster når P-verdi α Resultatene er signifikante på nivå α (P-verdi α) Ikke grunnlag for å forkaste når P-verdi>α Typisk: α=0.05 (eller 0.01) Signifikant betyr at bevisene mot nullhypotesen oppfyller standarden satt av α. Typisk utsagn er «Resultatene er signifikante (P < 0.05)»

41 Signifikanstest 1. Formuler H 0 og H a 2. Beregn test-observator 3. Finn P-verdi 4. Formuler en konklusjon NB: Bruker ofte datamaskin til å finne P-verdi, men en datamaskin Kan ikke formulere H 0 og H a Kan ikke tolke P-verdien for deg Kan ikke bedømme om forutsetningene for å bruke testen er oppfylt

42 Eksempel studielån Forskjell mellom private og offentlige college? H 0 : μ 1 - μ 2 =0 mot H a :μ 1 -μ 2 0 Estimat for μ 1 - μ 2 : x 1-x 2 (= 4100) Standardiserer: z=(4100-0)/3000 = 1.37 Z tilnærmet N(0,1): P-verdi = P( Z >1.37) = P(Z<-1.37) + P(Z>1.37) = = Eksempel på tolkning og konklusjon: Det er 17% sjanse for å observere en forskjell like ekstrem eller mer ekstrem som den observerte forskjellen på $4100 hvis den sanne populasjons-forskjellen mellom forventningene er 0. P-verdien sier oss altså at det observerte utfallet ikke er spesielt ekstremt. Vi kan si at de observerte dataene ikke gir grunnlag for å konkludere at det er en forskjell i forventet studielån mellom private og offentlige skoler

43 Eksempel studielån Økning i størrelsen på studielån fra 1997 til 2002? H 0 : μ 2 - μ 1 =0 mot ensidig H a :μ 2 -μ 1 >0, Estimat for μ 2 - μ 1 : x 2-x 1 (= 7500) Her: σ x 1-x 2 =1900 (skal se senere hvordan denne beregnes) Standardiserer: z=(7500-0)/3000 = 3.95 Z tilnærmet N(0,1): P-verdi = P(Z> 3.95) = Eksempel på tolkning og konklusjon: Det er en 4 til sjanse for å observere en forskjell like stor eller større som den observerte forskjellen på $7500 hvis den sanne populasjonsforskjellen mellom forventningene er 0. P-verdien sier oss altså at det observerte utfallet er ekstremt sjeldent. Vi konkluderer at de observerte dataene gir grunnlag for å konkludere at nullhypotesen er feil. Dataene viser tydelig at forventet studielån har økt mellom 1997 og 2002 (P<0.001)

44 Tester for populasjonsforventning H 0 :μ=μ 0 Data: x 1,...,x n Estimator for μ: x Testobservator: z=(x - μ 0 )/σ x =(x - μ 0 )/(σ n)

45

46 Eksempel: Blodtrykk National Center for Health Statistics rapporterer: Blodtrykk menn (alder 35-44) har μ=128, σ=15 Bedriftslege ønsker å undersøke: Har mannlige toppledere (alder 35-44) i bedriften annerledes forventet blodtrykk enn den generelle populasjonen av menn på samme alder? Målinger av blodtrykket til 72 toppledere x = Bedriftslegen har ingen grunn til å anta noen retning på forskjellen H 0 :μ=128, H a :μ 128 z=( )/(15/ 72)=-1.09 P-verdi = 2P(Z )= 2P(Z 1.09) = 2(1-P(Z <1.09) ) = 2( )=0.2758

47

48 Eksempel: Blodtrykk P-verdi = Tolkning og konklusjon: Et SRS med n=27 fra den den generelle populasjonen av menn på samme alder vil 27% av gangene gi et gjennomsnittlig blodtrykk like langt eller lenger fra 128 som det observerte x= Den observerte x gir altså ikke bevis for at topplederene er annerledes enn andre menn på samme alder. Ingen grunn til å forkaste H 0

49 To-sidige tester og konfidensintervall Konfidensintervall med konfidens C: [x -z*σ/ n, x +z*σ/ n] Verdier av μ utenfor intervall er ikke kompatible med data Mulig test-prosedyre: Forkaste H 0 hvis μ 0 ikke i konfidensintervall

50 Kan vises: Ekvivalent med signifikanstest En tosidig signifikanstest med nivå α som forkaster H 0 :μ=μ 0 er ekvivalent med at μ 0 faller utenfor konfidensintervallet for μ med nivå C=(1-α)% Noen ganger enklere å konstruere konfidensintervaller

51 Eksempel: To-sidige tester og konfidensintervall Analyse av konsentrasjonen av farmasøytisk produkt. Ikke presis målemetode, repeterte analyser av samme prøve vil gi litt forskjellig svar.konsentrasjon N(μ,σ=0.0068)-fordelt Laboratoriet har blitt spurt om å evaluere en påstand om at konsentrasjonen i en prøve er 0.86% H 0 :μ=0.86 H a : μ 0.86 Tre målinger av prøven ga resultatene , og x = z=( )/(0.0068/ 3)=-4.99 P=2P(Z> ) <

52 Eksempel: To-sidige tester og konfidensintervall Analyse av konsentrasjonen av farmasøytisk produkt. Ikke presis målemetode, repeterte analyser av samme prøve vil gi litt forskjellig svar.konsentrasjon N(μ,σ=0.0068)-fordelt Laboratoriet har blitt spurt om å evaluere en påstand om at konsentrasjonen i en prøve er 0.86% H 0 :μ=0.86 H a : μ 0.86 Tre målinger av prøven ga resultatene , og x = z=( )/(0.0068/ 3)= %-konfidensintervall (C=99% gir z*=2.576): x +/- z*σ/ n = [0.8303,0.8505]

53

54 P-verdier mot fast nivå α To mulige måter å rapportere: Hvis P-verdi < α, H 0 er forkastet på nivå α Angi P-verdi direkte Testing farmasøytisk produkt: Konsentrasjon N(μ,σ=0.0068) H 0 :μ=0.86 H a : μ 0.86 Observasjoner , , x = z=( )/(0.0068/ 3)=-4.99 P=2P(Z> )= Signifikant på 0.05 nivå, 0.01 nivå, nivå P-verdi: Laveste signifikansnivå som gir forkastning.

55

56 6.3 Bruk og misbruk av tester Utføre test enkelt (software) Bruke test vanskeligere Kun gyldig under visse forutsetninger Konfidensnivå: Ingen klar grense, vanlig å rapportere P-verdi Forkastning H 0 : Forskjell statistisk signifikant Forskjell kan være liten (hvis n stor) Ingen forkastning behøver ikke bety H 0 er sann Ofte mulig å gjøre mange mulige tester P-verdi relatert til å gjøre en test Hvis mange tester må justeringer gjøres

57 Testing av korrelasjon To variable, H 0 : Ingen korrelasjon 400 observasjoner, r=0.1 Statistisk signifikant med α=0.05 Variasjon forklart av annen variabel: r 2 =0.01

58 Hiv-behandling Behandlingsgruppe og kontrollgruppe Insidensrateforhold I: Forhold mellom rate i behandlingsgruppe i forhold til kontrollgruppe H 0 : I=1 95% konfidensintervall [0.63,1.58] Ikke nok data til å konkludere Kan både gi forbedringer og forverre!

59 Genomiske eksperimenter Ønsker å finne gen som forklarer sykdom Mange titusener mulige gener Kan utføre test på hvert gen tester, α=0.05 Forventer 500 tester vil være signifikante kun pga. tilfeldigheter! Forskning: Hvordan behandle mange tester simultant

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner

Detaljer

6.2 Signifikanstester

6.2 Signifikanstester 6.2 Signifikanstester Konfidensintervaller er nyttige når vi ønsker å estimere en populasjonsparameter Signifikanstester er nyttige dersom vi ønsker å teste en hypotese om en parameter i en populasjon

Detaljer

Verdens statistikk-dag.

Verdens statistikk-dag. Verdens statistikk-dag http://unstats.un.org/unsd/wsd/ Signifikanstester Ønsker å teste hypotese om populasjon Bruker data til å teste hypotese Typisk prosedyre Beregn sannsynlighet for utfall av observator

Detaljer

Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner

Detaljer

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån. http://unstats.un.org/unsd/wsd/

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån. http://unstats.un.org/unsd/wsd/ Verdens statistikk-dag http://unstats.un.org/unsd/wsd/ Signifikanstester Ønsker å teste hypotese om populasjon Bruker data til å teste hypotese Typisk prosedyre Beregn sannsynlighet for utfall av observator

Detaljer

Introduksjon til inferens

Introduksjon til inferens Introduksjon til inferens Hittil: Populasjon der verdien til et individ/enhet beskrives med en fordeling. Her inngår vanligvis ukjente parametre, μ, p,... Enkelt tilfeldig utvalg (SRS), observator p =

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Å analysere en utvalgsobservator for å trekke slutninger

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Analysere en observator for å finne ut noe om korresponderende

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig

Detaljer

Kapittel 7: Inferens for forventningerukjent standardavvik

Kapittel 7: Inferens for forventningerukjent standardavvik Kapittel 7: Inferens for forventningerukjent standardavvik 7.1: Inferens for forventningen i en populasjon 7.2: Inferens for å sammenligne to forventninger 7.1 Inferens for forventningen i en populasjon

Detaljer

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen gir testobservatoren t mer spredning enn testobservatoren

Detaljer

Inferens i fordelinger

Inferens i fordelinger Inferens i fordelinger Modifiserer antagelsen om at standardavviket i populasjonen σ er kjent Mer kompleks systematisk del ( her forventningen i populasjonen). Skal se på en situasjon der populasjonsfordelingen

Detaljer

Kapittel 3: Studieopplegg

Kapittel 3: Studieopplegg Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere

Detaljer

Kapittel 9 og 10: Hypotesetesting

Kapittel 9 og 10: Hypotesetesting Kapittel 9 og 1: Hypotesetesting Hypotesetesting er en standard vitenskapelig fremgangsmåte for å sjekke påstander. Generell problemstilling: Basert på informasjonen i data fra et tilfeldig utvalg ønsker

Detaljer

Hypotesetesting. mot. mot. mot. ˆ x

Hypotesetesting. mot. mot. mot. ˆ x Kapittel 6.4-6.5: ypotesetesting ypotesetesting er en standard vitenskapelig fremgangsmåte for å sjekke påstander. Generell problemstilling: Basert på informasjonen i data fra et tilfeldig utvalg ønsker

Detaljer

I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen I dag Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen Inferens for forventningen 4l en populasjon (7.1) Kapi@el 6: En antagelse om kjent standardavvik s i populasjonen

Detaljer

Statistikk og dataanalyse

Statistikk og dataanalyse Njål Foldnes, Steffen Grønneberg og Gudmund Horn Hermansen Statistikk og dataanalyse En moderne innføring Kapitteloversikt del 1 INTRODUKSJON TIL STATISTIKK Kapittel 1 Populasjon og utvalg 19 Kapittel

Detaljer

Econ 2130 uke 16 (HG)

Econ 2130 uke 16 (HG) Econ 213 uke 16 (HG) Hypotesetesting I Løvås: 6.4.1 6, 6.5.1-2 1 Testing av µ i uid modellen (situasjon I Z-test ). Grunnbegreper. Eksempel. En lege står overfor følgende problemstilling. Standardbehandling

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis

Detaljer

TMA4240 Statistikk H2010 (20)

TMA4240 Statistikk H2010 (20) TMA4240 Statistikk H2010 (20) 10.5: Ett normalfordelt utvalg, kjent varians (repetisjon) 10.4: P-verdi 10.6: Konfidensintervall vs. hypotesetest 10.7: Ett normalfordelt utvalg, ukjent varians Mette Langaas

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp. ÅMA Sannsynlighetsregning med statistikk, våren 8 Kp. 6 Hypotesetesting Hypotesetesting (kp. 6) Tre deler av faget/kurset:. Beskrivende statistikk. Sannsynlighetsteori, sannsynlighetsregning 3. Statistisk

Detaljer

Utvalgsfordelinger (Kapittel 5)

Utvalgsfordelinger (Kapittel 5) Utvalgsfordelinger (Kapittel 5) Oversikt pensum, fortid og fremtid Eksplorativ data-analyse (Kap 1, 2) Hvordan produsere data (Kap 3) Sannsynlighetsteori (Kap 4) Utvalgsfordelinger til observatorer (Kap

Detaljer

Kapittel 7: Inferens for forventningerukjent standardavvik

Kapittel 7: Inferens for forventningerukjent standardavvik Kapittel 7: Inferens for forventningerukjent standardavvik 7.1: Inferens for forventningen i en populasjon 7.: Inferens for å sammenligne to forventninger 7.1 Inferens for forventningen i en populasjon

Detaljer

Kapittel 9 og 10: Hypotesetesting

Kapittel 9 og 10: Hypotesetesting Kapittel 9 og 1: ypotesetesting ypotesetesting er en standard vitenskapelig fremgangsmåte for å sjekke påstander. Generell problemstilling: Basert på informasjonen i data fra et tilfeldig utvalg ønsker

Detaljer

Hypotesetesting av λ og p. p verdi.

Hypotesetesting av λ og p. p verdi. Forelesning 7, kapittel 6 Hypotesetesting av λ og p. p verdi. Det som gjøres i denne forelesningen er nær opptil det vi gjorde da vi konstruerte z test for µ, og styrkefunksjon for denne. I tillegg til

Detaljer

i x i

i x i TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 11, blokk II Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale

Detaljer

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf: Hypotesetesting Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf: 22 400 400 www.aschehoug.no 1 Oversikt Sannsynlighetsregning og statistikk

Detaljer

TMA4240 Statistikk H2010 (19)

TMA4240 Statistikk H2010 (19) TMA4240 Statistikk H2010 (19) Hypotesetesting 10.1-10.3: Generelt om statistiske hypoteser 10.5: Ett normalfordelt utvalg Mette Langaas Foreleses mandag 25.oktober, 2010 2 Estimering og hypotesetesting

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ... ÅMA Sannsynlighetsregning med statistikk, våren 6 Kp. 6 (kp. 6)... Begrep: nullhypotese alternativhypotese ensidig, tosidig teststørrelse (testobservator) nullfordeling kritisk verdi, forkastningsområde

Detaljer

Fasit for tilleggsoppgaver

Fasit for tilleggsoppgaver Fasit for tilleggsoppgaver Uke 5 Oppgave: Gitt en rekke med observasjoner x i (i = 1,, 3,, n), definerer vi variansen til x i som gjennomsnittlig kvadratavvik fra gjennomsnittet, m.a.o. Var(x i ) = (x

Detaljer

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2. Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Det er to populasjoner som vi ønsker å sammenligne. Vi trekker da et utvalg

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Inferens om varians og standardavvik for ett normalfordelt utvalg (9.4) Inferens om variansen til en normalfordelt populasjon

Detaljer

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk ÅMA Sannsynlighetsregning med statistikk, våren 2 Kp. 6 Hypotesetesting Hypotesetesting (kp. 6) Tre deler av faget/kurset:. Beskrivende statistikk 2. Sannsynlighetsteori, sannsynlighetsregning 3. Statistisk

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 11 Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale begreper

Detaljer

TMA4240 Statistikk H2010 (22)

TMA4240 Statistikk H2010 (22) TMA4240 Statistikk H2010 (22) 10.11-10.12: Testing av andelser 10.13: Testing av varians i ett N utvalg Mette Langaas Foreleses onsdag 3.november, 2010 2 Laban strakk seg ikke lenger, men smaker den bedre?

Detaljer

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere 2 Inferens om varians og standardavvik for ett normalfordelt utvalg (9.4) Inferens om variansen til en normalfordelt populasjon bruker kjikvadrat-fordelingen ( chi-square distribution ) (der kji er den

Detaljer

Utvalgsfordelinger (Kapittel 5)

Utvalgsfordelinger (Kapittel 5) Utvalgsfordelinger (Kapittel 5) Observator En observator er en funksjon av data for mange individer, for eksempel Gjennomsnitt Andel Stigningstall i regresjonslinje En observator er en tilfeldig variabel

Detaljer

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper Bo Lindqvist Institutt for matematiske fag 2 Kapittel 8: Sammenligning av grupper Situasjon: Vi ønsker

Detaljer

7.2 Sammenligning av to forventinger

7.2 Sammenligning av to forventinger 7.2 Sammenligning av to forventinger To-utvalgs z-observator To-utvalgs t-prosedyrer To-utvalgs t-tester To-utvalgs t-konfidensintervall Robusthet To-utvalgs t-prosedyrerår variansene er like Sammenlikning

Detaljer

Kapittel 10: Hypotesetesting

Kapittel 10: Hypotesetesting Kapittel 10: Hypotesetesting TMA445 Statistikk 10.1, 10., 10.3: Introduksjon, 10.5, 10.6, 10.7: Test for µ i normalfordeling, 10.4: p-verdi Turid.Follestad@math.ntnu.no p.1/19 Estimering og hypotesetesting

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon Bo Lindqvist Institutt for matematiske fag 2 Kap. 9: Inferens om én populasjon Statistisk inferens har som mål å tolke/analysere

Detaljer

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis μ 1 og μ. Vi trekker da ett utvalg fra hver populasjon. ST00 Statistikk for

Detaljer

Seksjon 1.3 Tetthetskurver og normalfordelingen

Seksjon 1.3 Tetthetskurver og normalfordelingen Seksjon 1.3 Tetthetskurver og normalfordelingen Har sett på ulike metoder for å plotte eller oppsummere data Vil nå starte på hvordan beskrive data ved modeller Hovedmetode er tetthetskurver Tetthetskurver

Detaljer

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0 Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir

Detaljer

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x Multiple regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable.det er fortsatt en responsvariabel. Måten dette gjøre på er nokså naturlig. Prediktoren

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Fra første forelesning: Populasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg En delmengde av

Detaljer

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må OPPGAVEHEFTE I STK000 TIL KAPITTEL 7 Regneoppgaver til kapittel 7 Oppgave Anta at man har resultatet av et randomisert forsøk med to grupper, og observerer fra gruppe, mens man observerer X,, X,2,, X,n

Detaljer

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Høst 2007 TMA4240 Statistikk Høst 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b4 Løsningsskisse Oppgave 1 Eksamen juni 1999, oppgave 3 av 3 a) µ populasjonsgjennomsnitt,

Detaljer

Seksjon 1.3 Tetthetskurver og normalfordelingen

Seksjon 1.3 Tetthetskurver og normalfordelingen Seksjon 1.3 Tetthetskurver og normalfordelingen Har sett på ulike metoder for å plotte eller oppsummere data ved tall Vil nå starte på hvordan beskrive data ved modeller Hovedmetode er tetthetskurver Tetthetskurver

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 9-10 (oversikt): Inferens om én og to populasjoner

ST0202 Statistikk for samfunnsvitere Kapittel 9-10 (oversikt): Inferens om én og to populasjoner ST0202 Statistikk for samfunnsvitere Kapittel 9-10 (oversikt): Inferens om én og to populasjoner Bo Lindqvist Institutt for matematiske fag 2 Inferens med EN populasjon 3 Oppgave: H2002 # 3 I følge Nielsen

Detaljer

Hypotesetest: generell fremgangsmåte

Hypotesetest: generell fremgangsmåte TMA4240 Statistikk H2010 (21) 10.8, 10.10: To normalfordelte utvalg 10.9: Teststyrke og antall observasjoner Mette Langaas Foreleses mandag 1.november, 2010 2 Hypotesetest: generell fremgangsmåte Generell

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Kapittel 7: Utvalgsfordeling Bo Lindqvist Institutt for matematiske fag 2 Fra kapittel 1: Populasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg

Detaljer

Fra første forelesning:

Fra første forelesning: 2 Fra første forelesning: ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag opulasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg En delmengde av populasjonen

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 8: Introduksjon til statistisk inferens

ST0202 Statistikk for samfunnsvitere Kapittel 8: Introduksjon til statistisk inferens ST0202 Statistikk for samfunnsvitere Kapittel 8: Introduksjon til statistisk inferens Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens har som mål å tolke/analysere

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 9: Inferens om én populasjon I Kapittel 8 brukte vi observatoren z = x µ σ/ n for å trekke konklusjoner om µ. Dette

Detaljer

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2. Sensurveiledning Ped 3001 h12 Oppgave 1 Er det sammenheng mellom støtte fra venner og selvaktelse hos ungdom? Dette spørsmålet ønsket en forsker å undersøke. Han samlet data på 9. klassingers opplevde

Detaljer

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som: Hypotesetesting. 10 og fore- Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte for å undersøke hypoteser (påstander) knyttet til parametre i sannsynlighetsfordelinger.

Detaljer

β(µ) = P(akseptere H 1 µ)

β(µ) = P(akseptere H 1 µ) Sentrale begreper for hypotesetesting Begrep Nullhypotesen H 0 Definisjon/forklaring Utrykker "status quo"/"situation normal"/"ting er slik produsenter påstår"/"alt er greit" Signifikansnivå α Sannsynligheten

Detaljer

estimert verdi ± feilmargin = X ± et visst antall standardavvik for snittet = X ± u α/2 σ n

estimert verdi ± feilmargin = X ± et visst antall standardavvik for snittet = X ± u α/2 σ n 5.4:Konfidensintervall (fra sist) Konfidensintervall for et gjennomsnitt µ: estimert verdi ± feilmargin = X ± et visst antall standardavvik for snittet = X ± u α/2 σ n u α/2 kalles en kvantil for standard

Detaljer

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar 2013. Skrevet av Stian Lydersen 16 januar 2013

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar 2013. Skrevet av Stian Lydersen 16 januar 2013 1 Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar 013. Skrevet av Stian Lydersen 16 januar 013 Vi antar at vårt utvalg er et tilfeldig og representativt utvalg for

Detaljer

Forkaste H 0 "Stikkprøven er unormal" Akseptere H 0 "Stikkprøven er innafor normalen" k kritisk verdi. Utgangspunkt for H 0

Forkaste H 0 Stikkprøven er unormal Akseptere H 0 Stikkprøven er innafor normalen k kritisk verdi. Utgangspunkt for H 0 * 6.2. Hypotesetest i normalfordeling med kjent σ v.h.a. kritisk verdi (fra i går) Overordnet mål med hypotesetest i normalfordeling: vurdere en påstand om µ ("er den påståtte verdien for µ riktig, eller

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 3. april Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer. Utvalgsfordelinger Vi har sett at utvalgsfordelinger til en statistikk (observator) er fordelingen av verdiene statistikken tar ved mange gjenttatte utvalg av samme størrelse fra samme populasjon. Utvalg

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6) TMA4245 Statistikk Vår 212 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving 4 blokk II Løsningsskisse Oppgave 1 4 personer spurt. Hvis mellom 22 og 26 personer svarer

Detaljer

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2009 TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b5 Løsningsskisse Oppgave 1 Vi ønsker å finne ut om et nytt serum kan stanse leukemi.

Detaljer

Kort overblikk over kurset sålangt

Kort overblikk over kurset sålangt Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente

Detaljer

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2 ECON30: EKSAMEN 06v SENSORVEILEDNING. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i

Detaljer

Bivariate analyser. Analyse av sammenhengen mellom to variabler. H 0 : Ingen sammenheng H 1 : Sammenheng

Bivariate analyser. Analyse av sammenhengen mellom to variabler. H 0 : Ingen sammenheng H 1 : Sammenheng Bivariate analyser Analyse av sammenhengen mellom to variabler H : Ingen sammenheng H 1 : Sammenheng Hvis den ene variabelen er kategorisk er en slik analyse det samme som å sammenligne grupper. Ulike

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Sara Martino a, Torstein Fjeldstad b Tlf: a 994 03 330, b 962 09 710 Eksamensdato: 28. november 2018 Eksamenstid

Detaljer

Kan vi stole på resultater fra «liten N»?

Kan vi stole på resultater fra «liten N»? Kan vi stole på resultater fra «liten N»? Olav M. Kvalheim Universitetet i Bergen Plan for dette foredraget Hypotesetesting og p-verdier for å undersøke en variabel p-verdier når det er mange variabler

Detaljer

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.

Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt. Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: H 0 : µ = µ 0 H 1 : µ < µ 0 eller µ > µ 0 Signifikanssannsynlighet p Angir sannsynligheten for å få en X som er

Detaljer

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2 Besvar alle oppgavene. Hver deloppgave har lik vekt. Oppgave I En kommune skal bygge ny idrettshall og vurderer to entreprenører, A og B. Begge gir samme pristilbud, men kommunen er bekymret for forsinkelser.

Detaljer

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y Statistiske metoder 1 høsten 004. Løsningsforslag Oppgave 1: a) Begge normalplottene gir punkter som ligger omtrent på ei rett linje så antagelsen om normalfordeling ser ut til å holde. Konfidensintervall

Detaljer

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER EKSAMEN I: MOT0 STATISTISKE METODER VARIGHET: TIMER DATO:. NOVEMBER 00 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV OPPGAVER PÅ 7 SIDER HØGSKOLEN

Detaljer

Frivillig respons utvalg

Frivillig respons utvalg Design av utvalg Andel college-studenter som er konservative? Andel ungdom som ser tv-reklame om ny sportssykkel? Gjennomsnittelig inntekt i en populasjon? Ønsker informasjon om stor populasjon Tid, kostnad:

Detaljer

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind Forelesning 6: Punktestimering, usikkerhet i estimering Jo Thori Lind j.t.lind@econ.uio.no Oversikt 1. Trekke utvalg 2. Estimatorer og observatorer som stokastiske variable 3. Egenskapene til en estimator

Detaljer

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned. EKSAMENSOPPGAVE, bokmål Institutt: IKBM Eksamen i: STAT100 STATISTIKK Tid: 29. mai 2012 09.00-12.30 (3.5 timer) Emneansvarlig: Trygve Almøy (Tlf: 95141344) Tillatte hjelpemidler: C3: alle typer kalkulator,

Detaljer

Notat 3 - ST februar 2005

Notat 3 - ST februar 2005 Notat 3 - ST1301 1. februar 2005 1 Simulering fra modell Når vi skal analysere et gitt konkret innsamlet datasett vil vi gjøre dette med utgangspunkt i en statistisk modell. Vi kan si at en slik statistisk

Detaljer

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting

H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting Hypotesetesting H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Rettsvesen hypotese Tiltalte er uskyldig inntil det motsatte er bevist. Hypoteser H 0 : Tiltalte er uskyldig H 1 :

Detaljer

10.1 Enkel lineær regresjon Multippel regresjon

10.1 Enkel lineær regresjon Multippel regresjon Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel

Detaljer

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - Fornuftig verdi Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.

Detaljer

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1 ECON 0 EKSAMEN 004 VÅR SENSORVEILEDNING Oppgaven består av 0 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

Estimering og hypotesetesting

Estimering og hypotesetesting Kapittel 10 Ett- og toutvalgs hypotesetesting TMA4240 H2006: Eirik Mo 2 Estimering og hypotesetesting Fenomen Bilkjøring Høyden til studenter Spørsmål Hvor stor andel av studentene synes de er flinkere

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 27. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II I denne øvingen skal vi fokusere på hypotesetesting. Vi ønsker å gi dere

Detaljer

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER HØGSKOLEN I STAVANGER Avdeling for TEKNISK NATURVITEN- EKSAMEN I: TE199 SANNSYNLIGHETSREGNING MED STATISTIKK SKAPELIGE FAG VARIGHET: 4 TIMER DATO: 5. JUNI 2003 TILLATTE HJELPEMIDLER: KALKULATOR OPPGAVESETTET

Detaljer

Oppgaver til Studentveiledning 3 MET 3431 Statistikk

Oppgaver til Studentveiledning 3 MET 3431 Statistikk Oppgaver til Studentveiledning 3 MET 3431 Statistikk 24. april 2012 kl 17.15-20.15 i B2 Handelshøyskolen BI 2 Oppgaver 1. Eksamensoppgaver: Eksamen 01/06/2011: Oppgave 1-7. Eksamensoppgaven fra 06/2011

Detaljer

+ S2 Y ) 2. = 6.737 6 (avrundet nedover til nærmeste heltall) n Y 1

+ S2 Y ) 2. = 6.737 6 (avrundet nedover til nærmeste heltall) n Y 1 Løsningsforslag for: MOT10 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 6. november 007 TILLATTE HJELPEMIDLER: Kalkulator: HP0S, Casio FX8 eller TI-0 Tabeller og formler i statistikk (Tapir forlag) MERKNADER:

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 13: Lineær korrelasjons- og regresjonsanalyse Kap. 13.1-13.3: Lineær korrelasjonsanalyse. Disse avsnitt er ikke pensum,

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må

Detaljer

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010 TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må

Detaljer

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer. Utvalgsfordelinger Vi har sett at utvalgsfordelinger til en observator er fordelingen av verdiene observatoren tar ved mange gjenttatte utvalg av samme størrelse fra samme populasjon. Utvalg er en tilfeldig

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland a, Sara Martino b Tlf: a 48 22 18 96, b 99 40 33 30 Eksamensdato: 30. november 2017 Eksamenstid

Detaljer

Inferens i regresjon

Inferens i regresjon Strategi som er fulgt hittil: Inferens i regresjon Deskriptiv analyse og dataanalyse først. Analyse av en variabel før studie av samvariasjon. Emne for dette kapittel er inferens når det er en respons

Detaljer