TMA4240 Statistikk H2010

Like dokumenter
Norske hoppdommere og Janne Ahonen

TMA4240 Statistikk H2010 (22)

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010

(utarbeidet av Mette Langaas), TMA4245 V2007

Foreleses onsdag 13.oktober, 2010

TMA4240 Statistikk H2010

Estimering og hypotesetesting

Estimering og hypotesetesting

TMA4240 Statistikk Høst 2009

Tilfeldig utvalg [8.1] U.i.f. Statistisk inferens. Kapittel 8 og 9

TMA4240 Statistikk Høst 2015

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Hypotesetest: generell fremgangsmåte

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

TMA4245 Statistikk Eksamen desember 2016

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Kp. 9.8 Forskjell mellom to forventninger

TMA4240 Statistikk H2010 (20)

TMA4240 Statistikk Høst 2007

Eksamensoppgave i TMA4240 Statistikk

LØSNINGSFORSLAG ) = Dvs

TMA4240 Statistikk H2010 (19)

TMA4240 Statistikk H2010

TMA4240 Statistikk 2014

TMA4240 Statistikk H2010

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Fasit for tilleggsoppgaver

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Løsningsforslag eksamen 27. februar 2004

TMA4240 Statistikk H2015

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

TMA4240 Statistikk Høst 2016

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

DEL 1 GRUNNLEGGENDE STATISTIKK

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

TMA4245 Statistikk Eksamen desember 2016

Kapittel 2: Hendelser

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

TMA4240 Statistikk Høst 2015

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

HØGSKOLEN I STAVANGER

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

Løsningsforslag oblig 1 STK1110 høsten 2014

TMA4245 Statistikk Eksamen august 2014

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up!

Kap. 6, Kontinuerlege Sannsynsfordelingar

Eksamensoppgåve i TMA4240 Statistikk

TMA4240 Statistikk Høst 2015

Kapittel 9: Estimering

TMA4240 Statistikk Høst 2015

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

TMA4240 Statistikk Høst 2015

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Formelsamling i medisinsk statistikk

STK Oppsummering

Kapittel 10: Hypotesetesting

Kap. 6, Kontinuerlege Sannsynsfordelingar

STK Oppsummering

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

TMA4240 Statistikk Eksamen desember 2015

Kap. 6, Kontinuerlege Sannsynsfordelingar

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Oppgave 1. Kilde SS df M S F Legering Feil Total

i x i

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Løsningsforslag: STK2120-v15.

TMA4240 Statistikk Høst 2018

TMA4240 Statistikk H2017 [15]

Oppgave 14.1 (14.4:1)

Løsning eksamen desember 2016

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren

EKSAMEN I HSTAT1101, 22. NOVEMBER 2018: LØSNINGSFORSLAG. Knut R. Wangen, Innledning

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

HØGSKOLEN I STAVANGER

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Løsningsforslag til oppgaver brukt i STA100

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

EKSAMEN I TMA4240 Statistikk

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Transkript:

TMA4240 Statistikk H2010 9.8: To uvalg (siste del) 9.9: Parvise observasjoner 9.10-9.11: Andelser 9.12: Varians Mette Langaas Foreleses onsdag 20.oktober, 2010

2 Norske hoppdommere og Janne Ahonen Janne Ahonen er en finsk skihopper, som har vunnet hoppuka 5 ganger. Han la opp i 2008, men gjorde et come-back for OL i 2010. Åge Aleksandersen har laget sang om smilet til Ahonen. Men, før OL i 2006 i Torino - så gikk treneren til Janne Ahonen ut i pressen og mente at norske hoppdommere konsekvent gir Janne Ahonen lavere stilkarakterer enn andre dommere. Norsk Regnesentral kikket på tallene fra sesongene 2004-2006 (t.o.m. OL) og fant at de var enig med Ahonens trener. Vi ser på tall fra 36 hopprenn, gjennomsnittlig karakter til Ahonen fra norske dommere og fra internasjonale dommere (ikke norske og finske) Hvordan skal vi regne på dette?

3 To utvalg: estimatorer (REPETISJON) X A 1, X A 2,..., X A n A er et tilfeldig utvalg fra en populasjon som beskrives av en normalfordeling med forventning µ A og varians σ 2 A. X B 1, X B 2,..., X B er et tilfeldig utvalg fra en populasjon som beskrives av en normalfordeling med forventning µ B og varians σ 2 B. Estimator for µ A µ B : ˆµ A ˆµ B = X A X B = 1 na n A i=1 X i A 1 nb j=1 X j B (intuitiv og SME). X A X B er normalfordelt med E(X A X B ) = µ A µ B Var(X A X B ) = σ2 A n A + σ2 B

4 To uavhengige utvalg: konfidensintervall (1 α)100% konfidensintervall for µ A µ B : når σa 2 og σ2 B er kjent: [(x A x B ) ± z α 2 σ 2 A n A + σ2 B ] når σ 2 A = σ2 B = σ2, men ukjente: [(x A x B ) ± t α 2,(n A+ 2)s p når σa 2 og σ2 B er ukjente (ikke like): der [(x A x B ) ± t α 2,ν 1 n A + 1 ] s 2 A n A + s2 B ] (sa 2 ν = /n A + sb 2 /) 2 [(s A 2 /n A) 2 /(n A 1)] + [(s B 2 /) 2 /( 1)]

5 Ahonen: to uavhengige utvalg X A 1, X A 2,..., X A n A er et tilfeldig utvalg fra en populasjon av stilkarakterer til Ahonen fra norske dommere. Antar normalfordelt med forventning µ A og varians σ 2 A = σ2. X B 1, X B 2,..., X B er et tilfeldig utvalg fra en populasjon av stilkarakterer til Ahonen fra internasjonale dommere (ikke norske og finske). Antar normalfordelt med forventning µ B og varians σ 2 B = σ2. Antar A-utvalget er uavhengig av B-utvalget! Lik, men ukjent varians: Estimator S 2 p. Konfidensintervall [(x A x B ) ± t α 2,(n A+ 2)s p 1 n A + 1 ]

6 To utvalg: σa 2 = σ2 B, men ukjente Definer: S 2 A = 1 n A 1 n A i=1 (Xi A X A ) 2 og SB 2 = 1 1 j=1 (X B j X B ) 2 Hvis vi vet at σ 2 A = σ2 B = σ2 så kan vi lage en estimator S 2 p (pooled) basert på summen av kvadratavvikene i de to utvalgene: S 2 p = na 1 n A + 2 [ (Xi A X A ) 2 + i=1 j=1 (X B j X B ) 2 ] = (n A 1)S 2 A + ( 1)S 2 B n A + 2 der X A = 1 n A na i=1 X A i og X B = 1 nb j=1 X B j.

Ahonen-data fra 36 renn

Ahonen-data som differanser fra 36 renn

9 Konfidensintervall for µ A µ B for parvise observasjoner Hvis d og s d er gjennomsnittet og standardavviket til normalfordelte differanser av n par av tilfeldige observasjoner, så er et (1-α)100% konfidensintervall for µ D = µ A µ B d t α 2,(n 1) s d n < µ D < d + t α 2,(n 1) s d n hvor t α 2,(n 1) er verdien i t-fordelingen med n 1 frihetsgrader som har areal α 2 til høyre, dvs. P(T > t α 2,(n 1) ) = α 2. Ser at dette er i tråd med ett utvalg, konfidensintervall for µ: x t α 2,(n 1) s n < µ < x + t α 2,(n 1) s n

10 Konfidensintervall for µ A µ B for parvise observasjoner Hvis d og s d er gjennomsnittet og standardavviket til normalfordelte differanser av n par av tilfeldige observasjoner, så er et (1-α)100% konfidensintervall for µ D = µ A µ B d t α 2,(n 1) s d n < µ D < d + t α 2,(n 1) s d n hvor t α 2,(n 1) er verdien i t-fordelingen med n 1 frihetsgrader som har areal α 2 til høyre, dvs. P(T > t α 2,(n 1) ) = α 2. Ser at dette er i tråd med ett utvalg, konfidensintervall for µ: x t α 2,(n 1) s n < µ < x + t α 2,(n 1) s n

11 9.12: Konfidensintervall for varians La X 1, X 2,..., X n være et tilfeldig utvalg fra en populasjon som beskrives av en normalfordeling med forventning µ og varians σ 2. S 2 = 1 n 1 n i=1 (X i X) 2 er en estimator for σ 2 (forventningsrett, men ikke SME). Størrelsen V = (n 1)S2 σ 2 er kjikvadrat-fordelt med n 1 frihetsgrader.

12 9.12: Konfidensintervall for varians Et (1 α)100% konfidensintervall for σ 2 er (n 1)S 2 χ 2 α 2,(n 1) < σ 2 < (n 1)S 2 χ 2 1 α 2,(n 1) hvor χ 2 α,(n 1) er verdien i kjikvadrat-fordelingen med n 1 2 frihetsgrader som har areal α 2 til høyre, dvs. P(V > χ 2 α,(n 1)) = α 2, og χ2 1 α,(n 1) er verdien i 2 2 kjikvadrat-fordelingen med n 1 frihetsgrader som har areal α 2 til venstre, dvs. P(V < χ 2 1 α,(n 1)) = α 2. 2

13 Studenter og bilkjøring Følgende tabell er tatt fra TMA4240 spørreundersøkelsen i 2010. Her angir n antall studenter i utvalget som hadde sertifikat, og x antall studenter som svarte at de er bedre enn gjennomsnittet av Norges befolkning til å kjøre bil. Tallen i parentes er fra 2006. x n x n Menn 35 (102) 16 (50) 0.46 (0.49) Kvinner 21 (37) 2 (9) 0.10 (0.24) Alle 56 (139) 18 (59) 0.32 (0.42) a) Finn punktestimat og 99% konfidensintervall for andelen av studenter som synes sine kjøreegenskaper er bedre enn gjennomsnittet. b) Finn punktestimat og 99% konfidensintervall for differensen mellom andelen av mannlige studenter og kvinnlige studenter som synes sine kjøreegenskaper er bedre enn gjennomsnittet.

14 Estimering av andel: ett utvalg X er antall suksesser i et binomisk forsøk med parametere antallet n og andelen p. Vi vil estimere p. (n er kjent.) Estimator ˆp = X n (intuitiv og SME). E(ˆp) = p og Var(ˆp) = p(1 p) n. Tilnærmet (1 α)100% konfidensintervall for p (normaltilnærming): ˆp(1 ˆp) [ˆp ± z α ] 2 n

15 Estimering av andel: to utvalg X A er antall suksesser i et binomisk forsøk med parametere antallet n A og andelen p A. X B er antall suksesser i et binomisk forsøk med parametere antallet og andelen p B. Vi vil estimere p A p B. Estimator ˆp A ˆp B = X A n A X B. E(ˆp A ˆp B ) = p A p B og Var(ˆp A ˆp B ) = p A(1 p A ) n A + p B(1 p B ). Tilnærmet (1 α)100% konfidensintervall for p A p B (normaltilnærming): [(ˆp A ˆp B ) ± z α 2 ˆp A (1 ˆp A ) n A + ˆp B(1 ˆp B ) ]

Forsikringsselskapene sluttet i 2006 med å føre detaljert statistikk over kvinner og menns skaderisiko i bil. Da ble det forbudt å gi kvinner og menn forskjellig priser på sin bilforsikring.