Norske hoppdommere og Janne Ahonen

Like dokumenter
TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 (22)

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010

(utarbeidet av Mette Langaas), TMA4245 V2007

Foreleses onsdag 13.oktober, 2010

TMA4240 Statistikk H2010

Estimering og hypotesetesting

Estimering og hypotesetesting

TMA4240 Statistikk Høst 2009

Tilfeldig utvalg [8.1] U.i.f. Statistisk inferens. Kapittel 8 og 9

TMA4240 Statistikk Høst 2015

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Kp. 9.8 Forskjell mellom to forventninger

Hypotesetest: generell fremgangsmåte

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

TMA4245 Statistikk Eksamen desember 2016

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

TMA4240 Statistikk H2010 (20)

TMA4240 Statistikk H2010

TMA4240 Statistikk Høst 2007

Løsningsforslag eksamen 27. februar 2004

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk H2010 (19)

TMA4240 Statistikk H2010

TMA4240 Statistikk 2014

LØSNINGSFORSLAG ) = Dvs

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Fasit for tilleggsoppgaver

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

TMA4240 Statistikk H2015

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

TMA4240 Statistikk Høst 2016

DEL 1 GRUNNLEGGENDE STATISTIKK

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

HØGSKOLEN I STAVANGER

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

TMA4240 Statistikk Høst 2015

TMA4245 Statistikk Eksamen desember 2016

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Kapittel 2: Hendelser

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Kapittel 9: Estimering

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Oppgave 1. Kilde SS df M S F Legering Feil Total

Løsningsforslag oblig 1 STK1110 høsten 2014

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

TMA4245 Statistikk Eksamen august 2014

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Om eksamen. Never, never, never give up!

Eksamensoppgåve i TMA4240 Statistikk

TMA4240 Statistikk Høst 2015

Oppgave 14.1 (14.4:1)

Kap. 6, Kontinuerlege Sannsynsfordelingar

Om eksamen. Never, never, never give up!

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Formelsamling i medisinsk statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Kapittel 10: Hypotesetesting

STK Oppsummering

STK Oppsummering

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Kap. 6, Kontinuerlege Sannsynsfordelingar

TMA4240 Statistikk Eksamen desember 2015

Kap. 6, Kontinuerlege Sannsynsfordelingar

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Eksamensoppgåve i ST1201/ST6201 Statistiske metoder

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

i x i

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Løsningsforslag: STK2120-v15.

TMA4240 Statistikk Høst 2018

TMA4240 Statistikk H2017 [15]

Løsning eksamen desember 2016

Eksamensoppgåve i ST0103 Brukarkurs i statistikk

TMA4240 Statistikk Høst 2016

EKSAMEN I HSTAT1101, 22. NOVEMBER 2018: LØSNINGSFORSLAG. Knut R. Wangen, Innledning

ÅMA110 Sannsynlighetsregning med statistikk, våren

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Løsningsforslag til oppgaver brukt i STA100

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

HØGSKOLEN I STAVANGER

UNIVERSITETET I OSLO

EKSAMEN I TMA4240 Statistikk

Transkript:

TMA440 Statistikk H010 9.8: To uvalg (siste del) 9.9: Parvise observasjoner 9.10-9.11: Andelser 9.1: Varians Mette Langaas Foreleses onsdag 0.oktober, 010 Norske hoppdommere og Janne Ahonen Janne Ahonen er en finsk skihopper, som har vunnet hoppuka 5 ganger. Han la opp i 008, men gjorde et come-back for OL i 010. Åge Aleksandersen har laget sang om smilet til Ahonen. Men, før OL i 006 i Torino - så gikk treneren til Janne Ahonen ut i pressen og mente at norske hoppdommere konsekvent gir Janne Ahonen lavere stilkarakterer enn andre dommere. Norsk Regnesentral kikket på tallene fra sesongene 004-006 (t.o.m. OL) og fant at de var enig med Ahonens trener. Vi ser på tall fra 36 hopprenn, gjennomsnittlig karakter til Ahonen fra norske dommere og fra internasjonale dommere (ikke norske og finske) Hvordan skal vi regne på dette?

3 To utvalg: estimatorer (REPETISJON) X A 1, X A,..., X A er et tilfeldig utvalg fra en populasjon som beskrives av en normalfordeling med forventning µ A og varians σ A. X B 1, X B,..., X B er et tilfeldig utvalg fra en populasjon som beskrives av en normalfordeling med forventning µ B og varians σ B. Estimator for µ A µ B : ˆµ A ˆµ B = X A X B = 1 na i=1 X i A 1 nb j=1 X j B X A X B er normalfordelt med E(X A X B ) = µ A µ B Var(X A X B ) = σ A + σ B (intuitiv og SME). 4 To uavhengige utvalg: konfidensintervall (1 α)100% konfidensintervall for µ A µ B : når σ A og σ B er kjent: [(x A x B ) ± z α σ A + σ B når σ A = σ B = σ, men ukjente: [(x A x B ) ± t α,(+ )s p 1 + 1 når σ A og σ B der er ukjente (ikke like): s [(x A x B ) ± t α,ν A + s B ν = (s A / + s B /) [(s A /) /( 1) + [(s B /) /( 1)

5 Ahonen: to uavhengige utvalg X A 1, X A,..., X A er et tilfeldig utvalg fra en populasjon av stilkarakterer til Ahonen fra norske dommere. Antar normalfordelt med forventning µ A og varians σ A = σ. X B 1, X B,..., X B er et tilfeldig utvalg fra en populasjon av stilkarakterer til Ahonen fra internasjonale dommere (ikke norske og finske). Antar normalfordelt med forventning µ B og varians σ B = σ. Antar A-utvalget er uavhengig av B-utvalget! Lik, men ukjent varians: Estimator S p. Konfidensintervall [(x A x B ) ± t α,(+ )s p 1 + 1 6 To utvalg: σa = σ B, men ukjente Definer: S A = 1 1 i=1 (Xi A X A ) og SB = 1 1 j=1 (X B j X B ) Hvis vi vet at σ A = σ B = σ så kan vi lage en estimator S p (pooled) basert på summen av kvadratavvikene i de to utvalgene: S p = na 1 + [ (Xi A X A ) + i=1 j=1 (X B j X B ) = ( 1)S A + ( 1)S B + der X A = 1 na i=1 X A i og X B = 1 nb j=1 X B j.

Ahonen-data fra 36 renn Ahonen-data som differanser fra 36 renn

9 Konfidensintervall for µ A µ B for parvise observasjoner Hvis d og s d er gjennomsnittet og standardavviket til normalfordelte differanser av n par av tilfeldige observasjoner, så er et (1-α)100% konfidensintervall for µ D = µ A µ B d t α,(n 1) s d n < µ D < d + t α,(n 1) s d n hvor t α,(n 1) er verdien i t-fordelingen med n 1 frihetsgrader som har areal α til høyre, dvs. P(T > t α,(n 1) ) = α. Ser at dette er i tråd med ett utvalg, konfidensintervall for µ: x t α,(n 1) s n < µ < x + t α,(n 1) s n 10 Konfidensintervall for µ A µ B for parvise observasjoner Hvis d og s d er gjennomsnittet og standardavviket til normalfordelte differanser av n par av tilfeldige observasjoner, så er et (1-α)100% konfidensintervall for µ D = µ A µ B d t α,(n 1) s d n < µ D < d + t α,(n 1) s d n hvor t α,(n 1) er verdien i t-fordelingen med n 1 frihetsgrader som har areal α til høyre, dvs. P(T > t α,(n 1) ) = α. Ser at dette er i tråd med ett utvalg, konfidensintervall for µ: x t α,(n 1) s n < µ < x + t α,(n 1) s n

11 9.1: Konfidensintervall for varians La X 1, X,..., X n være et tilfeldig utvalg fra en populasjon som beskrives av en normalfordeling med forventning µ og varians σ. S = 1 n 1 n i=1 (X i X) er en estimator for σ (forventningsrett, men ikke SME). Størrelsen V = (n 1)S σ er kjikvadrat-fordelt med n 1 frihetsgrader. 1 9.1: Konfidensintervall for varians Et (1 α)100% konfidensintervall for σ er (n 1)S χ α,(n 1) < σ < (n 1)S χ 1 α,(n 1) hvor χ α,(n 1) er verdien i kjikvadrat-fordelingen med n 1 frihetsgrader som har areal α til høyre, dvs. P(V > χ α,(n 1)) = α, og χ 1 α,(n 1) er verdien i kjikvadrat-fordelingen med n 1 frihetsgrader som har areal α til venstre, dvs. P(V < χ 1 α,(n 1)) = α.

13 Studenter og bilkjøring Følgende tabell er tatt fra TMA440 spørreundersøkelsen i 010. Her angir n antall studenter i utvalget som hadde sertifikat, og x antall studenter som svarte at de er bedre enn gjennomsnittet av Norges befolkning til å kjøre bil. Tallen i parentes er fra 006. x n x n Menn 35 (10) 16 (50) 0.46 (0.49) Kvinner 1 (37) (9) 0.10 (0.4) Alle 56 (139) 18 (59) 0.3 (0.4) a) Finn punktestimat og 99% konfidensintervall for andelen av studenter som synes sine kjøreegenskaper er bedre enn gjennomsnittet. b) Finn punktestimat og 99% konfidensintervall for differensen mellom andelen av mannlige studenter og kvinnlige studenter som synes sine kjøreegenskaper er bedre enn gjennomsnittet. 14 Estimering av andel: ett utvalg X er antall suksesser i et binomisk forsøk med parametere antallet n og andelen p. Vi vil estimere p. (n er kjent.) Estimator ˆp = X n (intuitiv og SME). E(ˆp) = p og Var(ˆp) = p(1 p) n. Tilnærmet (1 α)100% konfidensintervall for p (normaltilnærming): ˆp(1 ˆp) [ˆp ± z α n

15 Estimering av andel: to utvalg X A er antall suksesser i et binomisk forsøk med parametere antallet og andelen p A. X B er antall suksesser i et binomisk forsøk med parametere antallet og andelen p B. Vi vil estimere p A p B. Estimator ˆp A ˆp B = X A X B. E(ˆp A ˆp B ) = p A p B og Var(ˆp A ˆp B ) = p A(1 p A ) + p B(1 p B ). Tilnærmet (1 α)100% konfidensintervall for p A p B (normaltilnærming): [(ˆp A ˆp B ) ± z α ˆp A (1 ˆp A ) + ˆp B (1 ˆp B )

Forsikringsselskapene sluttet i 006 med å føre detaljert statistikk over kvinner og menns skaderisiko i bil. Da ble det forbudt å gi kvinner og menn forskjellig priser på sin bilforsikring.