Fasit for tilleggsoppgaver

Like dokumenter
TMA4240 Statistikk Høst 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

TMA4245 Statistikk Eksamen desember 2016

HØGSKOLEN I STAVANGER

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk 2014

Kapittel 2: Hendelser

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

TMA4240 Statistikk Høst 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

TMA4240 Statistikk Høst 2016

i x i

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

Løsningsforslag, eksamen statistikk, juni 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

ÅMA110 Sannsynlighetsregning med statistikk, våren

TMA4240 Statistikk Høst 2009

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

ÅMA 110 SANNSYNLIGHETSREGNING MED STATISTIKK Løsningsforslag til regneøving nr. 12 (s. 34)

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

SFB LØSNING PÅ EKSAMEN HØSTEN 2018

Løsning eksamen desember 2017

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

TMA4245 Statistikk Eksamen desember 2016

Econ 2130 uke 16 (HG)

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Eksamen desember 2015

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Eksamensoppgave i TMA4240 Statistikk

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

TMA4240 Statistikk H2010 (20)

Kapittel 3: Studieopplegg

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

HØGSKOLEN I STAVANGER

TMA4240 Statistikk H2010

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

LØSNINGSFORSLAG ) = Dvs

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Løsningsforslag statistikkeksamen desember 2014

ÅMA 110 (TE 199) Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2005, s. 1. Oppgave 1

Kp. 9.8 Forskjell mellom to forventninger

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Inferens i fordelinger

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

ST0202 Statistikk for samfunnsvitere

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Eksamensoppgave i ST0103 Brukerkurs i statistikk

ST0202 Statistikk for samfunnsvitere

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Løsning eksamen desember 2016

Om eksamen. Never, never, never give up!

TMA4240 Statistikk H2010

Norske hoppdommere og Janne Ahonen

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Om eksamen. Never, never, never give up!

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Kapittel 9 og 10: Hypotesetesting

TMA4240 Statistikk H2010 (22)

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Høst 2015

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

Utvalgsfordelinger (Kapittel 5)

Løsningsforslag eksamen 27. februar 2004

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

Introduksjon til inferens

Forelening 1, kapittel 4 Stokastiske variable

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 10. juni Ingeniørutdanning. TID: kl EMNEANSVARLIG: Hans Petter Hornæs

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

UNIVERSITETET I OSLO

Verdens statistikk-dag.

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

Eksamensoppgave i TMA4240 Statistikk

FORMELSAMLING TIL STK1100 OG STK1110

HØGSKOLEN I STAVANGER

Formelsamling i medisinsk statistikk

TMA4245 Statistikk Eksamen august 2014

DEL 1 GRUNNLEGGENDE STATISTIKK

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

ST0202 Statistikk for samfunnsvitere

Transkript:

Fasit for tilleggsoppgaver Uke 5 Oppgave: Gitt en rekke med observasjoner x i (i = 1,, 3,, n), definerer vi variansen til x i som gjennomsnittlig kvadratavvik fra gjennomsnittet, m.a.o. Var(x i ) = (x n 1 i x ), der x er gjennomsnittsverdi av alle x i ene. Vis at variansen også kan beregnes på følgende måte 1 Var(x i ) = [ (x n 1 i ) n(x ) ] 1 n i=1. n Svar: i=1 (x i x ) = (x i ) x x i + (x ) = (x i ) n(x ) + n(x ) = (x i ) n(x ). n i=1 Uke 7 Oppgave: Vis at ( n k ) = ( n n k ) ; Svar: følger umiddelbart fra definisjonen av ( n k ). Oppgave: vis også at ( n k ) = (n 1 k ) + (n 1 k 1 ). Svar: se Imai s. 86. Uke 10 Oppgave: Et prosjekt består av 4 uavhengige delprosjekter, som alle har normalfordelte varigheter. Prosjektene er nummerert fra 1 til 4, og utføres etter hverandre i denne rekkefølgen. Delprosjektene har forventningsverdi hhv. 4, 5, 7 og 9 dager og standardavvik 1 dag. La Y være prosjektets total varighet. Hvilken sannsynlighetsfordeling har Y? Finn E(Y) og Var (Y). Finn P(Y 0). Svar: siden alle delprosjektene har normalfordelte varigheter, er også Y normalfordelt. Den har forventning 4+5+7+9= 5 dager, varians 1+1+1+1 = 4 dager (p.g.a. uavhengighet) og standardavvik lik dager. Dermed blir P(Y 0) = P( Y 5 1 ) = 1 (0,5 + 0,4938) = 0,006. 0 5 ) = P(Z 1 ) = P(Z 1 ) = 1 P(Z

Uke 1 Oppgave 1.1 En stokastisk variabel Y er binomisk fordelt, Y ~ bin(90, 0.4). Finn en tilnærmet verdi for P(Y 39) ved å bruke Normaltilnærmingen uten og med heltallskorreksjon. Den eksakte verdien er lik 0.6435. Sammenlign med dine resultater og kommenter. Svar: Uten heltallskorreksjon: Y har forventning 90*0,4 = 37,8 og standardavvik lik (90*0,4*(1-0,4) = 4,68. Definer en normalfordelt stokastisk variabel X som har samme forventning og samme standardavvik som Y. Nå blir P(Y 39) P(X 39) = P(Z 39 37,8 ) = P(Z 0,56) = 0,5 + 0,106 = 0,606. 4,68 En god del lavere enn den sanne verdien (0,6435). Med heltallskorreksjon («continuity correction»; se Yakir 8.3.): P(Y 39) = P(X 39 1 ) = P(Z 391 37,8 ) = P(Z 0,363) = 0,5 + 0,1406 = 0,6406. Bra tilnærming. 4,68 Generelt: når Y er en diskret s.v. med utfallsrom {0,1,,3, } og X er en kontinuerlig s.v. med samme forventning og varians som X, kan vi skrive P(Y k) P(X k + 1 ) og P(Y < k) P(X k 1 ). Oppgave 1. Et vareparti ankommer i to containere med hhv. 300 og 700 enheter i hver. Vi undersøker 30 enheter i den første containeren og finner at X 1 er defekte. Vi sjekker 70 enheter i den andre og finner at X er defekte. Hvilken av de følgende estimatorene for defektandelen p er best? p 1 = X 1+X 100, p = 3X 1+7X. 580 Svar: siden E(X 1) = 30p og E(X ) = 70p, finner vi at E(p 1) = p. 30p + 70p 100 = p og at E(p ) = 3.30p + 7.70p Dessuten er Var(X 1) = 30p(1-p) og Var(X ) = 70p(1-p). Dermed blir Var(p 1) = 10 4 (Var(X 1 + X )) = 10 4 (30p(1 p) + 70p(1 p)), fordi X 1 og X kan betraktes som uavhengige. M.a.o. Var(p 1) = 0,01p(1 p). På samme måte Var(p ) = (Var(3X 1 + 7X )/580 ) = (9.30p(1 p) + 49.70p(1 p)/580 ) = 0,011p(1 p). Begge estimatorene er forventningsrette, men p 1 har (marginalt) lavere varians, slik at den er til å foretrekke. 580 =

Oppgave 1.3. I et løp deltar det N løpere med startnummer merket fra 1 til og med N. Røde Kors må behandle seks tilfeldige personer. De har startnummer 67, 3, 15, 83, 59 og 41. Finn en estimator for N. Tips: La X n være det største av n tilfeldig valgte nummer fra 1 t.o.m. N. Det kan vises at E(X n ) = n(n+1) n+1. Svar: estimatoren N for N må være en funksjon av X n. Den enkleste funksjonen er en lineær funksjon. Anta at N = a + bx n, og finn verdiene til a og b. Et naturlig krav er at estimatoren er forventningsrett for N. Det betyr at E(N ) = E(a + bx n ) = a + b n(n+1) = N. Med andre ord n+1 a(n + 1) + bn(n + 1) = N(n + 1), som også kan skrives som (bn (n + 1))N = a(n + 1) bn. Denne likheten må gjelde for alle verdier av N. (NB N X n) Det kan bare være riktig når bn (n+1) =0, og samtidig a(n+1) bn = 0. Løsningen er b = (n+1)/n, og a = -1. Dermed finner vi at en forventningsrett estimator for N er N = n+1 X n n 1. Vårt estimat blir (7/6).83 1 = 95,83 = 96 løpere. Oppgave 1.4 Vi har n tilfeldig trukne observasjoner X 1 X n fra en populasjon med ukjent varians σ. Vis at estimatoren S = 1 n (X n 1 i=1 i X ) er forventningsrett for σ. Svar: først trenger vi tre andre resultater, nemlig (i) i=1 (x i x ) = (x i ) n(x ) ; se tilleggsoppgave uke 5; (ii) for enhver stokastisk variabel T med forventning μ T og standardavvik σ T gjelder det at E(T ) = σ T + μ T ; se også Imai (6.35); (iii) Var(X ) = σ /n; Imai (6.43). E(S ) = E((X i) ) ne(x ) n 1 = n(σ + μ ) n(σ /n + μ ) n 1 n = (σ X + μ X ) n (σ X + μ X ) n 1 = σ. Bruk (i) ved første likhetstegn, (ii) ved andre likhetstegn, og (iii) ved tredje likhetstegn.

Uke 14 Oppgave 14.1 Vi har seks tilfeldig trukne observasjoner fra en underliggende normalfordeling med ukjent forventning μ og ukjent varians σ. Finn et 95% konfidensintervall for μ basert på observasjonene 31, 3, 30, 31, 9, 30. Tips: Variansen σ er ukjent, og må estimeres. Bruk derfor formel for konfidensintervall basert på Student t fordeling («T-intervall»); se Yakir avsnitt 11.3.1, Imai avsnitt 7.1.6. Svar: estimatene for μ og σ er hhv 30,5 og 1,049. Et 95% KI for μ blir da 30,5 +/-,571*1,049/( 6), eller [9,4, 31,6], der,571 er t 0,05 med 5 frihetsgrader. Oppgave 14. Dataene i oppgave 14.1 betraktes som en pilotstudie for å estimere standardavviket til normalfordelingen. Nå skal du planlegge en større undersøkelse hvor det kreves at konfidensintervallet for μ skal ha lengde mindre enn L = 0.. Hvor mange observasjoner trenger du? Tips: nå kan du anta at variansen er kjent, og at den er lik estimatet fra oppgave 14.1. Dermed kan du konstruere et Z-intervall (Yakir 11..1, Imai 7.1.3). Svar: et 95% KI (Z-intervall) for μ blir nå 30,5 +/- 1,96*1,049/( n) 0,0, der 1,96 er z 0,05. Dermed blir n 4,7 eller n minst 43 observasjoner. Oppgave 14.3 For en aksje har man observert følgende årlige avkastninger År 001 00 003 004 005 006 007 008 009 Avkastning 7.3 % 8. % 0.3 % -1.5 % 3.6 % 5.5 % 7.8 % 6. % 5. % Anta normalfordelt avkastning. Beregn et 95% konfidensintervall for forventningsverdien μ og for standardavviket σ. Svar: estimatene for μ og σ er hhv 4,733% og 3,368%. Et 95% KI for μ (T-intervall) blir (t 0,05=,306 for 8 frihetsgrader) 4,733 +/-,306*3,368/ 9 = [,144, 7,3]. En estimator for σ er S = 1 n (X n 1 i=1 i X ), se Yakir 11.3.. Den er forventningsrett (oppgave 1.4). Når målingene er normalfordelte, har (n-1)s /σ en kji-kvadrat-fordeling med n-1 frihetsgrader. P(Χ 0,975 (n-1)s /σ Χ 0,05 ), der Χ 0,05 og Χ 0,975 er hhv,5% og 97,5% kvantilene i kji-kvadratfordelingen med n-1 frihetsgrader. Med 8 frihetsgrader blir Χ 0,975 =,180 og Χ 0,05 = 17,535. Et 95% KI for σ er [5,176, 41,633]. Et 95% KI for σ er [ 5,176, 41,633] = [,75, 6,45].

Uke 15 15.1 Vi bruker t-fordelingen når vi konstruerer et konfidensintervall for forventningen til en normalfordeling med ukjent varians σ. Anta en konfidensgrad lik 95%. Bruk tabellene for normalfordelingen og t-fordelingen på semestersiden og vis at vi trenger flere enn 30 observasjoner for å kunne se bort fra t-fordelingen, og bruke normalfordelingen i stedet. Svar: sjekk i t-tabellen, kolonne for konfidensgrad = 95%, at t 0,05 nærmer seg 1,96 = z 0,05 når antall frihetsgrader øker, men at den er,04 selv med 30 frihetsgrader (= 31 observasjoner). 15. Bruk tallene fra tilleggsoppgave 14.3. Test nullhypotesen at avkastningen er 6%. Bruk et signifikansnivå lik 5%. Svar: Her er det snakk om en to-sidig T-test. H 0: μ = 6% vs H 1: μ 6%. Fra oppg 14.3: utvalgets gjennomsnitt er 4,733%, standardavvik er 3,368%, n = 9. Testobservator T = (4,733-6)/(3,368/ 9) = -1,18. T = 1,18 < t 0,05 for 8 frihetsgrader, som er,306. Kan ikke forkaste H 0. Dataene gir ikke tilstrekkelig grunn til å påstå at forventet avkastning ikke er 6%. Kritiske verdier k 1 og k gir samme konklusjon: k 1, = μ 0 +/- t 0,05(8)*S/ n = 6 +/-,306*3,368/3. k 1 = 3,41, k =8,59. Observert verdi (4,733%) ligger innenfor intervallet [k 1, k ], slik at vi ikke kan forkaste H 0. 15.3 Bruk tallene fra tilleggsoppgave 14.1. Test nullhypotesen at μ 30, med et signifikansnivå lik 5%. Svar: En-sidig T-test. H 0: μ = 30 vs H 1: μ > 30. Fra oppg 14.1: utvalgets gjennomsnitt er 30,5, standardavvik er 1,049, n = 6. Testobservator T = (30,5 30)/(1,049/ 6) = 1,168. Denne verdien er mindre enn t 0,05(5) =,015, slik at vi ikke kan forkaste H 0. Vi finner samme konklusjon når vi bruker kritisk verdi k, eller testens p-verdi. k = 30 +,015.1,049/ 6 = 30,863. Observert gjennomsnitt er mindre enn k ikke forkast H 0. Testens p-verdi kan beregnes fra t p(n-1) = ((x μ 0 )/(s/ n) = 1,168. Tabellen over t-fordeling viser at p må ligge mellom 10 og 5%, som er mye mer enn signifikansnivået (5%). Ikke forkast H 0. Uke 16 16.1 En undersøkelse blant 15 leger viser at 3 av disse var over 65 år. La p være andelen blant alle leger i Norge som er over 65 år. Gir undersøkelsen grunnlag for å påstå at p > 10 %? Velg selv signifikansnivå. Svar: en-sidig test for en ukjent andel p. H 0: p p 0 = 10%, H 1: p > 10%. Antall leger over 65 år i utvalget er s.v. X. X ~ Bin(n,p), E(X) = np, Var(X) = np(1-p). X er tilnærmet normalfordelt med samme forventning og varians. Vi forkaster H 0 for stor nok observert verdi av X. Velger signifikansnivå α lik 5%. Kritisk verdi k: P(X>k H 0 er sann) = 0,05 P(Z > (k-np 0)/ np 0(1- p 0)) = P(Z > (k-15,)/3,699) slik at k = 15, + 1,645.3,699 = 1,85. Forkast H 0. Alternativt kan vi bruke en testobservator (se Yakir 1.4) Z = (X-np 0)/( np 0(1- p 0)) som har observert verdi lik (3-15,)/3,699 =,109, som er mye større enn z α=1,645. Også her er konklusjonen: forkast H 0. Testens p-verdi finner vi fra z p=,109 slik at p blir

0,0174 = 1,7%. NB: X er diskret; med heltallskorreksjon finner vi kritisk verdi k fra P(X>k+0,5 H 0)= α slik at k = 0,785. Samme konklusjon. 16. Et bestemt parti har lenge hatt en oppslutning fra 15% av velgerne. En ny meningsmåling blant 400 personer viser at 7 av disse er tilhengere for partiet. Gir meningsmålingen grunnlag for å påstå at oppslutningen har endret seg? Bruk signifikansnivå lik 5%. Beregn også testens p-verdi. Svar: Antall tilhengere i utvalget X er s.v., binomisk fordelt med n=400 og ukjent p. E(X) = 400p, Var(X) = 400p(1-p). To-sidig hypotesetest: H 0 : p=0,15, H 1: p 0,15. Forkast H 0 når observert X er mye større eller mye mindre enn 400.0,15 = 60. P(X<k 1 eller X>k H 0 er sann) = α, slik at P(X>k H 0 er sann) = α/. Vi finner k = np 0 + z α/ (np 0(1-p 0) = 74. x = 7, ikke forkast H 0. z p/ = (7-60)/7,141 = 1,68. p/=0,0465 og p = 9,3%. 16.3 Finn styrkefunksjonen γ(μ) («power») til testen i oppgave 15.3 for ulike verdier av μ. Du kan anta at σ = 1,049 er kjent slik at det nå er snakk om en Z-test, og at kritisk verdi k = 30,704 (sjekk selv). Svar: γ(μ) er P(forkast H 0) for ulike verdier av μ, som er P(X > k) for ulike verdier av μ. M.a.o. vi må beregne 1-P[Z<(30,704-μ)/(1,049/ 6)]. For noen verdier av μ blir γ(μ) som følger: μ 8 8,5 9 9,5 30 30,5 31 31,5 3 (30,704-μ)/ 6,318 5,149 3,981,813 1,645 0,477-0,69-1,86-3,03 (1,049/ 6) γ(μ) 0 0 0 0,00 0,05 0,317 0,755 0,969 0,999 16.4 Vi bruker utvalgets gjennomsnitt og gjennomfører en en-sidig Z-test for en ukjent forventning μ i en normalfordeling med kjent varians. Nullhypotesen er at μ > μ 0, mens den alternative hypotesen er μ μ 0. Signifikansnivået er α. Forklar hvorfor styrkefunksjonen γ(μ) i punktet μ = μ 0 er lik α. Svar: sett in μ = μ 0 i formel for γ(μ). Uke 17 17.1 Vi har testet en ny blodtrykksmedisin. Ti tilfeldig valgte pasienter fikk den nye medisinen, ni andre fikk placebopiller. Vi måler reduksjon i blodtrykket etter en måneds bruk av den nye medisinen eller placebopillene. Gruppe Antall Gjennomsnittlig reduksjon Varians i reduksjon Medisin n 1 = 10 x = 4.7 S 1 = 18.49 Placebo n = 9 y = 0.8 S =.89 Test om medisinen virker, m.a.o. om forventet reduksjon i behandlingsgruppen er signifikant større enn forventet reduksjon i plasebogruppen. Bruk et signifikansnivå på 5%. Anta at de to fordelingene har samme varians. Siden vi har så få observasjoner må vi bruke følgende størrelse som testobservator:

T = x y S P 1 n1 + 1 n, der S P = (n 1 1)S 1 +(n 1)S. n 1 +n S P kalles for den interpolerte variansen. Under nullhypotesen har T en Student t-fordeling med n 1+n - frihetsgrader. Svar: en-sidig test for differansen μ 1 μ. H 0: μ 1 μ 0 mot H 1: μ 1 μ > 0. Forkast H 0 for stor nok observert verdi av T. S P = 3,339. T =,54, som er større enn t 0,05(17) = 1,74. Forkast H 0. 17. Hva blir testens konklusjon dersom du velger et signifikansnivå lik 1%? Svar: t 0,01(17) =,567. Nå kan vi ikke lenger forkaste H 0, men dette er på grensen. 17.3 Besvar oppgavene 17.1 og 17. på nytt, nå under forutsetning av at de to fordelingene har ulik varians (se Yakir s. 9, og Edwins forelesningsnotater «Comparing two samples» s. 0). Nå kan du bruke følgende testobservator T = x y S 1 + S n 1 n som, under H 0, er tilnærmet Student t-fordelt med k frihetsgrader. k finnes som k = (v 1 +v ) v 1 n1 1 + v, der v 1 = S 1 n 1 og v = S n. n 1 Svar: Nevneren i T-brøken blir nå (18,49/10 +,89/9) = 1,473, slik at T =,65. Formelen for k gir k = 11,991, slik at vi bruker 1 frihetsgrader. t(1) er 1,78 og,68 for α hhv lik 5% og 1%. Forkast H 0 på 5% nivå, men ikke på 1% nivå. 17.4 X og Y er to stokastiske variabler, a og b er to konstanter ulik null. I tillegg har vi to konstanter p og q. Vis at Cov(aX + p, by + q) = abcov(x,y). Svar: bruk definisjonen for Cov(V,W) for to s.v. V og W (Imai 7.3.5) og sett inn V = ax + p, W = by + q. 17.5 Skriv korrelasjonen mellom X og Y som ρ. Hva blir korrelasjonen mellom (ax + p) og (by + q)? Svar: bruk definisjonen Corr(V,W) = Cov(V,W)/[SD(V).SD(W)] for å vise at Corr(aX + p, by + q) = ρ.