Løsningsforslag til obligatorisk innlevering 3.



Like dokumenter
ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

Løsningsforslag Til Statlab 5

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

Mer om hypotesetesting

Regler i statistikk STAT 100

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

Fasit for tilleggsoppgaver

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

1 9-3: Sammenligne gjennomsnitt for to uavhengige stikkprøver : Sammenligne gjennomsnitt for to relaterte stikkprøver

2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

LØSNINGSFORSLAG ) = Dvs

Løsning eksamen desember 2017

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

TMA4240 Statistikk H2010

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

ST0202 Statistikk for samfunnsvitere

MOT310 Statistiske metoder 1, høsten 2010 Løsninger til regneøving nr. 11 (s. 1) der

Kapittel 3: Studieopplegg

Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert =

Eksamensoppgave i SØK Statistikk for økonomer

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

Antall oppgavesider: 4 Vedlegg: Ett internt notat (8 sider)

ST0202 Statistikk for samfunnsvitere

7.2 Sammenligning av to forventinger

Oppgave 1: Feil på mobiltelefoner

Inferens i fordelinger

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

HØGSKOLEN I STAVANGER

TMA4240 Statistikk Høst 2016

i x i

Sensorveiledning: skoleeksamen i SOS Kvantitativ metode

Statistikk og dataanalyse

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Tid: Torsdag 11.desember 9:00 12:30 (3.5 timer) Emneansvarlig: Solve Sæbø, Tlf

Løsning eksamen desember 2016

Eksamensoppgave i ST3001

Hypotesetest: generell fremgangsmåte

Kort overblikk over kurset sålangt

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ST0202 Statistikk for samfunnsvitere

> 6 7 ) = 1 Φ( 1) = = P (X < 7 X < 8) P (X < 8) < ) < ) = Φ(2) =

Formelsamling i medisinsk statistikk

TMA4245 Statistikk Eksamen desember 2016

TMA4240 Statistikk H2010 (22)

Løsningsforslag AA6526 Matematikk 3MX Privatister 3. mai eksamensoppgaver.org

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

QED 1 7. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

UNIVERSITETET I OSLO

ECON240 VÅR / 2016 BOKMÅL

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

Emnenavn: Deleksamen i Statistikk. Eksamenstid: Faglærer: Tore August Kro. Oppgaven er kontrollert:

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

TMA4240 Statistikk H2010 (20)

TMA4240 Statistikk Høst 2015

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Gruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.

+ S2 Y ) 2. = (avrundet nedover til nærmeste heltall) n Y 1

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Hypotesetesting. mot. mot. mot. ˆ x

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Medisinsk statistikk Del I høsten 2008:

STUDIEÅRET 2011/2012. Utsatt individuell skriftlig eksamen. STA 200- Statistikk. Mandag 27. august 2012 kl

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

QED Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

Sted Gj.snitt Median St.avvik Varians Trondheim Værnes Oppdal

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 =

Løsningsforslag: STK2120-v15.

Eksamen i emnet Stat111 - Statistiske metoder 28. mai 2014, kl

Eksamen REA3028 S2, Høsten 2012

Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.

HØGSKOLEN I STAVANGER

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

DEL 1 GRUNNLEGGENDE STATISTIKK

Kontinuerlige sannsynlighetsfordelinger.

Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler

TMA4240 Statistikk Høst 2009

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

OBLIGATORISK EKSAMENRELATERT OPPGAVE

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Bruk data fra tabellen over (utvalget) og opplysninger som blir gitt i oppgavene og svar på følgende spørsmål:

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Eksamensoppgave i TMA4240 Statistikk

HØGSKOLEN I STAVANGER

Transkript:

svar3.nb 1 Løsningsforslag til obligatorisk innlevering 3. Oppgave 1 * Vi skal sammenlikne to sensoere A og B. Begge har rettet den samme oppgaven. Hvis populasjonen er eksamensoppgavene, har vi altså brukt to metoder på hvert element i populasjonen og vi velger en paret test. * Vi velger en t-test siden standardavviket er kjent. * Vi bestemmer et 95% konfidensintervall for differansen d. Dersom 0 ikke er inkludert i intervallet er det grunnlag for å si at det er forskjell på sensorene. Beregningene: d _ = 0.76 ê 13 = 0.0584 s d 2 = Konfidensintervallet blir: 1 n 1 s d = 0.0904 13 i j d 2 i nd _ 2y z = 0.0816 ki=1 { s d Ad _ ± t αê2 è!!! n E der t αê2 = 2.56 H12 frihetsgraderl @0.0583 ± 0.0642D @ 0.006, 0.123D Konklusjonen blir: Siden 0 er inkludert i konfidensintervallet, er det ikke grunnlag for å si at det er forskjell i sensorenes bedømmelse, når vi krever en konfidensgrad på 95%. Oppgave 2 Vi velger en binomisk modell. Sannsynligheten for at er frø skal spire er p = 0.6 og den er den samme for alle frøene. Sannsynligheten for at ingen av de 4 frøene spirer er:

svar3.nb 2 P Hx = 0L = J 0 4 N p0 H1 pl 4 = 0.0256 P Hx 2L = 1 P Hx 1L = 1 0.179 = 0.821 Vi har fortsatt en binomisk fordeling. Enten spirer noen av frøene eller de gjør det ikke. Sannsynligheten for at 4 før ikke spirer fant vi i oppgave a, og den er p = 0.0256. Siden vi her har 20 elever (n = 20) kan vi her gå over til en Poisson fordeling med l= n p. λ=0.512 P HY = 1L = 0.307 E HYL = np= 0.512 Var HYL = nph1 pl = 0.499 ü c) Sannsynligheten for å gå med overskudd når m = 17 og s = 3. Vi har her en normalfordeling og skal finne P (W >12) 12 15 P HW > 12L = 1 P HW < 12L = 1 G J N 3 = 1 0.0478 = 0.952 ü d) Vi har her en sum av normalfordelte størrelser. Vi kan da ut fra sentralgrenseteoremet bruke en normalfordeling på summen. E HVL = E HW 1 L +..... + E HW 5 L = 75 Var HVL = Var HW 1 L +..... + Var HW 5 L = 47 P Hv > 85L = 1 P HW < 85L = 1 G i 85 75 y j è!!!!!! z k 47 { = 1 0.928 = 0.072

oblig3svar.nb 1 Oppgave 3 Median er middelverdien av de 2 mitterste verdiene 4.9 og 5.1 x = 5.0 Middelverdien x _ = 5.1, standardavviket s = $%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 1 Hx i x _ L 2 = 0.341 6 n 1 i=1 Et 95% konfidensintervall for forventningsverdien er Ax _ s ± t αê2 è!!!! E = @4.74, 5.457D her er t n αê2 = 2.571 ü c) Med et nytt forsøk med 8 prøver der forventningsverdi og standardavvik på ph- verdiene er henholdsvis 5.6 og 0.38 finner vi et 95% konfidensintervall for differansen: aµ 1 µ 2 ± t αê2 S "################## 1 p n 2 + n 1 2 q her er S p = "######################################## Hn1 1L S12 +Hn 1 1L S 2 2 2 n 1 +n 2 2 S p kalles for interpolert varians. Antall frihetsgrader for t αê2 er n 1 + n 2 2. Utregnet får vi et konfidensintervall på: [0.0716, 0.928] t αê2 = 2.179 S p = 0.364 "################## 1 n 2 + n 1 2 = 0.54 Vi ser at 0 ikke er inkludert i konfidensintervallet og kan konkludere med at det er forskjell på ph verdiene i de to blandingene.

oblig3svar.nb 2 ü d) Vi har her et sett med kategoriske data og må analysere den med kategorisk kryss tabell. i17 9y X i,j = 25 8 j z k12 6{ Forventningsverdiene blir: i18.23 7.77y E i,j = 23.14 9.86 j z k12.62 5.38{ Avvikskvadratene delt på forventningsverdiene i0.083 0.150y Q i,j = 0.195 0.351 j z k0.030 0.071{ Summen av alle Q i,j verdiene Q = 0.88 Hvis vi sammenlikner denne Q verdien med Q kritisk fra Kji -kvadrattabellen finner vi at Q < Q kritisk Hvis vi velger et 5% signifikansnivå for en hypotesetest der vi kontrollerer om det er forskjell på testene. Q kritisk = 5.99 med 2 frihetsgrader og a = 5% Oppgave 4 Nullhypotesen for bensinforbruket for de forskjellige bensintypene: H 0 : Det er ingen forskjell på bensintypene. Type A Type C 0.8 1.0 1.2 1.4 1.6 Liter / mil 1.8 Boksplot- Middelverdien til forbruket av bensintype A er minst og bensintype C er størst. Vi ser at midtre del av boksplottene over beninforbruket for beste og dårligste bensin overlapper hverandre godt. tene gir ikke et grunnlag for å si at den ene bensinen er vesentlig bedre enn den andre.

oblig3svar.nb 3 En-faktor variansanalysen gir ikke et grunnlag for å forkaste nullhypotesen. F-verdien er lavere enn F kritisk. To-faktor analysen gir en F-verdi er høyere enn F kritisk, og vi kan forkaste nullhypotesen. Vi ser at analysen skiller både på biltype og bensintype. Vi ser av analysen at biltypen er mer vesentlig for bensinforbruket en selve bensintypen. Når vi forkaster nullhypotesen så kan vi gjøre det med en konfidensgrad gitt ved 1-p verdien. Vi ser at det her er tilnærmet 100%. ü c) Et 98% symmetrisk konfidensintervall for det midlere bensinforbruket er gitt ved: s s x tα, x + tα 2 2 n n der s 2 er variansen til bensinforbruket i bil 8 Data hentet fra variansanalysen x _ = 1.31 og s = è!!!!!!!!!!!!!!!!!!!! 0.01489 = 0.122 Et 98% tosidig konfidensintervall for det midlere bensinforbruket til bil 8 er: 0.122 0.122 1.31 4.541,1.31+ 4.541 = [ 1.03,1.59] 4 4 Et 98% tosidig konfidensintervall for standardavviket på bensinforbruket til bil 8 er: ( ) ( ) 2 2 n 1 s n 1 s 3 0.0149 3 0.0149, =, 2 ( 1 2) 11.34 0.11 χα χ α => Konfidensintervallet til standardavviket blir: 0.0039, 0.406 = [ 0,062,0.637]

oblig3svar.nb 4 Oppgave 5 Kan firmaet ut fra de 14 problemene velge ut en av studentene? I tilfelle hvilken student. I denne oppgaven bruker vi en paret test, slik at det er uaktuelt å studere F- verdien i Fisher-testen Vi skal altså bruke en t-test for parvise utvalg. Vi ser at T kritisk, både ensidig og tosidig er mindre enn t-statistikk og vi kan konkludere med at det er en statistisk signifikant forskjell på student Y og X. Firmaet bør velge student Y. T-Test: Gjennomsnitt for to parvise utvalg CPU tid student X CPU tid student Y Gjennomsnitt 2.137 1.647 Varians 1.149 0.704 Observasjoner 14 14 Pearson-korrelasjon 0.807 Antatt avvik mellom gjennomsnittene 0 fg 13 t-stat 2.894 P(T<=t) ensidig 0.006 T-kritisk, ensidig 1.771 P(T<=t) tosidig 0.013 T-kritisk, tosidig 2.160 Testens p-verdi leses ut fra tabellen.her er det naturlig å velge p-ensidig og p-verdien er 0.006.p-verdien forteller hvor stor sannsynlighet vi har for å begå en feil,når vi sier at det er forskjell på X og Y.