Statistisk analyse av data fra planlagte forsøk
|
|
|
- Hjørdis Halvorsen
- 6 år siden
- Visninger:
Transkript
1 Statistisk analyse av data fra planlagte forsøk 19. mars Skypemøte 2 i NLR s kurs i forsøksarbeid 2019 Torfinn Torp
2 Temaer Noen sentrale begreper, framgangsmåte etc., via et eksempel. Noen retningslinjer ved planlegging, gjennomføring og analyse av forsøk. Randomisert fullstendig blokkforsøk, statistisk modell og analyse. Split plot forsøk, statistisk modell og analyse. Split split plot forsøk, statistisk modell. Split blokk forsøk (= strip plot forsøk), statistisk modell. Nøstede, faste og tilfeldige faktorer, manglende observasjoner, statistisk modell og analyse. Forsøksserier, over år og/eller sted. Programvare. Avslutning
3 Noen sentrale begreper, framgangsmåte etc., via et eksempel, I Dataene kommer fra et fullstendig randomisert forsøk (altså uten blokker) der maisavlingen er registrert på 24 homogene forsøksruter som har fått forskjellige gjødslingsmidler. Hvert av 4 gjødslingsmidler (= behandlingene) er fordelt tilfeldig på 6 forsøksruter. Behandling Forsøksrute Avling 1: Kontroll : Kontroll : Kontroll : Kontroll : Kontroll : Kontroll : K 2 O + N : K 2 O + N : K 2 O + N : K 2 O + N : K 2 O + N : K 2 O + N Behandling Forsøksrute Avling 3: K 2 O + P 2 O : K 2 O + P 2 O : K 2 O + P 2 O : K 2 O + P 2 O : K 2 O + P 2 O : K 2 O + P 2 O : N + P 2 O : N + P 2 O : N + P 2 O : N + P 2 O : N + P 2 O : N + P 2 O
4 Noen sentrale begreper, framgangsmåte etc., via et eksempel, II Behandling Gjennomsnitt Varians Standardavvik CV % 1: Kontroll : K 2 O + N : K 2 O + P 2 O : N + P 2 O Totalt Avling : Kontroll 2: K2O + N Behandling 3: K2O + P2O5 4: N + P2O5 Sammenligner forskjellene/variasjonen mellom behandlingene med variasjonen innen behandlingene
5 Noen sentrale begreper, framgangsmåte etc., via et eksempel, III Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Behandling Error Total F er et mål på forskjellene/variasjonen mellom behandlingene sammenlignet med variasjonen innen behandlingene, når vi tar hensyn til antall behandlinger og antall observasjoner både for hver behandling og totalt. Følgende relasjon for observasjonenes totale variasjon gjelder (k behandlinger, N = n 1 + n n k ): n n 2 2 k i k k i 2 ( Yij Y) = ni ( Yi Y) + ( Yij Yi ) i= 1 j= 1 i= 1 i= 1 j= 1 SS SS T B SSE Total varisajon Variasjon mellom behandlingene Variasjon innen behandlingene N 1 frihetsgrader k 1 frihetsgrader N k frihetsgrader
6 Noen sentrale begreper, framgangsmåte etc., via et eksempel, IV Antagelser: - Modell for observasjonene: Y ij = µ i + ε ij. - Alle ε ij ene er uavhengige. - Alle ε ij ene er normalfordelte. - Alle ε ij ene har forventet verdi 0. - Alle ε ij ene har samme varians, σ 2. - µ 1, µ 2,, µ k og σ 2 er ukjente parametere hvis verdier estimeres ved hjelp av dataene. Fra antagelsene og problemstillingen: Alle observasjonene med behandling i har forventet verdi µ i. Vi tester hypotesen H 0 : µ 1 = µ 2 = = µ k mot H 1 : ikke alle µ i ene er like. Hypotesen testes ved å forkaste H 0 dersom F er påfallende stor. For å avgjøre om det er tilfelle brukes P-verdien knyttet til F
7 Noen sentrale begreper, framgangsmåte etc., via et eksempel, V Generelt om testing av hypoteser Vår konklusjon Sannheten (dessverre ukjent) basert på data H 0 er sann H 1 er sann Forkast H 0, det vil si påstå H 1 Type I feil Riktig beslutning Ikke grunnlag for å forkaste H 0 Riktig beslutning Type II feil Bestemmer et signifikansnivå (= testnivå) α (ofte velges α = 0.05 = 5 %). Krever P(Type I feil) α. Desto mindre α desto mindre er P(Type I feil). P-verdien er den minste α som gir forkastning av H 0 på grunnlag av dataene
8 Noen sentrale begreper, framgangsmåte etc., via et eksempel, VI Våre maisdata gir P-verdi = Går derfor videre med en multippel sammenligningsmetode: Gruppering ved bruk av Tukey's metode Behandling N Mean Grouping 2: K2O + N A 4: N + P2O A B 1: Kontroll B 3: K2O + P2O B Gruppering ved bruk av LSD metoden Behandling N Mean Grouping 2: K2O + N A 4: N + P2O A B 1: Kontroll B C 3: K2O + P2O C Means that do not share a letter are significantly different (95 % confidence)
9 Noen sentrale begreper, framgangsmåte etc., via et eksempel, VII Sjekking av antagelsene: Normalfordelingsplot Tilpassede responsverdier mot residualer Percent Residual Residual Fitted Value Kontrollbehandlingen skiller seg noe ut, spesielt ved større variasjon i responsverdiene og med de to observasjonene, 1 og 2 i datamaterialet, markert i figurene ovenfor. Hva dersom kontrollbehandlingen utelates?
10 Noen sentrale begreper, framgangsmåte etc., via et eksempel, VIII Resultater fra data uten kontrollbehandlingen: Analysis of Variance Source DF Adj SS Adj MS F-Value P-Value Behandling Error Total Gruppering ved bruk av Tukey's metode Behandling N Mean Grouping 2: K2O + N A 4: N + P2O A 3: K2O + P2O B Gruppering ved bruk av LSD metoden Behandling N Mean Grouping 2: K2O + N A 4: N + P2O B 3: K2O + P2O C
11 Noen sentrale begreper, framgangsmåte etc., via et eksempel, IX Sjekking av antagelsene når data fra kontrollbehandlingen er utelatt: Normalfordelingsplot Tilpassede responsverdier mot residualer Percent Residual Residual Fitted Value
12 Noen retningslinjer ved planlegging, gjennomføring og analyse av forsøk 1. Definer og spesifiser problemstillingene (hypotesene). 2. Velg responsvariabler. 3. Velg faktorer, deres nivåer og eventuelle kovariabler. 4. Velg forsøksplan. 5. Utfør forsøket og datainnsamlingen. 6. Modeller og analyser dataene statistisk (estimer parametere og test hypotesene). 7. Konkluder, rapporter og gi råd. Noen punkter å ha med seg: Bruk mest mulig tilgjengelig kunnskap om problemstillingene. Utfør forsøket og analysene nøyaktig, grundig og enklest mulig. Husk forskjellen mellom praktisk signifikans og statistisk signifikans. Et forsøk gir neppe svar på alle problemstillingene. Forsøksvirksomhet er iterativ
13 Randomisert fullstendig blokkforsøk, statistisk modell og analyse, I Det er gjort et faktorielt randomisert fullstendig blokk forsøk med 4 blokker for å studere hvordan avlingen avhenger av sort (2 sorter, A og B) og gjødsling (3 nivåer, Lav, Middels og Høy). Blokk 1 Blokk 2 Blokk 3 Blokk 4 Rute 101 (A M) 18.1 Rute 201 (A H) 18.2 Rute 301 (A M) 17.1 Rute 401 (B H) 16.6 Samspillsplot Rute 102 (B H) 15.7 Rute 103 (B L) 12.6 Rute 104 (A H) 17.6 Rute 105 (A L) 14.3 Rute 106 (B M) 10.5 Rute 202 (B H) 17.5 Rute 203 (A M) 17.6 Rute 204 (A L) 14.5 Rute 205 (B L) 11.2 Rute 206 (B M) 12.8 Rute 302 (A H) 18.9 Rute 303 (B H) 16.7 Rute 304 (B M) 8.3 Rute 305 (B L) 11.0 Rute 306 (A L) 11.5 Rute 402 (A H) 18.2 Rute 403 (A M) 17.6 Rute 404 (B M) 9.1 Rute 405 (A L) 13.6 Rute 406 (B L) 12.1 Avling, gjennomsnitt over blokker L M Gjødsling H Sort A B
14 Randomisert fullstendig blokkforsøk, statistisk modell og analyse, II Statistisk modell for dataene: Y = µ + α + β + ( αβ ) + B + ε ijk i j ij k ijk Y ijk er observert avling for sort i (i = A, B), gjødsling j (j = L, M, H) i blokk k (k = 1, 2, 3, 4). E( Y ) = µ + α + β + ( αβ ) Var( Y ) = σ + σ 2 2 ijk i j ij ijk B Den tilfeldige blokkfaktoren tar høyde for at observasjoner fra samme blokk kan være korrelerte. Tests of Fixed Effects Term DF Num DF Den F-value P-value Sort Gjødsling Sort*Gjødsling
15 Randomisert fullstendig blokkforsøk, statistisk modell og analyse, III Variance Components Source Var % of Total SE Var Z-value P-Value Blokk Error Total Gruppering ved bruk av Tukey's metode Sort*Gjødsling N Mean Grouping A H A A M A B H A A L B B L B C B M C Means that do not share a letter are significantly different (95 % confidence)
16 Split plot forsøk, statistisk modell og analyse, I Grasavling (tørrstoff) studeres. Storrutefaktoren er sort (2 sorter, A1 og A2). Smårutefaktoren er behandling med en bakterie (3 nivåer, Kontroll, Levende og Død). Forsøket ble gjentatt i 4 blokker. Blokk 1 Blokk 2 Blokk 3 Blokk 4 K 29.4 D 28.7 D 29.7 K 26.7 Samspillsplot L D K L L K L D K L K L L D D L Grasavling, gjennomsnitt over blokker Sort A1 A2 D 29.7 K 28.7 D 29.1 K 26.8 K D Bakterie L A1 A
17 Split plot forsøk, statistisk modell og analyse, II Statistisk modell for dataene: Y = µ + α + β + ( αβ ) + B + ( Bα ) + ε ijk i j ij k ik ijk Y ijk er observert grasavling for sort i (i = A1, A2), bakterie j (j = K, L, D) i blokk k (k = 1, 2, 3, 4). E( Y ) = µ + α + β + ( αβ ) Var( Y ) = σ + σ α + σ ijk i j ij ijk B B De tilfeldige faktorene tar høyde for at observasjoner fra samme storrute i samme blokk kan være korrelerte og minst like korrelerte som observasjoner fra samme blokk, men fra forskjellige storruter. Tests of Fixed Effects Term DF Num DF Den F-value P-value Sort Bakterie Sort*Bakterie
18 Split plot forsøk, statistisk modell og analyse, III Variance Components Source Var % of Total SE Var Z-value P-Value Blokk Blokk*Sort Error Total Gruppering ved bruk av Tukey's metode Bakterie N Mean Grouping L A D B K C Means that do not share a letter are significantly different (95 % confidence)
19 Split plot forsøk, statistisk modell og analyse, IV 40 Grasavling, gjennomsnitt over blokker og sorter 95 % konfidensintervaller 30 C B A Grasavling K D L Bakterie Individual standard deviations are used to calculate the intervals. Normalfordelingsplot Tilpassede responsverdier mot residualer Percent Conditional Residual Conditional Residual Fitted Value
20 Split split plot forsøk, statistisk modell I et split split plot forsøk inngår 3 faktorer, la oss kalle dem A (storrutefaktoren), B (smårutefaktoren) og C (små smårutefaktoren). Nivåene til A randomiseres på storrutene innen hver blokk. Nivåene til B randomiseres på smårutene innen hver storrute innen hver blokk. Nivåene til C randomiseres på små smårutene innen hver smårute innen hver storrute innen hver blokk. Statistisk modell for dataene: Y = µ + α + β + γ + ( αβ ) + ( αγ ) + ( βγ ) + ( αβγ ) + B + ( Bα ) + ( Bαβ ) + ε ijkl i j k ij ik jk ijk l il ijl ijkl Y ijkl er observert verdi på responsvariabelen for nivå i av A, nivå j av B, nivå k av C i blokk l. EY ( ) = µ + α + β + γ + ( αβ ) + ( αγ ) +( βγ ) +( αβγ ) ijk i j k ij ik jk ijk Var( Y ) = σ + σ α + σ αβ + σ ijk B B B De tilfeldige faktorene tar høyde for eventuelle korrelasjonsstrukturer mellom observasjonene
21 Split blokk forsøk (= strip plot forsøk), statistisk modell I et split blokk forsøk inngår 2 faktorer, la oss kalle dem A (radfaktoren) og B (kolonnefaktoren). Nivåene til A randomiseres på radene innen hver blokk. Nivåene til B randomiseres på kolonnene innen hver blokk. Statistisk modell for dataene: Y = µ + α + β + ( αβ ) + B + ( Bα ) + ( Bβ ) + ε ijk i j ij k ik jk ijk Y ijk er observert verdi på responsvariabelen for nivå i av A, nivå j av B i blokk k. EY ( ) = µ + α + β + ( αβ ) ijk i j ij Var( Y ) = σ + σ α + σ β + σ ijk B B B De tilfeldige faktorene tar høyde for eventuelle korrelasjonsstrukturer mellom observasjonene
22 Nøstede, faste og tilfeldige faktorer, manglende observasjoner, statistisk modell og analyse, I 3 økologiske gjødslingsmidler skal sammenlignes for dyrking av mangold. 12 felt er disponible og hvert gjødslingsmiddel ble brukt på 4 tilfeldig valgte felt. Fra hvert felt ble det tatt prøver fra 2 tilfeldig valgte mangoldplanter der innholdet av jern i planten ble målt. Forsøksplan og data framgår nedenfor. Gjødsling Felt Prøve(felt) Jern Statistisk modell for dataene: Y = µ + α + B + ε ijk i j() i ijk Y ijk er observert innhold av jern i prøve k (k = 1, 2) fra felt j (j = 1, 2,, 12) innen gjødsling i (i = 1, 2, 3). EY ( ) ijk Var( Y ) ijk = µ + α = σ + σ i 2 2 F ( G) Den tilfeldige faktoren tar høyde for at observasjonene i prøvene fra samme felt (innen gjødsling) kan være korrelerte
23 Nøstede, faste og tilfeldige faktorer, manglende observasjoner, statistisk modell og analyse, II Tests of Fixed Effects Term DF Num DF Den F-value P-value Gjødsling Variance Components Source Var % of Total SE Var Z-value P-Value Felt(Gjødsling) Error Total 4.91 Gruppering ved bruk av Tukey's metode Gjødsling N Mean Grouping A B B Means that do not share a letter are significantly different (95 % confidence)
24 Nøstede, faste og tilfeldige faktorer, manglende observasjoner, statistisk modell og analyse, III Hva hvis det mangler observasjoner fra noen felt? Manglende verdier markert med * nedenfor. Gjødsling Felt Prøve(felt) Jern * * * * * * Samme statistiske modell for disse ubalanserte og ufullstendige dataene som vi brukte for de balanserte og fullstendige dataene
25 Nøstede, faste og tilfeldige faktorer, manglende observasjoner, statistisk modell og analyse, IV Tests of Fixed Effects Term DF Num DF Den F-value P-value Gjødsling Variance Components Source Var % of Total SE Var Z-value P-Value Felt(Gjødsling) Error Total 2.38 Gruppering ved bruk av Tukey's metode Gjødsling N Mean Grouping A B B Means that do not share a letter are significantly different (95 % confidence)
26 Forsøksserier, over år og/eller sted, I Bestem om sted skal modelleres som tilfeldig eller fast faktor. År modelleres nesten alltid som tilfeldig faktor. Som regel får vi mye informasjon ved å inkludere samspill i modellen, i alle fall i utgangspunktet. Det være seg samspill mellom behandlingene og årene, mellom behandlingene og stedene, og eventuelt mellom årene og stedene. 2 eksempler på modeller (på en svært skjematisk form): - Behandling modelleres som fast. - År og sted og samspill der år og sted inngår modelleres som tilfeldige. - Forsøk modelleres som tilfeldig. - Behandlingene kan være kombinasjoner av nivåene til to eller flere faktorer. Forsøk fra flere år. Flere forsøk pr. år. Forsøk fra et sted. Y = Behandling + År + År Behandling + Forsøk + Error Forsøk fra flere år og flere steder. Flere forsøk pr. år på hvert sted. Y = Behandling + År + Sted + År Behandling + Sted Behandling + År Sted + Forsøk + Error
27 Forsøksserier, over år og/eller sted, II Eksempel. For å sammenligne 3 sorter er det er gjort et randomisert blokk forsøk på 3 steder. Her er responsvariabelen avling. Data og noen resultater er gitt nedenfor. Sted Blokk Sort Rute Avling Avling, gjennomsnitt over blokker Samspillsplot 2 3 Sted Sort
28 Forsøksserier, over år og/eller sted, III Statistisk modell for dataene: Y = Sort + Sted + Blokk(Sted) + Sted Sort + Error Sted modelleres som tilfeldig faktor Tests of Fixed Effects Variance Components Term DF Num DF Den F-value P-value Source Var P-Value Sort Sted Blokk(Sted) Sted*Sort Error Total Sted modelleres som fast faktor Tests of Fixed Effects Variance Components Term DF Num DF Den F-value P-value Source Var P-Value Sted Blokk(Sted) Sort Error Sted*Sort Total
29 Programvare Krav: - Tilfeldig trekning. - Generelle lineære modeller (normalfordelte observasjoner). - Generaliserte lineære modeller (ikke nødvendigvis normalfordelte observasjoner). - Modellene må tillate faste og tilfeldige faktorer. Programvare: - Minitab. - Sas. - Statistica. - Matlab. - R. - Jmp. - Sigmaplot. - Stata. - Statgraphics. - Spss. - Systat
30 Avslutning Bruk tid på planlegging. Gjør ting så enkelt som mulig. Vær nøyaktig og grundig i planlegging, gjennomføring, datainnsamling, statistisk modellering, statistisk analyse, konklusjon, rapportering, rådgiving.. Vær redelig i rapportering og konklusjoner, husk at det er data beheftet med usikkerhet som ligger til grunn. Og, atter en gang: Hver gang du planlegger et forsøk eller en innsamling av data, husk at dataene skal modelleres og analyseres statistisk den dagen de foreligger
Oppgave 1. Kilde SS df M S F Legering Feil Total
MOT30 Statistiske metoder, høste0 Løsninger til regneøving nr. 0 (s. ) Oppgave Y ij = µ i + ε ij, der ε ij uavh. N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig
Oppgave 14.1 (14.4:1)
MOT30 Statistiske metoder, høste006 Løsninger til regneøving nr. 0 (s. ) Modell: Oppgave 4. (4.4:) Y ijk = µ + α i + β j + (αβ) ij + ε ijk, der ε ijk uavh. N(0, σ ) der µ er gjennomsnittseffekten, α i
MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2
MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.27 (11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal finne konfidensintervall
EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 12 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK Onsdag
Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y
Statistiske metoder 1 høsten 004. Løsningsforslag Oppgave 1: a) Begge normalplottene gir punkter som ligger omtrent på ei rett linje så antagelsen om normalfordeling ser ut til å holde. Konfidensintervall
EKSAMEN I TMA4255 ANVENDT STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 11 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Mandag 6.
EKSAMENSOPPGAVER STAT100 Vår 2011
EKSAMENSOPPGAVER STAT100 Vår 2011 Løsningsforslag Oppgave 1 (Med referanse til Tabell 1) a) De 3 fiskene på 2 år hadde lengder på henholdsvis 48, 46 og 35 cm. Finn de manglende tallene i Tabell 1. Test
EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 7 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 BOKMÅL EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE
Eksamensoppgave i TMA4255 Anvendt statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 30. mai 2014 Eksamenstid (fra til): 09:00-13:00
Forsøksplaner Sammenligninger, randomisering, gjentak, blokkdeling, fler-faktor forsøk og variansanalyse
Forsøksplaner Sammenligninger, randomisering, gjentak, blokkdeling, fler-faktor forsøk og variansanalyse Innlegg på kurs i forsøksarbeid Forsøksgården Vollebekk 18. september 2012 Torfinn Torp 1 Et forsøk
EKSAMEN I TMA4255 ANVENDT STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 7 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 25.
Anvendt medisinsk statistikk, vår Repeterte målinger, del II
Anvendt medisinsk statistikk, vår 009 Repeterte målinger, del II Eirik Skogvoll Overlege, Klinikk for anestesi og akuttmedisin 1. amanuensis, Enhet for anvendt klinisk forskning (med bidrag fra Harald
MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:
MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,
Generelle lineære modeller i praksis
Generelle lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y en eller flere uavhengige
Eksamensoppgave i TMA4255 Anvendt statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 16. mai 2015 Eksamenstid (fra til): 09:00-13:00
Løsningsforslag eksamen 25. november 2003
MOT310 Statistiske metoder 1 Løsningsforslag eksamen 25. november 2003 Oppgave 1 a) Vi har µ D = µ X µ Y. Sangere bruker generelt trapesius-muskelen mindre etter biofeedback dersom forventet bruk av trapesius
Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir
EKSAMEN I TMA4255 ANVENDT STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 11 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 7.
Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger
Intro til hypotesetesting Analyse av kontinuerlige data 21. april 2005 Tron Anders Moger Seksjon for medisinsk statistikk, UIO 1 Repetisjon fra i går: Normalfordelingen Variasjon i målinger kan ofte beskrives
Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger
Fordelinger, mer om sentralmål og variasjonsmål Tron Anders Moger 20. april 2005 1 Forrige gang: Så på et eksempel med data over medisinerstudenter Lærte hvordan man skulle få oversikt over dataene ved
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.25 (11.27, 11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal nne
Eksamensoppgave i TMA4255 Anvendt statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 3. juni 2016 Eksamenstid (fra til): 09:00-13:00
MOT310 Statistiske metoder 1, høsten 2011
MOT310 Statistiske metoder 1, høsten 2011 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 30. oktober, 2011 Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 1 / 15 -tabell
ECON240 VÅR / 2016 BOKMÅL
ECON240 VÅR / 2016 BOKMÅL UNIVERSITETET I BERGEN EKSAMEN UNDER SAMFUNNSVITENSKAPELIG GRAD [ DATO og KLOKKESLETT FOR EKSAMEN (START OG SLUTT) ] Tillatte hjelpemidler: Matematisk formelsamling av K. Sydsæter,
HØGSKOLEN I STAVANGER
EKSAMEN I: MOT0 STATISTISKE METODER VARIGHET: TIMER DATO:. NOVEMBER 00 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV OPPGAVER PÅ 7 SIDER HØGSKOLEN
ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper
ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper Bo Lindqvist Institutt for matematiske fag 2 Kapittel 8: Sammenligning av grupper Situasjon: Vi ønsker
Oppsummering av STK2120. Geir Storvik
Oppsummering av STK2120 Geir Storvik Vår 2011 Hovedtemaer Generelle inferensmetoder Spesielle modeller/metoder Bruk av R Vil ikke bli testet på kommandoer, men må forstå generelle utskrifter Generelle
Oppgave N(0, 1) under H 0. S t n 3
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr 9 (s 1) Oppgave 1 Modell: Y i β 0 + β 1 x i + β 2 x 2 i + ε i der ε 1,, ε n uif N(0, σ 2 ) e) Y Xβ + ε der Y Y 1 Y n, X 1 x 1 x 2 1
Eksamensoppgave i TMA4255 Anvendt statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: August 2016 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet
Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir
10.1 Enkel lineær regresjon Multippel regresjon
Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel
Forsøksfelt hvor små forskjeller finner vi. NLR Viken v/ Torgeir Tajet
Forsøksfelt hvor små forskjeller finner vi NLR Viken v/ Torgeir Tajet Hva betyr en forbedring Normalavling (kg ant/ daa) Pris (kr/ kg) Verdi (kr/ daa) Gulrot 3500 8 28000 Løk 3500 6 21000 Kålrot 2600 5
EKSAMEN I TMA4255 ANVENDT STATISTIKK
Noregs teknisk naturvitskaplege universitet Institutt for matematiske fag Side 1 av 7 Fagleg kontakt under eksamen: Mette Langaas (988 47 649) NYNORSK EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 25. mai
OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.
EKSAMEN I: MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir forlag) OPPGAVESETTET
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig
Forelesning 8 STK3100/4100
Forelesning STK300/400 Plan for forelesning: 0. oktober 0 Geir Storvik. Lineære blandede modeller. Eksempler - data og modeller 3. lme 4. Indusert korrelasjonsstruktur. Marginale modeller. Estimering -
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er
Kapittel 3: Studieopplegg
Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere
i x i
TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 11, blokk II Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale
Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere
2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Analysere en observator for å finne ut noe om korresponderende
Oppgave 1. Vi må forutsette at dataene kommer fra uavhengige og normalfordelte tilfeldige variable,
MOT30 Statistiske metoder Løsningsforslag til eksamen vår 0 s. Oppgave a Vi har x = 6. og x i x = 4.6. Herav s x = n Et 90% kondensintervall er gitt ved x i x = 4.6 = 0.89 6 SX X t 0.056 X + t S X 0.056
Tilleggsoppgaver for STK1110 Høst 2015
Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig
TMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer
LØSNINGSFORSLAG ) = Dvs
LØSNINGSFORSLAG 12 OPPGAVE 1 D j er differansen mellom måling j med metode A og metode B. D j N(µ D, 0.1 2 ). H 0 : µ D = 0 mot alternativet H 1 : µ D > 0. Vi forkaster om ˆµ D > k Under H 0 er ˆµ D =
EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-2004 Dato: 29.september 2016 Klokkeslett: 09 13 Sted: Tillatte hjelpemidler: B154 «Tabeller og formler i statistikk» av Kvaløy og
TMA4240 Statistikk Høst 2016
TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 11 Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale begreper
Eksamensoppgåve i TMA4255 Anvendt statistikk
Institutt for matematiske fag Eksamensoppgåve i TMA4255 Anvendt statistikk Fagleg kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 30. mai 2014 Eksamenstid (frå til): 09:00-13:00
Eksamensoppgave i ST1201/ST6201 Statistiske metoder
Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Tlf: Eksamensdato: august 2015 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler:
Kp. 14 Flerfaktoreksperiment. Kp. 14: Flerfaktor-eksperiment; oversikt
uten med Kp 14 Flerfaktor-eksperiment Bjørn H Auestad Kp 14: To-faktor eksperiment 1 / 20 Kp 14: Flerfaktor-eksperiment; oversikt uten med 141 Introduction 142 Interaction in the Two-Factor Experiment
Hypotesetest: generell fremgangsmåte
TMA4240 Statistikk H2010 (21) 10.8, 10.10: To normalfordelte utvalg 10.9: Teststyrke og antall observasjoner Mette Langaas Foreleses mandag 1.november, 2010 2 Hypotesetest: generell fremgangsmåte Generell
Løsningsforslag eksamen STAT100 Høst 2010
Løsningsforslag eksamen STAT100 Høst 2010 Oppgave 1 a) To-utvalg, parvise data. La Y være tilfeldig variabel som angir antall drepte i periode 1 og tilsvarende X for periode 2. Vi antar parvise avhengigheter
Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010
Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100
j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.
FORMELSAMLING TIL STK2120 (Versjon av 30. mai 2012) 1 Enveis variansanalyse Anta at Y ij = µ + α i + ɛ ij ; j = 1, 2,..., J i ; i = 1, 2,..., I ; der ɛ ij -ene er uavhengige og N(0, σ 2 )-fordelte. Da
Løsningsforslag STK1110-h11: Andre obligatoriske oppgave.
Løsningsforslag STK1110-h11: Andre obligatoriske oppgave. Oppgave 1 a) Legg merke til at X er gamma-fordelt med formparameter 1 og skalaparameter λ. Da er E[X] = 1/λ. Små verdier av X tyder derfor på at
Krysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.
SOS112 Kvantitativ metode Krysstabellanalyse (forts.) Forelesningsnotater 9. forelesning høsten 25 4. Statistisk generalisering Per Arne Tufte Eksempel: Hypoteser Eksempel: observerte frekvenser (O) Hvordan
Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere
2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Å analysere en utvalgsobservator for å trekke slutninger
TMA4240 Statistikk Høst 2007
TMA4240 Statistikk Høst 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b4 Løsningsskisse Oppgave 1 Eksamen juni 1999, oppgave 3 av 3 a) µ populasjonsgjennomsnitt,
Tid: Torsdag 11.desember 9:00 12:30 (3.5 timer) Emneansvarlig: Solve Sæbø, Tlf
EKSAMENSOPPGAVE Institutt: IKBM Eksamen i: STAT 100 STATISTIKK Tid: Torsdag 11.desember 9:00 12:30 (3.5 timer) Emneansvarlig: Solve Sæbø, Tlf 67232561 Tillatte hjelpemidler: C3: alle typer kalkulatorer,
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK 1000 Innføring i anvendt statistikk. Eksamensdag: Torsdag 1. juni 2006. Tid for eksamen: 09.00 12.00. Oppgavesettet er på
Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler
EKSAMENSOPPGAVER Institutt: Eksamen i: Tid: IKBM STAT100 Torsdag 13.des 2012 STATISTIKK 09.00-12.30 (3.5 timer) Emneansvarlig: Solve Sæbø ( 90065281) Tillatte hjelpemidler: C3: alle typer kalkulator, alle
I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x
Multiple regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable.det er fortsatt en responsvariabel. Måten dette gjøre på er nokså naturlig. Prediktoren
Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler. Oppgaveteksten er på 11 sider.
EKSAMENSOPPGAVE Fakultet KBM Eksamen i: STAT 100 Statistikk Tidspunkt 19. mai 017 09.00-1.30. 3,5 timer Kursansvarlig: Trygve Almøy Tillatte hjelpemidler: C3. Alle typer kalkulatorer, alle andre hjelpemidler.
Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert!
MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1 Flott! Samlet sett leverer dere gode resultater. Kandidatene 4507, 4542, 4545 og 4569 har meget gode besvarelser supert! Totalt
Eksamensoppgave i ST1201/ST6201 Statistiske metoder
Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: 20. desember 2016 Eksamenstid (fra til): 09:00
MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1
MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1 Oppgave 1 a) Normalantakelse: Målingene x 1,..., x 21 og y 1,..., y 8 betraktes som utfall av tilfeldige variable X 1,..., X 21
ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon
ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Kap. 13: Lineær korrelasjons-
EKSAMEN I TMA4255 ANVENDT STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Onsdag 8. august
TMA4240 Statistikk Høst 2015
TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II I denne øvingen skal vi fokusere på hypotesetesting. Vi ønsker å gi dere
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet
Kp. 12 Multippel regresjon
Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Kp 12 Multippel Bjørn H Auestad Kp 11: Regresjonsanalyse 1 / 46 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction
Lineære modeller i praksis
Lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y én eller flere uavhengige variabler:
Tidspunkt for eksamen: 12. mai ,5 timer
EKSAMENSOPPGAVE Institutt: IKBM Eksamen i: STAT 100 Statistikk Tidspunkt for eksamen: 12. mai 2016 09.00-12.30. 3,5 timer Kursansvarlig: Trygve Almøy Tillatte hjelpemidler: C3. Alle typer kalkulatorer,
Eksamensoppgave i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806
TMA4240 Statistikk 2014
TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 12, blokk II Oppgave 1 På ein av vegane inn til Trondheim er UP interessert i å måle effekten
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 13: Lineær korrelasjons- og regresjonsanalyse Kap. 13.1-13.3: Lineær korrelasjonsanalyse. Disse avsnitt er ikke pensum,
Eksamensoppgåve i TMA4255 Anvendt statistikk
Institutt for matematiske fag Eksamensoppgåve i TMA4255 Anvendt statistikk Fagleg kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 16. mai 2015 Eksamenstid (frå til): 09:00-13:00
Fasit for tilleggsoppgaver
Fasit for tilleggsoppgaver Uke 5 Oppgave: Gitt en rekke med observasjoner x i (i = 1,, 3,, n), definerer vi variansen til x i som gjennomsnittlig kvadratavvik fra gjennomsnittet, m.a.o. Var(x i ) = (x
TMA4240 Statistikk Høst 2009
TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b5 Løsningsskisse Oppgave 1 Vi ønsker å finne ut om et nytt serum kan stanse leukemi.
EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Mandag 9. mai 017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»
Tid: Fredag 16.mai 9:00 12:30 (3.5 timer) Emneansvarlig: Solve Sæbø,
EKSAMENSOPPGAVE Institutt: IKBM Eksamen i: STAT 100 STATISTIKK Tid: Fredag 16.mai 9:00 12:30 (3.5 timer) Emneansvarlig: Solve Sæbø, 6496 5823 Tillatte hjelpemidler: C3: alle typer kalkulatorer, alle andre
ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.
ÅMA1 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 0, s. 1 (Det tas forbehold om feil i løsningsforslaget.) a) Gjennomsnitt: x = 1 Emp. standardavvik: Median: 1 (1.33 + 1.) = 1.35
Eksamensoppgåve i TMA4255 Anvendt statistikk
Institutt for matematiske fag Eksamensoppgåve i TMA4255 Anvendt statistikk Fagleg kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: 3. juni 2016 Eksamenstid (frå til): 09:00-13:00
OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må
OPPGAVEHEFTE I STK000 TIL KAPITTEL 7 Regneoppgaver til kapittel 7 Oppgave Anta at man har resultatet av et randomisert forsøk med to grupper, og observerer fra gruppe, mens man observerer X,, X,2,, X,n
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Det er to populasjoner som vi ønsker å sammenligne. Vi trekker da et utvalg
STK juni 2016
Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6
