Innhold. Innledning. Del I



Like dokumenter
Innhold. Innledning. Del I

Statistikk og dataanalyse

4.8 EMNEBESKRIVELSER I STATISTIKK

DEL 1 GRUNNLEGGENDE STATISTIKK

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

ÅMA110 Sannsynlighetsregning med statistikk, våren

Sannsynlighetsregning og Statistikk.

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Kapittel 3: Studieopplegg

Regler i statistikk STAT 100

MATEMATIKK 1 (for trinn) Emnebeskrivelser for studieåret 2014/2015

Innhold. Forord... 15

Standardavvik. Varians. Utfallsrom (sannsynlighet)

FORMELSAMLING STATISTIKK, HiG

4.8 EMNEBESKRIVELSER I STATISTIKK

Dataanalyse. Hva er en dataanalyse og hvordan gå frem for å gjennomføre en dataanalyse av det innsamlede datagrunnlaget fra en feltundersøkelse?

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Kort overblikk over kurset sålangt

Høgskoleni Øs fold EKSAMEN. Om noe er uklart eller mangelfullt i oppgaven inngår det som en del av oppgaven å ta de nødvendige forutsetninger.

4.8 EMNEBESKRIVELSER I STATISTIKK

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Kapittel 2: Hendelser

Emnenavn: Deleksamen i Statistikk. Eksamenstid: Faglærer: Tore August Kro. Oppgaven er kontrollert:

4.8 EMNEBESKRIVELSER I STATISTIKK

Hogskoleni Østfold EKSAMEN. Eksamenstid: kl til k

STK Oppsummering

Høgskoleni østfold EKSAMEN

TMA 4255 Forsøksplanlegging og anvendte statistiske metoder

Oppfriskning av blokk 1 i TMA4240

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

FORMELSAMLING STATISTIKK, HiG

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

TMA4245 Statistikk Eksamen desember 2016

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl

NTNU KOMPiS Studieplan for MATEMATIKK 1 ( trinn) Studieåret 2014/2015

Løsning eksamen desember 2017

NTNU KOMPiS Studieplan for MATEMATIKK 1 ( trinn) med hovedvekt på trinn Studieåret 2015/2016

Oppgavesettet består av 11 sider inklusiv denne forsiden, hvorav de 7 siste er formelsamling og tabeller.

Hypotesetesting. mot. mot. mot. ˆ x

HØGSKOLEN I STAVANGER

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar Skrevet av Stian Lydersen 16 januar 2013

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

Studieåret 2017/2018

Utvalgsfordelinger (Kapittel 5)

Last ned Sannsynlighetsregning og statistisk metodelære - Knut Ole Lysø. Last ned

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).

Høgskoleni østfold EKSAMEN. SFB10711 Metodekurs 1: Grunnleggende matematikk og statistikk Skriftlig eksamen, vår, statistikk

Et lite notat om og rundt normalfordelingen.

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

TMA4240 Statistikk H2010

Formelsamling i medisinsk statistikk

SPSS Statistics-kurs 2014

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

Eksamensoppgave i TMA4240 Statistikk

FORMELSAMLING STATISTIKK, HiG Versjon per 10. januar 2002, ved Hornæs

Et lite notat om og rundt normalfordelingen.

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

Fasit for tilleggsoppgaver

Antall oppgavesider: 4 Vedlegg: Ett internt notat (8 sider)

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

HØGSKOLEN I STAVANGER

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Datainnsamling og dataanalyse

Løsningsforslag til obligatorisk innlevering 3.

STK1100 våren Generell introduksjon. Omhandler delvis stoffet i avsnitt 1.1 i læreboka (resten av kapittel 1 blir gjennomgått ved behov)

Bernoulli forsøksrekke og binomisk fordeling

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Kapittel 4.4: Forventning og varians til stokastiske variable

FORMELSAMLING TIL STK1100 OG STK1110

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Studieplan for MATEMATIKK 1 ( trinn) Studieåret 2016/2017

TMA4240 Statistikk H2010

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

Forelesning 7 Statistiske beskrivelser av enkeltvariabler. Mål for sentraltendens

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

Medisinsk statistikk Del I høsten 2009:

Inferens i regresjon

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Transkript:

Innhold Del I Innledning 1 Hva er statistikk?...17 1.1 Bokas innhold 18 1.1.1 Noen eksempler 18 1.1.2 Historie 21 1.1.3 Bokas oppbygning 22 1.2 Noen viktige begreper 23 1.2.1 Populasjon og utvalg 23 1.2.2 Variasjon 26 1.2.3 Variabeltyper 27 1.3 Modeller 28 1.4 Innsamling av data 29 1.4.1 Problemløsning krever data 29 1.4.2 Generelt om datainnsamling 31 1.4.3 Spørreundersøkelser 32 1.5 Oppsummering 34 2 Hva er fakta om utvalget?... 35 2.1 Beskrivelse av kategoriske data 36 2.2 Beskrivelse av diskrete data 39 2.3 Beskrivelse av kontinuerlige data 40 2.3.1 Frekvenstabell 40 2.3.2 Histogram 42 2.3.3 Stamme- og bladdiagram 44 2.3.4 Spredningsplott 44 2.3.5 Tidsserieplott 45 2.3.6 Generelle diagramtips 46 2.3.7 Formen på histogrammet 47

viii Innhold 2.4 Sentralmål 48 2.4.1 Modus 48 2.4.2 Median 49 2.4.3 Gjennomsnitt 50 2.4.4 Sammenligning av modus, median og gjennomsnitt 53 2.5 Spredningsmål 54 2.5.1 Variasjonsbredde 54 2.5.2 Varians og standardavvik 55 2.5.3 Variasjonskoeffisient 57 2.6 Skjevhet og kurtosis* 58 2.7 Grupperte data* 58 2.8 Statistikk med Excel 60 2.8.1 Legge inn data 60 2.8.2 Vanlige diagrammer 61 2.8.3 Frekvenstabeller og histogrammer 61 2.8.4 Beskrivende statistikk 63 2.9 Statistikk med Minitab 64 2.9.1 Skjermbildet 64 2.9.2 Grafikk og statistikk 65 2.10 Statistikk med SPSS 66 2.11 Oppsummering 67 Oppgaver til kapittel 2 68 Del II Sannsynlighetsteori 3 Sannsynlighetsregning...75 3.1 Utfallsrom og hendelse 76 3.2 Sannsynligheten for en hendelse 79 3.2.1 Uniform sannsynlighetsmodell 80 3.2.2 Sannsynlighet basert på relativ frekvens 81 3.2.3 Subjektiv sannsynlighet for en hendelse 85 3.2.4 Eksempel på tallfesting av sannsynligheter 86 3.3 Innføring i sannsynlighetsregning 88 3.3.1 Litt mengdelære 88 3.3.2 Sannsynlighetsregningens aksiomer 90 3.3.3 De viktigste regnereglene 90 3.4 Betingede sannsynligheter 94 3.4.1 Regler for betingede sannsynligheter 96 3.4.2 Litt om Bayes 99 3.4.3 Hendelsestre 102 3.5 Uavhengige hendelser 105 3.5.1 Er hendelsene uavhengige? 106 3.5.2 Regler for uavhengige hendelser 107

Innhold ix 3.6 Telleregler Kombinatorikk 111 3.6.1 Produktregelen 111 3.6.2 Urnemodellen 112 3.6.3 De viktigste tellereglene 113 3.6.4 Sannsynligheter basert på kombinatorikk 118 3.7 Bruk av datamaskin 120 3.8 Oppsummering 120 Oppgaver til kapittel 3 121 4 Stokastiske variabler...129 4.1 Stokastiske variabler 130 4.2 Diskrete sannsynlighetsmodeller 132 4.2.1 Sannsynlighetsfordeling 132 4.2.2 Forventningsverdi 139 4.2.3 Varians og standardavvik 143 4.3 Kontinuerlige sannsynlighetsmodeller 145 4.4 Flere variabler samtidig 151 4.4.1 Simultanfordeling 152 4.4.2 Kovarians og korrelasjon 155 4.4.3 Uavhengighet 158 4.4.4 Hendelsestre 160 4.5 Oppsummering 162 Oppgaver til kapittel 4 163 5 Vanlige sannsynlighetsmodeller... 169 5.1 Innledning 170 5.2 Binomisk modell 172 5.3 Hypergeometrisk fordeling 177 5.4 Geometrisk fordeling 180 5.5 Poissonfordelingen 181 5.6 Eksponentialfordelingen 185 5.7 Normalfordelingen 188 5.7.1 Normalfordelingen 189 5.7.2 Sjekk av normalitet 196 5.8 Sentralgrenseteoremet 197 5.9 Andre modeller* 202 5.9.1 Kjikvadratfordelingen 203 5.9.2 Student t-fordelingen 205 5.9.3 Fisher F-fordelingen 206 5.9.4 Multinomisk fordeling 207 5.9.5 Binormalfordelingen 209

x Innhold 5.10 Bruk av datamaskinen 211 5.10.1 Excel 211 5.10.2 Minitab 211 5.10.3 SPSS 212 5.11 Oppsummering 212 Oppgaver til kapittel 5 213 Del III Grunnleggende statistikk 6 Estimering og hypotesetesting...221 6.1 Et innledningseksempel 222 6.1.1 Hvilken vraksannsynlighet har det nye utstyret? 223 6.1.2 Hvor sikkert er estimatet? 224 6.1.3 Er det nye utstyret bedre enn det gamle? 225 6.1.4 Bør AluProd kjøpe det nye utstyret? 228 6.2 Punktestimering 228 6.2.1 Basisteori 228 6.2.2 Punktestimat for forventningsverdien 231 6.2.3 Punktestimat for standardavviket 234 6.2.4 Punktestimat for sannsynligheten p 235 6.2.5 Punktestimat for raten 236 6.2.6 Stratifisering* 237 6.3 Konfidensintervaller 238 6.3.1 Teori 239 6.3.2 Konfidensintervall for når er kjent (Z-intervall) 241 6.3.3 Konfidensintervall for når er ukjent (T-intervall) 242 6.3.4 Konfidensintervall for 245 6.3.5 Konfidensintervall for sannsynligheten p 246 6.3.6 Konfidensintervall for raten 248 6.4 Hypotesetesting metode og teori 249 6.4.1 Etablering av modell og formulering av hypotesene 249 6.4.2 Testobservator og forkastingsområdets form 251 6.4.3 Valg av akseptable feilsannsynligheter 253 6.4.4 Spesifikasjon av forkastingsområde 254 6.4.5 Styrkefunksjon 256 6.4.6 Testens konklusjon 259 6.4.7 Signifikanssannsynlighet (p-verdi) 260 6.4.8 Sammenheng med konfidensintervaller 262 6.5 Hypotesetesting i praksis 262 6.5.1 Hypotesetest av når er kjent (Z-test) 262 6.5.2 Hypotesetest av når er ukjent (T-test) 264 6.5.3 Hypotesetest av sannsynligheten p 266

Innhold xi 6.6 Empirisk fordelingsfunksjon* 268 6.7 Bruk av datamaskinen 270 6.7.1 Excel 270 6.7.2 Minitab 270 6.7.3 SPSS 270 6.8 Oppsummering 271 Oppgaver til kapittel 6 271 Del IV Statistisk analyse 7 Analyse av sammenhenger... 281 7.1 Innledning 282 7.2 Korrelasjon 284 7.3 Enkel lineær regresjon 287 7.3.1 Regresjonsmodellen 287 7.3.2 Regresjonslinjen 288 7.3.3 Hvor god er modellen? 291 7.3.4 Noen statistiske egenskaper ved regresjonsmodeller 292 7.3.5 Er det en sammenheng mellom x og y? 293 7.3.6 Hvilken respons kan vi forvente? 294 7.3.7 Hvilke observasjoner er sannsynlige? 296 7.3.8 Kontroll av forutsetningene 297 7.3.9 Vektet regresjon* 298 7.4 Multippel lineær regresjon 299 7.5 Ikke-lineær regresjon 303 7.5.1 Vanlig ikke-lineær regresjon 304 7.5.2 Polynomisk regresjon 306 7.6 Tidsrekkeanalyse prognoser 308 7.6.1 Trend 310 7.6.2 Sesongvariasjon 311 7.6.3 Tilfeldig variasjon 312 7.6.4 Prognose 312 7.6.5 Mer avanserte modeller* 313 7.7 Bruk av datamaskinen 315 7.7.1 Excel 315 7.7.2 Minitab 316 7.7.3 SPSS 317 7.8 Oppsummering 318 Oppgaver til kapittel 7 318

xii Innhold 8 Sammenligning av grupper...327 8.1 Innledning 328 8.1.1 Hvor mange grupper og hvor mange observasjoner? 328 8.1.2 Randomisering 328 8.1.3 Paring og blokkdeling 329 8.1.4 Klyngeutvalg 331 8.1.5 Hva slags data har vi? 331 8.2 Litt sammenligningsfilosofi 332 8.3 T-test for to grupper 334 8.3.1 Uparet T-test 334 8.3.2 Paret T-test 338 8.3.3 Vurdering av paret og uparet test* 340 8.4 Variansanalyse for flere grupper 340 8.4.1 Noen illustrasjoner 340 8.4.2 Enveis variansanalyse 342 8.4.3 Samtidige konfidensintervaller 345 8.4.4 Kontroll av forutsetninger 345 8.4.5 Toveis variansanalyse* 346 8.4.6 Litt forsøksplanlegging* 349 8.5 Ikke-parametriske tester 350 8.5.1 Uparet Mann-Whitney-Wilcoxon-test 350 8.5.2 Paret Wilcoxon-test 353 8.5.3 Paret fortegnstest 355 8.5.4 Kruskal-Wallis test av flere grupper* 356 8.6 Analyse av kategoriske krysstabeller 357 8.6.1 Kjikvadrattest 357 8.6.2 Simpsons paradoks 360 8.6.3 Modelltest 361 8.7 Bruk av datamaskinen 363 8.7.1 Excel 363 8.7.2 Minitab 364 8.7.3 SPSS 365 8.8 Oppsummering 366 Oppgaver til kapittel 8 366

Innhold xiii 9 SpÖrreundersÖkelse og datainnsamling... 373 9.1 Innledning 374 9.2 Utforming av spørreskjema 375 9.3 Opplegg for innsamling 377 9.4 Organisering av data 381 9.5 Analyse av data og presentasjon av resultater 381 9.6 Praktisk datainnsamling og analyse 385 9.6.1 Spørreundersøkelse om arealbruk 385 9.6.2 Analyse av leiepriser i boligmarkedet 387 9.7 Fallgruver 391 9.8 Oppsummering 392 Oppgaver til kapittel 9 393 Del V Andre anvendelser 10 Statistisk kvalitetsstyring... 397 10.1 Kontrolldiagrammer 398 10.1.1 Shewharts x-diagram 401 10.1.2 s-diagram for spredning 407 10.1.3 p-diagram for defektandel 409 10.1.4 Andre kontrolldiagrammer 410 10.2 Kapabilitet 411 10.2.1 Toleransegrenser og kapabilitetsindeks 411 10.2.2 Fortolkning av kapabilitetsindeks 413 10.3 Akseptanskontroll 415 10.3.1 Kontrollens karakteristikk 416 10.3.2 Akseptanskontroll basert på defektandel 418 10.3.3 Akseptanskontroll basert på målinger 419 10.4 Bruk av datamaskinen 422 10.4.1 Excel 422 10.4.2 Minitab 422 10.4.3 SPSS 423 10.5 Oppsummering 423 Oppgaver til kapittel 10 424

xiv Innhold 11 Simulering...427 11.1 Simulering av tilfeldige tall 428 11.2 Simulering av en stokastisk variabel 430 11.3 Simulering med datamaskinen 433 11.3.1 Excel 433 11.3.2 Minitab 433 11.3.3 SPSS 434 11.3.4 Noen eksempler 434 11.4 Simulering av flere stokastiske variabler 436 11.4.1 Uavhengige variabler 437 11.4.2 Avhengige variabler 438 11.5 Simulering av funksjoner 440 11.6 Simulering av integral* 444 11.7 Oppsummering 446 Oppgaver til kapittel 11 447 A Eksamensoppgaver...453 B Ekstra bevis...485 B.1 Bevis til kapittel 3 485 B.2 Bevis til kapittel 4 486 B.3 Bevis til kapittel 5 488 B.4 Bevis til kapittel 6 493 B.5 Bevis til kapittel 7 493 B.6 Bevis til kapittel 8 495 B.7 Bevis til kapittel 11 496 C Standard statistikkfunksjoner i Excel...497 C.1 Standard statistikkfunksjoner i Excel 497 C.2 Statistikkfunksjoner under dataanalyseverktøyet i Excel 501 D Fasit...504 E Statistiske tabeller...533 E.1 Kumulativ binomisk sannsynlighet 534 E.2 Kumulativ poissonfordeling 535 E.3 Kumulativ standardnormalfordeling 536 E.4 Standardnormalfordelingens kvantiltabell 537 E.5 t-fordelingens kvantiltabell 538 E.6 Kjikvadratfordelingens kvantiltabell 539 F Stikkord...540