FORMELSAMLING STATISTIKK, HiG
|
|
- Carina Samuelsen
- 8 år siden
- Visninger:
Transkript
1 FORMELSAMLING STATISTIKK, HiG Hans Petter Hornæs Versjon per 18. februar 2004 Innhold 1 EMPIRISKE STATISTISKE MÅL Forventningsverdi, varians og standardavvik Grupperte data Ordnede data, median og kvartiler Regresjon SANNSYNLIGHETSREGNING Definisjon av sannsynlighet - Kolmogoroffs aksiomer Kombinatorikk Diskrete sannsynlighetsfordelinger Kontinuerlige sannsynlighetsfordelinger Forventningsverdi og varians Regneregler for forventningsverdi og varians Sentralgrenseteoremet STATISTISKE METODER Generelle inisjoner Tifeldig utvalg, en variabel (eller paret modell) Tilfeldig utvalg, to variable (Uparet modell): Lineær regresjonsmodell Variansanalyse (ANOVA) Ikke parametriske tester χ 2 -tester (kjikvadrattester) TABELLER Kumulativ normalfordeling Φ(z) Fraktiler, normalfordeling Student T fordeling, fraktiltabell χ 2 fordeling, fraktiltabell Fishers F fordeling, fraktiltabell
2 1 EMPIRISKE STATISTISKE MÅL 1.1 Forventningsverdi, varians og standardavvik La x {x 1,x 2,... x n } være et datasett av (reelle) tall: Beliggenhetsmål: Empirisk forventningsverdi (gjennomsnitt): x x 1 + x x n n Definisjon av noen hjelpestørrelser: 1 n n x i (1) s xx n x 2 i n x2 n (x i x) 2 s yy n y 2 i n y2 n (y i y) 2 (2) s xy n x i y i n x y n (x i x)(y i y) Spredningsmål: Empirisk varians og standardavvik Varians (empirisk varians) s 2 er gitt ved: s 2 Var(x) n (x i x) 2 n 1 s xx (n 1) (3) Standardavvik er gitt ved: 1.2 Grupperte data s Var(x) (4) Hvis det er flere observasjoner av hver verdi kan observasjonene organiseres i en frekvenstabell. La y i for i {1, 2,...,k} være verdiene som finnes blant de n observasjonene. Antall observasjoner av y i kalles frekvensen, betegnet F i. Andel observasjoner av y i kalles den relative frekvensen, betegnet f i.daerf i F i /n. Med utgangspunkt i at verdiene y 1,y 2,...,y k, n og frekvensene (og dermed de relative frekvensene) er kjent, får vi følgende formler: Gjennomsnitt, grupperte data x k y i f i (5) Varians, grupperte data k s 2 (y i x) 2 f i n 1 Standardavviket er fortsatt s s 2. n ( k ) yi 2 n 1 f i (x) 2 (6) 1
3 1.3 Ordnede data, median og kvartiler La x {x [1],x [2],... x [n] } være et datasett av (reelle) tall ordnet i stigende rekkefølge: Beliggenhetsmål: Median Medianen x (også benevnt md eller q 2, midterste verdi) : x x [(n+1)/2] n oddetall ) x 1 2 (x [n/2] + x [(n/2)+1] n partall (7) Spredningsmål: Kvartilavstand Nedre kvartil q 1 avgrenser nedre fjerdedel, mens øvre kvartil q 4 avgrenser øvre fjerdedel av de ordnede dataene. (Mer presist, inert som i matematikkprogrammet Maple, inisjonen kan variere noe mellom forskjellige bøker eller kalkulatorer): s q 1 q 3 n 4k n/4 x [s] x [n s] 3 n 4k +1 (n 1)/4 4 x [s] x [s+1] 1 n 4k +2 (n 2)/4 2 x [s] x [s+1] 1 n 4k +3 (n 3)/4 4 x [s] x [s+1] 1 4 x [n s 1] x [n s] 1 2 x [n s 1] x [n s] 3 4 x [n s 1] x [n s] (8) 1.4 Regresjon Kvartilavstand: q 3 q 1 (9) Tilpasning av n tallpar { (x 1,y 1 ), (x 2,y 2 ),...(x n,y n ) } til linja y a + bx: Stigning: Konstant: Empirisk korrelasjon: b a r s xy s xx y bx (10) s xy sxx syy 2
4 2 SANNSYNLIGHETSREGNING 2.1 Definisjon av sannsynlighet - Kolmogoroffs aksiomer a) 0 P(A) 1 b) P(S) 1 c) P( A i ) P(A i ) hvis i j A i A j Noen umiddelbare konsekvenser av Kolmogoroffs aksiomer a) P(A B) P(A)+P(B) hvis A B b) P(A B) P(A)+P(B) P(A B) c) P(A) 1 P(A) d) P( ) 0 (11) (12) Betinget sannsynlighet P(A B) P(A B)/P(B) (13) Dette gir at P(A B) P(A B)P(B) ogp(a B) P(A)P(B A) Uavhengighet Hendelsene A og B kalles uavhengige P(A B) P(A)P(B) (14) Dette er det samme som at P(A B) P(A), og også det samme som at P(B A) P(B). 2.2 Kombinatorikk Multiplikasjonsprinsippet En operasjon utføres i n etapper. I i te etappe er det N i mulige utfall. Da er det totale antall mulige utfall N 1 N 2 N 3 N n (15) Fakultet og binomialkoeffisienter Fakultet ( n! ) N Binomialkoeffisienter n ( ) N Binomialkoeff., alternativ n For n 0 inerer vi 0! n (n 1) (n 2) N! (N n)! n! 1 N (N 1) (N 2) (N n +1) n (n 1) (n 2) 3 2 1, (16) ( ) N 1 (17) 0 3
5 2.2.3 Antall kombinasjoner Urnemodell: Trekker n kuler fra en urne med totalt N kuler. Antall måter å gjøre dette på: Ordnet utvalg Ikke ordnet utvalg Med tilbakelegging N n (Ikke pensum) ( ) (18) N Uten tilbakelegging N (N 1) (N 2) (N n +1) n 2.3 Diskrete sannsynlighetsfordelinger Generelt a) Kumulativ sanns.fordeling F (x) b) Punktsannsynlighet f(x) c) Forventningsverdi µ E(X) d) Varians Var(X) P(X x) P(X x) x i P(X x i ) Alternativ formel Var(X) e) Standardavvik σ (x i µ) 2 P(X x i ) x 2 i P(X x i) µ 2 Var(X) (19) Binomisk fordeling X bin(n, p) Parametrene p og n er konstanter, der 0 p 1ognet naturlig tall, hvis X har punktsannsynlighet ( ) n f(x) p x (1 p) n x x {0, 1, 2,...,n} (20) x Bruk: Gjentar samme forsøk n ganger, p er sannsynligheten for gunstig utfall i hvert enkelt forsøk, og X er antall gunstige utfall i forsøksrekken. For eksempel X er antall seksere i n terningkast. Da er p 1/6. Forventningsverdi E(X) np Varians Var(X) np(1 p) Standardavvik σ np(1 p) (21) 4
6 2.3.3 Poissonfordeling X po(λ t) (Parameteren λ t>0 er en konstant) hvis X har punktsannsynlighet (λ t)x f(x) e λ t x {0, 1, 2,...} (22) x! Bruk: X er antall ulykker i et tidsintervall med lengde t (konstant ulykkesrisiko, forventet antall ulykker per tidsenhet er λ). Forventningsverdi E(X) λ t Varians Var(X) λ t (23) Hypergeometrisk fordeling X hyp(n,m,n) (dern n>0, M N er naturlige tall) hvis X har punktsannsynlighet ( M )( N M ) x n x f(x) ( N x {0, 1, 2,...,n} (24) n) Bruk i urnemodell: Trekker n kuler uten tilbakelegging. Antall gunstige kuler er M og antall kuler totalt er N. X er antall gunstige kuler i utvalget. Ved å innføre p M/N, (p er andelen gunstige kuler ) har vi: Forventningsverdi E(X) np Varians Var(X) N n N 1 np(1 p) (25) 2.4 Kontinuerlige sannsynlighetsfordelinger Generelt a) Kumulativ sanns.fordeling F (x) b) Sannsynlighetstetthet f(x) c) Forventningsverdi µ E(X) d) Varians Var(X) P(X x) Alternativ formel Var(X) e) Standardavvik σ d dx F (x) xf(x) dx (x µ) 2 f(x) dx x 2 f(x) dx µ 2 Var(X) (26) 5
7 2.4.2 Eksponentialfordeling T exp(λ) (λ>0 en konstant) hvis T har sannsynlighetstetthet og kummulativ sannsynighetsfordeling gitt ved f(t) λe λt for t 0, (f(t) 0fort<0) F (t) t 0 λe λτ dτ 1 e λt for t 0, (F (t) 0fort<0) Bruk: T er tid fram til neste ulykke (konstant ulykkesrisiko, samme forutsetninger som for Poissonfordeling) Normalfordeling (27) Forventningsverdi E(X) 1/λ Varians Var(X) 1/λ 2 (28) En stokastisk variabel Z kalles standard normalfordelt, Z N(0, 1), om sannsynlighetstettheten er f(z) φ(z) 1 e 1 2 z2, ( <z< ) (29) 2π For standard normalfordeling betegnes den kumulative sannsynlighettstettheten Φ(z). Om Z N(0, 1), og µ, σ er konstanter, kalles fordelinga til normalfordeling med parametre µ og σ, med notasjon X σz + µ (der µ R og σ>0 ) (30) X N(µ, σ). Kumulativ sanns.fordeling F (x) ( ) x µ Φ σ Forventningsverdi E(X) µ Varians Var(X) σ 2 Tabell over sannsynligheter og fraktiler i standard normalfordeling er på side16 (31) χ 2 fordeling Hvis Z 1,...,Z n er uavhengige og standard normalfordelt inerer vi fordelinga til n X Zi 2 (32) som en χ 2 fordeling med parameter ν n frihetsgrader, X χ 2 ν Hvis X 1,...,X n er uavhengige og N(µ, σ) fordelt, og X n X i /n, har ( ) n 2 Xi X X χ 2 fordeling med ν n 1 frihetsgrader (33) σ Forventningsverdi E(X) ν Varians Var(X) 2ν χ 2 fordeling brukes ved undersøkelse av varianser, ved tester om stokastisk avhengighet (sammenheng) og om hvorvidt et datasett passer til en gitt fordelingstype (avsnitt 3.7). Fraktiltabell for χ 2 fordeling er på side (34)
8 2.4.5 Students t fordeling Hvis Z er standard normalfordelt og X er χ 2 fordelt med ν frihetsgrader, Z og X uavhengige, kalles fordelingen til T Z (35) X/ν Students t fordeling med parameter ν frihetsgrader, t T ν Anta X 1,...,X n er uavhengige og N(µ, σ) fordelt. ( n n ) Hvis X X i /n og S Xi 2 nx 2 /(n 1) gjelder: T X µ S/ n er Students t-fordelt med ν n 1 frihetsgrader (36) Students t-fordeling brukes ved slutninger om forventningsverdier når standardavviket er ukjent. Fraktiltabell for Students t fordeling er på side Fisher fordeling Hvis U er χ 2 fordelt med n frihetsgrader og V er χ 2 fordelt med m frihetsgrader, U og V uavhengige, inerer vi fordelingen til F U/n V/m (37) som en Fisherfordeling med n og m frihetsgrader, F F n,m. Fisherfordeling brukes i forbindelse med variansanalyse (avsnitt 3.5), og ved sammenlikning av varianser. Fraktiltabell for Fisher fordeling er på side Forventningsverdi og varians Definisjon: Diskrete fordelinger: E(g(X)) g(x i ) f(x i ) (f(x i )P(X x i )) Kontinuerlige fordelinger: E(g(X)) g(x) f(x) dx (f(x) er sannsynlighetstettheten ) ( Varians: Var(X) E (X µ) 2) ( E X 2) µ 2 (der µ E(X)) (38) Som oftest er g(x) X. 2.6 Regneregler for forventningsverdi og varians a, b, a 1, a 2... a n er konstanter og X, Y, X 1, X 2... X n er stokastiske variable (diskrete eller kontinuerlige). X (X 1 + X X n )/n er gjennomsnittet av n stokastiske variable. 7
9 2.6.1 Summeregler for forventningsverdier a) E(aX + b) a E(X)+b b) E(X + Y )E(X)+E(Y) c) E(a 1 X 1 + a 2 X a n X n + b) a 1 E(X 1 )+a 2 E(X 2 )+ + a n E(X n )+b Summeregler for varians a) Var(aX + b) a 2 Var(X) b) Var(X + Y )Var(X)+Var(Y ) hvis X og Y er uavhengige (ukorrelerte) c) Var(X + Y )Var(X)+Var(Y )+2Cov(X, Y ) d) Var(a 1 X 1 + a 2 X a n X n + b) a 2 1 Var(X 1 )+a 2 2 Var(X 2 )+ + a 2 n Var(X n ) hvis alle X i ene er uavhengige (ukorrelerte) Noen viktige konsekvenser a) σ ax+b aσ X hvis a>0, generelt σ ax+b a σ X b) E(X) µ hvis E(X i )µ for alle i c) Var(X) 1 n σ2 hvis Var(X i )σ 2 for alle i og alle X i ene er uavhengige d) σ X σ n hvis σ Xi σ for alle i og alle X i ene er uavhengige e) E(X Y )E(X) E(Y ) f) Var(X Y )Var(X)+Var(Y ) hvis X og Y er uavhengige 2.7 Sentralgrenseteoremet Om X 1, X 2,..., X i,... alle er uavhengige, E(X i )µ og Var(X i )σ 2 er ( n lim X i ) nµ N(0, 1) (standard normalfordelt) (39) n nσ I praksis betyr dette at summen av mange uavhengige observasjoner fra samme fordeling er tilnærmet normalfordelt. Om fordelingene i utgangspunktet er tilnærmet symmetriske behøver ikke n være videre stor for at tilnærmingen blir god. 8
10 2.7.1 Noen konsekvenser av sentralgrenseteoremet n X X i /n Y med Y N(µ, σ/ n) for store n (40) Det vil si at gjennomsnittet av mange uavhengige observasjoner fra samme fordeling er tilnærmet normalfordelt. ( Om X bin(n, p) erx Y der Y N np, ) np(1 p) P(a X b) P(a 1/2 Y b +1/2) for store n : (41) Det vil si at for store n er binomisk fordeling tilnærmet normalfordeling. Tommelfingerregel : np > 5 og n(1 p) > 5. For bedre tilnærming ta med en halv enhet ekstra i hver retning (halvkorreksjon). Også Poissonfordeling er tilnærmet normalfordelt for store λ ( Tommelfingerregel : λ > 15). Også her brukes halvkorreksjon. 9
11 3 STATISTISKE METODER 3.1 Generelle inisjoner Definisjon Hvis X er en tilfeldig variabel er α fraktilen k α inert ved likningen P (X >k α )α ( eller P (X k α )1 α ) (42) Definisjon betyr fordelt som. (f.eks betyr Z N(0, 1) at Z er standard normalfordelt) Definisjoner: Ved å bytte ut små med store bokstaver i inisjonene i avsnitt 1, Empiriske Statistiske Mål, for x og s ene i de empiriske formlene, får vi tilsvarende formler for tilfeldige variable (uobserverte verdier). Eksempel: S XX Xi 2 nx2 3.2 Tifeldig utvalg, en variabel (eller paret modell) La X 1,X 2,...,X n være uavhengige og identisk normalfordelte, X i N(µ, σ) σ kjent Fordelinga til gjennomsnittet: X N(µ, σ/ n) (43) Z X µ n N(0, 1) σ (standard normalfordelt) (44) På grunn av sentralgrenseteoremet er dette fordelingsresultatet robust mot moderate avvik fra normalfordeling på X i ene. Anvendelse : (1 α) konfidensintervall for µ når σ er kjent: ( ) σ σ x z α/2 n, x + z α/2 n (45) der z α/2 betyr α/2 fraktilen til en standard normal fordeling σ ukjent T X µ n Tn 1 (Students T-fordelt med n 1 frihetsgrader) (46) S Anvendelse (1) : (1 α) konfidensintervall for µ når σ er ukjent, og t α/2 betyr α/2 fraktilen til en Students T fordeling med (n 1) frihetsgrader: ( x t α/2 s n, x + t α/2 ) s n (47) Anvendelse (2): Hypotesetesting av H 0 : µ µ 0 mot H 1 : µ>µ 0 på α nivået: Forkast H 0 om x µ 0 s χ 2 fordeling (Kji-kvadrat fordeling) S XX σ 2 (n 1)S 2 /σ 2 n (X i X) 2 n > tα (48) σ 2 χ 2 n 1 (χ2 ford., n 1 frihetsgrader) (49) 10
12 3.3 Tilfeldig utvalg, to variable (Uparet modell): La X 1,X 2,...,X n være uavhengige og identisk normalfordelte, X i N(µ x,σ)ogy 1,Y 2,...,Y m uavhengige og identisk normalfordelte, Y i N(µ y,σ). (Dvs samme standard avvik, men muligens forskjellige forventningsverdier): T (X Y ) (µ x µ y ) S p 1 n + 1 m T n+m 2 (50) (Students T-fordelt med n + m 2 frihetsgrader.) Det polariserte standardavviket S p er estimator for σ, og er gitt ved formelen S p S XX + S YY n + m 2 (n 1)SX 2 +(m 1)S2 Y n + m 2 (51) S X og S Y er de empiriske standardavvikene til hhv. x-ene og y-ene. 3.4 Lineær regresjonsmodell La (x 1,Y 1 ), (x 2,Y 2 )...,(x n,y n ) være uavhengige par der vi antar Y ene stokastiske, og x ene under vår kontroll. Vi har en lineær regresjonsmodell om vi gjør følgende antagelse: Y i α + βx i + e i der e i N(0,σ) eller ekvivalent at Y i N(α + βx i,σ) (52) α estimeres ved a, ogβ ved b, dera og b er som i inisjonene i avsnitt 1.4. Før observasjonene (som tilfeldige variable) bruker vi de store Y ene istedenfor de små, og kaller størrelsene A og B: Fordelingsresultater: A x 2 N α, σ i ( B N β, ns xx ) σ sxx (53) (B β) S T n 2 e/s 2 xx der Se 2 S YY B 2 s xx (punktestimator for σ 2 ) n 2 Eksempel på anvendelse: Hypotesetesting av H 0 : β 0motH 1 : β 0 med signifikansnivå δ. Vi bruker testobservatoren t: b t s 2 e /s xx Forkast H 0 om t>t δ/2 eller t< t δ/2 (der t δ/2 er δ/2 fraktilen i students T fordeling med n 2 frihetsgrader). 11
13 3.4.2 Konfidensintervall for regresjonslinjen Øvre og nedre grense er funksjonsuttrykk i x, og regresjonslinjen ligger mellom disse to grafene med sannsynlighet 1 δ: a + bx t δ/2 s e 1 (x x)2 1 (x x)2 +,a+ bx + t n s δ/2 s e + xx n s xx der t δ/2 er fraktilen i en Students t fordeling med n 2 frihetsgrader Prediksjonsintervall For en verdi x vil tilhørende observvasjon av y ligge innenfor disse grensene med sannsynlighet 1 δ: a + bx t δ/2 s e 1+ 1 (x x)2 +,a+ bx + t n s δ/2 s e 1+ 1 (x x)2 + (55) xx n s xx der t δ/2 er fraktilen i en Students t fordeling med n 2 frihetsgrader. (54) 3.5 Variansanalyse (ANOVA) Enveis variansanalyse Datastruktur: Data Snitt Antall Gruppe 1 y 11,y 12,..., y 1n1 y 1 n 1 Gruppe 2 y 21,y 22,..., y 2n2 y 2 n 2.. Gruppe g y k1,y k2,..., y kng y g n g Total y n.. (56) Modell: Y ij µ i + e ij der e ij N(0,σ), e ij ene uavhengige Hypoteser: H 0 : µ 1 µ 2 µ g H 1 : Ikke alle µ i ene like Kvadratsummer: Variasjon Symbol Definisjon Utregning Frihetsgrader g n g g n g Total SS T (y ij y ) 2 yij 2 ny 2 n 1 j1 j1 g n g g Mellom grupper SS G (y i y ) 2 n i y 2 i ny 2 g 1 j1 g n g Residual SS E (y ij y i ) 2 SS T SS G n g j1 (57) Varianser: S 2 G SS G g 1 S 2 E SS E n g (58) 12
14 F observator: F S2 G SE 2, Hvis H 0 er sann er F F g 1,n g (59) Det vil si at F er Fisher-fordelt med g 1ogn g frihetsgrader hvis H 0 er sann. Testprosedyre: Forkast H 0 for store verdier av observasjon av F Toveis variansanalyse Antall grupper: g Antall blokker: b Antall elemnter i hvert feltr Antall observasjoner totalt:n g b r Datastruktur: Blokk 1... Blokk b Gruppesnitt Gruppe 1 y 111,...,y 11r... y 1b1,...,y 1br y Gruppe g y g11,...,y g1r... y gb1,...,y gbr y g Blokksnitt y 1... y b y (60) Modell: Y ijk α + β i + β j + e ijk, i {1,,g}, j {1,...,b}, k {1,...,r} og e ijk N(0,σ), uavhengige. g b β i 0, β j 0 (61) Kvadratsummer: j1 Variasjon Symbol Formel Frihetsgrader g b r Total SS T yijk 2 ny 2 n 1 j1 k1 g Mellom grupper SS G br y 2 i ny 2 g 1 j1 Mellom blokker SS B b gr y 2 j ny 2 b 1 Residual SS E SS T SS G SS B n b g +1 (62) Hypotesetester Generelt F F r,s betyr at F er Fisherfordelt med r og s frihetsgrader. Forkast H 0 for store verdier av observasjon av F. Grupper H 0 : β 1 β 2 β g, Testobservator: F Blokker H 0 : β 1 β 2 β b, Testobservator: F H 1 : Ikke alle β i ene er like. SS G /(g 1) SS E /(n b g +1). Hvis H 0 er sann er F F g 1,n b g+1 (63) H 1 : Ikke alle β j ene er like. SS B /(b 1) SS E /(n b g +1). Hvis H 0 er sann er F F b 1,n b g+1 (64) 13
15 3.6 Ikke parametriske tester Uparet Mann-Witney-Wilcoxon test Datastruktur : Gruppe 1 x 1 x 2 x n Gruppe 2 y 1 y 2 y m Definisjon av W : Sett opp alle dataene i en enkelt ordnet liste, og nummerer observasjonene i stigende rekkefølge. W er summen av numrene som tilhører x er. Hypoteser H 0 : x ỹ (medianene like) H 1 : x ỹ (medianene forskjellige). Testobservator Bruk W som testobservator. Hvis fordelingen på observasjonene er like og n > 10 og m > 10 er W tilnærmet normalfordelt: n(n + m + 1) W X N(µ, σ), µ, σ 2 nm(n+m+1) (65) 2 12 Er medianene (svært) ulike, er W vanligvis langt fra µ. Ensidige tester: Er x (mye) større (hhv. mindre) enn ỹ er W vanligvis større (hhv. mindre) enn µ Paret Wilcoxon test Datastruktur: {(x 1,y 1 ), (x 2,y 2 ),...,(x n,y n )} Definisjon av W : Sett opp differensen x i y i i en enkelt liste ordnet etter tallverdiene x i y i, og nummerer observasjonene i stigende rekkefølge. W er summen av numrene som tilhører positive verdier. Hypoteser H 0 : x ỹ (medianene like) H 1 : x ỹ (medianene forskjellige). Testobservator Bruk W som testobservator. Hvis fordelingen på observasjonene er like og n > 20 er W tilnærmet normalfordelt: n(n + 1) W X N(µ, σ), µ, σ 2 n(n + 1)(2n + 1) 4 24 Er medianene (svært) ulike, er W vanligvis langt fra µ. (66) 3.7 χ 2 -tester (kjikvadrattester) Krysstabeller- Test av uavhengighet En oppdeling av utfallsrommet S i hendelser A 1,A 2,...A r kalles en partisjon hvis A 1 A 2... A r S og A i A j når i j. La A 1,A 2,...A r og B 1,B 2,...B k være partisjoner av S.. Da sier vi partisjonene er uavhengige hvis P(A i B j )P(A i ) P(B j ) for alle par A i,b j. 14
16 Hypoteser H 0 : Partisjonene A 1,A 2,...A r og B 1,B 2,...B k er uavhengige. H 1 : Partisjonene A 1,A 2,...A r og B 1,B 2,...B k er avhengige. Vi skal foreta n observasjoner av uavhengige gjentagelser, og telle opp antall resultater i hver mengde A i B j, og kalle dette tallet X ij. Summen av antall observasjoner i A i kalles R i, og summen av antall observasjoner i B j kalles K j.hvish 0 er sann er E ij R i K j /n forventet antall observasjoner i A i B j. Definer: Q r k j1 (X ij E ij ) 2 E ij (67) Hvis alle E ij 5ogH 0 er sann er Q tilnærmet χ 2 (r 1)(k 1), χ2 fordelt med (r 1)(k 1) frihetsgrader Modelltest Forkast H 0 for store verdier av Q (68) Tester om et datasett med n verdier passer til en fordelingstype (f.eks normalfordeling) der vi må estimere r parametre (f.eks µ og σ, r 2) fra dataene: Hypoteser H 0 : Dataene passer til en fordeling fra en fordelingstype med r ukjente parametre H 1 : Dataene passer ikke til denne fordelingstypen. Del den reelle aksen inn i k intervaller [x i 1,x i ](derx 0 og x k ), og regn ut p i P(x i 1 X i <x i ) (fra fordelingen med de estimerte dataene). Definer E i n p i,oglax i være antall observasjoner i intervallet [x i 1,x i ]. Definer: Q k (X i E i ) 2 E i (69) Hvis alle E i 5ogH 0 er sann er Q tilnærmet χ 2 k r 1, χ2 fordelt med k r 1 frihetsgrader. Forkast H 0 for store verdier av Q (70) 15
17 4 TABELLER 4.1 Kumulativ normalfordeling Φ(z) z 1 Φ(z) P (Z z) e x2 /2 dx 2π For z<0brukatφ( z) 1 Φ(z). der Z N(0, 1) (standard normalfordelt). z.,.0.,.1.,.2.,.3.,.4.,.5.,.6.,.7.,.8.,.9 0, 0 0, , , , , , , , , , , 1 0, , , , , , , , , , , 2 0, , , , , , , , , , , 3 0, , , , , , , , , , , 4 0, , , , , , , , , , , 5 0, , , , , , , , , , , 6 0, , , , , , , , , , , 7 0, , , , , , , , , , , 8 0, , , , , , , , , , , 9 0, , , , , , , , , , , 0 0, , , , , , , , , , , 1 0, , , , , , , , , , , 2 0, , , , , , , , , , , 3 0, , , , , , , , , , , 4 0, , , , , , , , , , , 5 0, , , , , , , , , , , 6 0, , , , , , , , , , , 7 0, , , , , , , , , , , 8 0, , , , , , , , , , , 9 0, , , , , , , , , , , 0 0, , , , , , , , , , , 1 0, , , , , , , , , , , 2 0, , , , , , , , , , , 3 0, , , , , , , , , , , 4 0, , , , , , , , , , , 5 0, , , , , , , , , , , 6 0, , , , , , , , , , , 7 0, , , , , , , , , , , 8 0, , , , , , , , , , , 9 0, , , , , , , , , , 9986 z 3, 0 3, 1 3, 2 3, 3 3, 4 3, 5 3, 6 3, 7 3, 8 3, 9 Φ(z) 0, , , , , , , , , , Fraktiler, normalfordeling Tabell over z α,gittved P(Z>z α )α der Z N(0, 1) (standard normalfordelt) α 0, , , , , , , , , α% 10% 5% 2, 5% 1% 0, 5% 0, 1% 0, 05% 0, 01% 0, 005% z α 1, 282 1, 645 1, 960 2, 326 2, 576 3, 091 3, 291 3, 719 3, 891 For nedre fraktil, P(Z >z 1 α )1 α, brukatz 1 α z α For tosidige tester og intervaller brukes at P( z α/2 Z z α/2 )1 α 16
18 4.3 Student T fordeling, fraktiltabell Tabell over t α,gittvedp(t>t α )α der T T ν.detvilsit er Students T-fordelt med ν frihetsgrader. ν α 0, , , , , , , ,078 6,314 12,706 31,821 63, , , ,886 2,920 4,303 6,965 9,925 22,327 31, ,638 2,353 3,182 4,541 5,841 10,215 12, ,533 2,132 2,776 3,747 4,604 7,173 8, ,476 2,015 2,571 3,365 4,032 5,893 6, ,440 1,943 2,447 3,143 3,707 5,208 5, ,415 1,895 2,365 2,998 3,499 4,785 5, ,397 1,860 2,306 2,896 3,355 4,501 5, ,383 1,833 2,262 2,821 3,250 4,297 4, ,372 1,812 2,228 2,764 3,169 4,144 4, ,363 1,796 2,201 2,718 3,106 4,025 4, ,356 1,782 2,179 2,681 3,055 3,930 4, ,350 1,771 2,160 2,650 3,012 3,852 4, ,345 1,761 2,145 2,624 2,977 3,787 4, ,341 1,753 2,131 2,602 2,947 3,733 4, ,337 1,746 2,120 2,583 2,921 3,686 4, ,333 1,740 2,110 2,567 2,898 3,646 3, ,330 1,734 2,101 2,552 2,878 3,610 3, ,328 1,729 2,093 2,539 2,861 3,579 3, ,325 1,725 2,086 2,528 2,845 3,552 3, ,323 1,721 2,080 2,518 2,831 3,527 3, ,321 1,717 2,074 2,508 2,819 3,505 3, ,319 1,714 2,069 2,500 2,807 3,485 3, ,318 1,711 2,064 2,492 2,797 3,467 3, ,316 1,708 2,060 2,485 2,787 3,450 3, ,315 1,706 2,056 2,479 2,779 3,435 3, ,314 1,703 2,052 2,473 2,771 3,421 3, ,313 1,701 2,048 2,467 2,763 3,408 3, ,311 1,699 2,045 2,462 2,756 3,396 3, ,310 1,697 2,042 2,457 2,750 3,385 3, ,303 1,684 2,021 2,423 2,704 3,307 3, ,299 1,676 2,009 2,403 2,678 3,261 3, ,296 1,671 2,000 2,390 2,660 3,232 3, ,294 1,667 1,994 2,381 2,648 3,211 3, ,292 1,664 1,990 2,374 2,639 3,195 3, ,290 1,660 1,984 2,364 2,626 3,174 3, ,289 1,658 1,980 2,358 2,617 3,160 3,373 1,282 1,645 1,960 2,326 2,576 3,091 3,291 For store ν bruker vi at Students t-fordeling er tilnærmet standard normalfordelt. Fraktilene til standard normalfordeling er i tabellen plassert som ν. 17
19 4.4 χ 2 fordeling, fraktiltabell Tabell over k α,gittvedp(x>k α )α der X χ 2 ν. Det vil si X er χ 2 fordelt med ν frihetsgrader. ν α ,000 0,000 0,001 0,004 3,84 5,02 6,63 7,88 2 0,010 0,020 0,051 0,103 5,99 7,38 9,21 10,60 3 0,072 0,115 0,216 0,352 7,82 9,35 11,34 12,84 4 0,207 0,297 0,484 0,711 9,49 11,14 13,28 14,86 5 0,412 0,554 0,831 1,15 11,07 12,83 15,09 16,75 6 0,676 0,872 1,24 1,64 12,59 14,45 16,81 18,55 7 0,99 1,24 1,69 2,17 14,07 16,01 18,48 20,28 8 1,34 1,65 2,18 2,73 15,51 17,53 20,09 21,95 9 1,74 2,09 2,70 3,33 16,92 19,02 21,67 23, ,16 2,56 3,25 3,94 18,31 20,48 23,21 25, ,60 3,05 3,82 4,58 19,68 21,92 24,72 26, ,07 3,57 4,40 5,23 21,03 23,34 26,22 28, ,57 4,11 5,01 5,89 22,36 24,74 27,69 29, ,08 4,66 5,63 6,57 23,68 26,12 29,14 31, ,60 5,23 6,26 7,26 25,00 27,49 30,58 32, ,14 5,81 6,91 7,96 26,30 28,85 32,00 34, ,70 6,41 7,56 8,67 27,59 30,19 33,41 35, ,27 7,02 8,23 9,39 28,87 31,53 34,81 37, ,84 7,63 8,91 10,12 30,14 32,85 36,19 38, ,43 8,26 9,59 10,85 31,41 34,17 37,57 40, ,03 8,90 10,28 11,59 32,67 35,48 38,93 41, ,64 9,54 10,98 12,34 33,92 36,78 40,29 42, ,26 10,20 11,69 13,09 35,17 38,08 41,64 44, ,89 10,86 12,40 13,85 36,42 39,36 42,98 45, ,52 11,52 13,12 14,61 37,65 40,65 44,31 46, ,16 12,20 13,84 15,38 38,89 41,92 45,64 48, ,81 12,88 14,57 16,15 40,11 43,19 46,96 49, ,46 13,56 15,31 16,93 41,34 44,46 48,28 50, ,12 14,26 16,05 17,71 42,56 45,72 49,59 52, ,79 14,95 16,79 18,49 43,77 46,98 50,89 53, ,71 22,16 24,43 26,51 55,76 59,34 63,69 66, ,99 29,71 32,36 34,76 67,50 71,42 76,15 79, ,53 37,48 40,48 43,19 79,08 83,30 88,38 91, ,28 45,44 48,76 51,74 90,53 95,02 100,4 104, ,17 53,54 57,15 60,39 101,9 106,6 112,3 116, ,20 61,75 65,65 69,13 113,1 118,1 124,1 128, ,33 70,06 74,22 77,93 124,3 129,6 135,8 140,2 For store ν kan vi bruke at sentralgrenseteoremet gir at X N ( ν, 2ν ), slik at k α ν + 2ν z α 18
20 4.5 Fishers F fordeling, fraktiltabell Tabell over k α,gittvedp(f>k α )α der F F r,s,dvs.f er Fisher fordelt med r og s frihetsgrader. r er antall frihetsgrader i teller, i første rad, s er antall frihetsgrader i nevner, i første kolonne α 0.05 (ogα 0.95 ) s \ r ,5 19,0 19,2 19,2 19,3 19,3 19,4 19,4 19,4 19,5 19,5 3 10,1 9,55 9,28 9,12 9,01 8,94 8,85 8,79 8,70 8,63 8,58 4 7,71 6,94 6,59 6,39 6,26 6,16 6,04 5,96 5,86 5,77 5,70 5 6,61 5,79 5,41 5,19 5,05 4,95 4,82 4,74 4,62 4,52 4,44 6 5,99 5,14 4,76 4,53 4,39 4,28 4,15 4,06 3,94 3,83 3,75 7 5,59 4,74 4,35 4,12 3,97 3,87 3,73 3,64 3,51 3,40 3,32 8 5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,35 3,22 3,11 3,02 9 5,12 4,26 3,86 3,63 3,48 3,37 3,23 3,14 3,01 2,89 2, ,96 4,10 3,71 3,48 3,33 3,22 3,07 2,98 2,85 2,73 2, ,75 3,89 3,49 3,26 3,11 3,0 2,85 2,75 2,62 2,50 2, ,54 3,68 3,29 3,06 2,90 2,79 2,64 2,54 2,40 2,28 2, ,35 3,49 3,10 2,87 2,71 2,60 2,45 2,35 2,20 2,07 1, ,03 3,18 2,79 2,56 2,40 2,29 2,13 2,03 1,87 1,73 1, ,94 3,09 2,70 2,46 2,31 2,19 2,03 1,93 1,77 1,62 1,48 For α 0.95 bruk at k /l 0.05 der l 0.05 er fraktilen for F fordeling med s og r frihetsgrader (omvendt rekkefølge på frihetsgradene) α 0.01 (og α 0.99) s \ r ,5 99,0 99,2 99,2 99,3 99,3 99,4 99,4 99,4 99,5 99,5 3 34,1 30,8 29,5 28,7 28,2 27,9 27,5 27,2 26,9 26,6 26,4 4 21,2 18,0 16,7 16,0 15,5 15,2 14,8 14,5 14,2 13,9 13,7 5 16,3 13,3 12,1 11,4 11,0 10,7 10,3 10,1 9,72 9,45 9, ,7 10,9 9,78 9,15 8,75 8,47 8,10 7,87 7,56 7,30 7, ,2 9,55 8,45 7,85 7,46 7,19 6,84 6,62 6,31 6,06 5, ,3 8,65 7,59 7,01 6,63 6,37 6,03 5,81 5,52 5,26 5, ,6 8,02 6,99 6,42 6,06 5,80 5,47 5,26 4,96 4,71 4, ,0 7,56 6,55 5,99 5,64 5,39 5,06 4,85 4,56 4,31 4, ,33 6,93 5,95 5,41 5,06 4,82 4,50 4,30 4,01 3,76 3, ,68 6,36 5,42 4,89 4,56 4,32 4,0 3,80 3,52 3,28 3, ,10 5,85 4,94 4,43 4,10 3,87 3,56 3,37 3,09 2,84 2, ,17 5,06 4,20 3,72 3,41 3,19 2,89 2,70 2,42 2,17 1, ,90 4,82 3,98 3,51 3,21 2,99 2,69 2,50 2,22 1,97 1,74 For α 0.99 bruk at k /l 0.01, derl 0.01 er fraktilen for F fordeling med s og r frihetsgrader (omvendt rekkefølge på frihetsgradene). 19
FORMELSAMLING STATISTIKK, HiG Versjon per 10. januar 2002, ved Hornæs
FORMELSAMLING STATISTIKK, HiG Versjon per 10 januar 2002, ved Hornæs 1 EMPIRISKE STATISTISKE MÅL 11 Forventningsverdi, varians og standardavvik La x {x 1,x 2, x n } være et datasett av (reelle) tall: 111
DetaljerFORMELSAMLING STATISTIKK, HiG
Høgskolen i Gjøvik Avdeling for ingeniørfag Versjon fra mai 2007 FORMELSAMLING STATISTIKK, HiG Hans Petter Hornæs hans.hornaes@hig.no ISSN:??????? Innledning. Denne formelsamlingen er skrevet for bruk
DetaljerHøgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen
Høgskolen i Telemark Institutt for økonomi og informatikk FORMELSAMLING 6005 Statistikk I Til bruk ved eksamen Per Chr. Hagen . Sannsynlighetsregning. Regneregler Komplementsetningen: Addisjonssetningen:
DetaljerFORMELSAMLING TIL STK1100 OG STK1110
FORMELSAMLING TIL STK1100 OG STK1110 (Versjon av 16. november 2009) 1. Sannsynlighet La A, B, A 1, A 2,...,B 1, B 2,... være begivenheter, dvs. delmengder av et utfallsrom Ω. a) Aksiomene: Et sannsynlighetsmål
DetaljerKapittel 2: Hendelser
Kapittel 2: Hendelser FENOMEN Eksperiment Utfall Utfallsrom Eksperiment. Utfall. Eksperiment Utfall Hendelse Sannsynlighet: egenskaper, gunstige vs. mulige, relativ frekvens Sannsynlighet for mer enn en
DetaljerEKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.
KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. REA1081 EKSAMENSDATO: 11. juni 2007. KLASSE: Ingeniørklasser. TID: kl. 9.00 13.00. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 4 (innkl.
DetaljerEKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.
KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. BtG207 EKSAMENSDATO: 11. juni 2007. KLASSE: HIS 05 08. TID: kl. 8.00 13.00. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 5 (innkl. forside)
DetaljerFormelsamling i medisinsk statistikk
Formelsamling i medisinsk statistikk Versjon av 6. mai 208 Dette er en formelsamling til O. O. Aalen (red.): Statistiske metoder i medisin og helsefag, Gyldendal, 208. Gjennomsnitt x = n (x + x 2 + x 3
DetaljerOppfriskning av blokk 1 i TMA4240
Oppfriskning av blokk 1 i TMA4240 Geir-Arne Fuglstad November 21, 2016 2 Hva har vi gjort i dette kurset? Vi har studert to sterkt relaterte grener av matematikk Sannsynlighetsteori: matematisk teori for
DetaljerTMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer
DetaljerEKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.
KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. BtG207 EKSAMENSDATO: 1. juni 2010. KLASSE: HIS 08 11. TID: kl. 8.00 13.00. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 3 (innkl. forside)
DetaljerDEL 1 GRUNNLEGGENDE STATISTIKK
INNHOLD 1 INNLEDNING 15 1.1 Parallelle verdener........................... 18 1.2 Telle gunstige.............................. 20 1.3 Regneverktøy og webstøtte....................... 22 1.4 Oppgaver................................
DetaljerFORMELSAMLING TIL STK1100 OG STK1110
FORMELSAMLING TIL STK1100 OG STK1110 (Versjon av 11. november 2017) 1. Sannsynlighet La A, B, A 1, A 2,..., B 1, B 2,... være begivenheter, dvs. delmengder av et utfallsrom Ω. a) Aksiomene: Et sannsynlighetsmål
DetaljerFasit for tilleggsoppgaver
Fasit for tilleggsoppgaver Uke 5 Oppgave: Gitt en rekke med observasjoner x i (i = 1,, 3,, n), definerer vi variansen til x i som gjennomsnittlig kvadratavvik fra gjennomsnittet, m.a.o. Var(x i ) = (x
DetaljerObservatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter
Observatorer STK00 - Observatorer - Kap 6 Geir Storvik 4. april 206 Så langt: Sannsynlighetsteori Stokastiske modeller Nå: Data Knytte data til stokastiske modeller Utgangspunkt Eksempel høyde Oxford studenter
DetaljerBernoulli forsøksrekke og binomisk fordeling
Bernoulli forsøksrekke og binomisk fordeling Bernoulli forsøksrekke i) gjentar et forsøk n ganger ii) hvert forsøk gir enten suksess eller fiasko iii) sannsynligheten for suksess er p i alle forsøkene
DetaljerFormelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal
Formelsamling V-2014 MAT110 Statistikk 1 Per Kristian Rekdal 2 Forord Dette er formelsamlingen i emnet MAT110 Statistikk 1 ved høgskolen i Molde. Formlene i denne formelsamlingen er stort sett de formlene
Detaljer1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m
Formelsamling og tabeller FO020E Matte 2000 for elektroprogrammet 1 Matematikk 1.1 Denisjoner av ulike typer polynomer og rekker 1.1.1 Rekke med konstante ledd En rekke med konstante ledd er gitt som a
DetaljerForelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU
Forelesing 27 Oppsummering Torstein Fjeldstad Institutt for matematiske fag, NTNU 18.04.2018 I dag Lineær regresjon (sjekk av modellantagelser) Praktisk informasjon Andre statistikk-kurs Oversikt over
DetaljerHØGSKOLEN I STAVANGER
HØGSKOLEN I STAVANGER Avdeling for TEKNISK NATURVITEN- EKSAMEN I: TE199 SANNSYNLIGHETSREGNING MED STATISTIKK SKAPELIGE FAG VARIGHET: 4 TIMER DATO: 5. JUNI 2003 TILLATTE HJELPEMIDLER: KALKULATOR OPPGAVESETTET
DetaljerOm eksamen. Never, never, never give up!
I dag I dag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve 3 a og b (inkl SME) Om eksamen (Truleg) 10 punkt.
DetaljerÅMA110 Sannsynlighetsregning med statistikk, våren
ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 24. april Bjørn H. Auestad Oppsummering våren
DetaljerEksamensoppgave i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806
DetaljerÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering
ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 21. april Bjørn H. Auestad Oppsummering våren
DetaljerOm eksamen. Never, never, never give up!
Plan vidare Onsdag Gjere ferdig kap 11 + repetisjon Fredag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve
DetaljerStatistikk og dataanalyse
Njål Foldnes, Steffen Grønneberg og Gudmund Horn Hermansen Statistikk og dataanalyse En moderne innføring Kapitteloversikt del 1 INTRODUKSJON TIL STATISTIKK Kapittel 1 Populasjon og utvalg 19 Kapittel
DetaljerEKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai 2006. SENSURFRIST: 16. juni 2006. KLASSE: HIS 04 07. TID: kl. 8.00 13.00.
KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. BtG207 EKSAMENSDATO: 26. mai 2006. SENSURFRIST: 16. juni 2006. KLASSE: HIS 04 07. TID: kl. 8.00 13.00. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER
DetaljerEKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg.
KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. REA 1081F REA1081) EKSAMENSDATO: 1. juni 2010. KLASSE: Flexibel ingeniørutdanning, 2kl. Bygg. TID: kl. 9.00 12.00. FAGLÆRER: Hans Petter Hornæs ANTALL
DetaljerKap. 6, Kontinuerlege Sannsynsfordelingar
Kapittel 6, Kontinuerlege Sannsynsfordelingar Sjå på eit utval av ofte brukte kontinuerlege sannsynsfordelingar Uniform I går Normal I går Eksponensial I dag Gamma I dag Kji-kvadrat I dag Nokre eigenskapar
DetaljerKapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering
Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering TMA4245 Statistikk Kapittel 8.1-8.5. Kapittel 9.1-9.3+9.15 Turid.Follestad@math.ntnu.no p.1/21 Har sett
DetaljerKap. 6, Kontinuerlege Sannsynsfordelingar
Kapittel 6, Kontinuerlege Sannsynsfordelingar Sjå på eit utval av ofte brukte kontinuerlege sannsynsfordelingar Uniform I går Normal I går Eksponensial I dag Gamma I dag Kji-kvadrat I dag Nokre eigenskapar
DetaljerInnhold. Innledning. Del I
Del I Innledning 1 Hva er statistikk?... 19 1.1 Bokas innhold 20 1.1.1 Noen eksempler 20 1.1.2 Historie 23 1.1.3 Bokas oppbygning 25 1.2 Noen viktige begreper 26 1.2.1 Populasjon og utvalg 26 1.2.2 Variasjon
DetaljerLøsningsforslag, eksamen statistikk, juni 2015
Løsningsforslag, eksamen statistikk, juni 0 Oppgave 1 Siden det spørres om tall fra et intervall, som oppgaven viser kan være et reelle, er det tydelig at tallene er tatt fra en kontinuerlig fordeling.
DetaljerOppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir
DetaljerLøsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010
Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100
DetaljerEmnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard
EKSAMEN Emnekode: SFB107111 Emnenavn: Metode 1, statistikk deleksamen Dato: 16. mai 2017 Hjelpemidler: Godkjent kalkulator og vedlagt formelsamling m/tabeller Eksamenstid: 4 timer Faglærer: Hans Kristian
DetaljerTMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet
DetaljerLøsning eksamen desember 2016
Løsning eksamen desember 016 Oppgave 1 a) En drone har to uavhengige motorer. Vi innfører hendelsene A: motor 1 svikter B: motor svikter Dronen er avhengig av at begge virker, slik at sannsynligheten for
DetaljerTMA4240 Statistikk Høst 2008
TMA4240 Statistikk Høst 2008 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 7 Oppgave 1 Tippekonkurranse Denne oppgaven er ment som en kjapp test på hva du har
DetaljerEKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.
KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. BtG207 EKSAMENSDATO: 16. juni 2009. KLASSE: HIS 07 10. TID: kl. 8.00 13.00. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 3 innkl. forside)
DetaljerLøsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår
Løsningsforslag ECON 130 Obligatorisk semesteroppgave 017 vår Andreas Myhre Oppgave 1 1. (i) Siden X og Z er uavhengige, vil den simultane fordelingen mellom X og Z kunne skrives som: f(x, z) = P(X = x
DetaljerEksamensoppgave i ST1201/ST6201 Statistiske metoder
Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: 20. desember 2016 Eksamenstid (fra til): 09:00
DetaljerKap. 6, Kontinuerlege Sannsynsfordelingar
Kapittel 6, Kontinuerlege Sannsynsfordelingar Sjå på eit utval av ofte brukte kontinuerlege sannsynsfordelingar Uniform Onsdag Normal Onsdag Eksponensial I dag Gamma I dag Kji-kvadrat I dag Student-T (Kap
DetaljerTMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 Ei bedrift produserer elektriske komponentar. Komponentane kan ha to typar
DetaljerEKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 10. juni Ingeniørutdanning. TID: kl EMNEANSVARLIG: Hans Petter Hornæs
KANDIDATNUMMER: EKSAMEN EMNENAVN: EMNENUMMER: Statistikk. Rea181 EKSAMENSDATO: 1. juni 28 KLASSE: Ingeniørutdanning. TID: kl. 9. 13.. EMNEANSVARLIG: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 3 (innkl.
DetaljerSFB LØSNING PÅ EKSAMEN HØSTEN 2018
SFB107111 - LØSNING PÅ EKSAMEN HØSTEN 018 Eksamen høsten 018 Oppgave 1 Anta at 70% av studentene spiller fotball og at 0% ikke spiller fotball. Anta at av de som spiller fotball så er det 40% som spiller
DetaljerEKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.
KANDIDATNUMMER: EKSAMEN FAGNAVN: Statistikk. FAGNUMMER: Rea 1082 EKSAMENSDATO: 14. mai 2009. KLASSE: Ing. TID: kl. 9.00 13.00. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 3 (innkl. forside) TILLATTE
DetaljerEksamensoppgave i ST1201/ST6201 Statistiske metoder
Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Tlf: Eksamensdato: august 2015 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler:
DetaljerÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4
ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 27. mars Bjørn H. Auestad Kp. 6: Hypotesetesting
DetaljerOppgave 1. a) Anlysetype: enveis variansanalyse (ANOVA). Modell for y ij = ekspedisjonstid nr. j for skrankeansatt nr. i:
MOT310 tatistiske metoder 1 Løsningsforslag til eksamen høst 010, s 1 Oppgave 1 a) Anlysetype: enveis variansanalyse (ANOVA) Modell for y ij ekspedisjonstid nr j for skrankeansatt nr i: Y ij µ i + ε ij,
DetaljerNormal- og eksponentialfordeling.
Ukeoppgaver i Statistikk, uke 8 : Normal- og eksponentialfordeling. 1 Høgskolen i Gjøvik Avdeling for teknologi, økonomi og ledelse. Statistikk Ukeoppgaver uke 8 I løpet av uken blir løsningsforslag lagt
DetaljerGammafordelingen og χ 2 -fordelingen
Gammafordelingen og χ 2 -fordelingen Gammafunksjonen Gammafunksjonen er en funksjon som brukes ofte i sannsynlighetsregning. I mange fordelinger dukker den opp i konstantleddet. Hvis man plotter n-fakultet
DetaljerLøsningsforslag Eksamen i Statistikk SIF5060 Aug 2002
Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002 Oppgave 1 a) En god estimator er forventningsrett og har liten varians. Vi tester forventningsretthet: E[ˆµ] E[Y ] µ E[ µ] E[ 1 2 X + 1 2 Y ] 1 2 E[X]
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Løsningsforslag: Statistiske metoder og dataanalys Eksamensdag: Fredag 9. desember 2011 Tid for eksamen: 14.30 18.30
DetaljerEmnenavn: Deleksamen i Statistikk. Eksamenstid: Faglærer: Tore August Kro. Oppgaven er kontrollert:
EKSAMEN Emnekode: IRB22515, IRBIO22013, IRE22518, IRM23116 Emnenavn: Deleksamen i Statistikk Dato: Sensurfrist: 03.01.19 24.01.19 Eksamenstid: 09.00 12.00 Antall oppgavesider: 6 Antall vedleggsider: 9
DetaljerRegler i statistikk STAT 100
TORIL FJELDAAS RYGG - VÅREN 2010 Regler i statistikk STAT 100 Innhold side Sannsynlighetsregning 3 - Uttrykk 3 - Betinget sannsynlighet 4 - Regler for sannsynlighet 4 - Bayes teorem 4 - Uavhengige begivenheter
DetaljerHøgskoleni østfold EKSAMEN
et) Høgskoleni østfold EKSAMEN Emnekode:Emne: SFB10711Metode 1 Statistikkdel Dato: 5. feb. 2016Eksamenstid: kl. 1400 Hjelpemidler: Kalkulator Utlevert formelsamling til kl. 1800 Faglærer: Nils Ingar Arvidsen
DetaljerTMA4240 Statistikk Høst 2007
TMA4240 Statistikk Høst 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b4 Løsningsskisse Oppgave 1 Eksamen juni 1999, oppgave 3 av 3 a) µ populasjonsgjennomsnitt,
DetaljerForelening 1, kapittel 4 Stokastiske variable
Forelening 1, kapittel 4 Stokastiske variable Eksempel X = "antall kron på kast med to mynter (før de er kastet)" Uniformt utfallsrom {MM, MK, KM, KK}. X = x beskriver hendelsen "antall kron på kast med
DetaljerTo-dimensjonale kontinuerlige fordelinger
To-dimensjonale kontinuerlige fordelinger Noen resultater for diskrete fordelinger Vi har tidligere definert punktsannsynligheten p(x, y) for en todimensjonal variabel (X, Y ) som p(x, y) = P ({X = x}
DetaljerÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3
ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting
DetaljerHypotesetesting av λ og p. p verdi.
Forelesning 7, kapittel 6 Hypotesetesting av λ og p. p verdi. Det som gjøres i denne forelesningen er nær opptil det vi gjorde da vi konstruerte z test for µ, og styrkefunksjon for denne. I tillegg til
DetaljerEKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 11. juni HiS Jørstadmoen. TID: kl EMNEANSVARLIG: Hans Petter Hornæs
KANDIDATNUMMER: EKSAMEN EMNENAVN: EMNENUMMER: Statistikk. BtG27 EKSAMENSDATO: 11. juni 28 KLASSE: HiS 6-9 Jørstadmoen. TID: kl. 8. 13.. EMNEANSVARLIG: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 4 (innkl.
DetaljerLØSNINGSFORSLAG ) = Dvs
LØSNINGSFORSLAG 12 OPPGAVE 1 D j er differansen mellom måling j med metode A og metode B. D j N(µ D, 0.1 2 ). H 0 : µ D = 0 mot alternativet H 1 : µ D > 0. Vi forkaster om ˆµ D > k Under H 0 er ˆµ D =
DetaljerHØGSKOLEN I STAVANGER
EKSAMEN I: MOT0 STATISTISKE METODER VARIGHET: TIMER DATO:. NOVEMBER 00 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV OPPGAVER PÅ 7 SIDER HØGSKOLEN
DetaljerHøgskoleni Øs fold EKSAMEN. Om noe er uklart eller mangelfullt i oppgaven inngår det som en del av oppgaven å ta de nødvendige forutsetninger.
Høgskoleni Øs fold EKSAMEN Emnekode: Emne: SFB10711 Metodekurs 1: Grunnleggende matematikk og statistikk Deleksameni statistikk Dato: 3. januar 2014 Eksamenstid: kl. 0900 til kl. 1300 Hjelpemidler: Faglærer:
DetaljerHogskoleni Østfold EKSAMEN. Eksamenstid: kl til k
Hogskoleni Østfold EKSAMEN Emnekode: SFB10711 Dato: 5. jan 2015 Hjelpemidler: Kalkulator Utlevert formelsamling Emne: Metodekurs I: Grunnleggende matematikk og statistikk (Statistikk, ny og utsatt eksamen)
DetaljerKontinuerlige sannsynlighetsfordelinger.
Kontinuerlige sannsynlighetsfordelinger. Dekkes av kap. 6 og deler av kap. 8.5 i boka. Husk: f(x) er sannsynlighetstettheten til en kontinuerlig X dersom: 1. f(x) 0 for alle x R 2. f(x)dx =1 3. P (a
DetaljerTMA4240 Statistikk Høst 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 0, blokk II Løsningsskisse Oppgave Surhetsgrad i ferskvann Eksamen august 00, oppgave av 3 a) En god estimator
DetaljerEKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.
KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. BtG27 EKSAMENSDATO: 27. mai 211. KLASSE: HIS 8 11. TID: kl. 8. 13.. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 3 innkl. forside) TILLATTE
DetaljerLøsning eksamen desember 2017
Løsning eksamen desember 017 Oppgave 1 Innfører hendelsene D: enheten er defekt K: enheten blir kassert a i Disse sannsynlighetene kan leses ut av oppgaveteksten: P D = 0, 10 P K D = 0, 07 P K D = 0, 95
DetaljerLøsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007
Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007 Oppgave 1: Pengespill a) For hver deltaker har vi følgende situasjon: Deltakeren får en serie oppgaver. Hver runde har to mulige utfall: Deltakeren
DetaljerEKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg m.fl.
KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. REA 1081 og REA1081F EKSAMENSDATO: 1. juni 2011. KLASSE: Flexibel ingeniørutdanning, 2kl. Bygg m.fl. TID: kl. 9.00 12.00. FAGLÆRER: Hans Petter Hornæs
DetaljerA) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.
Oppgave 1 Det skal velges en komité bestående av 2 menn og 1 kvinne. Komitéen skal velges fra totalt 5 menn og 6 kvinner. Hvor mange ulike komitéer kan dannes? A) 86400 B) 400 C) 120 D) 60 E) 10 Rett svar:
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Deleksamen i: STK Sannsynlighetsregning og statistisk modellering Eksamensdag: Mandag 4. mars 26 Tid for eksamen: 5. 7. Oppgavesettet er
DetaljerFormelsamling V MAT110 Statistikk 1. Per Kristian Rekdal
Formelsamling V-2016 MAT110 Statistikk 1 Per Kristian Rekdal Figur 1: Statistikk. 3 Innhold 1 Beskrivende statistikk 9 1.1 Populasjon og utvalg.................................. 9 1.2 Statistiske mål
DetaljerEksamensoppgave i Løsningsskisse TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i Løsningsskisse TMA440 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland a, Sara Martino b Tlf: a 48 18 96, b 99 40 33 30 Eksamensdato: 30. november
DetaljerEksamensoppgave i TMA4240 / TMA4245 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4240 / TMA4245 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland Tlf: 48 22 18 96 Eksamensdato: 10. august 2017 Eksamenstid (fra til): 09.00-13.00
DetaljerTMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger
TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger Binomisk fordeling* ( ) n b(x; n, p) = p x (1 p) n x = x ( ) n p x q n x, x x = 0, 1, 2,..., n Fenomén: i) n forsøk. ii) Suksess/fiasko
DetaljerMedisinsk statistikk Del I høsten 2009:
Medisinsk statistikk Del I høsten 2009: Kontinuerlige sannsynlighetsfordelinger Pål Romundstad Beregning av sannsynlighet i en binomisk forsøksrekke generelt Sannsynligheten for at suksess intreffer X
DetaljerInnhold. Innledning. Del I
Innhold Del I Innledning 1 Hva er statistikk?...17 1.1 Bokas innhold 18 1.1.1 Noen eksempler 18 1.1.2 Historie 21 1.1.3 Bokas oppbygning 22 1.2 Noen viktige begreper 23 1.2.1 Populasjon og utvalg 23 1.2.2
DetaljerSTK Oppsummering
STK1100 - Oppsummering Geir Storvik 6. Mai 2014 STK1100 Tre temaer Deskriptiv/beskrivende statistikk Sannsynlighetsteori Statistisk inferens Sannsynlighetsregning Hva Matematisk verktøy for å studere tilfeldigheter
DetaljerEksamensoppgave i ST1201/ST6201 Statistiske metoder
Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: 04. desember 2015 Eksamenstid (fra til): 09:00
DetaljerTMA4240 Statistikk Høst 2009
TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b5 Løsningsskisse Oppgave 1 Vi ønsker å finne ut om et nytt serum kan stanse leukemi.
DetaljerLøsningsforslag til oppgaver brukt i STA100
Universitetet i Stavanger Løsningsforslag til oppgaver brukt i STA100 Oppgave 1 a) Populasjonen er alle studenter ved Universitetet i Stavanger, og utvalget er de (ca 100) studentene hun velger ut i undersøkelsen
DetaljerEksamensoppgave i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Sara Martino a, Torstein Fjeldstad b Tlf: a 994 03 330, b 962 09 710 Eksamensdato: 28. november 2018 Eksamenstid
DetaljerForventning og varians.
Forventning og varians. Dekkes av kapittel 4 i læreboka. Forventning (4.1) Forventningsverdi = gjennomsnitt i det lange løp. Defininsjon: Forventningsverdien til en stokastisk variabel X er: x xf(x),x
DetaljerTMA4240 Statistikk Høst 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 9 Løsningsskisse Oppgave 1 a) Vi lar her Y være antall fugler som kolliderer med vindmølla i løpet av den gitte
DetaljerForelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind
Forelesning 5: Kontinuerlige fordelinger, normalfordelingen Jo Thori Lind j.t.lind@econ.uio.no Oversikt 1. Kontinuerlige fordelinger 2. Uniform fordeling 3. Normal-fordelingen 1. Kontinuerlige fordelinger
DetaljerSTK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger
STK00 våren 206 Normalfordelingen Svarer til avsnitt 4.3 i læreboka Geir Storvik Matematisk institutt Universitetet i Oslo Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger Normalfordelingen
DetaljerTMA4245 Statistikk Eksamen august 2014
TMA4245 Statistikk Eksamen august 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Oppgave 1 En bedrift produserer en type medisin i pulverform Medisinen selges på flasker
DetaljerEksamensoppgåve i ST1201/ST6201 Statistiske metoder
Institutt for matematiske fag Eksamensoppgåve i ST1201/ST6201 Statistiske metoder Fagleg kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: 04. desember 2015 Eksamenstid (frå til): 09:00
DetaljerTMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlege stokastiske variabelen X ha fordelingsfunksjon (sannsynstettleik
DetaljerTMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag
TMA4245 Statistikk Vår 2017 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 3 Dette er den første av to innleveringer i blokk 2 Denne øvingen skal oppsummere pensum
DetaljerTMA4240 Statistikk H2015
TMA4240 Statistikk H2015 Kapittel 5: Noen diskrete sannsynlighetsfordelinger 5.4 Geometrisk og negativ binomisk fordeling 5.5 Poisson-prosess og -fordeling Mette Langaas Institutt for matematiske fag,
DetaljerHypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:
Hypotesetesting Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf: 22 400 400 www.aschehoug.no 1 Oversikt Sannsynlighetsregning og statistikk
DetaljerForventning og varians.
Forventning og varians. Dekkes av kapittel 4 i læreboka. Forventning (4.) Forventningsverdi gjennomsnitt i det lange løp. Defininsjon: Forventningsverdien til en stokastisk variabel X er: E(X) f(),x diskret
DetaljerEksamensoppgåve i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgåve i TMA4240 Statistikk Fagleg kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806
DetaljerOppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)
MOT310 tatistiske metoder 1 Løsningsforslag til eksamen vår 006, s. 1 Oppgave 1 a) En tilfeldig utvalgt besvarelse får F av sensor 1 med sannsynlighet p 1 ; resultatene for ulike besvarelser er uavhengige.
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1110 FASIT. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider. Vedlegg: Tillatte
Detaljer