Formelsamling V MAT110 Statistikk 1. Per Kristian Rekdal

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Begynne med side:

Download "Formelsamling V MAT110 Statistikk 1. Per Kristian Rekdal"

Transkript

1 Formelsamling V-2016 MAT110 Statistikk 1 Per Kristian Rekdal

2

3 Figur 1: Statistikk. 3

4

5 Innhold 1 Beskrivende statistikk Populasjon og utvalg Statistiske mål (èn variabel) Lokaliseringsmål Spredningsmål Statistiske mål (to variabler) Sannsynlighetsregning Utfallsrom Sannsynligheter Begivenhet Mengdelære Regning med sannsynligheter Addisjonssetningen Komplementsetningen Total sannsynlighet Tvillingsetningene Kombinatorikk Koblinger situasjoner (endelig populasjon) Betinget sannsynlighet Betinget sannsynlighet Multiplikasjonssetningen Bayes lov Oppsplitting av Ω Uavhengighet Tilfeldige variabler, forventning og varians Tilfeldige variabler Forventning og varians Forventning Varians Noen regneregler Generelle forventninger

6 6 Simultane sannsynlighetsfordelinger Simultan- og marginalfordeling Generelle forventninger Kovarians Sentrale sannsynlighetsfordelinger Den binomiske fordelingen Forventingsverdi Varians Den hypergeometriske fordelingen Forventning og varians Sammenheng mellom Hyp[N, M, n] og Bin[n, p] Poissonfordelingen Forventning og varians Normalfordelingen (kontinuerlig) Standardisering Sammenhengen mellom P (Z z) og G(z) Standardavvik σ og %-vis areal Sentralgrensesetningen Diskrete fordelinger normalfordeling Sammenheng: Bin, Hyp, Poi og N Sum av uavhengige stokastiske variabler Regresjonsanalyse Introduksjon Residual og SSE Minste kvadraters regresjonslinje Forklaringsstyrke og SST

7 Forord Dette er formelsamlingen i emnet MAT110 Statistikk 1 ved høgskolen i Molde. Formlene i denne formelsamlingen er stort sett de formlene som er markert med rød skrift og ramme rundt i kompendiet. Studentene oppfordres til å bruke formelsamlingen aktivt når øvingsoppgaver skal løses. Hjelpemidler eksamen: Godkjent kalkulator og formelsamling. Kun originalversjonen av formelsamlingen utgitt av SiMolde Bok er lov å ha med på eksamen. (Dette fordi det skal være lett å se at dere har med den riktige og lovlige formelsamlingen på eksamen). Det er lov å skrive egne notater i formelsamlingen som dere kan ta med på eksamen. Men: Ikke skriv av hele eksempler og hele oppgaver. (Dersom dette blir praktisert i stor grad må vi revurdere denne ordningen i forhold til neste års studenter). En gratis PDF-versjon av formelsamlingen kan lastes ned fra Per Kristian Rekdal Copyright c Høyskolen i Molde, mars

8 8

9 Kapittel 1 Beskrivende statistikk 1.1 Populasjon og utvalg Definisjon: ( populasjon ) Populasjon = den totale mengden av objekter/data som vi ønsker å analysere Definisjon: ( utvalg ) Utvalg = en delmengde av populasjonen, dvs. en samling av data som er hentet fra en populasjon Definisjon: ( statistisk inferens ) Statistisk inferens = det å tolke/analysere utvalget for å finne ut mest mulig om hele populasjonen 9

10 Populasjon Trekning av utvalg Utvalg Statistisk inferens Beskrivende statistikk Utvalgsresultater Figur 1.1: Prosessen ved statistisk inferens, generelt. Prosessen for statistisk inferens er illustrert generelt i figur (1.1). 10

11 1.2 Statistiske mål (èn variabel) Lokaliseringsmål Definisjon: ( median ) La n være en serie med tall/observasjoner i ordnet rekkefølge. Da er: median = midtre observasjonen, n = odde gjennomsnitt av to midterste observasjonene, n = like (1.1) Definisjon: ( typetall ) 1 La n være en serie med tall/observasjoner i ordnet rekkefølge. Da er: typetall = den verdien som forekommer hyppigst (1.2) Definisjon: ( gjennomsnitt ) La x 1, x 2, x 3,..., x n være n antall observasjoner. Da er gjennomsnittet: 2 x = 1 n n x i (1.3) i=1 1 Kalles også modus eller modalverdi. 2 Σ = den greske bokstaven sigma. F.eks. Σ 3 i=1 x i = x 1 + x 2 + x 3. 11

12 1.2.2 Spredningsmål Definisjon: ( modalprosent ) La n være en serie med tall/observasjoner i ordnet rekkefølge. Da er: modalprosent = %-vis andel av observasjonene som har verdi lik typetallet (1.4) Definisjon: ( variasjonsbredde ) La n være en serie med tall/observasjoner i ordnet rekkefølge. Da er: variasjonsbredde = differansen mellom største og minste verdi (1.5) Definisjon: ( kvartilavvik ) La n være en serie med tall/observasjoner i ordnet rekkefølge. Da er: k 1 = nedre kvartil, dvs. 25% av observasjonene har verdi k 1 (1.6) 50% av observasjonene har verdi k 2 k 2 = medianen, dvs. (1.7) 50% av observasjonene har verdi k 2 k 3 = øvre kvartil, dvs. 75% av observasjonene har verdi k 3 (1.8) Da er kvartilavvik = k 3 k 1 (1.9) 12

13 Definisjon: ( empirisk varians ) 3 La x 1, x 2, x 3,..., x n være observasjoner, og la x være gjennomsnittet. Da er den empiriske variansen: 4 S 2 x = 1 n 1 n (x i x) 2 (1.10) i=1 Definisjon: ( empirisk standardavvik ) 5 Det empiriske standardavviket er: S x = S 2 x (1.11) 3 Kalles også utvalgsvariansen. 4 Ulike estimater av variansen: I lign.(1.10) deler man på n 1, og ikke n. Om vi bruker det ene eller det andre er avhengig om x er gjennomsnittet for hele populajonen, eller bare et utvalg. I dette kurset skal vi imidlertid holde oss til definisjonen i lign.(1.10). 5 Kalles også utvalgstandardavviket. 13

14 1.3 Statistiske mål (to variabler) Definisjon: ( empirisk kovarians ) 6 La x 1, x 2, x 3,..., x n og y 1, y 2, y 3,..., y n være observasjoner, og la x samt y være de respektive gjennomsnitt. Den empiriske kovariansen er da: 7 S xy = 1 n 1 n (x i x)(y i y) (1.12) i=1 Definisjon: ( korrelasjonskoeffisient ) La x 1, x 2, x 3,..., x n og y 1, y 2, y 3,..., y n være observasjoner. Korrelasjonskoeffisienten er da: R xy = S xy S x S y (1.13) 6 Kalles også utvalgskovariansen. 7 Ulike estimater av kovariansen: (samme kommentar som på side 13) I lign.(1.12) deler man på n 1, og ikke n. Om vi bruker det ene eller det andre er avhengig om x og y er gjennomsnitt for hele sine respektive populajoner, eller bare et utvalg. I dette kurset skal vi imidlertid holde oss til definisjonen i lign.(1.12). 14

15 Kapittel 2 Sannsynlighetsregning Figur 2.1: Sannsynlighetsregning. 15

16 2.1 Utfallsrom Definisjon: ( utfallsrom ) Resultatet av et stokastisk forsøk 1 kan ikke forutsies entydig, men det kan angis en mengde mulige enkeltutfall. Denne mengden av mulige enkeltutfall kalles utfallsrom: 2 Ω = { mengden av alle mulige enkeltutfall } (2.1) 2.2 Sannsynligheter Definisjon: ( relativfrekvens ) La n være totalt antall forsøk. Og la n A være antall ganger, av de totalt n forsøkene, hvor et bestemt utfall A inntreffer. Den reletive frekevens for utfallet A er da: f r (n A ) = n A n (2.2) hvor altså n = totalt antall forsøk (2.3) n A = antall ganger hvor utfallet A inntreffer (2.4) 1 Dvs. forsøk med uforutsigbart utfall. 2 Den greske bokstaven Ω kalles omega. 16

17 Definisjon: ( sannsynlighet ) La n være totalt antall forsøk. Og la n A være antall ganger, av de totalt n forsøkene, hvor et bestemt utfall A inntreffer. Sannsynligheten for for at utfallet A inntreffer er da: p(a) = lim f r (n A ) (2.5) n hvor f r (n) er relativ frekvens. Egenskaper ved sannsynligheten: ( diskret utfallsrom ) Med kortnotasjonen p i p(u i ) så gjelder: 0 p i 1, for alle i = 1, 2, 3,..., n (2.6) n i=1 p i = 1 (2.7) hvor n i=1 p i = p 1 + p 2 + p p n. 17

18 2.3 Begivenhet Definisjon: ( begivenhet ) begivenhet = delmengde av utfallsrommet (2.8) A Ω Figur 2.2: Et venn-diagram for en begivenhet. Ω er utfallsrommet og A er en begivenhet. Egenskaper for en begivenhet: ( diskret utfallsrom ) P (A) = u A p(u) (2.9) I tillegg kan vi nå skrive lign.(2.6) og (2.7) på en alternativ måte: 0 P (A) 1, for alle A (2.10) P (Ω) = e Ω p(e) = 1 (2.11) 18

19 2.4 Mengdelære For et eksperiment, la A og B være to begivenheter i utfallsrommet Ω. Ω A Ω A A Utfallsrommet Ω er hele det blå området. Begivenheten A visualiseres ved det blå området. A benevnes ikke A Figur 2.3: Utfallsrommet Ω, begivenheten A og komplementet A. Ω A B Ω A Ω A B A ᴜ B B Snitt: A B betyr A og B. Tilsvarer OVERLAPP av mengder. Union: A ᴜ B betyr A eller B. Tilsvarer SUM av mengder. Figur 2.4: Snitt, union og disjunkt. Disjunkt: A B = Ø. A og B inntreffer ALDRI samtidig. Ingen felles elementer. 19

20 2.5 Regning med sannsynligheter Definisjon: ( disjunkte begivenheter) To begivenheter A og B er disjunkte dersom A og {}}{ B =. A B Ω Disjunkt: A B = Ø. A og B inntreffer ALDRI samtidig. Ingen felles elementer. Figur 2.5: A og B er disjunkt Addisjonssetningen Setningen: ( den spesielle addisjonssetningen ) Dersom begivenhetene A og B er disjunkte, dvs. A og {}}{ B =, så gjelder: P (A eller {}}{ B) = P (A) + P (B) (2.12) 20

21 Setningen: ( den generelle addisjonssetningen ) For begivenhetene A og B gjelder: eller {}}{ P (A B) = P (A) + P (B) P (A og {}}{ B) } {{ } ekstra ledd (2.13) A B Figur 2.6: Overlappen mellom A og B er A B. 21

22 Setningen: ( den generelle addisjonssetningen ) For begivenhetene A, B og C gjelder: P (A B C) }{{} eller = P (A) + P (B) + P (C) P (A B) P (A C) P (B C) + P (A B C) } {{ } og (2.14) som kan illustrereres via venn-diagrammet i figur (2.7). A B C Figur 2.7: Begivenhetene mellom A, B og C. 22

23 2.5.2 Komplementsetningen Setningen: ( komplementsetningen ) For begivenheten A og dens komplement A (eller A c ) gjelder: P (A) = 1 P (A) (2.15) A A A benevnes ikke A. Figur 2.8: Komplementet til A er A (eller A c ) Total sannsynlighet Setningen: ( total sannsynlighet ) For begivenhetene A og B gjelder: P (A) = P (A B) + P (A B) (2.16) A B A B A B Figur 2.9: Oppsplitting av begivenhenten A = (A B) (A B). 23

24 2.5.4 Tvillingsetningene Setninger: ( tvillingsetningene ) og eller {}}{{}}{ P (A B) = 1 P (A B) (2.17) og eller {}}{{}}{ P (A B) = 1 P (A B) (2.18) 24

25 Kapittel 3 Kombinatorikk Figur 3.1: Kombinatorikk. En lås med svært mange kombinasjonsmuligheter. 25

26 3.1 Koblinger Definisjon: ( koblinger ) Koblinger = forhold som gjør at et bestemt valg kan påvirke utfallet av andre valg vi skal gjøre. Grunnprinsipp i kombinatorikk: ( antagelse ) Ingen kobling mellom mellom valgmulighetene. (Med koblinger blir det fort vanskelig). Kombinasjoner: ( uten koblinger ) Dersom vi har m 1 = antall muligheter i valg nr. 1 m 2 = antall muligheter i valg nr. 2.. m N = antall muligheter i valg nr. N (3.1) da er antall mulige kombinasjoner = m 1 m 2 m 3... m N (3.2) 26

27 3.2 4 situasjoner (endelig populasjon) Det er ofte vanskelig å telle opp antall elementer i utfallsrommet. Det kan derfor ofte lønne seg å bruke urnemodellen. Tenk deg at alle mulige utfall av et eksperiment er representert ved kuler som ligger i en urne. Så trekker vi kuler etter tur. Da må vi skille mellom: er det trekking med eller uten tilbakelegging? betyr det noe i hvilken rekkefølge kulene trekkes? trekning m/tilbakelegging u/tilbakelegging ordnet situasjon 1 situasjon 2 ikke-ordnet situasjon 4 (forekommer sjelden) situasjon 3 Figur 3.2: 4 situasjoner for urnemodellen. 27

28 Egenskaper til binomialkoeffisienten ( ) N : ( N over s ) s ( ) N = s }{{} binomialkoeff. N! (N s)! s! (3.3) hvor f.eks. s! = (s 2) (s 1) s (3.4) 5! = (3.5) Legg merke til at ( ) N 0 ( ) N 1 ( ) N N = = = N! (N 0)! 0! N! (N 1)! 1! N! (N N)! N! = 1 (3.6) = N (3.7) = 1 (3.8) siden 0! = 1. 28

29 Kapittel 4 Betinget sannsynlighet Figur 4.1: Gitt at vi vet hvilke kuler som er i bøtten, hva er sannsynligheten for å trekke en hvit kule? 29

30 4.1 Betinget sannsynlighet Multiplikasjonssetningen Setning: ( multiplikasjonssetningen, generelle ) For begivenhetene A og B gjelder: P (A og {}}{ B) = P (A B) P (B) (4.1) hvor P (A B) = og -sannsynligheten for A og B (4.2) P (A B) = sannsynligheten for A gitt at B allerede har inntruffet ( A gitt B ) ( betinget sannsynlighet) P (B) = sannsynligheten for B 0 (4.3) (ubetinget sannsynlighet) For en betinget sannsynlighet står det vi vet til høyre for : P (B A) = P (B når } vi {{ veta} ) (4.4) vet 30

31 4.1.2 Bayes lov Setning: ( Bayes lov ) For begivenhetene A og B gjelder: P (A B) = P (B A) P (A) P (B) (4.5) eller alternativt: P (B A) = P (A B) P (B) P (A) (4.6) Figur 4.2: Bayes lov. Thomas Bayes. 31

32 4.2 Oppsplitting av Ω Setningen: ( oppsplitting av Ω i 2 ) {}}{ Anta at utfallsrommet Ω splittes i to delrom Ω = B 1 B 2, der B 1 B 2 =, dvs. delrommene B 1 og B 2 har ingen felles elementer: de er disjunkte. Enhver mengde A kan da skrives: eller med tilhørende sannsynlighet A = (A B 1 ) eller {}}{ (A B 2 ) (oppsplitting) (4.7) P (A) = P (A B 1 ) + P (A B 2 ) (4.8) Alternativt 1 kan lign.(4.8) skrives: P (A) = P (A B 1 ) P (B 1 ) + P (A B 2 ) P (B 2 ) (4.9) Ω: B 1 A B 2 Figur 4.3: Oppsplitting av sannsynlighetsrom Ω, jfr. lign.(4.7). 1 Via multiplikasjonssetningen i lign.(4.1): P (A og {}}{ B) = P (A B) P (B). 32

33 Setningen: ( oppsplitting av Ω ) eller eller eller eller {}}{{}}{{}}{{}}{ Anta at utfallsrommet Ω splittes i delrom Ω = B 1 B 2 B 3... B N, der alle B i B j =, dvs. ingen delrom B 1, B 2,..., B N har noen felles elementer: disjunkte 2. Enhver mengde A kan da skrives: eller {}}{ A = (A B 1 ) (A B 2 ) med tilhørende sannsynlighet eller {}}{... eller {}}{ (A B N ) (oppsplitting) (4.10) P (A) = P (A B 1 ) + P (A B 2 ) P (A B N ) (4.11) Alternativt 3 kan lign.(4.11) skrives: P (A) = P (A B 1 ) P (B 1 ) + P (A B 2 ) P (B 2 ) P (A B N ) P (B N ) (4.12) B 1 B 2 B B N Ω: A Figur 4.4: Oppsplitting av sannsynlighetsrom Ω, jfr. lign.(4.10). 2 Bitene i et puslespill overlapper akkurat ikke. Bitene i puslespillet er disjunkte. og {}}{ 3 Via multiplikasjonssetningen i lign.(4.1): P (A B) = P (A B) P (B). 33

34 4.3 Uavhengighet Definisjon: ( uavhengighet ) To begivenheter A og B er uavhengige dersom P (A B) = P (A) (4.13) Setning: ( multiplikasjonssetningen, spesielle ) Dersom begivenhetene A og B er uavhengige, så gjelder: P (A og {}}{ B) uavh. = P (A) P (B) (4.14) 34

35 Kapittel 5 Tilfeldige variabler, forventning og varians Figur 5.1: Forventning (svart linje) og varians. 35

36 5.1 Tilfeldige variabler Definisjon: ( tilfeldig/stokastisk variabel ) En stokastisk variabel er en størrelse X som kan anta ulike verdier x med ulike sannsynligheter. 1 Definisjon: ( sannsynlighetsfordeling, diskret ) En sannsynlighetsfordeling til en diskret variabel er en funksjon definert ved P (x) }{{} = P (X = x) }{{} liten x for verdier stor X for selve variabelen (5.1) Definisjon: ( kumulativ sannsynlighetsfordeling, diskret ) Den kumulative sannsynlighetsfordeling F til en diskret variabel X er definert ved F (x) = P (X x) (5.2) 1 En mer teknisk (matematisk) versjon av definisjonen av en stokastisk variabel er: Med en tilfeldig variabel mener vi en funksjon X som til ethvert mulig utfall definerer et bestemt reelt tall. 36

37 5.2 Forventning og varians Forventning Definisjon: ( forventningsverdi, diskret ) 2 For en diskret tilfeldig variabel X med de mulige verdiene x 1, x 2,..., x m er forventningsverdien: E[X] = m i=1 x i P (X = x i ) (5.3) Definisjon: ( forventningsverdi, kontinuerlig ) For en kontinuerlig tilfeldig variabel X er forventningsverdien: E[X] = x f(x) dx (5.4) hvor f(x) = sannsynlighetstettheten av x. 2 Jamfør den analoge størrelsen for (empirisk) gjennomsnitt definert i lign.(1.3): x = 1 n n i=1 x i. 37

38 5.2.2 Varians Definisjon: ( varians, diskret ) For en diskret tilfeldig variabel X er variansen V ar[x] = E[ (X E[X]) 2 ] (5.5) Setning: ( varians ) La X være en stokastisk variabel. For variansen gjelder da: V ar[x] = E[X 2 ] E[X] 2 (5.6) Definisjon: ( standardavvik, diskret ) 3 For en diskret tilfeldig variabel X er standardavviket σ[x] V ar[x] (5.7) 3 Jamfør den analoge størrelsen for (empirisk) standardavvik definert i lign.(1.11): S x = S 2 x. 38

39 5.2.3 Noen regneregler La a og b være konstanter. La videre X og Y være to stokastiske variabler. Da gjelder: Regneregler for forventning: E[a] = a (5.8) E[a + X] = a + E[X] (5.9) E[a X] = a E[X] (5.10) E[aX + by ] = ae[x] + be[y ] (5.11) Regneregler for varians: V ar[a] = 0 (5.12) V ar[a + X] = V ar[x] (5.13) V ar[a X] = a 2 V ar[x] (5.14) V ar[x] = V ar[ X] (5.15) Dessuten er alltid V ar[x] 0, dvs. en varians kan aldri være negativ. 39

40 5.3 Generelle forventninger Definisjon: ( generell forventningsverdi, diskret ) For en diskret tilfeldig variabel X og en vanlig funksjon h(x) så er E[h(X)] = m i=1 h(x i ) P (X = x i ) (5.16) 40

41 Kapittel 6 Simultane sannsynlighetsfordelinger Figur 6.1: Simultane sannsynlighetsfordelinger. 41

42 6.1 Simultan- og marginalfordeling Definisjon: ( simultanfordeling ) La X og Y være to stokastiske variabler. Med simultanfordeling menes: p(x, y) = P (X = x og Y = y) (6.1) Definisjon: ( marginalfordeling ) La X og Y være to stokastiske variabler. Med marginalfordeling menes: P (X = x) = y p(x, y) (6.2) P (Y = y) = x p(x, y) (6.3) Definisjon: ( uavhengighet ) 1 La X og Y være to stokastiske variabler. Disse er uavhengige dersom: P (X = x og Y = y) }{{} = p(x,y) = P (X = x) P (Y = y) (6.4) for alle X = x og Y = y. 1 Jamfør den analoge setn. for uavhengighet mellom begivenheter A og B i lign.(4.14): P (A B) = P (A) P (B). 42

43 6.2 Generelle forventninger Definisjon: ( generell forventingsverdi, diskret ) For diskrete stokastiske variabel X, Y og funksjonen h(x, Y ) så gjelder E[h(X, Y )] = m n i=1 j=1 h(x i, y j ) p(x i, y j ) (6.5) Spesialtilfelle: La oss se på et spesialtilfelle av lign.(6.5), nemlig det spesialtilfellet når: h(x, Y ) = X Y (6.6) Da er: E[X Y ] = m n i=1 j=1 x i y j p(x i, y j ) (6.7) 43

44 Setning: ( uavhengighet ) La X og Y være to uavhengige stokastiske variabler 2. Da gjelder: E[X Y ] = E[X] E[Y ] (6.9) 2 Ut fra definisjonen av uavhengighet mellom to stokastiske variabler ( se lign.(6.4) ) så vet vi X og Y er uavhengige dersom: P (X = x og Y = y) }{{} = p(x,y) lign.(6.4) = P (X = x) P (Y = y) (6.8) for alle X = x og Y = y. 44

45 6.3 Kovarians Definisjon: ( kovarians ) 3 La X og Y være to stokastiske variabler. Med samvariasjon/korrelasjon {}}{ kovariansen mellom disse mener vi: samvariasjon/korrelasjon {}}{ Cov[X, Y ] = E[ (X E[X])(Y E[Y ]) ] (6.10) Setning: ( kovarians ) La X og Y være to stokastiske variabler. For samvariasjon/korrelasjon {}}{ kovariansen gjelder da: samvariasjon/korrelasjon {}}{ Cov[X, Y ] = E[X Y ] E[X] E[Y ] (6.11) Setning (spesialtilfelle, kovarians ) La X og Y være to stokastiske variabler. Dersom X og Y er uavhengige, dvs.: E[X Y ] uavh. = E[X] E[Y ] (6.12) så er Cov[X, Y ] = 0 }{{} X og Y ukorrelerte (6.13) 3 Jamfør den analoge definisjonen av empirisk kovarians i lign.(1.12): S xy = 1 n 1 n i=1 (x i x)(y i ȳ). 45

46 Definisjon: ( korrelasjonskoeffisienten ) 4 La X og Y være to stokastiske variabler. Med korrelasjonskoeffisienten ρ[x, Y ] mener vi da: 5 ρ[x, Y ] = samvariasjon/korrelasjon {}}{ Cov[X, Y ] V ar[x] } {{ } spredning V ar[y ] }{{} spredning (6.15) 4 Jamfør den analoge definisjonen av korrelasjonskoeffisienten R xy i lign.(1.13): R xy = Sxy S x S y. 5 Siden σ[x] V ar[x], se lign.(5.7), så kan korrelasjonskoeffisienten ρ[x, Y ] skrives på en alternativ måte: ρ[x, Y ] = samvariasjon/korrelasjon {}}{ Cov[X, Y ] σ[x] }{{} spredning σ[y ] }{{} spredning (6.14) 46

47 Setning: ( kovarians II ) La X og Y være to stokastiske variabler. Generelt gjelder da følgende sammenhengen mellom variansen og kovariansen: samvariasjon variasjon/(spredning) {}}{{}}{ V ar[ax + by ] = a 2 V ar[x] + b 2 V ar[y ] + 2ab Cov[X, Y ] (6.16) hvor a og b er konstanter. Setning (spesialtilfelle, kovarians II ) La X og Y være to stokastiske variabler. Dersom X og Y er ukorrelerte, så er: Da gjelder: Cov[X, Y ] = 0 (6.17) V ar[ax + by ] = a 2 V ar[x] + b 2 V ar[y ] (6.18) 47

48 48

49 Kapittel 7 Sentrale sannsynlighetsfordelinger Figur 7.1: Sentralgrensesetningen ( CLT ). 49

50 7.1 Den binomiske fordelingen 2 param. diskret {}}{{}}{ Definisjon: ( binomisk fordeling, X Bin[n, p] ) Punktsannsynlighetene for en binomisk fordeling er P (X = x) def. = ( ) n p x (1 p) n x (7.1) x hvor X = stokastisk variabel (7.2) = antall suksesser i en binomisk forsøksserie på totalt n forsøk p = sannsynlighet for suksess (7.3) n = totalt antall forsøk (7.4) ( ) n x }{{} binomialkoeff. = n! (n x)! x! ( n over x ) (7.5) P(X=x) x Figur 7.2: Binomiske sannsynlighetsfordelinger P (X = x). 50

51 7.1.1 Forventingsverdi Setning: ( forventing av X 2 param. {}}{ Bin[n, p] ) La X være en binomisk variabel, dvs. X Bin[n, p]. Da gjelder: E[X] = n p (7.6) Varians Setning: ( varians av X 2 param. {}}{ Bin[n, p] La X være en binomisk variabel, dvs. X Bin[n, p]. Da gjelder: V ar[x] = n p (1 p) (7.7) 51

52 7.2 Den hypergeometriske fordelingen Definisjon: ( diskret 3 param. {}}{{}}{ hypergeometrisk fordeling, X Hyp[N, M, n] Punktsannsynlighetene for en hypergeometrisk fordeling er P (X = x) def. = ( ) ( ) M N M x n x ( ) (7.8) N n hvor X = stokastisk variabel = antall spesielle elementer i det tilfeldige utvalget på (7.9) n trukne elementer N = antall elementer i grunnmengden (7.10) M = antall spesielle elementer (7.11) N M = antall vanlige elementer (7.12) n = antall trukne elementer (7.13) ( ) N n }{{} binomialkoeff. = N! (N n)! n! ( N over n ) (7.14) 52

53 P(X=x) x Figur 7.3: Hypergeometriske sannsynlighetsfordelinger P (X = x). 53

54 7.2.1 Forventning og varians Setning: ( forventing av X 3 param. {}}{ Hyp[N, M, n] La X være en hypergeometrisk variabel, dvs. X Hyp[N, M, n]. Da gjelder: E[X] = n M N (7.15) Setning: ( varians av X 3 param. {}}{ Hyp[N, M, n] ) La X være en hypergeometrisk variabel, dvs. X Hyp[N, M, n]. Da gjelder: V ar[x] = N n N 1 n M ( N 1 M ) N (7.16) 54

55 7.3 Sammenheng mellom Hyp[N, M, n] og Bin[n, p] Setning: ( 3 param. {}}{ Hyp[N, M, n] 2 param. {}}{ Bin[n, p] ) Dersom grunnmengden N i en hypergeometrisk forsøkserie er mye større enn utvalget n, typisk så er N 20 n (7.17) X Hyp[N, M, n] N 20 n X Bin[n, p] (7.18) 55

56 7.4 Poissonfordelingen Definisjon: ( diskret 1 param. {}}{{}}{ Poissonfordeling, X Poi[λ] ) 1 Punktsannsynlighetene for en Poissonfordeling er P (X = x) def. = λx x! e λ (7.19) hvor X = stokastisk variabel = antall begivenheter som inntreffer innenfor en gitt tid eller gitt rom (7.20) λ = gjennsomsnittlig antall begivenheter innenfor en gitt tid eller gitt rom (7.21) P(X=x) x Figur 7.4: Poissonfordelinger P (X = x). 1 Kalles ofte loven om sjeldne begivenheter. 56

57 2 param. {}}{ Setning: ( Bin[n, p] 1 param. {}}{ Poi[λ] ) I en binomisk sannsynlighetsfordeling, dersom sannsynligheten for suksess p er svært liten og antall forsøk n er svært stor, typisk så er n 50 og p 0.05 (7.22) X Bin[n, p] n 50 og p 0.05 X Poi[λ] (7.23) 57

58 7.4.1 Forventning og varians Setning: ( forventing av X Poi[λ] 2 ) La X være en Poissionfordelt variabel, dvs. X Poi[λ]. Da gjelder: E[X] = λ (7.24) Setning: ( varians av X Poi[λ] ) La X være en Poissonfordelt variabel, dvs. X Poi[λ]. Da gjelder: V ar[x] = λ (7.25) 2 Skrivemåten X Poi[λ] betyr at den stokastiske variabelen X har en sannsynlighetsfordeling P (X = x) som er Poissonfordelt. 58

59 7.5 Normalfordelingen (kontinuerlig) Definisjon: ( generelle kont. {}}{ normalfordeling ) La X være en kontinuerlig stokastisk variabel. Den generelle normalfordelingen for X er f X (x) = 1 2π σ 2 e (x µ)2 2 σ 2 (7.26) hvor µ = E[X] = forventingen av X ( lokalisering av toppunkt ) (7.27) σ 2 = V ar[x] = variansen av X (7.28) σ = σ 2 = standardavviket av X ( halvbredden av kurven ) (7.29) f X (x) x Figur 7.5: Tetthetsfunksjoner f X (x) til ulike normalfordelinger. 59

60 Definisjon: ( standardisert kont. {}}{ normalfordeling, X N[µ = 0, σ = 1] ) La X være en kontinuerlig stokastisk variabel. Dersom E[X] = µ = 0, V ar[x] = σ 2 = 1 (7.30) så vil den generelle normalfordelingen i lign.(7.26) redusere seg til f X (x) = 1 2π e x2 2 (7.31) Dette kalles den standardiserte normalfordelingen. 60

61 7.5.1 Standardisering Omskalering: ( variabelskifte ) Z = X µ σ (7.32) Matematisk betyr det faktum at µ = 0 og σ = 1 i den nye omskalerte variabelen, følgende: E[Z] = 0, V ar[z] = 1 (7.33) 61

62 7.5.2 Sammenhengen mellom P (Z z) og G(z) arealet til venstre for z = sannsynligheten for at den stokastiske variabelen Z har verdier mindre eller lik z = P (Z z) (7.34) Arealet til venstre for z er det samme som integralet under grafen f Z (z): P (Z z) = stopp start = = G(z) {}}{ z f Z (s) ds def. = G(z) (7.35) Gaussintegralet G(z) behøver ikke regnes ut av oss. Det er tabelloppslag. f Z (z) areal = G(z) σ = 1 μ = 0-1 z 1 z Figur 7.6: Arealet som vist representerer sannsynligheten P (Z z). 62

63 P(Z z) = G(z) z 63

64 Setning: ( egenskap til G(z) ) Fra figur (7.7) innser vi at G(z) + G( z) = arealet under hele kurven = 1 (7.36) Altså vi kan skrive: eller ekvivalent G( z) = 1 G(z) (7.37) P (Z z) = 1 P (Z z) (7.38) f Z (z) f Z (z) areal = G(z) areal = G(-z) z z - z z Figur 7.7: Arealene representerer Gaussintegralene G(z) og G( z). 64

65 7.5.3 Standardavvik σ og %-vis areal Som vi har lært tidligere så er varians og standardavvik et mål på spredning. For en normalfordeling med et gitt standardavvik σ, så dekker intervallet µ σ X µ + σ hele 68.2 % av arealet (7.39) under sannsynlighetfordelingen f X (x). Tilsvarende dekker intervallet µ 2σ X µ + 2σ hele 95.4 % av arealet (7.40) under sannsynlighetfordelingen f X (x). Dette er illustrert i denne figuren: f X (x) z x Figur 7.8: Standardavvik σ og %-vis areal for en normalfordeling. 65

66 Bin[ n, p ] Hyp[ N, M, n ] Poi[ λ ] N[ μ, σ ] 2 param. 3 param. 1 param. 2 param. diskret diskret diskret kontinuerlig

67 Bin[ n, p ] Hyp[ N, M, n ] Poi[ λ ] N[ μ, σ ] 1) 2 mulig utfall 2) samme p for suksess 3) uavhengige 1) x antall suksesser / spesielle 2) N antall i grunnmengden 3) M antall spesielle 1) x antall begivenheter innenfor en gitt tid 2) λ = rate 1) Tetthetsfunksjon f X (x) 2) Gausskurve 4) n antall forsøk 4) n antall trukne elementer - kjenner ikke fordelingen i urnen - m / tilbakelegging - teller opp antall suksesser - kjenner fordelingen i urnen - u / tilbakelegging - teller opp antall suksesser - rate ( konstant ) - antall begivenheter innenfor en gitt tid eller gitt rom - telleforsøk - loven om skjeldne begivenh. - under bestemte betingelser vil mange diskrete og kontinuerige fordelinger med god tilnæring være normalfordelt (f.eks. CLT )

68 7.6 Sentralgrensesetningen Setning: ( CLT 3, sentralgrensesetningen ) La X 1, X 2, X 3,... X n være uavhengige stokastiske variabler med samme P (X = x i ), dvs. diskret ELLER kont. {}}{ sannsynlighetsfordeling X i samme sannsynlighetsfordeling for alle i = 1, 2, 3,..., n (7.41) hvor n er antall forsøk, dvs. E[X i ] = µ og V ar[x i ] = σ 2, i = 1, 2, 3,..., n (7.42) er den samme for alle forsøk / gitt stokastisk variabel i. Da gjelder at gjennomsnittet X: X = X 1 + X 2 + X X n n er normalfordelt i grensen når antall forsøk n blir stor: X n = stor [ ] σ N µ, n (7.44) (7.43) altså P (X = x) er normalfordelt med forventning og varians hhv. E[ X ] = µ og V ar[ X ] = σ2 n (7.45) 3 På engelsk brukes ofte forkortelsen CLT, dvs. central limit theorem. 68

69 Det er en alternativ måte å formulere sentralgrensesetningen på: Setning: ( sentralgrensesetningen og G(z) ) diskret ELLER kont. {}}{ La X 1, X 2, X 3,... X n være n stk. uavhengige stokastiske variabler med samme sannsynlighetsfordeling med µ som forventingsverdi og σ 2 som varians, dvs. E[X i ] = µ og V ar[x i ] = σ 2, i = 1, 2, 3,..., n (7.46) Gjennomsnittet X av disse n stk. stokastiske variablene X = 1 ( ) X 1 + X 2 + X X n n (7.47) er da normalfordelt for store n, dvs. P (X x) n = stor ( ) x µ G σ n (7.48) hvor G(z) = gitt ved lign.(??) (7.49) σ = er standardavviket for en gitt stokastisk variabel X i (7.50) 69

70 Kommentar: Hvor stor n må være ( n = antall forsøk ) for at sentralgrensesetningen skal gjelde er avhengig av situasjonen. Men en tommelfingerregel er at vi bør ha n 30 (7.51) dvs. antall forsøk bør være ca. 30 eller mer. 70

71 7.7 Diskrete fordelinger normalfordeling Setning: ( Bin[n, p] N[µ, σ] ) For en diskret {}}{ binomisk fordeling, X Bin[n, p], hvor n p (1 p) 5 (7.52) så er sannsynligheten X har verdien x være kont. {}}{ normalfordelt, dvs. X N [ E[X], σ[x] ], slik at: P (X x) ( ) x E[X] G σ[x] P (X x) ( ) x 0.5 E[X] 1 G σ[x] (7.53) (7.54) hvor forventning og standardavvik er E[X] lign.(7.6) = n p (7.55) σ[x] lign.(7.7) = n p (1 p) (7.56) 71

72 Setning: ( Hyp[N, M, n] N[µ, σ] ) For en diskret {}}{ hypergeometrisk fordeling, X Hyp[N, M, n], hvor N 20 n (7.57) n M N ( 1 M N ) 5 (7.58) så vil X være tilnærmet en kont. {}}{ normalfordeling, dvs. X N [ E[X], σ[x] ], slik at: P (X x) ( ) x E[X] G σ[x] P (X x) ( ) x 0.5 E[X] 1 G σ[x] (7.59) (7.60) hvor forventning og standardavvik er E[X] σ[x] lign.(7.15) = n M N lign.(7.16) = N n N 1 n M ( 1 M N N ) (7.61) (7.62) 72

73 Setning: ( Poi[λ] N[µ, σ] ) For en diskret {}}{ Poissonfordeling, X Poi[λ], hvor λ 5 (7.63) så vil X være tilnærmet en kont. {}}{ normalfordeling, dvs. X N [ E[X], σ[x] ], slik at: P (X x) ( ) x E[X] G σ[x] P (X x) ( ) x 0.5 E[X] 1 G σ[x] (7.64) (7.65) hvor forventning og standardavvik er E[X] lign.(7.24) = λ (7.66) σ[x] lign.(7.25) = λ (7.67) 73

74 Setning: ( diskret N[µ, σ] ) Dersom X er diskret sannsynlighetsfordeling som er tilnærmet kont. {}}{ normalfordelt, dvs. og hvor X kun kan ha hele tall, dvs. X tilnærmet N[µ, σ] (7.68) da gjelder X = diskret stokastisk variabel som kun har hele tall (7.69) P (X x) ( ) x E[X] G σ[x] P (X x) ( ) x 0.5 E[X] 1 G σ[x] (7.70) (7.71) hvor E[X] σ[x] lign.(7.24) = forventning til den diskrete variabelen (7.72) lign.(7.25) = variansen til den diskrete variabelen (7.73) 74

75 7.8 Sammenheng: Bin, Hyp, Poi og N I kapittel (7.3) fant vi sammenhengen mellom Hyp[N, M, n] og Bin[n, p], se lign.(7.18). I kapittel (7.4) fant vi sammenhengen mellom Bin[n, p] og Poi[λ], se lign.(7.23). Dessuten er alle fordelingene Bin[n, p], Hyp[N, M, n] og Poi[λ] relatert til N[µ, σ] i visse grenser. Bin[ n, p ] Poi[ λ ] N[ μ, σ ] ( kontinuerlig ) Hyp[ N, M, n ] Bin[ n, p ] N[ μ, σ ] ( kontinuerlig ) Poi[ λ ] N[ μ, σ ] ( kontinuerlig ) Figur 7.9: Fordelingene Bin[n, p], Hyp[N, M, n], Poi[λ] og N[µ, σ]. De blå pilene representerer setningene i lign.(7.18) og lign.(7.23). 75

76 7.9 Sum av uavhengige stokastiske variabler Setning: ( binomisk fordeling ) Anta at vi har uavhengige og binomisk fordelte stokastiske variabler X 1 Bin[ n 1, p ], X 2 Bin[ n 2, p ] og X 3 Bin[ n 3, p ]. Da er også summen Y = X 1 + X 2 + X 3 (7.74) binomisk fordelt: Y Bin [ n Y, p ] (7.75) hvor n Y = n 1 + n 2 + n 3 (7.76) 76

77 Setning: ( hypergeometrisk ) Det er ingen enkel eller generell sannsynlighetsfordeling for summen av uavhengige hypergeometriske stokastiske variabler. 77

78 Setning: ( Poisson fordeling ) Anta at vi har uavhengige og Poisson fordelte stokastiske variabler X 1 Poi[ λ 1 ], X 2 Poi[ λ 2 ] og X 3 Poi[ λ 3 ] Da er også summen Y = X 1 + X 2 + X 3 (7.77) Poisson fordelt: Y Poi [ λ Y ] (7.78) hvor λ Y = λ 1 + λ 2 + λ 3 (7.79) 78

79 Setning: ( normalfordeling ) Anta at vi har uavhengige og normalfordelte stokastiske variabler X 1 N[ µ 1, σ 2 1 ], X 2 N[ µ 2, σ 2 2 ] og X 3 N[ µ 3, σ 2 3 ] Da er også lineærkombinajonen Y = ax 1 + bx 2 + cx 3 (7.80) normalfordelt: Y N [ µ Y, σ 2 Y ] (7.81) hvor µ Y = aµ 1 + bµ 2 + cµ 3 (7.82) σ 2 Y = a 2 σ b 2 σ c 2 σ 2 3 (7.83) 79

80 For oversikten sin del så formulerer vi her sentralgrenseteoremet fra side 68 i samme stil, altså vi formulerer CLT på en alternativ og likeverdig måte sammenlignet med lign.(7.44). Setning: ( CLT ) Anta at vi har n antall uavhengige og stokastiske variabler. Anta videre at disse variablene har samme forventning og samme varians, dvs. E[X i ] = µ og V ar[x i ] = σ 2, i = 1, 2, 3,..., n (7.84) Da vil også summen Y = X 1 + X 2 + X X n (7.85) i grensen når n, være normalfordelt: Y N [ µ Y, σ 2 Y ] (7.86) hvor E[Y ] = µ (7.87) V ar[y ] = n σ 2 (7.88) 80

81 Kapittel 11 Regresjonsanalyse Figur 11.1: Regresjon. 81

82 11.1 Introduksjon Regresjonsanalyse: Teori og metoder for å analysere og utnytte samvariasjon mellom variable. Formål: konstruere modeller som kan brukes til å anslå verdien ( prediksjon/forutsi ) av en variabel Y ved hjelp av informasjon om en annen variabel X. teminologi: variabel X: har info om dette/kjenner denne {}}{ uavhengig variabel eller forklaringsvariabel variabel Y: avhengig variabel eller responsvariabel }{{} ønsker å anslå denne Man skiller ofte mellom lineær regresjon og ikke-lineær regresjon. I dette kurset skal vi kun se på: lineær regresjon samspill mellom bare to variabler y x Figur 11.2: Lineær regresjon. 82

83 11.2 Residual og SSE 1) Observasjoner: De røde punktene i figur (11.3) viser de fem observasjonspunktene (x 1, y 1 ), (x 2, y 2 ),..., (x 5, y 5 ). 2) Rett linje: Den røde linjen i figur (11.3) viser linjen ŷ = a + bx, hvor a og b er parametre. For observasjonsverdien x i, hvor i = 1, 2,..., 5, er det en tilhørende verdi ŷ i på den rette linjen: 1 ŷ i = a + bx i (11.1) Forskjellen mellom de observerte verdiene y i og de tilsvarende verdiene til den rette linjen er de loddrette avstandene (blå linjer) som vist i figur (11.3). Denne forskjellen/avviket mellom observert verdi og prediksjonen som rette linjen foreslår for datapunktet er: e i = y i ŷ }{{} i residual (11.2) og kalles residual eller estimat for eksperimentfeilen. Residualen e i måler dermed feilen vi gjør ved å bruke verdien på den rette linjen istedet for de observerte verdiene. Residualen e i kan være positiv, negativ eller 0. 2 y y = a + bx (Dette er ikke den linjen som passer best ). e 5 e 1 e 2 e 3 e 4 x Figur 11.3: Residual. 1 Den røde linjen i figur (11.3) er ikke den som passer best. Å finne denne den linjen som passer best er tema i neste avsnitt. 2 Ingen residual i figur (11.3) er null. Alle er negative. 83

84 Definisjon: ( SSE ) 3 La (x 1, y 2 ), (x 2, y 2 ),..., (x n, y n ) være observasjonspar/datasett. Størrelsen SSE, sum squared error, er da definert ved: 4 SSE = n (y i ŷ i ) 2 (11.4) i=1 hvor ŷ i er prediksjonene som linjen 5 ŷ i = a + bx }{{} i prediksjoner (11.5) gir for tilhørende observasjonsverdiene x i, og y i er de faktiske observasjonene/dataene: y i }{{} faktiske observasjoner/data (11.6) 3 SSE står for sum square error. 4 Siden e i lign.(11.2) = y i ŷ i så kan SSE alternativt skrives: 5 a og b er parametre. SSE = n e 2 i (11.3) i=1 84

85 11.3 Minste kvadraters regresjonslinje Setning: ( minste kvadraters lineære regresjonslinje ) La (x 1, y 2 ), (x 2, y 2 ),..., (x n, y n ) være observasjonspar/datasett. Minste kvadraters lineære regresjonslinje 6 er da gitt ved: hvor ŷ = ˆα + ˆβ x, (11.7) og ˆβ = S xy (11.8) Sx 2 ˆα = y ˆβ x (11.9) S 2 x S xy lign.(1.10) = lign.(1.12) = 1 n 1 1 n 1 n (x i x) 2 (11.10a) i=1 n (x i x)(y i y) (11.10b) i=1 samt x = 1 n n i=1 x i og y = 1 n n i=1 y i. y Vilkårlig a og b: y α og β som passer best: y = a + bx y = α + βx e 5 e 5 e 1 e 2 e 3 e 4 e 3 e 4 x e 1 e 2 x Figur 11.4: Linje som ikke passer best, og linje som passer best. 6 Den linjen som passer best, dvs. minst SSE, har altså fått navnet regresjonslinje. 85

86 11.4 Forklaringsstyrke og SST Definisjon: ( SST ) 7 La (x 1, y 2 ), (x 2, y 2 ),..., (x n, y n ) være observasjonspar/datasett. Størrelsen SST, sum squared total, er da definert ved: SST = n (y i y) 2 (11.11) i=1 hvor y i er de faktiske observasjonene/dataene: y i }{{} faktiske observasjoner/data (11.12) og y er det empiriske gjennomsnittet, dvs. y lign.(1.3) = 1 n n y i (11.13) i=1 y y i y i = residual y i y i y i y i = total variasjon y x i x Figur 11.5: Residual og total variasjon. 7 SST står for sum square total. 86

87 Definisjon: ( forklaringsstyrke ) 8 La x 1, x 2, x 3,..., x n og y 1, y 2, y 3,..., y n være observasjoner. Forklaringsstyrken R 2 er da: R 2 = 1 SSE SST (11.14) hvor SSE = SST = n (y i ŷ i ) 2 (11.15) i=1 n (y i y) 2 (11.16) i=1 hvor y i er de faktiske observasjonene/dataene: y i }{{} faktiske observasjoner/data (11.17) og ŷ i er prediksjonene som linjen 9 ŷ i = ˆα + ˆβx }{{} i prediksjoner (11.18) samt y er det empiriske gjennomsnittet, dvs. y = 1 n n y i (11.19) i=1 8 Kalls også forklaringsgrad. 9 Se lign.(11.7). Parametrene/koeffisientene ˆα og ˆβ er parametre gitt ved lign.(11.9) og (11.8). 87

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal

Formelsamling V-2014 MAT110. Statistikk 1. Per Kristian Rekdal Formelsamling V-2014 MAT110 Statistikk 1 Per Kristian Rekdal 2 Forord Dette er formelsamlingen i emnet MAT110 Statistikk 1 ved høgskolen i Molde. Formlene i denne formelsamlingen er stort sett de formlene

Detaljer

Eksamen i. MAT110 Statistikk 1

Eksamen i. MAT110 Statistikk 1 Avdeling for logistikk Eksamen i MAT110 Statistikk 1 Eksamensdag : Torsdag 28. mai 2015 Tid : 09:00 13:00 (4 timer) Faglærer/telefonnummer : Molde: Per Kristian Rekdal / 924 97 051 Kristiansund: Terje

Detaljer

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at Kapittel 4 Forventningsverdi, varians, kovarians for én stokastisk variabel og funksjoner av stokastiske variabler TMA4245 V2007: Eirik Mo 2 4.1 Forventing til en stokastisk variabel DEF 4.1: La X være

Detaljer

Kompendium V-2014 MAT110. Statistikk 1. Del 1 av 2. Per Kristian Rekdal

Kompendium V-2014 MAT110. Statistikk 1. Del 1 av 2. Per Kristian Rekdal Kompendium V-2014 MAT110 Statistikk 1 Del 1 av 2 Per Kristian Rekdal 2 Figur 1: But under a different accounting convention... 3 4 Forord Dette er del I (av II) av kompendiet i faget MAT110 Statistikk

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010. ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010. ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 ÅMA Sannsynlighetsregning med statistikk, våren Kp. Diskrete tilfeldige variable ÅMA Sannsynlighetsregning med statistikk, våren Kp. Diskrete tilfeldige variable Diskrete tilfeldige variable, innledning

Detaljer

Sannsynlighetsregning og kombinatorikk

Sannsynlighetsregning og kombinatorikk Sannsynlighetsregning og kombinatorikk Introduksjon Formålet med sannsynlighet og kombinatorikk er å kunne løse problemer i statistikk, somoftegårutpååfattebeslutninger i situasjoner der tilfeldighet rår.

Detaljer

FORMELSAMLING STATISTIKK, HiG

FORMELSAMLING STATISTIKK, HiG Høgskolen i Gjøvik Avdeling for ingeniørfag Versjon fra mai 2007 FORMELSAMLING STATISTIKK, HiG Hans Petter Hornæs hans.hornaes@hig.no ISSN:??????? Innledning. Denne formelsamlingen er skrevet for bruk

Detaljer

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Utsatt eksamen i: ECON2130 - Statistikk 1 Eksamensdag: 19.06.2014 Tid for eksamen: kl. 09:00 12:00 Oppgavesettet er på 4 sider UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Tillatte hjelpemidler: Alle trykte

Detaljer

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem MAT400 PROSJEKTOPPGAVE: Statistikk i S2 Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem 20. mai 205 Innhold. Stokastisk Variabel.. Stokastiske variable som funksjoner 3 2. Forventningsverdi

Detaljer

Regler i statistikk STAT 100

Regler i statistikk STAT 100 TORIL FJELDAAS RYGG - VÅREN 2010 Regler i statistikk STAT 100 Innhold side Sannsynlighetsregning 3 - Uttrykk 3 - Betinget sannsynlighet 4 - Regler for sannsynlighet 4 - Bayes teorem 4 - Uavhengige begivenheter

Detaljer

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger 1 Section 4-1: Introduksjon til sannsynlighet 2 Section 4-2: Enkel sannsynlighetsregning 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger 4 Section 5-2: Tilfeldige variable 5 Section 5-3: Binomisk

Detaljer

Sannsynlighetsregning og Statistikk.

Sannsynlighetsregning og Statistikk. Sannsynlighetsregning og Statistikk. Leksjon Velkommen til dette kurset i sannsynlighetsregning og statistikk! Vi vil som lærebok benytte Gunnar G. Løvås:Statistikk for universiteter og høyskoler. I den

Detaljer

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller. KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. BtG207 EKSAMENSDATO: 11. juni 2007. KLASSE: HIS 05 08. TID: kl. 8.00 13.00. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 5 (innkl. forside)

Detaljer

TMA4245 Statistikk Vår 2007

TMA4245 Statistikk Vår 2007 TMA4245 Statistikk Vår 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 7 Oppgave Tippekonkurranse Denne oppgaven er ment som en kjapp test på hva du har lært.

Detaljer

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4245 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland Tlf: 48 22 18 96 Eksamensdato:??. august 2014 Eksamenstid (fra til): 09:00 13:00 Hjelpemiddelkode/Tillatte

Detaljer

Fagdag 5-08.01.09. 2) Du skal fylle ut en tippekupong. På hvor mange måter kan dette gjøres?

Fagdag 5-08.01.09. 2) Du skal fylle ut en tippekupong. På hvor mange måter kan dette gjøres? Fagdag Plan Fagdag - 08.01.0 1,2 time: Repetisjon kapittel 3 - Sannsynlighet Oppgaver Teori (lesestoff) 3, time: Arbeide med.1 og.2: 16, 17, 18, 1 3, time: Ekstra vurdering før terminoppgjør Repetisjon

Detaljer

Kapittel 4: Sannsynlighet - Studiet av tilfeldighet

Kapittel 4: Sannsynlighet - Studiet av tilfeldighet Kapittel 4: Sannsynlighet - Studiet av tilfeldighet Vi så i forrige kapittel at utvalgsfordeling til en statistikk (observator) er fordelingen av verdiene til statistikken over alle utvalg av samme størrelse

Detaljer

EKSAMEN I TMA4240 Statistikk

EKSAMEN I TMA4240 Statistikk Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Henning Omre (909 37848) Mette Langaas (988 47649) EKSAMEN I TMA4240 Statistikk 18.

Detaljer

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere 2 Loven om total sannsynlighet La A og Ā være komplementære hendelser, mens B er en annen hendelse. Da er: P(B) P(B oga)+p(b ogā) P(B A)P(A)+P(B Ā)P(Ā) ST0202 Statistikk for samfunnsvitere Bo Lindqvist

Detaljer

Kontinuerlige sannsynlighetsfordelinger.

Kontinuerlige sannsynlighetsfordelinger. Kontinuerlige sannsynlighetsfordelinger. Dekkes av kap. 6 og deler av kap. 8.5 i boka. Husk: f(x er sannsynlighetstettheten til en kontinuerlig X dersom:. f(x 0 for alle x R 2. f(xdx = 3. P (a

Detaljer

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Dette er det andre settet med obligatoriske oppgaver i STK1110 høsten 2010. Oppgavesettet består av fire oppgaver. Det er valgfritt om du vil

Detaljer

Oppgave 1: Feil på mobiltelefoner

Oppgave 1: Feil på mobiltelefoner Oppgave 1: Feil på mobiltelefoner a) Sannsynlighetene i oppgaven blir P (F 1 F 2 ) P (F 1 ) + P (F 2 ) P (F 1 F 2 ) P (F 1 ) + 1 P (F2 C ) P (F 1 F 2 ) 0.080 + 0.075 0.006 0.149 P (F 1 F 2 ) P (F 1 F 2

Detaljer

år i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 i=1 (x i x) 2 = 60, 9

år i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 i=1 (x i x) 2 = 60, 9 TMA424 Statistikk Vår 214 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II Oppgave 1 Matlabkoden linearreg.m, tilgjengelig fra emnets hjemmeside, utfører

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen Bo Lindqvist Institutt for matematiske fag 2 Kap. 6: Normalfordelingen Normalfordelingen regnes som den viktigste statistiske fordelingen!

Detaljer

Notater til forelesning i Sannsynlighetsregning SK 101 Matematikk i grunnskolen I

Notater til forelesning i Sannsynlighetsregning SK 101 Matematikk i grunnskolen I Notater til forelesning i Sannsynlighetsregning SK 101 Matematikk i grunnskolen I 4 Kombinatorikk Vi må lære tellemetoder når valgtrær, som vi brukte tidligere, blir for store og vanskelig å håndtere.

Detaljer

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt.

OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 6 SIDER MERKNADER: Alle deloppgaver vektlegges likt. EKSAMEN I: MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir forlag) OPPGAVESETTET

Detaljer

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0 Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir

Detaljer

TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger

TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger Kontinuerlig uniform fordeling f() = B A, A B. En kontinuerlig størrelse (vekt, lengde, tid), som aldri kan bli mindre enn

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Jo Eidsvik og Arild Brandrud Næss Tlf: 90 12 74 72 og 99 53 82 94 Eksamensdato: 9. desember 2013 Eksamenstid

Detaljer

Læreplan i matematikk for samfunnsfag - programfag i studiespesialiserende program

Læreplan i matematikk for samfunnsfag - programfag i studiespesialiserende program Læreplan i matematikk for samfunnsfag - programfag i studiespesialiserende program Fastsatt som forskrift av Utdanningsdirektoratet 27. mars 2006 etter delegasjon i brev 26. september 2005 fra Utdannings-

Detaljer

Sammendrag R1. Sandnes VGS 19. august 2009

Sammendrag R1. Sandnes VGS 19. august 2009 Sammendrag R1 Sandnes VGS 19. august 2009 1 1 Notasjon Implikasjon Vi skriver A B hvis påstanden A impliserer B. Det vil si at hvis påstand A er riktig, så er påstand B riktig. Ekvivalens Vi skriver A

Detaljer

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Underveiseksamen i: STK1000. Eksamensdag: Onsdag 17/3, 2004. Tid for eksamen: Kl. 09.00 12.00. Tillatte hjelpemidler: Lærebok: Moore & McCabe

Detaljer

Lær å bruke GeoGebra 4.0

Lær å bruke GeoGebra 4.0 Lær å bruke GeoGebra 4.0 av Sigbjørn Hals Innhold: Generelt om GeoGebra... 2 Innstillinger... 2 Likninger og ulikheter... 5 Implisitte likninger... 5 Ulikheter... 9 Statistikkberegninger i regnearket...

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Deleksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 12. oktober 2011. Tid for eksamen: 15:00 17:00. Oppgavesettet

Detaljer

MATEMATIKK 1 (for 8. 10. trinn) Emnebeskrivelser for studieåret 2014/2015

MATEMATIKK 1 (for 8. 10. trinn) Emnebeskrivelser for studieåret 2014/2015 MATEMATIKK 1 (for 8. 10. trinn) Emnebeskrivelser for studieåret 2014/2015 Emnenavn Grunnleggende matematikk Precalculus MA6001 Undervisningssemester Høst 2014 Professor Petter Bergh petter.bergh@math.ntnu.no

Detaljer

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller. KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. BtG27 EKSAMENSDATO: 27. mai 211. KLASSE: HIS 8 11. TID: kl. 8. 13.. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 3 innkl. forside) TILLATTE

Detaljer

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014 Statistikk 1 Nico Keilman ECON 2130 Vår 2014 Pensum Kap 1-7.3.6 fra Løvås «Statistikk for universiteter og høgskoler» 3. utgave 2013 (eventuelt 2. utgave) Se overspringelsesliste på emnesiden Supplerende

Detaljer

QED 5 10. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

QED 5 10. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode QED 5 10 Matematikk for grunnskolelærerutdanningen Bind 2 Fasit kapittel 4 Statistikk og kvantitativ metode Kapittel 4 Oppgave 1. La x være antall øyne på terningen. a) Vi får følgende sannsynlighetsfordeling

Detaljer

Sammendrag R1. 26. januar 2011

Sammendrag R1. 26. januar 2011 Sammendrag R1 26. januar 2011 1 1 Notasjon Implikasjon Vi skriver A B hvis påstanden A impliserer B. Det vil si at hvis påstand A er riktig, så er påstand B riktig. Ekvivalens Vi skriver A B hvis to påstander

Detaljer

Standardavvik. Varians. Utfallsrom (sannsynlighet)

Standardavvik. Varians. Utfallsrom (sannsynlighet) Standardavvik Median Varians n = partall Utfallsrom (sannsynlighet) Persentil er verdien definert ved at minst 100% * p% lav observasjonene ligger nedenfor denne verdien En stokatisk variabel X er en funksjon

Detaljer

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene 1 Sec 3-2: Hvordan beskrive senteret i dataene 2 Sec 3-3: Hvordan beskrive spredningen i dataene Todeling av statistikk Deskriptiv statistikk Oppsummering og beskrivelse av den stikkprøven du har. Statistisk

Detaljer

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai 2006. SENSURFRIST: 16. juni 2006. KLASSE: HIS 04 07. TID: kl. 8.00 13.00.

EKSAMEN KANDIDATNUMMER: EKSAMENSDATO: 26. mai 2006. SENSURFRIST: 16. juni 2006. KLASSE: HIS 04 07. TID: kl. 8.00 13.00. KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. BtG207 EKSAMENSDATO: 26. mai 2006. SENSURFRIST: 16. juni 2006. KLASSE: HIS 04 07. TID: kl. 8.00 13.00. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER

Detaljer

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005 SOS110 Kvantitativ metode Forelesningsnotater 6 forelesning høsten 005 Statistisk beskrivelse av enkeltvariabler (Univariat analyse) Per Arne Tufte Disposisjon Datamatrisen Variabler Datamatrisen Frekvensfordelinger

Detaljer

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis μ 1 og μ. Vi trekker da ett utvalg fra hver populasjon. ST00 Statistikk for

Detaljer

Statistikk 1 kapittel 3

Statistikk 1 kapittel 3 Statistikk 1 kapittel 3 Nico Keilman ECON 2130 Vår 2014 Kapittel 3 Sannsynlighetsregning Formål: å kvantifisere usikkerhet ved hjelp av sannsynligheter Viktige begreper stokastisk forsøk: et forsøk der

Detaljer

Sannsynlighetsbegrepet

Sannsynlighetsbegrepet Sannsynlighetsbegrepet Notat til STK1100 Ørnulf Borgan Matematisk institutt Universitetet i Oslo Januar 2004 Formål Dette notatet er et supplement til kapittel 1 i Mathematical Statistics and Data Analysis

Detaljer

Øving 7: Statistikk for trafikkingeniører

Øving 7: Statistikk for trafikkingeniører NTNU Veg og samferdsel EVU kurs Trafikkteknikk Oslo / høsten 2007 Øving 7: Statistikk for trafikkingeniører Det anbefales generelt å arbeide i grupper med 2-3 studenter i hver gruppe. Bruk gjerne Excel

Detaljer

Kap. 5.2: Utvalgsfordelinger for antall og andeler

Kap. 5.2: Utvalgsfordelinger for antall og andeler Kap. 5.2: Utvalgsfordelinger for antall og andeler Binære data (1/0, Ja/Nei, Suksess/Feil) Utvalgsundersøkelser: Ja/Nei-spørsmål Tilstedeværelse av arter: Tilstede/Ikke-tilstede (1/0) Overlevelse etter

Detaljer

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG

Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 8) LØSNINGSFORSLAG HØGSKOLEN I SØR-TRØNDELAG AVDELING FOR MAT- OG MEDISINSK TEKNOLOGI Matteknologisk utdanning Kandidatnr: Eksamensdato:

Detaljer

Normalfordeling. Høgskolen i Gjøvik Avdeling for teknologi, økonomi og ledelse. Statistikk Ukeoppgaver uke 7

Normalfordeling. Høgskolen i Gjøvik Avdeling for teknologi, økonomi og ledelse. Statistikk Ukeoppgaver uke 7 Ueoppgaver i BtG207 Statisti, ue 7 : Normalfordeling. 1 Høgsolen i Gjøvi Avdeling for tenologi, øonomi og ledelse. Statisti Ueoppgaver ue 7 Normalfordeling. Oppgave 1 Anta Z N(0, 1), dvs. Z er standard

Detaljer

6 Sannsynlighetsregning

6 Sannsynlighetsregning MATEMATIKK: 6 Sannsynlighetsregning 6 Sannsynlighetsregning 6.1 Forsøk. Utfallsrom. Sannsynlighet (sjanse). Sannsynlighetsmodell Ved ett kast med en terning vet vi at terningen vil vise enten ett, to,

Detaljer

ST0103 Brukerkurs i statistikk Høst 2014

ST0103 Brukerkurs i statistikk Høst 2014 Norges teknisk naturvitenskapelige univsitet Institutt for matematiske fag ST0103 Brukkurs i statistikk Høst 2014 Løsningsforslag Øving 6 5.2 Antall sprukne pøls X binomialfordelt med n 8 og p 0.2, og

Detaljer

Faktor - en eksamensavis utgitt av ECONnect

Faktor - en eksamensavis utgitt av ECONnect Faktor - en eksamensavis utgitt av ECONnect Løsningsforslag: SØK1004 Statistikk for økonomer Eksamen: Våren 009 Antall sider: 16 SØK1004 - Løsningsforslag Om ECONnect: ECONnect er en frivillig studentorganisasjon

Detaljer

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Håvard Rue 73 59 35 20 Håkon Tjelmeland 73 59 35 20 Bjørn Kåre Hegstad 73 59 35 20

Detaljer

Kontinuerlige stokastiske variable.

Kontinuerlige stokastiske variable. Kontinuerlige stokastiske variable. I forelesning har vi sett på en kontinuerlig stokastisk variabel med sannsynlighetstetthet f() =2 og sannsynlighetsfunksjon F () = 2 for. Der hadde jeg et reint regneteknisk

Detaljer

1 Section 6-2: Standard normalfordelingen. 2 Section 6-3: Anvendelser av normalfordelingen. 3 Section 6-4: Observator fordeling

1 Section 6-2: Standard normalfordelingen. 2 Section 6-3: Anvendelser av normalfordelingen. 3 Section 6-4: Observator fordeling 1 Section 6-2: Standard normalfordelingen 2 Section 6-3: Anvendelser av normalfordelingen 3 Section 6-4: Observator fordeling 4 Section 6-5: Sentralgrenseteoremet Oversikt Kapittel 6 Kontinuerlige tilfeldige

Detaljer

6.2 Normalfordeling. Høyde kvinner og menn. 6.1 Kontinuerlig uniform fordeling. Kapittel 6

6.2 Normalfordeling. Høyde kvinner og menn. 6.1 Kontinuerlig uniform fordeling. Kapittel 6 3 6.2 Normalfordeling Kapittel 6 Noen kontinuerlige sannsynlighetsfordelinger TMA4245 V2007: Eirik Mo Normalfordeling: Sannsynlighetstettheten til en normalfordelt stokastisk variabel, X, med forventning

Detaljer

QED 1 7. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode

QED 1 7. Matematikk for grunnskolelærerutdanningen. Bind 2. Fasit kapittel 4 Statistikk og kvantitativ metode QED 1 7 Matematikk for grunnskolelærerutdanningen Bind 2 Fasit kapittel 4 Statistikk og kvantitativ metode Kapittel 4 Oppgave 1 La være antall øyne på terningen. a) Vi får følgende sannsynlighetsfordeling

Detaljer

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller. KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. BtG207 EKSAMENSDATO: 16. juni 2009. KLASSE: HIS 07 10. TID: kl. 8.00 13.00. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 3 innkl. forside)

Detaljer

NTNU KOMPiS Studieplan for MATEMATIKK 1 (8.-13. trinn) med hovedvekt på 8.-10. trinn Studieåret 2015/2016

NTNU KOMPiS Studieplan for MATEMATIKK 1 (8.-13. trinn) med hovedvekt på 8.-10. trinn Studieåret 2015/2016 Versjon 01/15 NTNU KOMPiS Studieplan for MATEMATIKK 1 (8.-13. trinn) med hovedvekt på 8.-10. trinn Studieåret 2015/2016 Profesjons- og yrkesmål Dette studiet er beregnet for lærere på ungdomstrinnet som

Detaljer

EKSAMEN I TMA4245 Statistikk

EKSAMEN I TMA4245 Statistikk Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Turid Follestad (98 06 68 80/73 59 35 37) Hugo Hammer (45 21 01 84/73 59 77 74) Eirik

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 7. oktober 2009. Tid for eksamen: 15:00 17:00. Oppgavesettet er på

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon Bo Lindqvist Institutt for matematiske fag 2 Kap. 9: Inferens om én populasjon Statistisk inferens har som mål å tolke/analysere

Detaljer

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Underveiseksamen i: STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 28/3, 2007. Tid for eksamen: Kl. 09.00 11.00. Tillatte hjelpemidler:

Detaljer

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32).

Oppgave 1. og t α/2,n 1 = 2.262, så er et 95% konfidensintervall for µ D (se kap 9.9 i læreboka): = ( 0.12, 3.32). Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 16. november 2009 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir

Detaljer

NTNU KOMPiS Studieplan for MATEMATIKK 1 (8. - 10. trinn) Studieåret 2014/2015

NTNU KOMPiS Studieplan for MATEMATIKK 1 (8. - 10. trinn) Studieåret 2014/2015 Godkjent april 2014 NTNU KOMPiS Studieplan for MATEMATIKK 1 (8. - 10. trinn) Studieåret 2014/2015 Profesjons- og yrkesmål Dette studiet er beregnet for lærere som har godkjent lærerutdanning med innslag

Detaljer

b) i) Finn sannsynligheten for at nøyaktig 2 av 120 slike firmaer går konkurs.

b) i) Finn sannsynligheten for at nøyaktig 2 av 120 slike firmaer går konkurs. Eksamen i: MET 040 Statistikk for økonomer Eksamensdag: 31 Mai 2007 Tid for eksamen: 09.00-13.00 Oppgavesettet er på 4 sider. Tillatte hjelpemidler: Alle trykte eller egenskrevne hjelpemidler og kalkulator.

Detaljer

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger 6.4-5.7: Normalfordelingen, normalapproksimasjon, eksponensial og gamma.

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger 6.4-5.7: Normalfordelingen, normalapproksimasjon, eksponensial og gamma. TMA4240 Statistikk H2010 Kapittel 6: Kontinuerlige sannsynlighetsfordelinger 6.4-5.7: Normalfordelingen, normalapproksimasjon, eksponensial og gamma. Mette Langaas Foreleses mandag 27. september 2010 2

Detaljer

EKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg m.fl.

EKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg m.fl. KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. REA 1081 og REA1081F EKSAMENSDATO: 1. juni 2011. KLASSE: Flexibel ingeniørutdanning, 2kl. Bygg m.fl. TID: kl. 9.00 12.00. FAGLÆRER: Hans Petter Hornæs

Detaljer

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER EKSAMEN I: MOT310 STATISTISKE METODER VARIGHET: 4 TIMER DATO: 27. FEBRUAR 2004 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV 3 OPPGAVER PÅ 5

Detaljer

Høgskolen i Gjøviks notatserie, 2001 nr 5

Høgskolen i Gjøviks notatserie, 2001 nr 5 Høgskolen i Gjøviks notatserie, 2001 nr 5 5 Java-applet s for faget Statistikk Tor Slind Avdeling for Teknologi Gjøvik 2001 ISSN 1501-3162 Sammendrag Dette notatet beskriver 5 JAVA-applets som demonstrerer

Detaljer

4: Sannsynlighetsregning

4: Sannsynlighetsregning Plan for hele året: - Kapittel 5: Januar - Kapittel 6: Februar - Kapittel 7: Februar/mars 4: Sannsynlighetsregning - Kapittel 8: Mars/april - Repetisjon: April/mai - Økter, prøver, prosjekter: Mai - juni

Detaljer

Sannsynlighetsregning

Sannsynlighetsregning Sannsynlighetsregning Per G. Østerlie Thora Storm vgs per.osterlie@stfk.no 5. april 203 Hva og hvorfor? Hva? Vi får høre at det er sannsynlig at et eller annet kommer til å skje. Sannsynligheten for å

Detaljer

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 = 3.6080.

Oppgave 1. Det oppgis at dersom y ij er observasjon nummer j fra laboratorium i så er SSA = (y ij ȳ i ) 2 = 3.6080. EKSAMEN I: MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 28. FEBRUAR 2005 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV 4 OPPGAVER PÅ

Detaljer

Øving 1 TMA4240 - Grunnleggende dataanalyse i Matlab

Øving 1 TMA4240 - Grunnleggende dataanalyse i Matlab Øving 1 TMA4240 - Grunnleggende dataanalyse i Matlab For grunnleggende introduksjon til Matlab, se kursets hjemmeside https://wiki.math.ntnu.no/tma4240/2015h/matlab. I denne øvingen skal vi analysere to

Detaljer

+ S2 Y ) 2. = 6.737 6 (avrundet nedover til nærmeste heltall) n Y 1

+ S2 Y ) 2. = 6.737 6 (avrundet nedover til nærmeste heltall) n Y 1 Løsningsforslag for: MOT10 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 6. november 007 TILLATTE HJELPEMIDLER: Kalkulator: HP0S, Casio FX8 eller TI-0 Tabeller og formler i statistikk (Tapir forlag) MERKNADER:

Detaljer

Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner

Detaljer

En kort innføring i sannsynlighetsregning

En kort innføring i sannsynlighetsregning En kort innføring i sannsynlighetsregning Harald Goldstein Sosialøkonomisk institutt Januar 2000 Innhold 1 Innledning 1 2 Begivenheter og sannsynlighet 4 2.1 Matematiskbeskrivelseavbegivenheter... 4 2.2

Detaljer

Sannsynlighetsregning

Sannsynlighetsregning Sannsynlighetsregning 1 Sannsynlighet Mål for opplæringa er at eleven skal kunne formulere, eksperimentere med og drøfte enkle uniforme og ikkje-uniforme sannsynsmodellar berekne sannsyn ved hjelp av systematiske

Detaljer

Øving 1 TMA4245 - Grunnleggende dataanalyse i Matlab

Øving 1 TMA4245 - Grunnleggende dataanalyse i Matlab Øving 1 TMA4245 - Grunnleggende dataanalyse i Matlab For grunnleggende bruk av Matlab vises til slides fra basisintroduksjon til Matlab som finnes på kursets hjemmeside. I denne øvingen skal vi analysere

Detaljer

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

Første sett med obligatoriske oppgaver i STK1110 høsten 2015 Første sett med obligatoriske oppgaver i STK1110 høsten 2015 Dette er det første obligatoriske oppgavesettet i STK1110 høsten 2015. Oppgavesettet består av fire oppgaver. Du må bruke Matematisk institutts

Detaljer

Statistikk 2. Tabellen nedenfor viser oljeproduksjonen i et OPEC-land i perioden 1990 til 2005. Produksjonen er i 1000 tonn.

Statistikk 2. Tabellen nedenfor viser oljeproduksjonen i et OPEC-land i perioden 1990 til 2005. Produksjonen er i 1000 tonn. Statistikk Innledning Begrepet statistikk skriver seg fra tiden da en stat samlet inn opplysninger som myndighetene hadde bruk for. Opplysningene eller dataene som ble samlet inn, dreide seg for det meste

Detaljer

Konfidensintervall for µ med ukjent σ (t intervall)

Konfidensintervall for µ med ukjent σ (t intervall) Forelesning 3, kapittel 6 Konfidensintervall for µ med ukjent σ (t intervall) Konfidensintervall for µ basert på n observasjoner fra uavhengige N( µ, σ) fordelinger når σ er kjent : Hvis σ er ukjent har

Detaljer

Forelesning 6, kapittel 3. : 3.6: Kombinatorikk.

Forelesning 6, kapittel 3. : 3.6: Kombinatorikk. Forelesning 6, kapittel 3. : 3.6: Kombinatorikk. Kombinatorikk betyr her: Formler for opptelling av antall kombinasjoner. Generelt er denne grenen av matematikk videre, og omfatter blant annet grafteori.

Detaljer

Beskrivende statistikk.

Beskrivende statistikk. Obligatorisk oppgave i Statistikk, uke : Beskrivende statistikk. 1 Høgskolen i Gjøvik Avdeling for teknologi, økonomi og ledelse. Statistikk Ukeoppgaver uke I løpet av uken blir løsningsforslag lagt ut

Detaljer

EKSAMENSOPPGAVER SV SØ 232: METODE II

EKSAMENSOPPGAVER SV SØ 232: METODE II EKSAMENSOPPGAVER SV SØ 232: METODE II H-1998 Gjør rede for følgende begreper: 1. Stokastisk variabel 2. Sannsynlighet 3. Estimator 4. Estimat 5. Forventning 6. Varians 7. Kovarians Gjør rede for trinnene

Detaljer

Fra krysstabell til regresjon

Fra krysstabell til regresjon Fra krysstabell til regresjon La oss si at vi er interessert i å undersøke i hvilken grad arbeidstid er avhengig av utdanning. Vi har ca. 3200 observasjoner (dvs. arbeidstakere som er spurt). For hver

Detaljer

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl. 10.00-12.

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl. 10.00-12. MASTR I IDRTTSVITNSKAP 2014/2016 Utsatt individuell skriftlig eksamen i STA 400- Statistikk Mandag 24. august 2015 kl. 10.00-12.00 Hjelpemidler: kalkulator ksamensoppgaven består av 10 sider inkludert

Detaljer

NR. 2-2005 11. årgang

NR. 2-2005 11. årgang nytt NR. - 005 11. årgang FX-9860G SD Casio lanserer i nær framtid et nytt tilskudd på stammen av grafiske lommeregnere spesielt beregnet for videregående skole. Den svart hvite skjermen, er blitt større

Detaljer

Matteknologisk utdanning

Matteknologisk utdanning Statistikk, FO242N, AMMT, HiST 2. årskurs, 30. mai 2007 side 1 ( av 5) HØGSKOLEN I SØR-TRØNDELAG AVDELING FOR MAT- OG MEDISINSK TEKNOLOGI Matteknologisk utdanning Kandidatnr: Eksamensdato: 30. mai 2007

Detaljer

Sentralverdi av dataverdi i et utvalg Vi tenker oss et utvalg med datapar. I vårt eksempel har vi 5 datapar.

Sentralverdi av dataverdi i et utvalg Vi tenker oss et utvalg med datapar. I vårt eksempel har vi 5 datapar. Statistisk behandling av kalibreringsresultatene Del 4. v/ Rune Øverland, Trainor Elsikkerhet AS Denne artikkelserien handler om statistisk behandling av kalibreringsresultatene. Dennne artikkelen tar

Detaljer

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK

EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: John Tyssedal 41 64 53 76 EKSAMEN I FAG TMA4240/TMA4245 STATISTIKK Lørdag 10. august

Detaljer

EKSAMENSOPPGAVE. Eksamen i: STA- 0001 Brukerkurs i statistikk 1 Mandag 03. juni 2013 Kl 09:00 13:00 Åsgårdvegen 9

EKSAMENSOPPGAVE. Eksamen i: STA- 0001 Brukerkurs i statistikk 1 Mandag 03. juni 2013 Kl 09:00 13:00 Åsgårdvegen 9 FAKULTET FOR NATURVITENSKAP OG TEKNOLOGI EKSAMENSOPPGAVE Eksamen i: STA- 0001 Brukerkurs i statistikk 1 Dato: Tid: Sted: Mandag 03. juni 2013 Kl 09:00 13:00 Åsgårdvegen 9 Tillatte hjelpemidler: Alle trykte

Detaljer

H ØGSKOLEN I BERGEN Avdeling for ingeniørutdanning

H ØGSKOLEN I BERGEN Avdeling for ingeniørutdanning H ØGSKOLEN I BERGEN Avdeling for ingeniørutdanning EKSAMEN KLASSAR FOA 172 Statistikk : alle DATO : 5. desember 2007 TAL pa OPPGAVER TAL pa SIDER VEDLEGG HJELPEMIDDEL TID MALFORM FAGLÆRARAR : 4 : 3 (inkludert

Detaljer

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk

MASTER I IDRETTSVITENSKAP 2013/2015 MASTER I IDRETTSFYSIOTERAPI 2013/2015. Individuell skriftlig eksamen. STA 400- Statistikk MASTER I IDRETTSVITENSKAP 013/015 MASTER I IDRETTSFYSIOTERAPI 013/015 Individuell skriftlig eksamen i STA 400- Statistikk Mandag 10. mars 014 kl. 10.00-1.00 Hjelpemidler: kalkulator Eksamensoppgaven består

Detaljer

Binomisk fordeling. Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Binomisk fordeling. Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk MAT0100V Sannsynlighetsregning og kombinatorikk Forventning, varians og standardavvik Tilfeldige variabler Når vi kaster to terninger er det 36 utfall Vi ser på X = «sum antall øyne» De mulige verdiene

Detaljer

Ordliste faguttrykk; ÅMA110 Sannsynlighetsregning med statistikk

Ordliste faguttrykk; ÅMA110 Sannsynlighetsregning med statistikk Ordliste faguttrykk; ÅMA110 Sannsynlighetsregning med statistikk average cell center class intervall class midpoint cluster cumulative frequency descriptive descriptive statistics deviation distribution

Detaljer

Innhold DEL I MATEMATIKK SKOLEFAG OG KULTURARV.. 21

Innhold DEL I MATEMATIKK SKOLEFAG OG KULTURARV.. 21 Innhold Velkommen til studiet... 13 Oppbygning... 15 Sammenheng og helhet... 16 Pedagogisk struktur... 17 Lykke til med et spennende kurs... 19 DEL I MATEMATIKK SKOLEFAG OG KULTURARV.. 21 Kapittel 1 Tall...

Detaljer

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Underveiseksamen i: STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 13/10, 2004. Tid for eksamen: Kl. 09.00 11.00. Vedlegg:

Detaljer

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt. Eksamen i: MET00 Statistikk for økonomer Eksamensdag: 8. november 2007 Tid for eksamen: 09.00-13.00 Oppgavesettet er på 5 sider. Tillatte hjelpemidler: Alle trykte eller egenskrevne hjelpemidler og kalkulator.

Detaljer