Bakgrunnsto fra sannsynlighetsregning og matematisk statistikk

Størrelse: px
Begynne med side:

Download "Bakgrunnsto fra sannsynlighetsregning og matematisk statistikk"

Transkript

1 Bakgrunnsto fra sannsynlighetsregning og matematisk statistikk M.B August 25 Georg Cantor 1883: Das Wesen der Mathematik liegt in ihrer Freiheit 1 Innledninng Det matematiske grunnlaget for disse disiplinene er et sett av aksiomer utviklet av A.N.Kolmogorov [1]. Siden dette ikke er ment å være en matematisk tekst, skal vi legge mer vekt på enkle formuleringer enn på matematisk stringens. Dette hindrer desverre ikke at deler av innholdet i første omgang kan virke abstrakt og vanskelig tilgjengelig. Dette kommer delvis av at stoet i seg selv bygger på relativt avansert matematikk og at presentasjonen er konsentrert. Den matnyttige delen av innholdet benner seg hovedsaklig i avsnittene om statistiske fordelinger,ekstremverdifordelinger og beskrivende statistikk. Det er mulig å gå direkte dit for de som særlig er interessert i dette stoet. Disse avsnittene er også noe mer praktiske enn det generelle stoet i begynnelsen. Det bør forøvrig være mulig å ha en viss nytte av innholdet uten å fortape seg i eller forstå alle detaljene. 1

2 2 Sentrale begreper I sannsynlighetsregningen analyserer vi prosesser/eksperimenter med tilfeldige/usikre utfall. Typiske eksempler er kaste med terning, spille lotto, etc. Ofte betegnes slike systemer/prosesser som stokastiske. For å formulere stokastiske prosesser i forhold til en matematisk struktur innfører vi begrepet utfallsrom som vi symboliserer med Ω. Denisjon 2.1. Ω er en ikke-tom mengde som innebefatter alle mulige utfall fra prosessen/eksperimentet. Elementene i Ω kaller vi følgelig utfall. Erfaringsmessig vet vi at det er knyttet visse fundamentale egenskaper til systemer med tilfeldige utfall. Eksempelvis at sannsynligheten for vinst i lotto øker med antall rekker, eller at vi er sikre på å få 1 rette i tipping dersom vi helgarderer 1 kamper. For å sikre oss at de matematiske strukturene våre beholder disse egenskapene viser det seg nyttig å innføre den såkalte σalgebraen. Denisjon 2.2. En mengde E av delmengder til Ω er en σalgebra når disse egenskapene er oppfyllt: 1. Ω E 2. A E A c E 3. Når alle A i E gjelder: i N Ai E I literaturen blir symbolet ofte benyttet om mengder som representerer en σalgebra. Begrepet σalgebra er ellers av svært generell natur. Eks Vi har f.eks: P(Ω) er en σalgebra. {, Ω} er en σalgebra. {, A, A c, Ω} er en σalgebra. Kontroller gjerne at eksemplene har egenskaper i samsvar med denisjonen 2.2 I sannsynlighetsregningen er det endel mengdebegreper som har en litt spesiell tolkning. For om mulig å gjøre stoet litt enklere tar vi med denne summariske utdypningen av noen sentrale begreper. ω Ω Utfall A Ω Hendelse A B Hendelsene A og B inntreer. A B Hendelsen A eller B inntreer. A c Komplementmengde Hendelsen A inntreer ikke. A B = Hendelsene A og B uteslutter hverandre. A + B Skrivemåte for A B når A B = 2 i=1

3 Her er noen ere symbolforklaringer. Den tomme mengden. (Umulig hendelse) A Antall elementer i A. P(A) Potensmengde: Mengden av delmengdene i A A \ B Dierensmengde: A \ B = {a : a A og a / B} n A i = A A 1 A n Serie av unioner. i= Når Ω har et endelig eller uendelig tellbart 1 antall elementer elementer representerer alle elementene i (A) hendelser og vi kan sette E = P(Ω) Ω representerer da et diskret utfallsrom, og vi denerer det tilsvarende diskrete sannsynlighetsrommet som følger: Denisjon 2.4. Trippelet Ω, P(Ω), P er et diskret sannsynlighetsrom når P oppfyller disse betingelsene: 1. P : P(Ω) R 2 2. P (A), A Ω 3. P (Ω) = 1 4. P (A B) = P (A) + P (B),for alle A, B P(Ω) der A B = Elementene i P(Ω) kaller vi hendelser, En hendelse som tilvarer et utfall blir kalt elementærhendelse. P skal vi kalle sannsynlighetsfordeling over Ω. Når A P, er P (A) sannsynligheten for hendelsen A Før vi går videre til kontinuerlige sannsynlighetsrom, bryter vi av den teoretiske innføringen med et klassisk eksempel. Vi kaster med en terning. Da er det velkjent at vi får et utfall mellom 1 og 6. Følgelig blir Ω = {1, 2, 3, 4, 5, 6}. Hvis vi tror at terningen er god er det rimelig å sette P 1 (1) = P 1 (2) =... = P 1 (6) = 1/6. Dette valget tilfredsstiller denisjonene 2.4, og P 1 er følgelig en akseptabel funksjon. P 1 (1 2) er sannsynligheten for å få en ener eller toer. Et terningkast har kun et utfall og vi har (1 2) =. Da er: P 1 (1 2) = 1/6 + 1/6 = 1/3, som vi ville forvente. Hvis vi mener at terningen er kset slik at den gir et overskudd av seksere kunne det f.eks. være aktuelt å sette P 1 (6) = 1/5 men da måtte vi endre de andre verdiene og sette P 1 ( 6) = 4/25! Det er tilsynelatende ikke stor forskjell mellom denisjonene av et diskret/kontra et kontinuerlig sannsynlighetsrom. Det som imidlertid kompliserer saken er valget av σalgebra. Vi kan si potensmengdebegrepet for stort. Vi må nne metoder å denere en sammenfatning av delmengder i Ω som fyller behovet men samtidig ikke er større enn nødvendig. I en generell 1 En størrelse er tellbar når det eksisterer en avbildning fra størrelsen på en delmengde av ℵ. ℵ er mengden av naturlige tall. 2 R er mengden av reelle tall. D.v.s. P er en reell funksjon. 3

4 sammenheng er dette et omfattende tema, som egentlig er en egen disiplin, og som vi ikke kan gå inn på her. I mange konkrete tilfeller byr det imidlertid ikke på alt for store problemer å nne en funksjonell σalgebra. For å belyse problematikken, kan vi se på tilfellet Ω = R. Når a og b er reelle tall er det åpebart at: A = {x : x Z og x [a, b]} R 3, men representerer denne mengden en reell hendelse? Med disse begrensningene kan vi denere et sannsynlighetsrom på denne måten: Denisjon 2.5. Trippelet (Ω, E, P ) er et sannsynlighetsrom når: E er en σalgebra, og P er sannsynlighetsfordeling. P har disse egenskapene: 1. P : E R 2. P (A), A E 3. P (Ω) = 1 4. P (A B) = P (A) + P (B),for alle A, B der A B = Det ligger implisitt i denisjonen 2.5 at P skal være målbar. D.v.s at funksjonen skal,i generell forstand, være integrerbar over alle A E. Dette leder tilbake til de reeksjonene vi gjorde rundt valg av σalgebra. I det kontinuerlige tilfellet er elmentærhendelser ω Ω av underordnet betydning. (Integralet over et punkt vil være null.) Nedenfor er noen umiddelbare konsekvenser av de strukturene vi har konstruert listet opp. P (A + B) = P (A) + P (B) Fra (a) P ( ) = A = B = A B = og P (A) = P (B) = fra (a) P (A c ) = 1 P (A) Fra (a) med B = A C A B P (A) P (B) Følger av: B = A B \ A Alle disse resultatene er i samsvar med empirisk sannsynlighetsregning. Vi skal se på et nytt klassisk eksempel. Denne gangen dreier det seg om Buons nålproblem. Dette går ut på at vi slipper en nål ned på et vilkårlig sted på et gulv. I vår variant består gulvet av planker med samme bredde som lengden på nålen. Vi ønsker å bestemme sannsynligheten for at nålen blir liggende på to gulvplanker. Problemet har navn etter Georges-Louis Leclerc, Comte de Buon. Altså etter et grevskap og ikke, som det er nærliggende å tro, etter et personnavn. Det skriver seg fra tiden rundt 177. Når vi analyserer problemet innser vi at de bestemmende parametrerne er avstanden fra midtpunktet på nålen til den nærmeste fugen, og vinkelen mellom nålen og gulvplankene. Se forøvrig g. 1 på neste side. Det er dessuten ere symmetrier. Nålen er symmetrisk om midtpunktet og vi har symmetri både om midtlinjen på gulvplanken og om normalen på denne gjennom nålens 3 Z er mengden av rasjonale tall. 4

5 Figur 1: Buons nålproblem midtpunkt. Dette gjør at vi kan innskrenke oss til området π/2 for α, og l for y. Et primitivt utfallsrom blir et rektangel med sider l og π/2, eller mer formelt: Ω 1 = { α y : α [, π 2 ] og y [, l] Betingelsen for at nålen skal hvile på to planker, som vi for enkelhets skyld kan kalle tre, er åpenbart at: l sin α > y. Fig 1 antyder et alternativt utfallsrom. Treene ligger i den delen av rektangelet som er under grafen for l sin α. Dersom vi kaller denne punktmengden A og punktmengden over grafen for B, kan vi sette Ω 2 = {A, B} Nå har et diskret utfallsrom og ved å sette P (A) = (arealet av A)/(arealet av Ω 1 ) etc. har vi åpenbart en gyldig sannsynlighetsfordeling. Vi hadde også nådd fram ved å ta utgangspunkt i Ω 1 og valgt en σalgebra som delte rektangelet opp i Riemann-integrable deler. Nå er arealet av A: = π/2 l sin α dα = l Arealet av Ω 1 er: l π 2 Følgelig blir den søkte sannsynligheten: } P (A) = 2 π Resultatet er interessant fordi det viser en eksperimentell mulighet for å bestemme π. Jeg har sett referert slike forsøk utført på 18tallet av Wolf og Smith. De kk resultater som vist i tabellen. Wolf(185) exp.π = 3, forsøk Smith(1855) exp.π = 3, forsøk Resultatene er rimelig (men ikke urealistisk) gode. I vår tid er det sannsynligvis mer intereesant å eksperimentere med simulering på en datamaskin. 5

6 Figur 2: Reip En test med et enkelt C++program tyder på at det må gjøres i størrelsesorden 1 forsøk for å bestemme π med to desimaler. Fig. 2 skal forestille et reip som ligger utover gulvet. Kan du tenke deg at resultatet fra Buons nålproblem kan benyttes til å anslå lengden på reipet? 3 Fordelinger og stokastiske variabler Formelt matematisk er en stokastisk variabel X en avbildning X : Ω Ω X Ω er det nå velkjente utfallsrommet, og Ω X kaller vi verdirom. Vi skal innskrenke oss til de tifellene der Ω X R. Vi kan tenke oss X som resultat av eksperimenter på et stokastisk system. Vi er ikke nødvendigvis opptatt enkeltutfall, men registrer en kvantiserbar egenskap ved systemet. Dette kan vi i prinsippet gjøre uten at vi behøver å kjenne detaljer i strukturen til Ω. Dersom X høyst kan anta et uendelig tellelig antall verdier, er den stokastiske variabelen diskret. I motsatt fall er X en kontinuerlig stokastisk variabel. En stokastisk variabel X er asossiert med en fordeling P (X). I det diskrete tilfellet er P (X = x i ) sannsynligheten for X = x i og: P (X = x i ) for alle i. (a), i P (X = x i ) = 1 (b) (1) Når X er kontinuerlig, kommer vi tilbake til de samme problemstillingene om målbarhet som vi har omtalt i forbindelse med kontinuerlige utfallsrom. Her skal vi imidlertid la problemet ligge og konsentrere oss om fordelinger som er Riemannintegrerbare over R. D.v.s at det eksisterer det en funksjon f(x) der: b f(x)dx = 1 (a), P (a X b) = f(x)dx (b) (2) 6 a

7 f(x) er fordelingens frekvensfunksjon eller sannsynlighetstetthet. P (a X b) er sannsynligheten for å nne X i intervallet [a, b]. Den kumulative fordelingsfunksjonen F (x) er denert som: F (x) = P ( X x) (3) F (x) blir ofte bare kalt fordelingsfunksjonen. F (x) uttrykker sannsynligheten for at: X x Når fordelingen er diskret er: F (x) = For en kontinuerlig fordeling: x i x x i = P (X = x i ) (4) F (x) = x f(t)dt (5) Ved å fokusere på kumulativ fordeling kan vi gi diskrete og kontinerlige fodelinger en enhetlig behandling. Forventningsverdi er en karakterisisk størrelse for en fordeling. Den kan tolkes som den forventede gjennomsnittsverdien for den stokastiske variabelen. Når X er diskret: µ X = x j P (X = x j ) (6) j Når X er kontinuerlig: µ X = x f(x)dx (7) µ X kan også oppfattes som tyngdepunktet til sannsynlighetsmassen. En annen karakteristisk størrelse er varians. Den er et uttrykk for hvor konsentrert fordelingen er omkring forventningsverdien. Når X er diskret har vi: V X = (x j µ X ) 2 P (X = x j ) (8) j Når X er kontinuerlig: V X = (x µ X ) 2 f(x)dx (9) 7

8 Fra formlene ser vi at spredningen kan oppfattes som treghetsmomentet til sannsynlighetsmassen i forhold til tyngdepunktaksen. Vi ser at lign.(2),(7) og(9), kan sammenfattes og generaliseres dersom vi denerer størrelsen: M n (c) = Sammenfatter vi lign.(2),(6) og(8), får vi: (x c) n f(x)dx (1) M n (c) = j (x c) n P (X = x j ) (11) M n (c) kalles momentet av n.orden m.h.t. c. Vi ser at M (c) = 1 for alle c. Setter vi c = µ, får vi de tilsvarende sentralmomentene. Vi ser at sentalmomentet av 1. orden er null. Sentralmomentet av 2.orden er identisk med variansen. Forventningsverdien tilsvarer M 1 (). Størrelsen σ X = V X, kalles spredning. V = σ µ kalles variasjonskoesient. Når fordelingen er kontinuerlig er medianverdien x (5 ) denert som: x (5 ) F (t)dt =, 5 (12) Sannsynligheten for at en stokastisk variabel skal være mindre eller lik x (5) er m.a.o. 5%. Andre percentiler blir denert på samme måte. Medianverdien for en diskret fordeling, blir denert analogt med denisjonen av empirisk median i lign (65) og (66). Fra lign.(1): M 2 (c) = Når c = µ blir: (x c) 2 f(x)dx = x 2 f(x)dx 2c xf(x)dx+c 2 f(x)dx = M 2 () 2cµ+c 2 (13) V = M 2 () µ 2 (14) 4 Eksempler på fordelinger I de kommende avsnittene kommer vi til tider i kontakt med spesielle matematiske funksjoner og beslektet sto. Dette er grundig behandlet i [2] 8

9 4.1 Likefordeling Diskret likefordeling er sannsynligvis den første fordelingen en møter når en konfronteres med sannsynlighetregning. En stokastisk variabel X er likefordelt over j = 1, 2..., k når: P (X = x j ) = 1 k (15) µ = 1 + k 2 og σ = ( k ) 1 2 (16) Eks Kast med terning: µ = = 7 2, σ = ( ) 1 2 1, 7 For en kontinuerlig likefordeling over intervallet [a, b], gjelder: F (x) = x a b a f(x) = 1 b a x [a, b], f(x) = for x < b eller x > a (17) x [a, b], F (x) = for x < a, F (x) = 1 for x > b (18) µ = a + b Geometrisk fordeling ( (b a) 2 og σ = 12 ) 1 2 (19) En diskret stokastisk variabel X er geometrisk fordelt med parameter p når: P (X = x j = p(1 p) j, (j =... n) og p, 1 (2) µ = 1 p p F (n) = 1 (1 p) n (21) = 1 p 1 og σ = ( 1 p p 2 ) 1 2 (22) Den geometriske fordelingen kommer fram som resultat av at vi gjentar et eksperiment, der sannsynligheten for et gunstig utfall er p, inntil vi får tre. X representer antall forsøk før vi får tre. Beregningen av sannsynligheten for overskridelser av s k i Karakteristisk snølast baserer seg på en geometrisk fordeling. Navnet geometrisk fordeling kommer av at sannsynlighetene for at X =, X = 1,... danner en geometrisk rekke. Eks Sannsynligheten for at vi må gjøre eksakt 4 forsøk med å trekke kort fra en kortstokk før vi får et ess (Forutsatt at vi legger kortene tilbake.) ( 1 er: ), 56 Sannsynligheten for å få ess i løpet av 4 trekk er 1 ( )4, 27. Forventet antall trekk: = 13. 9

10 4.5 Normalfordeling Normal eller Gaussfordeling er vel den mest velkjente kontinuerlige fordelingen. Den omtales her i første rekke som en innlednig til log-normalfordelingen som er av interesse i snølastsammenheng. I standardform er frekvensfunksjonen: ϕ(x) = 1 2π e x2 /2 (23) Φ(x) = z ϕ(z)dz (24) Φ(x) kan ikke uttrykkes ved elementære funksjoner men den er tabellert som standardfunksjon i mange sammenhenger. Standardformen er symmetrisk og har µ = og σ = 1 Den mer generelle standardfordelingen har parametre µ og σ 2, og frekvensfunksjon: Fordelingsfunksjonen F (x) = z standardfordelt, og vi setter f(x) = 1 σ 2π e (x µ)2 /2σ 2 (25) f(z)dz er ikke elementær, men når X er Y = σx + µ (26) blir Y normalfordelt med parametre µ og σ 2. (Parametrene er identiske med fordelingens forventningsverdi og varians!) Ved hjelp av lign.(26): F Y (z) = Φ( z µ σ ) (27) En normalfordelt stokastisk variabel kan bl.a.tenkes oppstått som en sum av en stor mengde uavhengige stokastiske variabler. Med tanke på dette er det nærmest opplagt at en sum av normalfordelte variabler også er normalfordelt. 4.6 Logaritmisk normalfordeling En stokastisk variabel X som har en normalfordelt logaritme sies å være logaritmisk normalfordelt. Siden bare positive tall har en reell logaritme ligger det implisitt at X >. Dersom den underliggende normalfordelingen har forventnigsverdi α og spredning β, er frekvensfunksjonen: f(x) = 1 x β 2π e (ln x α)2 /2β 2, x > (28) Analogt med lign.(27), nner vi: ( ) lnz α F (z) = Φ β Forventningsverdi og spredning: µ = e α+β2 /2 og σ = (29) e 2α+β2 (e β2 1) (3) Siden normalfordelingen kan tenkes som en sum av tilfeldigheter kan den logaritmiske normalfordelingen tenkes som et tilsvarende produkt. 1

11 4.7 Eksponentialfordeling En eksponentialfordeling med parameter ϑ >, har frekvensfunksjonen: Fordelingsfunksjonen blir: f(x) =, x < og f(x) = e ϑx, x (31) Forventningsverdi, varians og sprednng blir: V = F (x) = 1 e ϑx, x (32) µ = 5 Ekstremverdifordelinger xϑe ϑx dx = 1 ϑ (33) (x 1 ϑ )2 ϑe ϑx dx = 1 ϑ 2, σ = 1 ϑ (34) As I am sure almost every geophysicist knows, distributions of actual errors and uctuations have much more straggling extreme values than would correspond to the magic bell-shaped distribution of Gauss and Laplace. John Tukey Når en sampler en stokastisk variabel og velger ut max-/min-verdiene, vil disse også representere en stokastisk variabel. Denne variabelen sies å ha en ekstremalfordeling. Fordelingene blir ulike avhengig av om vi velger ut min. eller max. verdier og vi har derfor maksimal og minimalverdi varianter av disse fordelingene. Det kan vises at under relativt generelle betingelser vil maksimalverdiene ha en fordeling som kan approksimeres med en GEVfordeling. (Generalized extreme value distribution.) Den kumulative fordelingsfunksjonen har formen: x µ (1+xi( G(x) = e σ ))1/ξ, 1 + ξ x µ > og ξ (35) σ Her er µ lokaliseringsparameter, σ skaleringsparameter og ξ er en formparameter. I grensetilfellet ξ,får vi: x µ e ( σ G(x) = e ) (36) G(x) er en Weibullfordeling når ξ <, en Gumbelfordeling når ξ =, og en Fréchetfordeling når ξ >. 11

12 5.1 Gumbelfordeling Gumbelfordelingen er den mest anvendte fordelingen for å modellere maksimalverdier for naturlaster. Ved å innføre parametrene α og β i (36), kan den kumuluative fordelingsfunksjonen for Gumbelfordelingen skrives: Den tilhørende frekvensfunksjonen blir: f(x) = F (x) = e e β(x α) (37) df (x) dx = βe β(x α) e e β(x α) (38) Vi kan merke oss at Gumbelfordelingen ikke har noen formparameter. D.v.s. at alle Gumbelfordelinger har samme form. f(x) kan integreres ved variabeltransformasjonen: z = e β(α x) (39) x = α 1 ln z (4) β Dette gir jfr. lign.(1): dz = βe β(α x) dx = βzdx (41) M 2 () = M () = M 1 () = x 2 f(x)dx = f(x)dx = xf(x)dx = (α 2 2αln z β e z dz = 1 (42) (α ln z β )e z dz (43) + ln2 z β 2 )e z dz (44) Integralene(43) og(44) kan uttrykkes ved gammafunksjonen Γ(x). Vi har: Γ(x) = Ved å derivere inne i integralet får vi: Γ (x) = Γ (x) = Γ (1) = u x 1 e u du (45) u x 1 ln(u)e u du (46) u x 1 ln 2 (u)e u du (47) ln(u)e u du = γ (48) 12

13 Her er γ = lim n Γ (1) = n 1 ln 2 (u)e u du = γ 2 + π2 6 (49) 1 k ln(n), 5772, Eulers konstant. Ved å kombinere(43),(44),(48) og(49), får vi til sist jfr.lign.(14): M 1 () = α + γ β = µ (forventningsverdien) (5) Varians og spredning: M 2 () = ( α + γ ) 2 + π2 β 6 β 2 (51) V = π2 6 β 2 og σ = π β 6 (52) Medianverdien nnes fra (37): x (5) = α ln(ln2) β (53) 5.2 Weibullfordeling Weibullfordelingen hører som tidligere nevnt med til familien av ekstremverdifordelinger. En Weibullfordeling med to parametre har den kumulative fordelingsfunksjonen: F (x) = 1 e ( x β )k, x, k >, β > og F (x) =, x < (54) Her er k formparameter og β skaleringsparameter. Frekvensfunksjonen blir: f(x) = k β ( ) x k 1 ( ) x k e β, x og f(x) =, x < (55) β Vi ser at vi får en eksponentialfordeling for k = (jfr.(27) og (32)). Momentene nnes fra: M n () = x n k ( ) x k 1 ( ) x k e β dx (56) β β Integralet (56) kan omformes med koordinattransformasjonene: x = βu, dx = βdu, z = u k, dz = ku k 1 M n () = β n z n k e z dz = β n Γ(1 + n k ) (57) Γ(x) er den tidligere omtalte gammafunksjonen. Gammafunksjonen er bl.a. tabellert i [2] 13

14 Spesielt blir forventningsverdien: Varians og spredning: V = β 2 Γ(1 + 2 k ) Γ2 (1 + 1 k ), σ = V = Medianverdien nnes fra (54) µ = βγ(1 + 1 k ) (58) β 2 Γ(1 + 2 k ) Γ2 (1 + 1 k ) (59) e ( x (5) β )k = 2, x 5 = βln(2) 1 k (6) 6 Vurdering av observerte data Observerte data fra et stokastisk system, representerer en eller ere stokastiske variabler. Vi skal anta at enkeltdataene er innbyrdes uavhengige og målt under identiske forhold. I dette ligger det også en implisitt forutsetning om at fordelingen er den samme. Dette kan f.eks. realiseres ved å registrere resultater fra forsøk som er utført et antall ganger under like forhold. Dersom vi antar at de bakenforliggende omstendighetene er statiske, slik at måleresultatene ikke representerer en trend, vil målinger som representerer tidsserier også kunne komme inn under denne kategorien. Dette kan være årlig maksimal snølast på en lokalitet, eller årsmiddelemperatur på det samme stedet. Vi har også mulighet for å justere slike måleresultater for en kjent eller antatt trend. Vi antar nå at vi disponerer en måleserie x j. Denne har et et antall karakteristiske egenskaper: Middelverdi : x = 1 n n x j (61) Middelverdi og forventningsverdi er analoge størrelser, men mens middelverdi er resultat av konkrete observasjoner, er forventningsverdi en teoretisk størrelse med bakgrunn i en matematisk modell. De samme analogiene gjelder for andre karakteristiske størrelser. (empirisk) V arians : s 2 = 1 n 1 (empirisk) F ordeling : F n (t) = 1 n n n n (x j x) 2 (62) 1 {x j t} (63) Relativ frekvens : f [a,b] = 1 n 1 {a x j b} (64) Dersom vi sorterer måleresultatene etter størrelse slik at: x (1) x (2) x (n), 14

15 kan vi denere empirisk median som følger: x 5 = x ( n+1 2 ) hvis n = 1, 3, 5 (65) x 5 = 1 ( ) x 2 ( n 2 ) + x ( n +1) 2 hvis n = 2, 4, 6 (66) Den empiriske spredningen er s jfr. (62). En alternativ form for den kumulative empiriske fordelingen er denne: F n (t) = 1 n n {x j t} (67) Forskjellen i forhold til lign.(63) er at summen divideres med n + 1. Denne formen, som bl.a. referer seg til Gumbel, tar i betraktning at den største verdien i en stikkprøve ikke nødvendigvis er den maksimale i hele populasjonen. Vi får dessuten en symmetrering da den kumulative sannsynligheten til høyeste og laveste observasjon kommer like langt fra 1 resp.. Se også [3]. Dersom måleserien refererer til en kontinuerlig stokastisk variabel X, antar vi at denne kan beskrives v.h.a. en sannsynlighetstetthet f(x ϑ). Her står ϑ (som kan oppfattes som en vektor) for eventuelle (ukjente) parametre. For å forenkle problemstillingen skal vi anta at vi på grunnlag av erfaring eller kjennskap til de bakenforliggende prosessene (sannsynlighetsrommet), har en oppfatning om arten av f(x ϑ). Dette gjør at oppgaven reduseres til å bestemme parametervektoren ϑ slik at f(x ϑ) gir en god beskrivelse av x j. En enkel metode som ofte gir gode resultater. er å velge ϑ slik at f(x ϑ) får forventningsverdi,spredning etc. som tilsvarer de tilsvarende empiriske størrelsene. En annen metode er den såkalte MaximumLikelihood metoden som vi forkorter til ML metoden. I tilfelle av en kontinuerlig fordeling går ML metoden går ut på å bestemme komponentene ϑ i slik at n f(x ϑ) blir maksimert. I det diskrete tilfellet er det størrelsen n P (X j = x j ϑ) som skal maksimeres. Det er lett å forstå at denne metoden kan kreve betydelige dataresurser når en skal behandle mange observasjoner. Eks Vi antar at den aktuelle stokastiske variabelen er normalfordelt med parametrene µ og σ jfr.lign (25). Til å begynne med konstaterer vi at å maksimere n f(x ϑ) er det samme som å maksimere ln n f(x ϑ). Det vil si at vi må maksimere uttrykket: ( ) 1 n ln σ 1 2π 2σ 2 15 n (x j µ) 2 (68)

16 Vi konstaterer at med konstant σ blir uttrykket (68) maksimert når: n (x j µ) 2 = Det vil si når µ = x jfr. (61). Ved å sette: ( ) 1 n ln σ σ 1 n 2π 2σ 2 (x j x) 2 = får vi: n σ + 1 σ 3 n (x j x) 2 =, σ 2 = 1 n n (x j x) 2 s 2 (69) Forskjellen mellom s 2 og σ 2 kommer fra denisjonen (62) av s 2. For store n er denne dierensen av liten betydning. Vi nner følgelig at når observasjonene er normalfordelt gir de to omtalte metodene det samme sluttresultatet. Referanser [1] A. N. Kolmogorov. Grundbegrie der Wahrscheinlichkeitsrechnung. Springer, Berlin, [2] M. Abramowitz & I. Stegun (197), Handbook of Mathematical Functions, Dover Publications, Inc., New York [3] Singh, K.P Handbook of Applied Meteorology, ed.david D. Houghton, John Wiley & Sons, Toronto, side

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger TMA4245 Statistikk (B, K1, I) 3.1, 3.2, 3.3 foreleses torsdag 15.januar 0.00 0.02 0.04 0.06 0.08 160 170 180 190 hoyde i cm Mette.Langaas@math.ntnu.no

Detaljer

Sannsynlighetsregning

Sannsynlighetsregning Sannsynlighetsregning Per G. Østerlie Thora Storm vgs per.osterlie@stfk.no 5. april 203 Hva og hvorfor? Hva? Vi får høre at det er sannsynlig at et eller annet kommer til å skje. Sannsynligheten for å

Detaljer

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden. Estimeringsmetoder Momentmetoden La X, X 2,..., X n være uavhengige variable som er rektangulært fordelte på intervallet [0, θ]. Vi vet da at forventningsverdiene til hver observasjon og forventningen

Detaljer

TMA4240 Statistikk Høst 2008

TMA4240 Statistikk Høst 2008 TMA4240 Statistikk Høst 2008 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 7 Oppgave 1 Tippekonkurranse Denne oppgaven er ment som en kjapp test på hva du har

Detaljer

Terningkast. Utfallsrommet S for et terningskast med en vanlig spillterning med 6 sider er veldefinert 1, 2, 3, 4, 5, 6

Terningkast. Utfallsrommet S for et terningskast med en vanlig spillterning med 6 sider er veldefinert 1, 2, 3, 4, 5, 6 Terningkast Halvor Aarnes, UiO, 2014 Innhold Ett terningkast og utfallsrom... 1 Union og snitt... 4 Betinget sannsynlighet... 5 Forventningsverdi E(X) og varianse Var(X)... 5 Konfidensintervall for proporsjoner...

Detaljer

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019

ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag ST/ST Sannsynlighetsregning og statistikk Vår 9 Oppgaver fra boka 3..9 Ved et terningkast anses utfallet antall øyne lik for

Detaljer

Sannsynlighetsbegrepet

Sannsynlighetsbegrepet Sannsynlighetsbegrepet Notat til STK1100 Ørnulf Borgan Matematisk institutt Universitetet i Oslo Januar 2004 Formål Dette notatet er et supplement til kapittel 1 i Mathematical Statistics and Data Analysis

Detaljer

Forelening 1, kapittel 4 Stokastiske variable

Forelening 1, kapittel 4 Stokastiske variable Forelening 1, kapittel 4 Stokastiske variable Eksempel X = "antall kron på kast med to mynter (før de er kastet)" Uniformt utfallsrom {MM, MK, KM, KK}. X = x beskriver hendelsen "antall kron på kast med

Detaljer

Gammafordelingen og χ 2 -fordelingen

Gammafordelingen og χ 2 -fordelingen Gammafordelingen og χ 2 -fordelingen Gammafunksjonen Gammafunksjonen er en funksjon som brukes ofte i sannsynlighetsregning. I mange fordelinger dukker den opp i konstantleddet. Hvis man plotter n-fakultet

Detaljer

STK Oppsummering

STK Oppsummering STK1100 - Oppsummering Geir Storvik 6. Mai 2014 STK1100 Tre temaer Deskriptiv/beskrivende statistikk Sannsynlighetsteori Statistisk inferens Sannsynlighetsregning Hva Matematisk verktøy for å studere tilfeldigheter

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 3.3: Kontinuerlige sannsynlighetsfordelinger 4.1: Matematisk forventing (univariat del) Mette Langaas Foreleses mandag 6. september 2010 2 3.1 Stokastisk variabel (repetisjon)

Detaljer

3.1 Stokastisk variabel (repetisjon)

3.1 Stokastisk variabel (repetisjon) TMA4240 Statistikk H2010 3.3: Kontinuerlige sannsynlighetsfordelinger 4.1: Matematisk forventing (univariat del) Mette Langaas Foreleses mandag 6. september 2010 2 3.1 Stokastisk variabel (repetisjon)

Detaljer

Medisinsk statistikk Del I høsten 2009:

Medisinsk statistikk Del I høsten 2009: Medisinsk statistikk Del I høsten 2009: Kontinuerlige sannsynlighetsfordelinger Pål Romundstad Beregning av sannsynlighet i en binomisk forsøksrekke generelt Sannsynligheten for at suksess intreffer X

Detaljer

Kontinuerlige sannsynlighetsfordelinger.

Kontinuerlige sannsynlighetsfordelinger. Kontinuerlige sannsynlighetsfordelinger. Dekkes av kap. 6 og deler av kap. 8.5 i boka. Husk: f(x er sannsynlighetstettheten til en kontinuerlig X dersom:. f(x 0 for alle x R 2. f(xdx = 3. P (a

Detaljer

Eksempel: kast med to terninger

Eksempel: kast med to terninger Kapittel 3 TMA4245 V2007: Eirik Mo 2 Eksempel: kast med to terninger I et eksperiment kaster vi to terninger og registerer antall øyne på hver terning. Utfallsrom S={(,),(,2),(,3),...,(,), (2,),...,(2,),...,(,)}

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 ÅMA0 Sannsynlighetsregning med statistikk, våren 008 Kp. Sannsynlighetsregning (sannsynlighetsteori).5 Betinget sannsynlighet Betinget sannsynlighet (kp..5) - innledning Eks.: Et terningkast; {,, 3, 4,

Detaljer

Oppfriskning av blokk 1 i TMA4240

Oppfriskning av blokk 1 i TMA4240 Oppfriskning av blokk 1 i TMA4240 Geir-Arne Fuglstad November 21, 2016 2 Hva har vi gjort i dette kurset? Vi har studert to sterkt relaterte grener av matematikk Sannsynlighetsteori: matematisk teori for

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Fra første forelesning: Populasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg En delmengde av

Detaljer

Sannsynlighetsregning og Statistikk

Sannsynlighetsregning og Statistikk Sannsynlighetsregning og Statistikk Leksjon 2. Leksjon 2 omhandler begreper og regneregler for sannsynligheter. Dette er behandlet i kapittel 3.1 og 3.2 i læreboka. Du bør når du har fullført leksjon 2

Detaljer

Sannsynlighetsregning og kombinatorikk

Sannsynlighetsregning og kombinatorikk Sannsynlighetsregning og kombinatorikk Introduksjon Formålet med sannsynlighet og kombinatorikk er å kunne løse problemer i statistikk, somoftegårutpååfattebeslutninger i situasjoner der tilfeldighet rår.

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må

Detaljer

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010 TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må

Detaljer

Betinget sannsynlighet

Betinget sannsynlighet Betinget sannsynlighet Multiplikasjonsloven for sannsynligheter (s. 49 i bok): P( AB ) = P( A B ) P(B) Veldig viktig verktøy for å finne sannsynligheter for snitt. (Bevises ved rett fram manipulering av

Detaljer

To-dimensjonale kontinuerlige fordelinger

To-dimensjonale kontinuerlige fordelinger To-dimensjonale kontinuerlige fordelinger Noen resultater for diskrete fordelinger Vi har tidligere definert punktsannsynligheten p(x, y) for en todimensjonal variabel (X, Y ) som p(x, y) = P ({X = x}

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Kapittel 7: Utvalgsfordeling Bo Lindqvist Institutt for matematiske fag 2 Fra kapittel 1: Populasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg

Detaljer

TMA4245 Statistikk Høst 2016

TMA4245 Statistikk Høst 2016 TMA5 Statistikk Høst 6 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving Løsningsskisse Oppgave a) Den tilfeldige variabelen X er kontinuerlig fordelt med sannsynlighetstetthet

Detaljer

Sannsynlighetsregning og Statistikk.

Sannsynlighetsregning og Statistikk. Sannsynlighetsregning og Statistikk. Leksjon Velkommen til dette kurset i sannsynlighetsregning og statistikk! Vi vil som lærebok benytte Gunnar G. Løvås:Statistikk for universiteter og høyskoler. I den

Detaljer

Fra første forelesning:

Fra første forelesning: 2 Fra første forelesning: ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag opulasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg En delmengde av populasjonen

Detaljer

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte

Detaljer

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger 1 Section 4-1: Introduksjon til sannsynlighet 2 Section 4-2: Enkel sannsynlighetsregning 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger 4 Section 5-2: Tilfeldige variable 5 Section 5-3: Binomisk

Detaljer

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger

Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger f(x,y) NTNU Kapittel 3: Stokastiske variable og sannsynlighetsfordelinger TMA4240 Statistikk (F2 og E7) 3.4: Foreleses mandag 30.august y=hoyde x=vekt Ole.Petter.Lodoen@math.ntnu.no p.1/18 Oppsummering

Detaljer

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem MAT400 PROSJEKTOPPGAVE: Statistikk i S2 Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem 20. mai 205 Innhold. Stokastisk Variabel.. Stokastiske variable som funksjoner 3 2. Forventningsverdi

Detaljer

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4 3 Tyngdepunkt Kapittel 4 Forventningsverdi, varians, kovarians for én stokastisk variabel og funksjoner av stokastiske variabler TMA4240 H2006: Eirik Mo 2 4.1 Forventing til en stokastisk variabel DEF

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 2.8: Bayes regel 3.1: Stokastisk variabel 3.2: Diskrete sannsynlighetsfordelinger 3.3: Kontinuerlige sannsynlighetsfordelinger Mette Langaas Foreleses onsdag 1. september 2010

Detaljer

Forelesning 3, kapittel 3. : 3.2: Sannsynlighetsregning. Kolmogoroffs aksiomer og bruk av disse.

Forelesning 3, kapittel 3. : 3.2: Sannsynlighetsregning. Kolmogoroffs aksiomer og bruk av disse. Forelesning 3, kapittel 3. : 3.2: Sannsynlighetsregning. Kolmogoroffs aksiomer og bruk av disse. Den klassiske definisjonen (uniform modell) av sannsynlighet for en hendelse A i et utfallsrom S er at sannsynligheten

Detaljer

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind Forelesning 5: Kontinuerlige fordelinger, normalfordelingen Jo Thori Lind j.t.lind@econ.uio.no Oversikt 1. Kontinuerlige fordelinger 2. Uniform fordeling 3. Normal-fordelingen 1. Kontinuerlige fordelinger

Detaljer

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Boka (Ch 1.4) motiverer dette ved å gå fra histogrammer til tetthetskurver.

Detaljer

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer. Utvalgsfordelinger Vi har sett at utvalgsfordelinger til en statistikk (observator) er fordelingen av verdiene statistikken tar ved mange gjenttatte utvalg av samme størrelse fra samme populasjon. Utvalg

Detaljer

1 Stokastisk variabel

1 Stokastisk variabel FY1/TFY415 Innføring i kvantefysikk - Notat om sannsynlegheit 1 1 Stokastisk variabel Før vi byrjar på oppgåvene gjev vi ein liten briefing om stokastiske variable, middelverdiar, usikkerheiter osb. Ein

Detaljer

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner STK1100 våren 2017 Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner Svarer til avsnittene 4.1 og 4.2 i læreboka Ørnulf Borgan Matematisk institutt Universitetet i

Detaljer

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at

Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at Kapittel 4 Forventningsverdi, varians, kovarians for én stokastisk variabel og funksjoner av stokastiske variabler TMA4245 V2007: Eirik Mo 2 4.1 Forventing til en stokastisk variabel DEF 4.1: La X være

Detaljer

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte

Detaljer

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast) Diskret sannsynlighetsfordeling (kap 1.1-1.6) Oversikt Utfallsrom (sample space) Sannsynlighetsfordeling Forventning (expectation), E(X), populasjonsgjennomsnitt Bruk av figurer og histogram Binomialfordelingen

Detaljer

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen Høgskolen i Telemark Institutt for økonomi og informatikk FORMELSAMLING 6005 Statistikk I Til bruk ved eksamen Per Chr. Hagen . Sannsynlighetsregning. Regneregler Komplementsetningen: Addisjonssetningen:

Detaljer

Kapittel 4.4: Forventning og varians til stokastiske variable

Kapittel 4.4: Forventning og varians til stokastiske variable Kapittel 4.4: Forventning og varians til stokastiske variable Forventning og varians til stokastiske variable Histogrammer for observerte data: Sannsynlighets-histogrammer og tetthetskurver for stokastiske

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 24. april Bjørn H. Auestad Oppsummering våren

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag Situasjonen er som i quiz-eksempelet: n = 4, p = 1/3 ( suksess betyr å gjette riktig alternativ), q = 2/3. Oppgave: Finn

Detaljer

FORMELSAMLING TIL STK1100 OG STK1110

FORMELSAMLING TIL STK1100 OG STK1110 FORMELSAMLING TIL STK1100 OG STK1110 (Versjon av 16. november 2009) 1. Sannsynlighet La A, B, A 1, A 2,...,B 1, B 2,... være begivenheter, dvs. delmengder av et utfallsrom Ω. a) Aksiomene: Et sannsynlighetsmål

Detaljer

0.1 Kort introduksjon til komplekse tall

0.1 Kort introduksjon til komplekse tall Enkel introduksjon til matnyttig matematikk Vi vil i denne innledningen introdusere litt matematikk som kan være til nytte i kurset. I noen tilfeller vil vi bare skrive opp uttrykk uten å komme inn på

Detaljer

Transformasjoner av stokastiske variabler

Transformasjoner av stokastiske variabler Transformasjoner av stokastiske variabler Notasjon merkelapper på fordelingene Sannsynlighetstettheten og den kumulative fordelingen til en stokastisk variabel X betegnes hhv. f X og F X. Indeksen er altså

Detaljer

TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger

TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger Kontinuerlig uniform fordeling f() = B A, A B. En kontinuerlig størrelse (vekt, lengde, tid), som aldri kan bli mindre enn

Detaljer

Kontinuerlige stokastiske variable.

Kontinuerlige stokastiske variable. Kontinuerlige stokastiske variable. I forelesning har vi sett på en kontinuerlig stokastisk variabel med sannsynlighetstetthet f() =2 og sannsynlighetsfunksjon F () = 2 for. Der hadde jeg et reint regneteknisk

Detaljer

Sum to terninger forts. Eksempel: kast med to terninger. Sum to terninger forts. Kapittel 3. TMA4240 H2006: Eirik Mo

Sum to terninger forts. Eksempel: kast med to terninger. Sum to terninger forts. Kapittel 3. TMA4240 H2006: Eirik Mo 3 Sum to terninger forts. Kapittel 3 TMA4240 H200: Eirik Mo 2 3 4 5,,2,3,4,5, 2 2, 2,2 2,3 2,4 2,5 2, Andre 3 3, 3,2 3,3 3,4 3,5 3, terning 4 4, 4,2 4,3 4,4 4,5 4, 5 5, 5,2 5,3 5,4 5,5 5,,,2,3,4,5, Med

Detaljer

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4245 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland Tlf: 48 22 18 96 Eksamensdato:??. august 2014 Eksamenstid (fra til): 09:00 13:00 Hjelpemiddelkode/Tillatte

Detaljer

Legg merke til at summen av sannsynlighetene for den gunstige hendelsen og sannsynligheten for en ikke gunstig hendelse, er lik 1.

Legg merke til at summen av sannsynlighetene for den gunstige hendelsen og sannsynligheten for en ikke gunstig hendelse, er lik 1. Sannsynlighet Barn spiller spill, vedder og omgir seg med sannsynligheter på andre måter helt fra de er ganske små. Vi spiller Lotto og andre spill, og håper vi har flaks og vinner. Men hvor stor er sannsynligheten

Detaljer

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler STK1000 Uke 36, 2016. Studentene forventes å lese Ch 1.4 (+ 3.1-3.3 + 3.5) i læreboka (MMC). Tetthetskurver Eksempel: Drivstofforbruk hos 32 biler Fra histogram til tetthetskurver Anta at vi har kontinuerlige

Detaljer

Kap. 6.1: Fordelingen til en observator og stok. simulering

Kap. 6.1: Fordelingen til en observator og stok. simulering Kap. 6.1: Fordelingen til en observator og stok. simulering Data, observatorer og relaterte fordelinger. Stokastisk simulering. Illustrasjon: - Sammenligning av jury bedømmelser i idrett. Fra data til

Detaljer

Høgskolen i Gjøviks notatserie, 2001 nr 5

Høgskolen i Gjøviks notatserie, 2001 nr 5 Høgskolen i Gjøviks notatserie, 2001 nr 5 5 Java-applet s for faget Statistikk Tor Slind Avdeling for Teknologi Gjøvik 2001 ISSN 1501-3162 Sammendrag Dette notatet beskriver 5 JAVA-applets som demonstrerer

Detaljer

Litt om forventet nytte og risikoaversjon. Eksempler på økonomisk anvendelse av forventning og varians.

Litt om forventet nytte og risikoaversjon. Eksempler på økonomisk anvendelse av forventning og varians. H. Goldstein Revidert januar 2008 Litt om forventet nytte og risikoaversjon. Eksempler på økonomisk anvendelse av forventning og varians. Dette notatet er ment å illustrere noen begreper fra Løvås, kapittel

Detaljer

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering TMA4245 Statistikk Kapittel 8.1-8.5. Kapittel 9.1-9.3+9.15 Turid.Follestad@math.ntnu.no p.1/21 Har sett

Detaljer

Innledning kapittel 4

Innledning kapittel 4 Innledning kapittel 4 Sannsynlighet og tilfeldighet Basert på materiale fra Ørnulf Borgan Matematisk institutt Universitetet i Oslo 1 Deterministiske fenomener Almanakk for Norge viser: når det er fullmåne

Detaljer

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen Diskret sannsynlighetsfordeling (kap 1.1-1.6) Oversikt Utfallsrom (sample space) Sannsynlighetsfordeling Forventning (expectation), E(, populasjonsgjennomsnitt Bruk av figurer og histogram Binomialfordelingen

Detaljer

DEL 1 GRUNNLEGGENDE STATISTIKK

DEL 1 GRUNNLEGGENDE STATISTIKK INNHOLD 1 INNLEDNING 15 1.1 Parallelle verdener........................... 18 1.2 Telle gunstige.............................. 20 1.3 Regneverktøy og webstøtte....................... 22 1.4 Oppgaver................................

Detaljer

L12-Dataanalyse. Introduksjon. Nelson Aalen plott. Page 76 of Introduksjon til dataanalyse. Levetider og sensurerte tider

L12-Dataanalyse. Introduksjon. Nelson Aalen plott. Page 76 of Introduksjon til dataanalyse. Levetider og sensurerte tider Page 76 of 80 L12-Dataanalyse Introduksjon Introduksjon til dataanalyse Presentasjonen her fokuserer på dataanalyseteknikker med formål å estimere parametere (MTTF,, osv) i modeller vi benytter for vedlikeholdsoptimering

Detaljer

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>. 1 ECON213: EKSAMEN 217 VÅR - UTSATT PRØVE TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i

Detaljer

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013 Introduksjon til statistikk og dataanalyse Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013 Introduksjon til statistikk og dataanalyse Hollywood-filmer fra 2011 135 filmer Samla budsjett: $ 7 166

Detaljer

Løsningsforslag, eksamen statistikk, juni 2015

Løsningsforslag, eksamen statistikk, juni 2015 Løsningsforslag, eksamen statistikk, juni 0 Oppgave 1 Siden det spørres om tall fra et intervall, som oppgaven viser kan være et reelle, er det tydelig at tallene er tatt fra en kontinuerlig fordeling.

Detaljer

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene 1 Sec 3-2: Hvordan beskrive senteret i dataene 2 Sec 3-3: Hvordan beskrive spredningen i dataene Todeling av statistikk Deskriptiv statistikk Oppsummering og beskrivelse av den stikkprøven du har. Statistisk

Detaljer

- Et stokastisk forsøk er et forsøk underlagt tilfeldige variasjoner, for eks. kast med en terning, trekking av et lottotall o.l.

- Et stokastisk forsøk er et forsøk underlagt tilfeldige variasjoner, for eks. kast med en terning, trekking av et lottotall o.l. SANNSYNLIGHETSREGNING Terminologi Kombinatorikk Stokastisk Utfallsrom / utfall (enkeltutfall) - Et stokastisk forsøk er et forsøk underlagt tilfeldige variasjoner, for eks. kast med en terning, trekking

Detaljer

Innledning kapittel 4

Innledning kapittel 4 Innledning kapittel 4 Sannsynlighet og tilfeldighet Basert på materiale fra Ørnulf Borgan Matematisk institutt Universitetet i Oslo 1 Deterministiske fenomener Almanakk for Norge viser: når det er fullmåne

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 2 Sannsynlighetsregning (sannsynlighetsteori) 1 Grunnbegrep Stokastisk forsøk: forsøk med uforutsigbart utfall Enkeltutfall: et av de mulige

Detaljer

ST0103 Brukerkurs i statistikk Høst 2014

ST0103 Brukerkurs i statistikk Høst 2014 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag ST0103 Brukerkurs i statistikk Høst 2014 Løsningsforslag Øving 1 2.1 Frekvenstabell For å lage en frekvenstabell må vi telle

Detaljer

Kontinuerlige sannsynlighetsfordelinger.

Kontinuerlige sannsynlighetsfordelinger. Kontinuerlige sannsynlighetsfordelinger. Dekkes av kap. 6 og deler av kap. 8.5 i boka. Husk: f(x) er sannsynlighetstettheten til en kontinuerlig X dersom: 1. f(x) 0 for alle x R 2. f(x)dx =1 3. P (a

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011 ÅMA110 Sannsynlighetsregning med statistikk, våren 2011 Kp. 2 Sannsynlighetsregning (sannsynlighetsteori) 1 Grunnbegrep Stokastisk forsøk: forsøk med uforutsigbart utfall Enkeltutfall: et av de mulige

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer

Detaljer

Kapittel 4.3: Tilfeldige/stokastiske variable

Kapittel 4.3: Tilfeldige/stokastiske variable Kapittel 4.3: Tilfeldige/stokastiske variable Litt repetisjon: Sannsynlighetsteori Stokastisk forsøk og sannsynlighet Tilfeldig fenomen Individuelle utfall er usikre, men likevel et regulært mønster for

Detaljer

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik. Oppgave 1 Det skal velges en komité bestående av 2 menn og 1 kvinne. Komitéen skal velges fra totalt 5 menn og 6 kvinner. Hvor mange ulike komitéer kan dannes? A) 86400 B) 400 C) 120 D) 60 E) 10 Rett svar:

Detaljer

Statistikk og dataanalyse

Statistikk og dataanalyse Njål Foldnes, Steffen Grønneberg og Gudmund Horn Hermansen Statistikk og dataanalyse En moderne innføring Kapitteloversikt del 1 INTRODUKSJON TIL STATISTIKK Kapittel 1 Populasjon og utvalg 19 Kapittel

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen Bo Lindqvist Institutt for matematiske fag 2 Kap. 6: Normalfordelingen Normalfordelingen regnes som den viktigste statistiske fordelingen!

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010. ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010. ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 ÅMA Sannsynlighetsregning med statistikk, våren Kp. Diskrete tilfeldige variable ÅMA Sannsynlighetsregning med statistikk, våren Kp. Diskrete tilfeldige variable Diskrete tilfeldige variable, innledning

Detaljer

ECON2130 Kommentarer til oblig

ECON2130 Kommentarer til oblig ECON2130 Kommentarer til oblig Her har jeg skrevet ganske utfyllende kommentarer til en del oppgaver som mange slet med. Har noen steder gått en del utover det som det strengt tatt ble spurt om i oppgaven,

Detaljer

TMA4245 Statistikk Eksamen august 2014

TMA4245 Statistikk Eksamen august 2014 TMA4245 Statistikk Eksamen august 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Oppgave 1 En bedrift produserer en type medisin i pulverform Medisinen selges på flasker

Detaljer

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20). Econ 130 HG mars 017 Supplement til forelesningen 7. februar Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.0). Regel 5.19 sier at summer, Y X1 X X

Detaljer

TMA4240 Statistikk H2015

TMA4240 Statistikk H2015 TMA4240 Statistikk H2015 Funksjoner av stokastiske variabler (kapittel 7+notat) Fokus på start med kumulativ fordeling 7.2 Funksjon av en SV (inkludert en-entydighet). Fordeling til max/min (fra notat).

Detaljer

6 x P (X = x) = x=1 = P (X 2 = 6)P (X 2 = 6)P (X 3 = 6) =

6 x P (X = x) = x=1 = P (X 2 = 6)P (X 2 = 6)P (X 3 = 6) = Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 4, blokk I Løsningsskisse Oppgave 1 a) Utfallsrommet til X 1 er {1, 2,, 4, 5, }. Sannsynlighetsfordelingen

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Tilfeldige variable (5.2) Dersom vi til hvert utfall av eksperimentet tilordner et tall, har vi laget en tilfeldig variabel.

Detaljer

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i Løsningsskisse TMA440 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland a, Sara Martino b Tlf: a 48 18 96, b 99 40 33 30 Eksamensdato: 30. november

Detaljer

Tilfeldige variable (5.2)

Tilfeldige variable (5.2) Tilfeldige variable (5.) Dersom vi til hvert utfall av eksperimentet tilordner et tall, har vi laget en tilfeldig variabel. Tilfeldig variabel: En variabel som har en numerisk verdi for hvert utfall i

Detaljer

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling Kapittel 8 Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling TMA4240 H2006: Eirik Mo 2 Til nå... Definert sannsynlighet og stokastiske variabler (kap. 2 & 3).

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3. ÅMA Sannsynlighetsregning med statistikk, våren 8 Kp. Diskrete tilfeldige variable Kp. Diskrete tilfeldige variable Har sett på (tidligere: begrep/definisjoner; tilfeldig (stokastisk variabel sannsynlighetsfordeling

Detaljer

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m Formelsamling og tabeller FO020E Matte 2000 for elektroprogrammet 1 Matematikk 1.1 Denisjoner av ulike typer polynomer og rekker 1.1.1 Rekke med konstante ledd En rekke med konstante ledd er gitt som a

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,

Detaljer

STK1100 våren Introduksjon til sannsynlighetsbegrepet. Deterministiske fenomener. Stokastiske forsøk. Litt historikk

STK1100 våren Introduksjon til sannsynlighetsbegrepet. Deterministiske fenomener. Stokastiske forsøk. Litt historikk STK1100 våren 2016 Introduksjon til sannsynlighetsbegrepet Svarer til avsnittene 2.1 og 2.2 i læreboka Geir Storvik Basert på presentasjon av Ørnulf Borgan Matematisk institutt Universitetet i Oslo 1 Deterministiske

Detaljer

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf: Hypotesetesting Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf: 22 400 400 www.aschehoug.no 1 Oversikt Sannsynlighetsregning og statistikk

Detaljer

Prosjektoppgaver om diusjonsprosesser og diusjonstilnærmelse

Prosjektoppgaver om diusjonsprosesser og diusjonstilnærmelse Prosjektoppgaver om diusjonsprosesser og diusjonstilnærmelse February 22, 2007 I alle oppgavene skal det skrives litt om hva diusjonsprosesser er, hvilke spesielle resultater fra diusjonsteorien man skal

Detaljer

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) TMA440 Statistikk H010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,

Detaljer

Konfidensintervall for µ med ukjent σ (t intervall)

Konfidensintervall for µ med ukjent σ (t intervall) Forelesning 3, kapittel 6 Konfidensintervall for µ med ukjent σ (t intervall) Konfidensintervall for µ basert på n observasjoner fra uavhengige N( µ, σ) fordelinger når σ er kjent : Hvis σ er ukjent har

Detaljer

Løsningsforslag AA6526 Matematikk 3MX Privatister 3. mai 2005. eksamensoppgaver.org

Løsningsforslag AA6526 Matematikk 3MX Privatister 3. mai 2005. eksamensoppgaver.org Løsningsforslag AA6526 Matematikk 3MX Privatister 3. mai 2005 eksamensoppgaver.org eksamensoppgaver.org 2 Om løsningsforslaget Løsningsforslaget for matematikk eksamen i 3MX er gratis, og det er lastet

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Kapittel 5: Sannsynlighetsfordelinger for diskrete variabler Bo Lindqvist Institutt for matematiske fag 2 Tilfeldige variabler (5.1) Dersom vi til hvert utfall av eksperimentet

Detaljer

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU Observatorar og utvalsfordeling Torstein Fjeldstad Institutt for matematiske fag, NTNU 08.10.2018 I dag Til no i emnet Observatorar Utvalsfordelingar Sentralgrenseteoremet 2 Til no i emnet definisjon av

Detaljer