(utarbeidet av Mette Langaas), TMA4245 V2007

Størrelse: px
Begynne med side:

Download "(utarbeidet av Mette Langaas), TMA4245 V2007"

Transkript

1 Kapittel 8 og 9 Ett- og toutvalgs estimering; statistisk inferens, forventningsretthet, punktestimat, intervallestimat og prediksjonsintervall, estimere forventningsverdi, differanse, andel og varians, standardfeil, sannsynlighetsmaksimering TMA445 V007: Eirik Mo Statistisk inferens Fra innsamling, bearbeiding, analyse og fortolkning av numeriske data og målinger: trekke slutninger utover det man har observert. Vi ønsker å si noe generelt om en populasjon basert på et innsamlet tilfeldig utvalg fra populasjonen. Bakgrunn: vår kunnskap i sannsynlighetsregning. Sannsynlighetsregning Populasjon Utvalg Statistisk inferens

2 3 Tilfeldig utvalg [8.1] DEF 8.1: En populasjon er mengden av observasjoner som vi ønsker å studere, dvs. alle observasjoner det er mulig å gjøre. (Dersom elementene i populasjonen har fordeling f(x), kaller boka det en f(x)-populasjon.) DEF 8.: En utvalg er en delmengde av en populasjon. Representativt utvalg: elementene som velges ut må ikke bare representere en delmengde av populasjonen som alle har en spesiell egenskap, de må kunne være representanter for hele populasjonen. Uendelig populasjon: vi skal jobbe som om populasjonen vår er uendelig stor! 4 U.i.f DEF 8.3: La X 1, X,..., X n være n uavhengige stokastiske variable, hver med den samme sannsynlighetsfordeling f(x). Vi definerer at X 1, X,..., X n er et tilfeldig utvalg av størrelse n fra f(x)-populasjonen og skriver den simultane sannsynlighetsfordelingen som f(x 1, x,..., x n ) = f(x 1 )f(x ) f(x n ) U.i.f: et tilfeldig utvalg (som over) blir da et sett med uavhengige identisk fordelte (u.i.f.) observasjoner.

3 5 Heat flow data Data fra NIST/SEMATECH e-handbook of Statistical Methods Viser heat flow meter calibration and stability analysis. The response variable is a calibration factor. n = Boksplott Min. 1st Qu. Median Mean 3rd Qu. Max

4 7 Stamme- og bladdiagram LO: * * * * * (0) 96* * * * * * * 0 HI: Histogram Histogram of heatflow Histogram of heatflow Density Density heatflow heatflow Histogram of heatflow Histogram of heatflow Density Density heatflow heatflow

5 9 Normalplott Empirisk kumulativ fordeling er ˆF(x) = antall observasjoner mindre eller lik x. n Hvis data er normalfordelt ville vi forvente at ˆF(x) ligner på den kumulative fordelingsfunksjonen til normalfordelingen. FFemp FFemp sort(heatflow) sort(heatflow) Hver observasjon er et punkt i diagrammet. Så justerer vi skalaen på y-aksen slik at det blir en lineær sammenheng når dataene er normalfordelte (bruke invers funksjon til kumulativ fordeling). Noen bytter om på aksene. 10 Normal QQ-plott Normal Q Q Plot Sample Quantiles Theoretical Quantiles

6 11 Normal QQ-plott Figurer fra NIST/SEMATECH e-handbook of Statistical Methods, 1 Estimering og hypotesetesting Fenomen Defekte produkter i industriell prosess Mengden melk i melkekartong Hva vil vi vite? ESTIMERING: Hva er andelen defekte? HYPOTESETESTING: Er det 1 liter melk i en 1 liters melkekartong? Populasjon Alle produkter i prosessen. Alle melkekartonger levert. Utføre eksperiment Samler inn data uavhengig, representativt? Stokastisk variabel med fordeling Vi får: Undersøke produkt, er det defekt eller ikke? Sjekker n artikler og lar X være antall defekte. Vi finner x defekte. X er binomisk fordelt med n forsøk og ukjent sannsynlighet for defekt p. Finne beste anslag for p og et intervall der vi har stor tillit til at p ligger (konfidensintervall). Undersøke melkekartong, hvor mye melk inneholder den? Sjekker n melkekartonger, måler for hver melkekartong X = mengden melk. X er normalfordelt med ukjent forventning µ og ukjent varians σ. Finne beste anslag av µ og σ, og bruke anslagene (med grad av tillit) til å si hvor sikre vi er på at det er 1 liter melk i melkekartongen.

7 13 TMA440/TMA445 Statistikk: Læringsmål 005/006: Emnet skal gi en innføring i grunnleggende begreper og metoder i statistikk. 006/007: Emnet skal gi studentene et grunnlag i sannsynlighetsregning og statistisk inferens, som gjør dem i stand til å gjenkjenne enkle statistiske standardsituasjoner innen teknologi og naturvitenskap, og vite hvordan disse best kan analyseres. Videre skal studentene kunne forstå de viktigste begrepene innen statistikk og sannsynlighetsregning, og kjenne til terminologien slik at de kan kommunisere med en fagstatistiker i mer kompliserte situasjoner. 14 Estimering Mål: finne sannheten om et fenomen i en populasjon. Sannheten knytter vi til en ukjent parameter, θ, i en valgt fordeling. Vi trekker et tilfeldig utvalg fra populasjonen; X 1, X,..., X n (u.i.f.). En estimator gir et anslag for den ukjente parameteren og er en funksjon av stokastiske variabler, ˆθ = ˆθ(X 1, X,..., X n ). Hvilke egenskaper bør en god estimator ha? Estimatoren bør være forventningsrett, dvs. E(ˆθ) = θ. Estimatoren bør ha minst mulig varians, Var(ˆθ), og variansen bør avta når antall observasjoner, n, øker. Hvordan kan vi finne estimatorer? ved intuisjon, ved matematisk metode. Sannsynlighetsmaksimeringsestimatoren (SME) finner det anslaget som gjør at de observasjonene vi har gjort (utvalget) har maksimal rimelighet!

8 15 Forventingsrett estimator DEF 9.1: En observator θ er en forventningsrett estimator for parameteren θ hvis E( θ) = θ. fx E(S ), s 3 nx (X i X) = = = = nx nx (X i µ + µ X) = [(X i µ) ( X µ)] nx nx (X i µ) ( X µ) (X i µ) + n( X µ) nx (X i µ) ( X µ)n( X µ) + n( X µ) nx (X i µ) n( X µ) E(S ) = 1 nx E[ (X i X) ] = 1 nx n 1 n 1 {E[ (X i µ) ] E[n( X µ) ]} = 1 nx n 1 [ Var(X i ) nvar( X)] = 1 nx n 1 [ σ n σ n ] = 1 n 1 (nσ σ ) = σ

9 17 Mest effektive estimator DEF 9.: Hvis vi ser på alle mulige forventningsrette estimatorene for en parameter θ, kaller vi den med minst varians for den mest effektive estimatoren til θ. fx Eksamen, juni 004, 1c

10 19 Fordeling til gjennomsnittet, X Hvis X 1, X,...,X n er uavhengige stokastiske variable, gjelder n E( a i X i ) = Var( n a i X i ) = n a i E(X i ) n a i Var(X i) Fra kapittel 7: Hvis X 1, X,...,X n i tillegg er normalfordelte, vil a 1 X 1 + a X + a n X n også være normalfordelt med forventning og varians som ovenfor. 0 Fordeling til gjennomsnittet X [8.5] TEO 8.: Sentralgrenseteoremet La X 1, X,..., X n være et tilfeldig utvalg fra en fordeling med forventning µ og varians σ. Da har vi at sannsynlighetsfordelingen til Z = X µ σ/ n går mot standard normalfordelingen, n(z; 0, 1), når n.

11 1 Sentralgrenseteoremet Figure fra Devore. SME [9.15] DEF 9.6: Gitt uavhengige observasjoner x 1, x,..., x n fra en sannsynlighetstetthet (i det kontinuerlige tilfellet) eller en punktsannsynlighet (i det diskrete tilfellet) f(x; θ). Da er sannsynlighetsmaksimeringsestimatoren (SME) for θ verdien som maksimerer rimelighetsfunksjonen L(x 1, x,..., x n,θ) = f(x 1 ;θ) f(x ;θ) f(x n ;θ).

12 Figur fra 4 SME for µ i normalfordelingen Tilfeldig utvalg, X 1, X,..., X n u.i.f normal n(x; µ, σ). Husker mulige estimator for µ er X. Hva er SME? Rimelighetsfunksjonen og logaritmen til rimelighetsfunksjonen:: L(x 1, x,...x n, µ, σ ) = = n 1 πσ e 1 σ (x i µ) 1 (π) n/ (σ ) n/ e 1 σ P n (x i µ) ln L(x 1, x,...x n, µ, σ ) = n ln(π) n ln σ 1 σ n (x i µ)

13 5 SME for µ i normalfordelingen Derivere mhp µ: ln L(x 1, x,...x n, µ, σ ) µ = 1 n σ (x i µ) Finne ˆµ ved å sette ln L µ = 0: 1 σ n (x i ˆµ) = 0. ˆµ = 1 n n X i = X 6 SME for σ i normalfordelingen Husker mulig estimator for σ er S. Hva er SME? Har logaritmen til rimelighetsfunksjonen, og vet at ˆµ = X. ln L(x 1, x,...x n, µ, σ ) = n ln(π) n ln σ 1 n σ (x i µ) Derivere mhp σ : ln L(x 1, x,...x n, µ, σ ) σ = n σ + 1 (σ ) n (x i µ) Finne σ ved å sette ln L (σ ) = 0. Setter inn estimatet x for µ. n + 1 n (x i x) = 0 σ ( σ ) n + 1 σ n (x i x) = 0 dvs. σ = 1 n n (X i X)

14 7 SME: steg 1. Ønsker estimator for parameter θ, basert på. tilfeldig utvalg fra populasjon beskrevet ved kjent parametrisk fordeling f(x; θ). 3. Rimelighetsfunksjonen; L(x 1, x,...,x n, θ) = f(x 1 ; θ)f(x ; θ) f(x n ; θ). 4. Skal maksimere rimelighetsfunksjonen, lettere å jobbe med den naturlige logaritmen til rimelighetsfunksjonen l(x 1, x,...,x n, θ) = ln L(x 1, x,..., x n, θ) 5. Deriverer logaritmen til rimelighetsfunksjonen med hensyn på θ. 6. Setter den deriverte lik 0 og løser ut for θ. Dette blir vår sannsynlighetsmaksimeringsestimator for θ. (Kan også sjekke at dette er maksimum og ikke minimum ved å derivere en gang til og se at denne.deriverte er negativ.) 8 Estimering Mål: finne sannheten om et fenomen i en populasjon. Sannheten knytter vi til en ukjent parameter, θ, i en valgt fordeling. Vi trekker et tilfeldig utvalg fra populasjonen; X 1, X,..., X n (u.i.f.). En estimator gir et anslag for den ukjente parameteren og er en funksjon av stokastiske variabler, ˆθ = ˆθ(X 1, X,..., X n ). Estimatoren bør være forventningsrett, dvs. E(ˆθ) = θ. Estimatoren bør ha minst mulig varians, Var(ˆθ), og variansen bør avta når antall observasjoner, n, øker. Sannsynlighetsmaksimeringsestimatoren (SME) finner det anslaget som gjør at de observasjonene vi har gjort (utvalget) har maksimal rimelighet! I tillegg til punktestimatet kan vi lage et 95% konfidensintervall der vi har 95% tillit til at den sanne parameteren ligger.

15 9 Data fra DNA microarrays Studere effekt av trening på hjertet: måler forholdet mellom genuttrykk for rotter trent i 48 timer og rotter som ikke har trent gener studert, vi ser på genet: UI-R-A0-ar-f-11-0-UI med beskrivelse ESTs Highly similar to INTERFERON REGULATORY FACTOR 3 [M.musculus] Kan anta at en transformasjon av genuttrykksforholdet for trenete og utrenete rotter er normalfordelt. Positivt tall: genet er mer aktivt for trente enn for utrente rotter Nær 0: genet er like aktivt for trente og utrente rotter. Negativt tall: genet er mindre aktivt for trente enn for utrente rotter. Observasjoner fra 1 par av trenete og utrente rotter: ˆµ = x = Konfidensintervall for µ med σ kjent Hvis x er gjennomsnittet av et tilfeldig utvalg av størrelse n fra en populasjon med kjent varians σ, så er et (1-α)100% konfidensintervall for µ x z α σ n < µ < x + z α σ n hvor z α er verdien i standard normalfordelingen som har areal α til høyre, dvs. P(Z > z α ) = α.

16 31 Konfidensintervall for µ med σ kjent x z α σ n < µ < x + z α σ n 1 α α α zα 0 zα 3 Intervallestimering med rottedata Antar målinger er normalfordelte. Observasjoner fra 1 par av trenete og utrente rotter: % konfidensintervall for µ nå σ er kjent (antar σ =0.1): x z α σ n < µ < x + z α σ n Rottedata: ˆµ = x = 1.54, n=1, z 0.05 = 1.96, 95% konfidensintervall for µ er [1.36, 1.7].

17 33 Intervallestimering med rottedata Hvis vi ikke kjenner σ kan vi estimere den med S, og får 95% konfidensintervall for µ nå σ er ukjent: x t α,(n 1) s n < µ < x + t α,(n 1) s n Rottedata: S =0.146, t 0.05,11 =.01, 95% konfidensintervall for µ er da [1.30, 1.78]. 34 Kvantiler N og t.5%: N=black, t.15=blue, t.10=red

18 35 Konfidensintervall for µ med σ ukjent Hvis x er gjennomsnittet og s er estimert standardavvik av et tilfeldig utvalg av størrelse n fra en populasjon med ukjent varians σ, så er et (1-α)100% konfidensintervall for µ x t α,(n 1) s n < µ < x + t α,(n 1) s n hvor t α,(n 1) er verdien i t-fordelingen med n 1 frihetsgrader som har areal α til høyre, dvs. P(T > t α,(n 1) ) = α. 36 Konfidensintervall for µ med σ ukjent x t α,(n 1) s n < µ < x + t α,(n 1) s n 1 α α α tα 0 tα

19 37 Test nasjonen Lørdag 7. november 004 ble TV-programmet Test nasjonen sendt på NRK1. Deltakere i studium svarte på spørsmål og fikk tildelt en IQ-score. Testen var laget slik at man forventet at IQ-score til en tilfeldig valgt person skulle være normalfordelt med forventningsverdi 100 og standardavvik 15. Deltakerne var delt inn i ulike grupper (av rundt 40 deltakere). 38 Test nasjonen (forts) Følgende gjennomsnittsscore be oppnådd: Sekretærer 88 Reality-deltakere 94 Kjendiser 98 Svensker 99 Kroppsbyggere 100 Finansfolk 101 Journalister 10 Er deltakerne valgt ut tilfeldig fra populasjonen bestående av Norges befolkning i gitte gruppe? Vi antar at det er kjent at σ = 15, og at hver gruppe bestod av 40 deltakere. Lag 95% konfidensintervaller for de ulike gruppene.

20 39 Ett normalfordelt utvalg: punkt- og intervallestimering Eksempler: melkekartonger, genuttrykk, høyde, betongstyrke, IQ. X 1, X,..., X n er et tilfeldig utvalg fra en populasjon som beskrives av en normalfordeling med forventning µ og varians σ. ˆµ = X = 1 n n X i estimator for µ (intuitiv og SME). E(X) = µ, Var(X) = σ n. Hvis σ er ukjent er S = 1 n n 1 (X i X) estimator for σ (forventningsrett, men ikke SME). (1 α)100% konfidensintervall for µ når σ er kjent: σ σ [x z α, x + z α ] n n (1 α)100% konfidensintervall for µ når σ er ukjent? 40 T og t-fordeling COR: La X 1, X,..., X n være uavhengige stokastiske variabler som alle er normalfordelte med samme forventning µ og samme standardavvik σ. La X = 1 n n X i og S = 1 n 1 n (X i X) Da er den stokastiske variablen T = X µ S/ n t-fordelt med ν = (n 1) frihetsgrader.

21 41 W. S. Gosset alias Student 4 Historisk: Student-t fordelingen W.S. Gosset ( ) was employed by the Guinness Brewing Company of Dublin. Sample sizes available for experimentation in brewing were necessarily small, and Gosset knew that a correct way of dealing with small samples was needed. He consulted Karl Pearson ( ) of Universiy College in London about the problem. Pearson told him the current state of knowledge was unsatisfactory. The following year Gosset undertook a course of study under Pearson. An outcome of his study was the publication in 1908 of Gosset s paper on "The Probable Error of a Mean," which introduced a form of what later became known as Student s t-distribution. Gosset s paper was published under the pseudonym "Student." The modern form of Student s t-distribution was derived by R.A. Fisher and first published in 195.

22 43 t-fordelingen 44 DEF: t-fordeling TEO 8.5: La Z være en standard normalfordelt stokastisk variabel og V være en kjikvadrat-fordelt stokastisk variabel med ν frihetsgrader. Hvis Z og V er uavhengige, er fordelingen til den stokastiske variablen T T = Z V/ν E(T) = 0 hvis ν. Var(T) = ν ν gitt ved sannsynlighetstettheten h(t) = Γ[(ν + 1)/] Γ(ν/) πν (1 + t ν ) (ν+1)/ for < t <. Denne fordelingen har navnet (Student) t fordelingen med ν frihetsgrader. hvis ν 3.

23 45 Fordelingen til S Resultat: V = (n 1)S = n σ ν = n 1 frihetsgrader. Fordi: Z i Z er kjikvadrat-fordelt med i) X 1,..., X n u.i.f. normal, E(X i ) = µ og Var(X i ) = σ. ii) Z i = X i µ σ er standard normalfordelt, og Z = X µ σ n standard normalfordelt. ( ) Xi µ er kjikvadrat-fordelt med 1 frihetsgrad. iii) Z i = σ Z = ( X µ σ n ) er kjikvadrat-fordelt med 1 frihetsgrad. iv) n Z i er kjikvadratfordelt med n frihetsgrader. v) (n 1)S = n (X i X) = n (X i µ) n( X µ), og dermed V = (n 1)S σ vi) n Z i og Z er uavhengige. = n Z i Z er 46 Prediksjonsintervall for fremtidig observasjon, normalfordeling For en normalfordeling med ukjent forventningsverdi µ, men kjent varians σ, er et (1-α)100% prediksjonsintervall for en fremtidig observasjon x 0 gitt som x z α σ n < x 0 < x + z α σ n hvor z α er verdien i normal-fordelingen som har areal α til høyre, dvs. P(Z > z α ) = α.

24 47 Prediksjonsintervall for fremtidig observasjon, normalfordeling For en normalfordeling med ukjent forventningsverdi µ, og ukjent varians σ, er et (1-α)100% prediksjonsintervall for en fremtidig observasjon x 0 gitt som x t α,(n 1) s n < x 0 < x + t α,(n 1) s n hvor t α,(n 1) er verdien i t-fordelingen med n 1 frihetsgrader som har areal α til høyre, dvs. P(T > t α,(n 1) ) = α, og s = n (x i x) 48 To utvalg: eksempler Betong: to ulike oppskrifter, A og B, skal sammenlignes. Hvor stor forskjell er det i styrken ( crushing strength ) for betong fra oppskrift A og fra oppskrift B? Sykdom: tester ut ny blodtrykksmedisin. Hvor mye bedre er den enn nåværende markedsledende blodtrykksmedisin? Kosthold: hvor stor vektreduksjon vil man oppleve ved å følge Dr Fedon Lindbergs kostråd i et halvt år? (balanse i blodsukker, lav glykemisk indeks) Bildekk: to typer dekk, A og B, skal sammenlignes mhp slitasje. Kan enten sette både A og B-dekk på hver bil eller noen biler med A og noen biler med B.

25 49 To utvalg: statistisk situasjon Ønsker å sammenligne to populasjoner basert på et u.i.f. utvalg fra hver populasjon. Studerer en egenskap som kan sies å være normalfordelt i hver populasjon, og ønsker å anslå differansen mellom forveningsverdien i de to populasjonene og et intervall der vi har stor tillit til at den sanne differansen i forventningsverdiene ligger. Sammenligningene kan være parvise eller ikke parvise. 50 To utvalg: Bensinforbruk Problemstilling: Vil sammenligne to biltyper A og B mhp bensinforbruk. Utvalg 1: X A i :#km/liter for bil nummer i, type A. Utvalg : X B j :#km/liter for bil nummer j, type B. Anta at X A i Anta at X B i Observasjoner: er normalfordelt med ukjent µ A og kjent σ A = km/liter. er normalfordelt med ukjent µ B og kjent σ B = 3 km/liter. n A = 1 målinger på bil A, med gjennomsnitt x A = 10 km/liter. n B = 10 målinger på bil B, med gjennomsnitt x B = 8 km/liter.

26 51 To utvalg: estimatorer X A 1, X A,..., X A n A er et tilfeldig utvalg fra en populasjon som beskrives av en normalfordeling med forventning µ A og varians σ A. X B 1, X B,..., X B n B er et tilfeldig utvalg fra en populasjon som beskrives av en normalfordeling med forventning µ B og varians σ B. Estimator for µ A µ B : ˆµ A ˆµ B = X A X B = 1 na n A X i A 1 nb n B j=1 X j B X A X B er normalfordelt med E(X A X B ) = µ A µ B Var(X A X B ) = σ A n A + σ B n B Hvis σ A og σ B er kjente så er Z standard normalfordelt. Z = (X A X B ) (µ A µ B ) s (intuitiv og SME). σ A n A + σ B n B 5 To utvalg: konfidensintervall for µ A µ B når σa og σ B er kjente Hvis X A og X B er gjennomsnittene til to tilfeldig utvalg av størrelse n A og n B fra populasjoner med kjent varians σa og σ B, så er et (1-α)100% konfidensintervall for µ A µ B σa (x A x B ) z α (x A x B ) + z α + σ B < (µ A µ B ) < n A n B σa + σ B n A n B hvor z α er verdien i standard normalfordelingen som har areal α til høyre, dvs. P(Z > z α ) = α.

27 53 To utvalg: Bensinforbruk 95% konfidensintervall for µ A µ B. Punktestimator: ˆµ A ˆµ B = X A X B. Punktestimat: x A x B = km/liter. 95% konfidensintervall: α = 0.05, z α = z 0.05 = 1.96, [ , ] = [0.66, 3.34] To utvalg: σa = σ B, men ukjente Hvis σ A σ B lager vi S A = 1 n A 1 n A (Xi A X A ) og SB = 1 n B 1 n B j=1 (X B j X B ) Hvis vi vet at σ A = σ B = σ så kan vi lage en estimator S p (pooled) basert på summen av kvadratavvikene i de to utvalgene: S p = na 1 n A + n B [ (Xi A X A ) + n B j=1 (X B j X B ) ] = (n A 1)S A + (n B 1)S B n A + n B der X A = 1 n A na X A i og X B = 1 n B nb j=1 X B j.

28 55 To utvalg: konfidensintervall (1 α)100% konfidensintervall for µ A µ B : når σa og σ B er kjent: [(x A x B ) ± z α når σ A = σ B = σ, men ukjente: [(x A x B ) ± t α,(n A+n B )s p σ A n A + σ B n B ] 1 n A + 1 n B ] når σ A og σ B der er ukjente (ikke like): s [(x A x B ) ± t α,ν A + s B ] n A n B ν = (s A /n A + s B /n B) [(s A /n A) /(n A 1)] + [(s B /n B) /(n B 1)] 56 Konfidensintervall for µ A µ B for parvise observasjoner Hvis d og s d er gjennomsnittet og standardavviket til normalfordelte differanser av n par av tilfeldige observasjoner, så er et (1-α)100% konfidensintervall for µ D = µ A µ B d t α,(n 1) s d n < µ D < d + t α,(n 1) s d n hvor t α,(n 1) er verdien i t-fordelingen med n 1 frihetsgrader som har areal α til høyre, dvs. P(T > t α,(n 1) ) = α. Ser at dette er i tråd med ett utvalg, konfidensintervall for µ: x t α,(n 1) s n < µ < x + t α,(n 1) s n

29 57 Eksempel: Dekkslitasje Vil sammenligne slitasje til to typer bildekk, A og B. 1. Utstyr n A tilfeldig valgte biler med dekk av type A, og n B tilfeldig valgte biler med dekk av type B. X A i, i = 1,...,n A er slitasje (gj.snitt over 4 dekk) for A-dekk-bilene. X B j, j = 1,..., n B er slitasje (gj.snitt over 4 dekk) for B-dekk-bilene. X1 A, X A,...,X n A A, X1 B, X B,...,X n B B alle uavhengige.. Utstyr n tilfeldig valgte biler med to dekk av type A og to av type B. Xi A, i = 1,...,n er slitasje til type A-dekk (gj.snitt over to dekk). Xi B, i = 1,..., n er slitasje til de n tilhørende parene av type B-dekk (gj.snitt over to dekk). Xi A og Xi B er ikke uavhengige, typisk positivt korrelert. Parene (X1 A, X 1 B), (X A, X B),..., (X n A, X n B ) er uavhengige. Hvilken strategi er best? 58 Eksempel: Dekkslitasje (forts.) Valgte strategi : parvise observasjoner. n = 15 forsøk med observerte verdier for D i = Xi A Xi B : d i : 1.5, -0.5, 0.0, 0.8, 1., 1., 0.9, -0.3, 1.3, 0., -0.7, 0.7,.6, -0.3,.. Anta D A, D B,..., D n u.i.f, D i n(d; µ D, σ D ), der µ D og σ D er ukjente. Punktestimator for µ D : ˆµ D = D, estimat d = 0.7. Punktestimator for σ D : ˆσ D = S D = 1 n 1 n (D i D), estimat s d = % konfidensintervall for µ D = E(D i ): α = 0.05, t α,n 1 = t 0.05,14 =.145, [ d ± t α,(n 1) s d n ] = [0.7 ±.145 = [0.18, 1.6] ]

30 59 Norske hoppdommere og Janne Ahonen Treneren til Janne Ahonen gikk (før OL) ut i pressen og mente at norske hoppdommere konsekvent gir Janne Ahonen lavere stilkarakterer enn andre dommere. Norsk Regnesentral kikket på tallene fra sesongene (t.o.m. OL) og fant at de var enig med Ahonens trener. Lenke til artikkel fra Forskning.no og mer og mer informasjon om gjennomsnittskarakterer finnes fra fagets hjemmeside. Vi ser på tall fra 36 hopprenn, gjennomsnittlig karakter til Ahonen fra norske dommere og fra internasjonale dommere (ikke norske og finske) Hvordan skal vi regne på dette?

31 61 Ahonen: to uavhengige utvalg X A 1, X A,..., X A n A er et tilfeldig utvalg fra en populasjon av stilkarakterer til Ahonen fra norske dommere. Antar normalfordelt med forventning µ A og varians σ A = σ. X B 1, X B,..., X B n B er et tilfeldig utvalg fra en populasjon av stilkarakterer til Ahonen fra internasjonale dommere (ikke norske og finske). Antar normalfordelt med forventning µ B og varians σ B = σ. Antar A-utvalget er uavhengig av B-utvalget! Lik, men ukjent varians: Estimator S p. Konfidensintervall [(x A x B ) ± t α,(n A+n B )s p 1 n A + 1 n B ]

32 63 Konfidensintervall for µ A µ B for parvise observasjoner Hvis d og s d er gjennomsnittet og standardavviket til normalfordelte differanser av n par av tilfeldige observasjoner, så er et (1-α)100% konfidensintervall for µ D = µ A µ B d t α,(n 1) s d n < µ D < d + t α,(n 1) s d n hvor t α,(n 1) er verdien i t-fordelingen med n 1 frihetsgrader som har areal α til høyre, dvs. P(T > t α,(n 1) ) = α. Ser at dette er i tråd med ett utvalg, konfidensintervall for µ: x t α,(n 1) s n < µ < x + t α,(n 1) s n 64 Studenter og bilkjøring Følgende tabell er tatt fra TMA445 spørreundersøkelsen. Her angir n antall studenter i utvalget som hadde sertifikat, og x antall studenter som svarte at de er bedre enn gjennomsnittet av Norges befolkning til å kjøre bil. x n x n Menn Kvinner Alle a) Finn punktestimat og 99% konfidensintervall for andelen av studenter som synes sine kjøreegenskaper er bedre enn gjennomsnittet. b) Finn punktestimat og 99% konfidensintervall for differensen mellom andelen av mannlige studenter og kvinnlige studenter som synes sine kjøreegenskaper er bedre enn gjennomsnittet.

33 65 Estimering av andel: ett utvalg X er antall suksesser i et binomisk forsøk med parametere antallet n og andelen p. Vi vil estimere p. (n er kjent.) Estimator ˆp = X n (intuitiv og SME), øving B3). E(ˆp) = p og Var(ˆp) = p(1 p) n. Tilnærmet (1 α)100% konfidensintervall for p (normaltilnærming): ˆp(1 ˆp) [ˆp ± z α ] n 66 Estimering av andel: to utvalg X A er antall suksesser i et binomisk forsøk med parametere antallet n A og andelen p A. X B er antall suksesser i et binomisk forsøk med parametere antallet n B og andelen p B. Vi vil estimere p A p B. Estimator ˆp A ˆp B = X A n A X B n B. E(ˆp A ˆp B ) = p A p B og Var(ˆp A ˆp B ) = p A(1 p A ) n A + p B(1 p B ) n B. Tilnærmet (1 α)100% konfidensintervall for p A p B (normaltilnærming): [(ˆp A ˆp B ) ± z α ˆp A (1 ˆp A ) n A + ˆp B (1 ˆp B ) n B ]

34 68 9.1: Konfidensintervall for varians La X 1, X,..., X n være et tilfeldig utvalg fra en populasjon som beskrives av en normalfordeling med forventning µ og varians σ. S = 1 n 1 n (X i X) er en estimator for σ (forventningsrett, men ikke SME). Størrelsen V = (n 1)S σ er kjikvadrat-fordelt med n 1 frihetsgrader. 1 α α α 0 χ (1 α ) ν χ α

35 69 9.1: Konfidensintervall for varians Et (1 α)100% konfidensintervall for σ er (n 1)S χ α,(n 1) < σ < (n 1)S χ 1 α,(n 1) hvor χ α,(n 1) er verdien i kjikvadrat-fordelingen med n 1 frihetsgrader som har areal α til høyre, dvs. P(V > χ α,(n 1)) = α, og χ 1 α,(n 1) er verdien i kjikvadrat-fordelingen med n 1 frihetsgrader som har areal α til venstre, dvs. P(V < χ 1 α,(n 1)) = α. Oppgave: se på Eksamen August 003, oppgave 1.

Foreleses onsdag 13.oktober, 2010

Foreleses onsdag 13.oktober, 2010 TMA440 Statistikk H010 Statistisk inferens: 9.4: Konfidensintervall for µ 8.7: Student-t fordeling 8.6: Fordeling til S Mette Langaas Foreleses onsdag 13.oktober, 010 Estimering Mål: finne sannheten om

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 9.4: Konfidensintervall for µ 8.7: Student-t fordeling 8.6: Fordeling til S 2 Mette Langaas Foreleses onsdag 13.oktober, 2010 2 Estimering Mål: finne sannheten

Detaljer

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) TMA440 Statistikk H010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,

Detaljer

Tilfeldig utvalg [8.1] U.i.f. Statistisk inferens. Kapittel 8 og 9

Tilfeldig utvalg [8.1] U.i.f. Statistisk inferens. Kapittel 8 og 9 3 Tilfeldig utvalg [8.1] DEF 8.1: En populasjon er mengden av observasjoner som vi ønsker å studere, dvs. alle observasjoner det er mulig å gjøre. (Dersom elementene i populasjonen har fordeling f(x),

Detaljer

TMA4240 Statistikk H2015

TMA4240 Statistikk H2015 TMA4240 Statistikk H2015 Ett utvalg: estimere forventningsverdi og intervall [9.4] Student-t fordeling [8.6] Quiz fra SME og konfidensintervall Mette Langaas Institutt for matematiske fag, NTNU wiki.math.ntnu.no/emner/tma4240/2015h/start/

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 9.6: Prediksjonsintervall 9.8: To utvalg, differanse µ 1 µ 2 Mette Langaas Foreleses mandag 18.oktober, 2010 2 Prediksjonsintervall for fremtidig observasjon,

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må

Detaljer

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010 TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må

Detaljer

Norske hoppdommere og Janne Ahonen

Norske hoppdommere og Janne Ahonen TMA440 Statistikk H010 9.8: To uvalg (siste del) 9.9: Parvise observasjoner 9.10-9.11: Andelser 9.1: Varians Mette Langaas Foreleses onsdag 0.oktober, 010 Norske hoppdommere og Janne Ahonen Janne Ahonen

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 9.8: To uvalg (siste del) 9.9: Parvise observasjoner 9.10-9.11: Andelser 9.12: Varians Mette Langaas Foreleses onsdag 20.oktober, 2010 2 Norske hoppdommere og Janne Ahonen Janne

Detaljer

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling Kapittel 8 Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling TMA4240 H2006: Eirik Mo 2 Til nå... Definert sannsynlighet og stokastiske variabler (kap. 2 & 3).

Detaljer

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering TMA4245 Statistikk Kapittel 8.1-8.5. Kapittel 9.1-9.3+9.15 Turid.Follestad@math.ntnu.no p.1/21 Har sett

Detaljer

Kapittel 2: Hendelser

Kapittel 2: Hendelser Kapittel 2: Hendelser FENOMEN Eksperiment Utfall Utfallsrom Eksperiment. Utfall. Eksperiment Utfall Hendelse Sannsynlighet: egenskaper, gunstige vs. mulige, relativ frekvens Sannsynlighet for mer enn en

Detaljer

TMA4240 Statistikk H2010 (22)

TMA4240 Statistikk H2010 (22) TMA4240 Statistikk H2010 (22) 10.11-10.12: Testing av andelser 10.13: Testing av varians i ett N utvalg Mette Langaas Foreleses onsdag 3.november, 2010 2 Laban strakk seg ikke lenger, men smaker den bedre?

Detaljer

Estimering og hypotesetesting

Estimering og hypotesetesting Kapittel 10 Ett- og toutvalgs hypotesetesting TMA4240 H2006: Eirik Mo 2 Estimering og hypotesetesting Fenomen Bilkjøring Høyden til studenter Spørsmål Hvor stor andel av studentene synes de er flinkere

Detaljer

TMA4240 Statistikk H2017 [15]

TMA4240 Statistikk H2017 [15] TMA4240 Statistikk H207 [5] Del 2: Statistisk inferens Populasjon og utvalg [8.] Observatorer og utvalgsfordelinger [8.2-8.3] Fordeling til gjennomsnittet og sentralgrenseteoremet [8.4] Normalplott [8.8]

Detaljer

Estimering og hypotesetesting

Estimering og hypotesetesting Kapittel 10 Ett- og toutvalgs hypotesetesting TMA4245 V2007: Eirik Mo 2 Estimering og hypotesetesting Fenomen Bilkjøring Høyden til studenter Spørsmål Hvor stor andel av studentene synes de er flinkere

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 9 Løsningsskisse Oppgave 1 a) Vi lar her Y være antall fugler som kolliderer med vindmølla i løpet av den gitte

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 0, blokk II Løsningsskisse Oppgave Surhetsgrad i ferskvann Eksamen august 00, oppgave av 3 a) En god estimator

Detaljer

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU Estimatorar Torstein Fjeldstad Institutt for matematiske fag, NTNU 11.10.2018 I dag Repetisjon Er dataa mine normalfordelt? Estimatorar Eigenskapar til S 2 Kahoot 2 Repetisjon Obervator Ein observator

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer

Detaljer

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i Løsningsskisse TMA440 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland a, Sara Martino b Tlf: a 48 18 96, b 99 40 33 30 Eksamensdato: 30. november

Detaljer

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - Fornuftig verdi Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.

Detaljer

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Eksamen desember 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet

Detaljer

STK Oppsummering

STK Oppsummering STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer

Detaljer

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2009 TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b5 Løsningsskisse Oppgave 1 Vi ønsker å finne ut om et nytt serum kan stanse leukemi.

Detaljer

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU Observatorar og utvalsfordeling Torstein Fjeldstad Institutt for matematiske fag, NTNU 08.10.2018 I dag Til no i emnet Observatorar Utvalsfordelingar Sentralgrenseteoremet 2 Til no i emnet definisjon av

Detaljer

Fasit for tilleggsoppgaver

Fasit for tilleggsoppgaver Fasit for tilleggsoppgaver Uke 5 Oppgave: Gitt en rekke med observasjoner x i (i = 1,, 3,, n), definerer vi variansen til x i som gjennomsnittlig kvadratavvik fra gjennomsnittet, m.a.o. Var(x i ) = (x

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Løsningsskisse Oppgave X er kontinuerlig fordelt med sannsynlighetstetthet f X (x) = { x exp( x ) x

Detaljer

STK Oppsummering

STK Oppsummering STK1100 - Oppsummering Geir Storvik 6. Mai 2014 STK1100 Tre temaer Deskriptiv/beskrivende statistikk Sannsynlighetsteori Statistisk inferens Sannsynlighetsregning Hva Matematisk verktøy for å studere tilfeldigheter

Detaljer

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen Høgskolen i Telemark Institutt for økonomi og informatikk FORMELSAMLING 6005 Statistikk I Til bruk ved eksamen Per Chr. Hagen . Sannsynlighetsregning. Regneregler Komplementsetningen: Addisjonssetningen:

Detaljer

Forslag til endringar

Forslag til endringar Forslag til endringar Bakgrunn: Vi har ingen forelesningar veka etter påske. Eg skal bort 18. og 19. april. Eksamen er 30.mai Forslag til endringar: Ekstra forelesningar onsdag 16.mars og onsdag 30 mars

Detaljer

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden. Estimeringsmetoder Momentmetoden La X, X 2,..., X n være uavhengige variable som er rektangulært fordelte på intervallet [0, θ]. Vi vet da at forventningsverdiene til hver observasjon og forventningen

Detaljer

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100

Detaljer

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up! I dag I dag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve 3 a og b (inkl SME) Om eksamen (Truleg) 10 punkt.

Detaljer

Kap. 8: Utvalsfordelingar og databeskrivelse

Kap. 8: Utvalsfordelingar og databeskrivelse Kap. 8: Utvalsfordelingar og databeskrivelse Utvalsfordelingar Utvalsfordeling for gjennomsnitt (med kjent varians) ( X ) Sentralgrenseteoremet (SGT) Utvalsfordeling for varians (normalfordeling) Utvalfordeling

Detaljer

Løsningsforslag oblig 1 STK1110 høsten 2014

Løsningsforslag oblig 1 STK1110 høsten 2014 Løsningsforslag oblig STK høsten 4 Oppgave I forbindelse med en studie av antioksidanter og antocyanider, ble innholdet av antocyan i 5 beger med blåbær målt. De målte verdiene var (i mg per gram): 55

Detaljer

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som: Hypotesetesting. 10 og fore- Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte for å undersøke hypoteser (påstander) knyttet til parametre i sannsynlighetsfordelinger.

Detaljer

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene. Estimering 2 -Konfidensintervall Dekkes av kap. 9.4-9.5, 9.10, 9.12 og forelesingsnotatene. En (punkt-)estimator ˆΘ gir oss et anslag på en ukjent parameterverdi, men gir oss ikke noen direkte informasjon

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Oppgave 1 X er kontinuerlig fordelt med sannsynlighetstetthet f(x) = 2xe

Detaljer

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up! Plan vidare Onsdag Gjere ferdig kap 11 + repetisjon Fredag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806

Detaljer

DEL 1 GRUNNLEGGENDE STATISTIKK

DEL 1 GRUNNLEGGENDE STATISTIKK INNHOLD 1 INNLEDNING 15 1.1 Parallelle verdener........................... 18 1.2 Telle gunstige.............................. 20 1.3 Regneverktøy og webstøtte....................... 22 1.4 Oppgaver................................

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon Bo Lindqvist Institutt for matematiske fag 2 Kap. 9: Inferens om én populasjon Statistisk inferens har som mål å tolke/analysere

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 24. april Bjørn H. Auestad Oppsummering våren

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag Situasjonen er som i quiz-eksempelet: n = 4, p = 1/3 ( suksess betyr å gjette riktig alternativ), q = 2/3. Oppgave: Finn

Detaljer

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgave i TMA4240 / TMA4245 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 / TMA4245 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland Tlf: 48 22 18 96 Eksamensdato: 10. august 2017 Eksamenstid (fra til): 09.00-13.00

Detaljer

TMA4245 Statistikk Eksamen august 2014

TMA4245 Statistikk Eksamen august 2014 TMA4245 Statistikk Eksamen august 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Oppgave 1 En bedrift produserer en type medisin i pulverform Medisinen selges på flasker

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 21. april Bjørn H. Auestad Oppsummering våren

Detaljer

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Høst 2007 TMA4240 Statistikk Høst 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b4 Løsningsskisse Oppgave 1 Eksamen juni 1999, oppgave 3 av 3 a) µ populasjonsgjennomsnitt,

Detaljer

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007 Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007 Oppgave 1: Pengespill a) For hver deltaker har vi følgende situasjon: Deltakeren får en serie oppgaver. Hver runde har to mulige utfall: Deltakeren

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA440 Statstkk H00 Statstsk nferens: 9.6: Predksjonsntervall 9.8: To utvalg, dfferanse µ µ Mette Langaas Foreleses mandag 8.oktober, 00 Predksjonsntervall for fremtdg observasjon, normalfordelng For en

Detaljer

i x i

i x i TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 11, blokk II Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale

Detaljer

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper Bo Lindqvist Institutt for matematiske fag 2 Kapittel 8: Sammenligning av grupper Situasjon: Vi ønsker

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig

Detaljer

Kp. 9.8 Forskjell mellom to forventninger

Kp. 9.8 Forskjell mellom to forventninger andeler I analysene skal vi se på situasjonene der σx og σ Y er kjente; normalantakelse a σx og σ Y er ukjente men σ X = σ Y ; normalantakelse og b σx og σ Y er ukjente og σ X σ Y ; normalantakelse 3 og

Detaljer

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 3, blokk II Dette er den første av to innleveringer i blokk 2. Denne øvingen skal oppsummere

Detaljer

Oppfriskning av blokk 1 i TMA4240

Oppfriskning av blokk 1 i TMA4240 Oppfriskning av blokk 1 i TMA4240 Geir-Arne Fuglstad November 21, 2016 2 Hva har vi gjort i dette kurset? Vi har studert to sterkt relaterte grener av matematikk Sannsynlighetsteori: matematisk teori for

Detaljer

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER HØGSKOLEN I STAVANGER Avdeling for TEKNISK NATURVITEN- EKSAMEN I: TE199 SANNSYNLIGHETSREGNING MED STATISTIKK SKAPELIGE FAG VARIGHET: 4 TIMER DATO: 5. JUNI 2003 TILLATTE HJELPEMIDLER: KALKULATOR OPPGAVESETTET

Detaljer

Hypotesetest: generell fremgangsmåte

Hypotesetest: generell fremgangsmåte TMA4240 Statistikk H2010 (21) 10.8, 10.10: To normalfordelte utvalg 10.9: Teststyrke og antall observasjoner Mette Langaas Foreleses mandag 1.november, 2010 2 Hypotesetest: generell fremgangsmåte Generell

Detaljer

TMA4240 Statistikk H2015

TMA4240 Statistikk H2015 TMA4240 Statistikk H2015 Funksjoner av stokastiske variabler (kapittel 7+notat) Fokus på start med kumulativ fordeling 7.2 Funksjon av en SV (inkludert en-entydighet). Fordeling til max/min (fra notat).

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 11 Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale begreper

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Analysere en observator for å finne ut noe om korresponderende

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 27. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig

Detaljer

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002 Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002 Oppgave 1 a) En god estimator er forventningsrett og har liten varians. Vi tester forventningsretthet: E[ˆµ] E[Y ] µ E[ µ] E[ 1 2 X + 1 2 Y ] 1 2 E[X]

Detaljer

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU Forelesing 27 Oppsummering Torstein Fjeldstad Institutt for matematiske fag, NTNU 18.04.2018 I dag Lineær regresjon (sjekk av modellantagelser) Praktisk informasjon Andre statistikk-kurs Oversikt over

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II I denne øvingen skal vi fokusere på hypotesetesting. Vi ønsker å gi dere

Detaljer

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Vår 2017 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 3 Dette er den første av to innleveringer i blokk 2 Denne øvingen skal oppsummere pensum

Detaljer

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6) TMA4245 Statistikk Vår 212 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving 4 blokk II Løsningsskisse Oppgave 1 4 personer spurt. Hvis mellom 22 og 26 personer svarer

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Det er to populasjoner som vi ønsker å sammenligne. Vi trekker da et utvalg

Detaljer

UNIVERSITETET I OSLO Matematisk Institutt

UNIVERSITETET I OSLO Matematisk Institutt UNIVERSITETET I OSLO Matematisk Institutt Midtveiseksamen i: STK 1000: Innføring i anvendt statistikk Tid for eksamen: Onsdag 9. oktober 2013, 11:00 13:00 Hjelpemidler: Lærebok, ordliste for STK1000, godkjent

Detaljer

Kapittel 3: Studieopplegg

Kapittel 3: Studieopplegg Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Å analysere en utvalgsobservator for å trekke slutninger

Detaljer

Løsningsforslag eksamen 27. februar 2004

Løsningsforslag eksamen 27. februar 2004 MOT30 Statistiske metoder Løsningsforslag eksamen 7 februar 004 Oppgave a) Y ij = µ i + ε ij, der ε ij uavh N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig variasjon)

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1100 Statistiske metoder og dataanalyse 1 - Løsningsforslag Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30

Detaljer

TMA4240 Statistikk H2010 (20)

TMA4240 Statistikk H2010 (20) TMA4240 Statistikk H2010 (20) 10.5: Ett normalfordelt utvalg, kjent varians (repetisjon) 10.4: P-verdi 10.6: Konfidensintervall vs. hypotesetest 10.7: Ett normalfordelt utvalg, ukjent varians Mette Langaas

Detaljer

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger Kapittel 6: Kontinuerlige sannsynlighetsfordelinger TMA4240 Statistikk (F2 og E7) Foreleses 15. september, 2004. µ µ µ + Basert på slides av Mette Langås p.1/16 6.1 Kontinuerlig uniform fordeling Kontinuerlig

Detaljer

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47) MOT310 tatistiske metoder 1 Løsningsforslag til eksamen vår 006, s. 1 Oppgave 1 a) En tilfeldig utvalgt besvarelse får F av sensor 1 med sannsynlighet p 1 ; resultatene for ulike besvarelser er uavhengige.

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 Ei bedrift produserer elektriske komponentar. Komponentane kan ha to typar

Detaljer

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler STK1000 Uke 36, 2016. Studentene forventes å lese Ch 1.4 (+ 3.1-3.3 + 3.5) i læreboka (MMC). Tetthetskurver Eksempel: Drivstofforbruk hos 32 biler Fra histogram til tetthetskurver Anta at vi har kontinuerlige

Detaljer

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Eksamen desember 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlege stokastiske variabelen X ha fordelingsfunksjon (sannsynstettleik

Detaljer

TMA4240 Statistikk 2014

TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Løsningsskisse Oppgave Scriptet run confds.m simulerer n data x,..., x n fra en normalfordeling med

Detaljer

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B Situasjonen er som i quiz-eksempelet: n = 4, p = 1/3 ( suksess betyr å gjette riktig alternativ), q = 2/3. Oppgave: Finn P(x), x=0,1,2,3,4 fra den generelle formelen for binomisk sannsynlighetsfordeling

Detaljer

Medisinsk statistikk Del I høsten 2009:

Medisinsk statistikk Del I høsten 2009: Medisinsk statistikk Del I høsten 2009: Kontinuerlige sannsynlighetsfordelinger Pål Romundstad Beregning av sannsynlighet i en binomisk forsøksrekke generelt Sannsynligheten for at suksess intreffer X

Detaljer

Kapittel 9: Estimering

Kapittel 9: Estimering Kapittel 9: Estimeing TMA445 Statistikk 9.8,9.9: Estimeing, to utvalg. 9.6: Pediksjonsintevall Tuid.Follestad@math.ntnu.no p.1/13 Repetisjon: Punkt-og intevall-estimeing, eitt utvalg La X 1, X,..., X n

Detaljer

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf: Hypotesetesting Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf: 22 400 400 www.aschehoug.no 1 Oversikt Sannsynlighetsregning og statistikk

Detaljer

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte

Detaljer

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 10 LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011 Oppgave 1 Oljeleting a) Siden P(A

Detaljer

Notasjon. Løsninger. Problem. Kapittel 7

Notasjon. Løsninger. Problem. Kapittel 7 3 Notasjon Kapittel 7 Funksjoner av stokastiske variabler Har n stokastiske variabler, X 1, X 2,..., X n, med kjent fordeling f( 1, 2,..., n ) og kumulativ fordeling F( 1, 2,..., n ). Ser på Y = u(x 1,

Detaljer

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger Fordelinger, mer om sentralmål og variasjonsmål Tron Anders Moger 20. april 2005 1 Forrige gang: Så på et eksempel med data over medisinerstudenter Lærte hvordan man skulle få oversikt over dataene ved

Detaljer

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind Forelesning 6: Punktestimering, usikkerhet i estimering Jo Thori Lind j.t.lind@econ.uio.no Oversikt 1. Trekke utvalg 2. Estimatorer og observatorer som stokastiske variable 3. Egenskapene til en estimator

Detaljer

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte

Detaljer

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2009 TMA440 Statistikk Høst 009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Løsningsskisse Oppgave a) n 8, i x i 675, x 37.5, i y i 488, i x i 375, i x iy i

Detaljer

Statistikk og dataanalyse

Statistikk og dataanalyse Njål Foldnes, Steffen Grønneberg og Gudmund Horn Hermansen Statistikk og dataanalyse En moderne innføring Kapitteloversikt del 1 INTRODUKSJON TIL STATISTIKK Kapittel 1 Populasjon og utvalg 19 Kapittel

Detaljer

ST0103 Brukerkurs i statistikk Høsten Momentestimatoren og sannsynlighetsmaksimeringsestimatoren

ST0103 Brukerkurs i statistikk Høsten Momentestimatoren og sannsynlighetsmaksimeringsestimatoren ST0103 Brukerkurs i statistikk Høsten 2016 Momentestimatoren og sannsynlighetsmaksimeringsestimatoren (SME) Boka har bare ett eksempel med sannsynlighetsmaksimeringsestimatoren. Vi gjengir dette nedenfor,

Detaljer

TMA4240 Statistikk H2010 (19)

TMA4240 Statistikk H2010 (19) TMA4240 Statistikk H2010 (19) Hypotesetesting 10.1-10.3: Generelt om statistiske hypoteser 10.5: Ett normalfordelt utvalg Mette Langaas Foreleses mandag 25.oktober, 2010 2 Estimering og hypotesetesting

Detaljer