Tilfeldig utvalg [8.1] U.i.f. Statistisk inferens. Kapittel 8 og 9

Størrelse: px
Begynne med side:

Download "Tilfeldig utvalg [8.1] U.i.f. Statistisk inferens. Kapittel 8 og 9"

Transkript

1 3 Tilfeldig utvalg [8.1] DEF 8.1: En populasjon er mengden av observasjoner som vi ønsker å studere, dvs. alle observasjoner det er mulig å gjøre. (Dersom elementene i populasjonen har fordeling f(x), kaller boka det en f(x)-populasjon.) Kapittel 8 og 9 Ett- og toutvalgs estimering; statistisk inferens, forventningsretthet, punktestimat, intervallestimat og prediksjonsintervall, estimere forventningsverdi, differanse, andel og varians, standardfeil, sannsynlighetsmaksimering DEF 8.: En utvalg er en delmengde av en populasjon. Representativt utvalg: elementene som velges ut må ikke bare representere en delmengde av populasjonen som alle har en spesiell egenskap, de må kunne være representanter for hele populasjonen. Uendelig populasjon: vi skal jobbe som om populasjonen vår er uendelig stor! TMA445 V007: Eirik Mo 4 Statistisk inferens Fra innsamling, bearbeiding, analyse og fortolkning av numeriske data og målinger: trekke slutninger utover det man har observert. Vi ønsker å si noe generelt om en populasjon basert på et innsamlet tilfeldig utvalg fra populasjonen. Bakgrunn: vår kunnskap i sannsynlighetsregning. Populasjon Sannsynlighetsregning Utvalg U.i.f DEF 8.3: La X 1, X,..., X n være n uavhengige stokastiske variable, hver med den samme sannsynlighetsfordeling f(x). Vi definerer at X 1, X,..., X n er et tilfeldig utvalg av størrelse n fra f(x)-populasjonen og skriver den simultane sannsynlighetsfordelingen som f(x 1, x,..., x n ) = f(x 1 )f(x ) f(x n ) U.i.f: et tilfeldig utvalg (som over) blir da et sett med uavhengige identisk fordelte (u.i.f.) observasjoner. Statistisk inferens

2 5 7 Heat flow data Data fra NIST/SEMATECH e-handbook of Statistical Methods Viser heat flow meter calibration and stability analysis. The response variable is a calibration factor. n = 195. Stamme- og bladdiagram LO: * * * * * (0) 96* * * * * * * 0 HI: Boksplott Histogram Min. 1st Qu. Median Mean 3rd Qu. Max Histogram of heatflow Histogram of heatflow Density Density heatflow Histogram of heatflow heatflow Density Density heatflow Histogram of heatflow heatflow

3 9 11 Normalplott Normal QQ-plott Empirisk kumulativ fordeling er ˆF(x) = antall observasjoner mindre eller lik x. n Hvis data er normalfordelt ville vi forvente at ˆF(x) ligner på den kumulative fordelingsfunksjonen til normalfordelingen. FFemp FFemp sort(heatflow) sort(heatflow) Hver observasjon er et punkt i diagrammet. Så justerer vi skalaen på y-aksen slik at det blir en lineær sammenheng når dataene er normalfordelte (bruke invers funksjon til kumulativ fordeling). Noen bytter om på aksene. Figurer fra NIST/SEMATECH e-handbook of Statistical Methods, Normal QQ-plott Estimering og hypotesetesting Sample Quantiles Normal Q Q Plot Theoretical Quantiles Fenomen Defekte produkter i industriell prosess Hva vil vi vite? ESTIMERING: Hva er andelen defekte? Mengden melk i melkekartong HYPOTESETESTING: Er det 1 liter melk i en 1 liters melkekartong? Populasjon Alle produkter i prosessen. Alle melkekartonger levert. Utføre eksperiment Samler inn data uavhengig, representativt? Stokastisk variabel med fordeling Vi får: Undersøke produkt, er det defekt eller ikke? Sjekker n artikler og lar X være antall defekte. Vi finner x defekte. X er binomisk fordelt med n forsøk og ukjent sannsynlighet for defekt p. Finne beste anslag for p og et intervall der vi har stor tillit til at p ligger (konfidensintervall). Undersøke melkekartong, hvor mye melk inneholder den? Sjekker n melkekartonger, måler for hver melkekartong X= mengden melk. X er normalfordelt med ukjent forventning µ og ukjent varians. Finne beste anslag av µ og, og bruke anslagene (med grad av tillit) til å si hvor sikre vi er på at det er 1 liter melk i melkekartongen.

4 13 TMA440/TMA445 Statistikk: Læringsmål 005/006: Emnet skal gi en innføring i grunnleggende begreper og metoder i statistikk. 006/007: Emnet skal gi studentene et grunnlag i sannsynlighetsregning og statistisk inferens, som gjør dem i stand til å gjenkjenne enkle statistiske standardsituasjoner innen teknologi og naturvitenskap, og vite hvordan disse best kan analyseres. Videre skal studentene kunne forstå de viktigste begrepene innen statistikk og sannsynlighetsregning, og kjenne til terminologien slik at de kan kommunisere med en fagstatistiker i mer kompliserte situasjoner. 15 Forventingsrett estimator DEF 9.1: En observator θ er en forventningsrett estimator for parameteren θ hvis fx E( θ) = θ Estimering Mål: finne sannheten om et fenomen i en populasjon. Sannheten knytter vi til en ukjent parameter, θ, i en valgt fordeling. Vi trekker et tilfeldig utvalg fra populasjonen; X 1, X,..., X n (u.i.f.). En estimator gir et anslag for den ukjente parameteren og er en funksjon av stokastiske variabler, ˆθ = ˆθ(X 1, X,..., X n ). Hvilke egenskaper bør en god estimator ha? Estimatoren bør være forventningsrett, dvs. E(ˆθ) = θ. Estimatoren bør ha minst mulig varians, Var(ˆθ), og variansen bør avta når antall observasjoner, n, øker. Hvordan kan vi finne estimatorer? ved intuisjon, ved matematisk metode. Sannsynlighetsmaksimeringsestimatoren (SME) finner det anslaget som gjør at de observasjonene vi har gjort (utvalget) har maksimal rimelighet! 16 E(S ), s 3 nx (X i X) = = = = nx nx (X i µ + µ X) = [(X i µ) ( X µ)] nx nx (X i µ) ( X µ) (X i µ) + n( X µ) nx (X i µ) ( X µ)n( X µ) + n( X µ) nx (X i µ) n( X µ) E(S ) = 1 nx E[ (X i X) ] = 1 nx n 1 n 1 {E[ (X i µ) ] E[n( X µ) ]} = 1 nx n 1 [ Var(X i ) nvar( X)] = 1 nx n 1 [ n n ] = 1 n 1 (n ) =

5 17 Mest effektive estimator DEF 9.: Hvis vi ser på alle mulige forventningsrette estimatorene for en parameter θ, kaller vi den med minst varians for den mest effektive estimatoren til θ. fx Fordeling til gjennomsnittet, X Hvis X 1, X,...,X n er uavhengige stokastiske variable, gjelder E( Var( a i X i ) = a i X i ) = a i E(X i ) a i Var(X i) Fra kapittel 7: Hvis X 1, X,...,X n i tillegg er normalfordelte, vil a 1 X 1 + a X + a n X n også være normalfordelt med forventning og varians som ovenfor Eksamen, juni 004, 1c 0 Fordeling til gjennomsnittet X [8.5] TEO 8.: Sentralgrenseteoremet La X 1, X,..., X n være et tilfeldig utvalg fra en fordeling med forventning µ og varians. Da har vi at sannsynlighetsfordelingen til Z = X µ / n går mot standard normalfordelingen, n(z; 0, 1), når n.

6 1 Sentralgrenseteoremet Figur fra Figure fra Devore. SME [9.15] 4 SME for µ i normalfordelingen DEF 9.6: Gitt uavhengige observasjoner x 1, x,..., x n fra en sannsynlighetstetthet (i det kontinuerlige tilfellet) eller en punktsannsynlighet (i det diskrete tilfellet) f(x; θ). Da er sannsynlighetsmaksimeringsestimatoren (SME) for θ verdien som maksimerer rimelighetsfunksjonen L(x 1, x,..., x n,θ) = f(x 1 ;θ) f(x ;θ) f(x n ;θ). Tilfeldig utvalg, X 1, X,..., X n u.i.f normal n(x; µ, ). Husker mulige estimator for µ er X. Hva er SME? Rimelighetsfunksjonen og logaritmen til rimelighetsfunksjonen:: L(x 1, x,...x n, µ, ) = = n 1 π e 1 (x i µ) 1 (π) n/ ( ) n/ e 1 P n (x i µ) ln L(x 1, x,...x n, µ, ) = n ln(π) n ln 1 (x i µ)

7 5 SME for µ i normalfordelingen Derivere mhp µ: ln L(x 1, x,...x n, µ, ) µ = 1 (x i µ) Finne ˆµ ved å sette ln L µ = 0: 1 n (x i ˆµ) = 0. ˆµ = 1 n X i = X 7 SME: steg 1. Ønsker estimator for parameter θ, basert på. tilfeldig utvalg fra populasjon beskrevet ved kjent parametrisk fordeling f(x; θ). 3. Rimelighetsfunksjonen; L(x 1, x,...,x n, θ) = f(x 1 ; θ)f(x ; θ) f(x n ; θ). 4. Skal maksimere rimelighetsfunksjonen, lettere å jobbe med den naturlige logaritmen til rimelighetsfunksjonen l(x 1, x,...,x n, θ) = ln L(x 1, x,..., x n, θ) 5. Deriverer logaritmen til rimelighetsfunksjonen med hensyn på θ. 6. Setter den deriverte lik 0 og løser ut for θ. Dette blir vår sannsynlighetsmaksimeringsestimator for θ. (Kan også sjekke at dette er maksimum og ikke minimum ved å derivere en gang til og se at denne.deriverte er negativ.) 6 SME for i normalfordelingen Husker mulig estimator for er S. Hva er SME? Har logaritmen til rimelighetsfunksjonen, og vet at ˆµ = X. ln L(x 1, x,...x n, µ, ) = n ln(π) n ln 1 (x i µ) Derivere mhp : ln L(x 1, x,...x n, µ, ) = n + 1 ( ) (x i µ) Finne ved å sette ln L = 0. Setter inn estimatet x for µ. ( ) n + 1 (x i x) = 0 ( ) n + 1 (x i x) = 0 dvs. = 1 n (X i X) 8 Estimering Mål: finne sannheten om et fenomen i en populasjon. Sannheten knytter vi til en ukjent parameter, θ, i en valgt fordeling. Vi trekker et tilfeldig utvalg fra populasjonen; X 1, X,..., X n (u.i.f.). En estimator gir et anslag for den ukjente parameteren og er en funksjon av stokastiske variabler, ˆθ = ˆθ(X 1, X,..., X n ). Estimatoren bør være forventningsrett, dvs. E(ˆθ) = θ. Estimatoren bør ha minst mulig varians, Var(ˆθ), og variansen bør avta når antall observasjoner, n, øker. Sannsynlighetsmaksimeringsestimatoren (SME) finner det anslaget som gjør at de observasjonene vi har gjort (utvalget) har maksimal rimelighet! I tillegg til punktestimatet kan vi lage et 95% konfidensintervall der vi har 95% tillit til at den sanne parameteren ligger.

8 9 Data fra DNA microarrays Studere effekt av trening på hjertet: måler forholdet mellom genuttrykk for rotter trent i 48 timer og rotter som ikke har trent gener studert, vi ser på genet: UI-R-A0-ar-f-11-0-UI med beskrivelse ESTs Highly similar to INTERFERON REGULATORY FACTOR 3 [M.musculus] Kan anta at en transformasjon av genuttrykksforholdet for trenete og utrenete rotter er normalfordelt. Positivt tall: genet er mer aktivt for trente enn for utrente rotter Nær 0: genet er like aktivt for trente og utrente rotter. Negativt tall: genet er mindre aktivt for trente enn for utrente rotter. Observasjoner fra 1 par av trenete og utrente rotter: ˆµ = x = Konfidensintervall for µ med kjent x z α n < µ < x + z α 1 α α α zα 0 zα n 30 Konfidensintervall for µ med kjent 3 Intervallestimering med rottedata Hvis x er gjennomsnittet av et tilfeldig utvalg av størrelse n fra en populasjon med kjent varians, så er et (1-α)100% konfidensintervall for µ x z α n < µ < x + z α n hvor z α er verdien i standard normalfordelingen som har areal α til høyre, dvs. P(Z > z α ) = α. Antar målinger er normalfordelte. Observasjoner fra 1 par av trenete og utrente rotter: % konfidensintervall for µ nå er kjent (antar =0.1): x z α n < µ < x + z α n Rottedata: ˆµ = x = 1.54, n=1, z 0.05 = 1.96, 95% konfidensintervall for µ er [1.36, 1.7].

9 33 Intervallestimering med rottedata 35 Konfidensintervall for µ med ukjent Hvis vi ikke kjenner kan vi estimere den med S, og får 95% konfidensintervall for µ nå er ukjent: x t α,(n 1) s n < µ < x + t α,(n 1) s n Rottedata: S =0.146, t 0.05,11 =.01, 95% konfidensintervall for µ er da [1.30, 1.78]. Hvis x er gjennomsnittet og s er estimert standardavvik av et tilfeldig utvalg av størrelse n fra en populasjon med ukjent varians, så er et (1-α)100% konfidensintervall for µ x t α,(n 1) s n < µ < x + t α,(n 1) s n hvor t α,(n 1) er verdien i t-fordelingen med n 1 frihetsgrader som har areal α til høyre, dvs. P(T > t α,(n 1) ) = α. 34 Kvantiler N og t.5%: N=black, t.15=blue, t.10=red 36 Konfidensintervall for µ med ukjent x t α,(n 1) s n < µ < x + t α,(n 1) s n α α α tα 0 tα

10 37 Test nasjonen Lørdag 7. november 004 ble TV-programmet Test nasjonen sendt på NRK1. Deltakere i studium svarte på spørsmål og fikk tildelt en IQ-score. Testen var laget slik at man forventet at IQ-score til en tilfeldig valgt person skulle være normalfordelt med forventningsverdi 100 og standardavvik 15. Deltakerne var delt inn i ulike grupper (av rundt 40 deltakere). 39 Ett normalfordelt utvalg: punkt- og intervallestimering Eksempler: melkekartonger, genuttrykk, høyde, betongstyrke, IQ. X 1, X,..., X n er et tilfeldig utvalg fra en populasjon som beskrives av en normalfordeling med forventning µ og varians. ˆµ = X = 1 n n X i estimator for µ (intuitiv og SME). E(X) = µ, Var(X) = n. Hvis er ukjent er S = 1 n n 1 (X i X) estimator for (forventningsrett, men ikke SME). (1 α)100% konfidensintervall for µ når er kjent: [x z α, x + z α ] n n (1 α)100% konfidensintervall for µ når er ukjent? 38 Test nasjonen (forts) Følgende gjennomsnittsscore be oppnådd: Sekretærer 88 Reality-deltakere 94 Kjendiser 98 Svensker 99 Kroppsbyggere 100 Finansfolk 101 Journalister 10 Er deltakerne valgt ut tilfeldig fra populasjonen bestående av Norges befolkning i gitte gruppe? Vi antar at det er kjent at = 15, og at hver gruppe bestod av 40 deltakere. Lag 95% konfidensintervaller for de ulike gruppene. 40 T og t-fordeling COR: La X 1, X,..., X n være uavhengige stokastiske variabler som alle er normalfordelte med samme forventning µ og samme standardavvik. La X = 1 n X i og S = 1 n 1 Da er den stokastiske variablen T = X µ S/ n t-fordelt med ν = (n 1) frihetsgrader. (X i X)

11 41 W. S. Gosset alias Student 43 t-fordelingen 4 Historisk: Student-t fordelingen W.S. Gosset ( ) was employed by the Guinness Brewing Company of Dublin. Sample sizes available for experimentation in brewing were necessarily small, and Gosset knew that a correct way of dealing with small samples was needed. He consulted Karl Pearson ( ) of Universiy College in London about the problem. Pearson told him the current state of knowledge was unsatisfactory. The following year Gosset undertook a course of study under Pearson. An outcome of his study was the publication in 1908 of Gosset s paper on "The Probable Error of a Mean," which introduced a form of what later became known as Student s t-distribution. Gosset s paper was published under the pseudonym "Student." The modern form of Student s t-distribution was derived by R.A. Fisher and first published in DEF: t-fordeling TEO 8.5: La Z være en standard normalfordelt stokastisk variabel og V være en kjikvadrat-fordelt stokastisk variabel med ν frihetsgrader. Hvis Z og V er uavhengige, er fordelingen til den stokastiske variablen T T = Z V/ν E(T) = 0 hvis ν. gitt ved sannsynlighetstettheten h(t) = Γ[(ν + 1)/] Γ(ν/) πν (1 + t ν ) (ν+1)/ for < t <. Denne fordelingen har navnet (Student) t fordelingen med ν frihetsgrader. Var(T) = ν ν hvis ν 3.

12 45 Fordelingen til S Resultat: V = (n 1)S = n ν = n 1 frihetsgrader. Fordi: Z i Z er kjikvadrat-fordelt med i) X 1,..., X n u.i.f. normal, E(X i ) = µ og Var(X i ) =. ii) Z i = X i µ er standard normalfordelt, og Z = X µ n standard normalfordelt. ( ) Xi µ er kjikvadrat-fordelt med 1 frihetsgrad. iii) Z i = Z = ( X µ n ) er kjikvadrat-fordelt med 1 frihetsgrad. iv) n Z i er kjikvadratfordelt med n frihetsgrader. v) (n 1)S = n (X i X) = n (X i µ) n( X µ), og dermed V = (n 1)S vi) n Z i og Z er uavhengige. = n Z i Z er 47 Prediksjonsintervall for fremtidig observasjon, normalfordeling For en normalfordeling med ukjent forventningsverdi µ, og ukjent varians, er et (1-α)100% prediksjonsintervall for en fremtidig observasjon x 0 gitt som x t α,(n 1) s n < x 0 < x + t α,(n 1) s n hvor t α,(n 1) er verdien i t-fordelingen med n 1 frihetsgrader som har areal α til høyre, dvs. P(T > t α,(n 1) ) = α, og s = n (x i x) 46 Prediksjonsintervall for fremtidig observasjon, normalfordeling For en normalfordeling med ukjent forventningsverdi µ, men kjent varians, er et (1-α)100% prediksjonsintervall for en fremtidig observasjon x 0 gitt som x z α n < x 0 < x + z α n hvor z α er verdien i normal-fordelingen som har areal α til høyre, dvs. P(Z > z α ) = α. 48 To utvalg: eksempler Betong: to ulike oppskrifter, A og B, skal sammenlignes. Hvor stor forskjell er det i styrken ( crushing strength ) for betong fra oppskrift A og fra oppskrift B? Sykdom: tester ut ny blodtrykksmedisin. Hvor mye bedre er den enn nåværende markedsledende blodtrykksmedisin? Kosthold: hvor stor vektreduksjon vil man oppleve ved å følge Dr Fedon Lindbergs kostråd i et halvt år? (balanse i blodsukker, lav glykemisk indeks) Bildekk: to typer dekk, A og B, skal sammenlignes mhp slitasje. Kan enten sette både A og B-dekk på hver bil eller noen biler med A og noen biler med B.

13 49 To utvalg: statistisk situasjon Ønsker å sammenligne to populasjoner basert på et u.i.f. utvalg fra hver populasjon. Studerer en egenskap som kan sies å være normalfordelt i hver populasjon, og ønsker å anslå differansen mellom forveningsverdien i de to populasjonene og et intervall der vi har stor tillit til at den sanne differansen i forventningsverdiene ligger. Sammenligningene kan være parvise eller ikke parvise. 51 To utvalg: estimatorer X A 1, X A,..., X A n A er et tilfeldig utvalg fra en populasjon som beskrives av en normalfordeling med forventning µ A og varians A. X B 1, X B,..., X B n B er et tilfeldig utvalg fra en populasjon som beskrives av en normalfordeling med forventning µ B og varians B. Estimator for µ A µ B : ˆµ A ˆµ B = X A X B = 1 na n A X i A 1 nb n B j=1 X j B (intuitiv og SME). X A X B er normalfordelt med E(X A X B ) = µ A µ B Var(X A X B ) = A n A + B n B Hvis A og B er kjente så er Z standard normalfordelt. Z = (X A X B ) (µ A µ B ) s A + B n A n B 50 To utvalg: Bensinforbruk Problemstilling: Vil sammenligne to biltyper A og B mhp bensinforbruk. Utvalg 1: X A i :#km/liter for bil nummer i, type A. Utvalg : X B j :#km/liter for bil nummer j, type B. Anta at X A i Anta at X B i Observasjoner: er normalfordelt med ukjent µ A og kjent A = km/liter. er normalfordelt med ukjent µ B og kjent B = 3 km/liter. n A = 1 målinger på bil A, med gjennomsnitt x A = 10 km/liter. n B = 10 målinger på bil B, med gjennomsnitt x B = 8 km/liter. 5 To utvalg: konfidensintervall for µ A µ B når A og B er kjente Hvis X A og X B er gjennomsnittene til to tilfeldig utvalg av størrelse n A og n B fra populasjoner med kjent varians A og B, så er et (1-α)100% konfidensintervall for µ A µ B A (x A x B ) z α (x A x B ) + z α + B < (µ A µ B ) < n A n B A + B n A n B hvor z α er verdien i standard normalfordelingen som har areal α til høyre, dvs. P(Z > z α ) = α.

14 53 To utvalg: Bensinforbruk 95% konfidensintervall for µ A µ B. Punktestimator: ˆµ A ˆµ B = X A X B. Punktestimat: x A x B = km/liter. 95% konfidensintervall: α = 0.05, z α = z 0.05 = 1.96, [ , ] = [0.66, 3.34] To utvalg: konfidensintervall (1 α)100% konfidensintervall for µ A µ B : når A og B er kjent: [(x A x B ) ± z α når A = B =, men ukjente: [(x A x B ) ± t α,(n A+n B )s p når A og B er ukjente (ikke like): der [(x A x B ) ± t α,ν A n A + B n B ] 1 n A + 1 n B ] s A n A + s B n B ] (sa ν = /n A + sb /n B) [(s A /n A) /(n A 1)] + [(s B /n B) /(n B 1)] 54 To utvalg: A = B, men ukjente Hvis A B lager vi S A = 1 n A 1 n A (Xi A X A ) og SB = 1 n B 1 n B j=1 (X B j X B ) Hvis vi vet at A = B = så kan vi lage en estimator S p (pooled) basert på summen av kvadratavvikene i de to utvalgene: S p = na 1 n A + n B [ (Xi A X A ) + = (n A 1)S A + (n B 1)S B n A + n B der X A = 1 n A na X A i og X B = 1 n B nb j=1 X B j. n B j=1 (X B j X B ) ] 56 Konfidensintervall for µ A µ B for parvise observasjoner Hvis d og s d er gjennomsnittet og standardavviket til normalfordelte differanser av n par av tilfeldige observasjoner, så er et (1-α)100% konfidensintervall for µ D = µ A µ B d t α,(n 1) s d n < µ D < d + t α,(n 1) s d n hvor t α,(n 1) er verdien i t-fordelingen med n 1 frihetsgrader som har areal α til høyre, dvs. P(T > t α,(n 1) ) = α. Ser at dette er i tråd med ett utvalg, konfidensintervall for µ: x t α,(n 1) s n < µ < x + t α,(n 1) s n

15 57 Eksempel: Dekkslitasje Vil sammenligne slitasje til to typer bildekk, A og B. 1. Utstyr n A tilfeldig valgte biler med dekk av type A, og n B tilfeldig valgte biler med dekk av type B. X A i, i = 1,...,n A er slitasje (gj.snitt over 4 dekk) for A-dekk-bilene. X B j, j = 1,..., n B er slitasje (gj.snitt over 4 dekk) for B-dekk-bilene. X1 A, X A,...,X n A A, X1 B, X B,...,X n B B alle uavhengige.. Utstyr n tilfeldig valgte biler med to dekk av type A og to av type B. Xi A, i = 1,...,n er slitasje til type A-dekk (gj.snitt over to dekk). Xi B, i = 1,..., n er slitasje til de n tilhørende parene av type B-dekk (gj.snitt over to dekk). Xi A og Xi B er ikke uavhengige, typisk positivt korrelert. Parene (X1 A, X 1 B), (X A, X B),..., (X n A, X n B ) er uavhengige. Hvilken strategi er best? 59 Norske hoppdommere og Janne Ahonen Treneren til Janne Ahonen gikk (før OL) ut i pressen og mente at norske hoppdommere konsekvent gir Janne Ahonen lavere stilkarakterer enn andre dommere. Norsk Regnesentral kikket på tallene fra sesongene (t.o.m. OL) og fant at de var enig med Ahonens trener. Lenke til artikkel fra Forskning.no og mer og mer informasjon om gjennomsnittskarakterer finnes fra fagets hjemmeside. Vi ser på tall fra 36 hopprenn, gjennomsnittlig karakter til Ahonen fra norske dommere og fra internasjonale dommere (ikke norske og finske) Hvordan skal vi regne på dette? 58 Eksempel: Dekkslitasje (forts.) Valgte strategi : parvise observasjoner. n = 15 forsøk med observerte verdier for D i = Xi A Xi B : d i : 1.5, -0.5, 0.0, 0.8, 1., 1., 0.9, -0.3, 1.3, 0., -0.7, 0.7,.6, -0.3,.. Anta D A, D B,..., D n u.i.f, D i n(d; µ D, D ), der µ D og D er ukjente. Punktestimator for µ D : ˆµ D = D, estimat d = 0.7. Punktestimator for D : ˆ D = S D = 1 n 1 n (D i D), estimat s d = % konfidensintervall for µ D = E(D i ): α = 0.05, t α,n 1 = t 0.05,14 =.145, [ d ± t α,(n 1) s d n ] = [0.7 ±.145 = [0.18, 1.6] ]

16 61 Ahonen: to uavhengige utvalg X A 1, X A,..., X A n A er et tilfeldig utvalg fra en populasjon av stilkarakterer til Ahonen fra norske dommere. Antar normalfordelt med forventning µ A og varians A =. X B 1, X B,..., X B n B er et tilfeldig utvalg fra en populasjon av stilkarakterer til Ahonen fra internasjonale dommere (ikke norske og finske). Antar normalfordelt med forventning µ B og varians B =. Antar A-utvalget er uavhengig av B-utvalget! Lik, men ukjent varians: Estimator S p. Konfidensintervall [(x A x B ) ± t α,(n A+n B )s p 1 n A + 1 n B ] 63 Konfidensintervall for µ A µ B for parvise observasjoner Hvis d og s d er gjennomsnittet og standardavviket til normalfordelte differanser av n par av tilfeldige observasjoner, så er et (1-α)100% konfidensintervall for µ D = µ A µ B d t α,(n 1) s d n < µ D < d + t α,(n 1) s d n hvor t α,(n 1) er verdien i t-fordelingen med n 1 frihetsgrader som har areal α til høyre, dvs. P(T > t α,(n 1) ) = α. Ser at dette er i tråd med ett utvalg, konfidensintervall for µ: x t α,(n 1) s n < µ < x + t α,(n 1) s n 64 Studenter og bilkjøring Følgende tabell er tatt fra TMA445 spørreundersøkelsen. Her angir n antall studenter i utvalget som hadde sertifikat, og x antall studenter som svarte at de er bedre enn gjennomsnittet av Norges befolkning til å kjøre bil. x n x n Menn Kvinner Alle a) Finn punktestimat og 99% konfidensintervall for andelen av studenter som synes sine kjøreegenskaper er bedre enn gjennomsnittet. b) Finn punktestimat og 99% konfidensintervall for differensen mellom andelen av mannlige studenter og kvinnlige studenter som synes sine kjøreegenskaper er bedre enn gjennomsnittet.

17 65 Estimering av andel: ett utvalg X er antall suksesser i et binomisk forsøk med parametere antallet n og andelen p. Vi vil estimere p. (n er kjent.) Estimator ˆp = X n (intuitiv og SME), øving B3). E(ˆp) = p og Var(ˆp) = p(1 p) n. Tilnærmet (1 α)100% konfidensintervall for p (normaltilnærming): ˆp(1 ˆp) [ˆp ± z α ] n 66 Estimering av andel: to utvalg X A er antall suksesser i et binomisk forsøk med parametere antallet n A og andelen p A. X B er antall suksesser i et binomisk forsøk med parametere antallet n B og andelen p B. Vi vil estimere p A p B. Estimator ˆp A ˆp B = X A n A X B n B. E(ˆp A ˆp B ) = p A p B og Var(ˆp A ˆp B ) = p A(1 p A ) n A + p B(1 p B ) n B. Tilnærmet (1 α)100% konfidensintervall for p A p B (normaltilnærming): [(ˆp A ˆp B ) ± z α ˆp A (1 ˆp A ) n A + ˆp B(1 ˆp B ) n B ] : Konfidensintervall for varians La X 1, X,..., X n være et tilfeldig utvalg fra en populasjon som beskrives av en normalfordeling med forventning µ og varians. S = 1 n 1 n (X i X) er en estimator for (forventningsrett, men ikke SME). Størrelsen V = (n 1)S α er kjikvadrat-fordelt med n 1 frihetsgrader. 1 α α 0 χ (1 α ) ν χ α

18 69 9.1: Konfidensintervall for varians Et (1 α)100% konfidensintervall for er (n 1)S χ α,(n 1) < < (n 1)S χ 1 α,(n 1) hvor χ α,(n 1) er verdien i kjikvadrat-fordelingen med n 1 frihetsgrader som har areal α til høyre, dvs. P(V > χ α,(n 1)) = α, og χ 1 α,(n 1) er verdien i kjikvadrat-fordelingen med n 1 frihetsgrader som har areal α til venstre, dvs. P(V < χ 1 α,(n 1)) = α. Oppgave: se på Eksamen August 003, oppgave 1.

Foreleses onsdag 13.oktober, 2010

Foreleses onsdag 13.oktober, 2010 TMA440 Statistikk H010 Statistisk inferens: 9.4: Konfidensintervall for µ 8.7: Student-t fordeling 8.6: Fordeling til S Mette Langaas Foreleses onsdag 13.oktober, 010 Estimering Mål: finne sannheten om

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 9.4: Konfidensintervall for µ 8.7: Student-t fordeling 8.6: Fordeling til S 2 Mette Langaas Foreleses onsdag 13.oktober, 2010 2 Estimering Mål: finne sannheten

Detaljer

(utarbeidet av Mette Langaas), TMA4245 V2007

(utarbeidet av Mette Langaas), TMA4245 V2007 Kapittel 8 og 9 Ett- og toutvalgs estimering; statistisk inferens, forventningsretthet, punktestimat, intervallestimat og prediksjonsintervall, estimere forventningsverdi, differanse, andel og varians,

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,

Detaljer

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) TMA440 Statistikk H010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,

Detaljer

TMA4240 Statistikk H2015

TMA4240 Statistikk H2015 TMA4240 Statistikk H2015 Ett utvalg: estimere forventningsverdi og intervall [9.4] Student-t fordeling [8.6] Quiz fra SME og konfidensintervall Mette Langaas Institutt for matematiske fag, NTNU wiki.math.ntnu.no/emner/tma4240/2015h/start/

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må

Detaljer

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010 TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 9.6: Prediksjonsintervall 9.8: To utvalg, differanse µ 1 µ 2 Mette Langaas Foreleses mandag 18.oktober, 2010 2 Prediksjonsintervall for fremtidig observasjon,

Detaljer

Norske hoppdommere og Janne Ahonen

Norske hoppdommere og Janne Ahonen TMA440 Statistikk H010 9.8: To uvalg (siste del) 9.9: Parvise observasjoner 9.10-9.11: Andelser 9.1: Varians Mette Langaas Foreleses onsdag 0.oktober, 010 Norske hoppdommere og Janne Ahonen Janne Ahonen

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 9.8: To uvalg (siste del) 9.9: Parvise observasjoner 9.10-9.11: Andelser 9.12: Varians Mette Langaas Foreleses onsdag 20.oktober, 2010 2 Norske hoppdommere og Janne Ahonen Janne

Detaljer

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling Kapittel 8 Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling TMA4240 H2006: Eirik Mo 2 Til nå... Definert sannsynlighet og stokastiske variabler (kap. 2 & 3).

Detaljer

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering TMA4245 Statistikk Kapittel 8.1-8.5. Kapittel 9.1-9.3+9.15 Turid.Follestad@math.ntnu.no p.1/21 Har sett

Detaljer

Kapittel 2: Hendelser

Kapittel 2: Hendelser Kapittel 2: Hendelser FENOMEN Eksperiment Utfall Utfallsrom Eksperiment. Utfall. Eksperiment Utfall Hendelse Sannsynlighet: egenskaper, gunstige vs. mulige, relativ frekvens Sannsynlighet for mer enn en

Detaljer

TMA4240 Statistikk H2010 (22)

TMA4240 Statistikk H2010 (22) TMA4240 Statistikk H2010 (22) 10.11-10.12: Testing av andelser 10.13: Testing av varians i ett N utvalg Mette Langaas Foreleses onsdag 3.november, 2010 2 Laban strakk seg ikke lenger, men smaker den bedre?

Detaljer

TMA4240 Statistikk H2017 [15]

TMA4240 Statistikk H2017 [15] TMA4240 Statistikk H207 [5] Del 2: Statistisk inferens Populasjon og utvalg [8.] Observatorer og utvalgsfordelinger [8.2-8.3] Fordeling til gjennomsnittet og sentralgrenseteoremet [8.4] Normalplott [8.8]

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon Bo Lindqvist Institutt for matematiske fag 2 Kap. 9: Inferens om én populasjon Statistisk inferens har som mål å tolke/analysere

Detaljer

Estimering og hypotesetesting

Estimering og hypotesetesting Kapittel 10 Ett- og toutvalgs hypotesetesting TMA4245 V2007: Eirik Mo 2 Estimering og hypotesetesting Fenomen Bilkjøring Høyden til studenter Spørsmål Hvor stor andel av studentene synes de er flinkere

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 0, blokk II Løsningsskisse Oppgave Surhetsgrad i ferskvann Eksamen august 00, oppgave av 3 a) En god estimator

Detaljer

Estimering og hypotesetesting

Estimering og hypotesetesting Kapittel 10 Ett- og toutvalgs hypotesetesting TMA4240 H2006: Eirik Mo 2 Estimering og hypotesetesting Fenomen Bilkjøring Høyden til studenter Spørsmål Hvor stor andel av studentene synes de er flinkere

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer

Detaljer

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU Estimatorar Torstein Fjeldstad Institutt for matematiske fag, NTNU 11.10.2018 I dag Repetisjon Er dataa mine normalfordelt? Estimatorar Eigenskapar til S 2 Kahoot 2 Repetisjon Obervator Ein observator

Detaljer

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen Høgskolen i Telemark Institutt for økonomi og informatikk FORMELSAMLING 6005 Statistikk I Til bruk ved eksamen Per Chr. Hagen . Sannsynlighetsregning. Regneregler Komplementsetningen: Addisjonssetningen:

Detaljer

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2009 TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b5 Løsningsskisse Oppgave 1 Vi ønsker å finne ut om et nytt serum kan stanse leukemi.

Detaljer

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU Observatorar og utvalsfordeling Torstein Fjeldstad Institutt for matematiske fag, NTNU 08.10.2018 I dag Til no i emnet Observatorar Utvalsfordelingar Sentralgrenseteoremet 2 Til no i emnet definisjon av

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 9 Løsningsskisse Oppgave 1 a) Vi lar her Y være antall fugler som kolliderer med vindmølla i løpet av den gitte

Detaljer

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Eksamen desember 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet

Detaljer

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - Fornuftig verdi Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.

Detaljer

STK Oppsummering

STK Oppsummering STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Løsningsskisse Oppgave X er kontinuerlig fordelt med sannsynlighetstetthet f X (x) = { x exp( x ) x

Detaljer

STK Oppsummering

STK Oppsummering STK1100 - Oppsummering Geir Storvik 6. Mai 2014 STK1100 Tre temaer Deskriptiv/beskrivende statistikk Sannsynlighetsteori Statistisk inferens Sannsynlighetsregning Hva Matematisk verktøy for å studere tilfeldigheter

Detaljer

Fasit for tilleggsoppgaver

Fasit for tilleggsoppgaver Fasit for tilleggsoppgaver Uke 5 Oppgave: Gitt en rekke med observasjoner x i (i = 1,, 3,, n), definerer vi variansen til x i som gjennomsnittlig kvadratavvik fra gjennomsnittet, m.a.o. Var(x i ) = (x

Detaljer

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i Løsningsskisse TMA440 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland a, Sara Martino b Tlf: a 48 18 96, b 99 40 33 30 Eksamensdato: 30. november

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806

Detaljer

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100

Detaljer

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

Første sett med obligatoriske oppgaver i STK1110 høsten 2015 Første sett med obligatoriske oppgaver i STK1110 høsten 2015 Dette er det første obligatoriske oppgavesettet i STK1110 høsten 2015. Oppgavesettet består av fire oppgaver. Du må bruke Matematisk institutts

Detaljer

Kapittel 3: Studieopplegg

Kapittel 3: Studieopplegg Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere

Detaljer

Løsningsforslag oblig 1 STK1110 høsten 2014

Løsningsforslag oblig 1 STK1110 høsten 2014 Løsningsforslag oblig STK høsten 4 Oppgave I forbindelse med en studie av antioksidanter og antocyanider, ble innholdet av antocyan i 5 beger med blåbær målt. De målte verdiene var (i mg per gram): 55

Detaljer

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up! I dag I dag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve 3 a og b (inkl SME) Om eksamen (Truleg) 10 punkt.

Detaljer

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden. Estimeringsmetoder Momentmetoden La X, X 2,..., X n være uavhengige variable som er rektangulært fordelte på intervallet [0, θ]. Vi vet da at forventningsverdiene til hver observasjon og forventningen

Detaljer

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis μ 1 og μ. Vi trekker da ett utvalg fra hver populasjon. ST00 Statistikk for

Detaljer

Eksamensoppgave i TMA4245 Statistikk

Eksamensoppgave i TMA4245 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4245 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland Tlf: 48 22 18 96 Eksamensdato:??. august 2014 Eksamenstid (fra til): 09:00 13:00 Hjelpemiddelkode/Tillatte

Detaljer

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Vår 2017 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 3 Dette er den første av to innleveringer i blokk 2 Denne øvingen skal oppsummere pensum

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II I denne øvingen skal vi fokusere på hypotesetesting. Vi ønsker å gi dere

Detaljer

UNIVERSITETET I OSLO Matematisk Institutt

UNIVERSITETET I OSLO Matematisk Institutt UNIVERSITETET I OSLO Matematisk Institutt Midtveiseksamen i: STK 1000: Innføring i anvendt statistikk Tid for eksamen: Onsdag 9. oktober 2013, 11:00 13:00 Hjelpemidler: Lærebok, ordliste for STK1000, godkjent

Detaljer

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper Bo Lindqvist Institutt for matematiske fag 2 Kapittel 8: Sammenligning av grupper Situasjon: Vi ønsker

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 24. april Bjørn H. Auestad Oppsummering våren

Detaljer

1 Section 6-2: Standard normalfordelingen. 2 Section 6-3: Anvendelser av normalfordelingen. 3 Section 6-4: Observator fordeling

1 Section 6-2: Standard normalfordelingen. 2 Section 6-3: Anvendelser av normalfordelingen. 3 Section 6-4: Observator fordeling 1 Section 6-2: Standard normalfordelingen 2 Section 6-3: Anvendelser av normalfordelingen 3 Section 6-4: Observator fordeling 4 Section 6-5: Sentralgrenseteoremet Oversikt Kapittel 6 Kontinuerlige tilfeldige

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 21. april Bjørn H. Auestad Oppsummering våren

Detaljer

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER HØGSKOLEN I STAVANGER Avdeling for TEKNISK NATURVITEN- EKSAMEN I: TE199 SANNSYNLIGHETSREGNING MED STATISTIKK SKAPELIGE FAG VARIGHET: 4 TIMER DATO: 5. JUNI 2003 TILLATTE HJELPEMIDLER: KALKULATOR OPPGAVESETTET

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Oppgave 1 X er kontinuerlig fordelt med sannsynlighetstetthet f(x) = 2xe

Detaljer

Forslag til endringar

Forslag til endringar Forslag til endringar Bakgrunn: Vi har ingen forelesningar veka etter påske. Eg skal bort 18. og 19. april. Eksamen er 30.mai Forslag til endringar: Ekstra forelesningar onsdag 16.mars og onsdag 30 mars

Detaljer

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger

Kapittel 6: Kontinuerlige sannsynlighetsfordelinger Kapittel 6: Kontinuerlige sannsynlighetsfordelinger TMA4240 Statistikk (F2 og E7) Foreleses 15. september, 2004. µ µ µ + Basert på slides av Mette Langås p.1/16 6.1 Kontinuerlig uniform fordeling Kontinuerlig

Detaljer

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up! Plan vidare Onsdag Gjere ferdig kap 11 + repetisjon Fredag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve

Detaljer

Statistikk og dataanalyse

Statistikk og dataanalyse Njål Foldnes, Steffen Grønneberg og Gudmund Horn Hermansen Statistikk og dataanalyse En moderne innføring Kapitteloversikt del 1 INTRODUKSJON TIL STATISTIKK Kapittel 1 Populasjon og utvalg 19 Kapittel

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 27. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar 2013. Skrevet av Stian Lydersen 16 januar 2013

Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar 2013. Skrevet av Stian Lydersen 16 januar 2013 1 Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar 013. Skrevet av Stian Lydersen 16 januar 013 Vi antar at vårt utvalg er et tilfeldig og representativt utvalg for

Detaljer

Kap. 8: Utvalsfordelingar og databeskrivelse

Kap. 8: Utvalsfordelingar og databeskrivelse Kap. 8: Utvalsfordelingar og databeskrivelse Utvalsfordelingar Utvalsfordeling for gjennomsnitt (med kjent varians) ( X ) Sentralgrenseteoremet (SGT) Utvalsfordeling for varians (normalfordeling) Utvalfordeling

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Det er to populasjoner som vi ønsker å sammenligne. Vi trekker da et utvalg

Detaljer

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 3, blokk II Dette er den første av to innleveringer i blokk 2. Denne øvingen skal oppsummere

Detaljer

i x i

i x i TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 11, blokk II Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale

Detaljer

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene. Estimering 2 -Konfidensintervall Dekkes av kap. 9.4-9.5, 9.10, 9.12 og forelesingsnotatene. En (punkt-)estimator ˆΘ gir oss et anslag på en ukjent parameterverdi, men gir oss ikke noen direkte informasjon

Detaljer

Kort overblikk over kurset sålangt

Kort overblikk over kurset sålangt Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente

Detaljer

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som: Hypotesetesting. 10 og fore- Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte for å undersøke hypoteser (påstander) knyttet til parametre i sannsynlighetsfordelinger.

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig

Detaljer

Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner

Detaljer

DEL 1 GRUNNLEGGENDE STATISTIKK

DEL 1 GRUNNLEGGENDE STATISTIKK INNHOLD 1 INNLEDNING 15 1.1 Parallelle verdener........................... 18 1.2 Telle gunstige.............................. 20 1.3 Regneverktøy og webstøtte....................... 22 1.4 Oppgaver................................

Detaljer

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Høst 2007 TMA4240 Statistikk Høst 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b4 Løsningsskisse Oppgave 1 Eksamen juni 1999, oppgave 3 av 3 a) µ populasjonsgjennomsnitt,

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA440 Statstkk H00 Statstsk nferens: 9.6: Predksjonsntervall 9.8: To utvalg, dfferanse µ µ Mette Langaas Foreleses mandag 8.oktober, 00 Predksjonsntervall for fremtdg observasjon, normalfordelng For en

Detaljer

Oppfriskning av blokk 1 i TMA4240

Oppfriskning av blokk 1 i TMA4240 Oppfriskning av blokk 1 i TMA4240 Geir-Arne Fuglstad November 21, 2016 2 Hva har vi gjort i dette kurset? Vi har studert to sterkt relaterte grener av matematikk Sannsynlighetsteori: matematisk teori for

Detaljer

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Forelesing 27 Oppsummering. Torstein Fjeldstad Institutt for matematiske fag, NTNU Forelesing 27 Oppsummering Torstein Fjeldstad Institutt for matematiske fag, NTNU 18.04.2018 I dag Lineær regresjon (sjekk av modellantagelser) Praktisk informasjon Andre statistikk-kurs Oversikt over

Detaljer

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Dette er det andre settet med obligatoriske oppgaver i STK1110 høsten 2010. Oppgavesettet består av fire oppgaver. Det er valgfritt om du vil

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Analysere en observator for å finne ut noe om korresponderende

Detaljer

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002 Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002 Oppgave 1 a) En god estimator er forventningsrett og har liten varians. Vi tester forventningsretthet: E[ˆµ] E[Y ] µ E[ µ] E[ 1 2 X + 1 2 Y ] 1 2 E[X]

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 Ei bedrift produserer elektriske komponentar. Komponentane kan ha to typar

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 11 Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale begreper

Detaljer

TMA4245 Statistikk Eksamen august 2014

TMA4245 Statistikk Eksamen august 2014 TMA4245 Statistikk Eksamen august 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Oppgave 1 En bedrift produserer en type medisin i pulverform Medisinen selges på flasker

Detaljer

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf: Hypotesetesting Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf: 22 400 400 www.aschehoug.no 1 Oversikt Sannsynlighetsregning og statistikk

Detaljer

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind Forelesning 6: Punktestimering, usikkerhet i estimering Jo Thori Lind j.t.lind@econ.uio.no Oversikt 1. Trekke utvalg 2. Estimatorer og observatorer som stokastiske variable 3. Egenskapene til en estimator

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis

Detaljer

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer. Utvalgsfordelinger Vi har sett at utvalgsfordelinger til en statistikk (observator) er fordelingen av verdiene statistikken tar ved mange gjenttatte utvalg av samme størrelse fra samme populasjon. Utvalg

Detaljer

ST0103 Brukerkurs i statistikk Høsten Momentestimatoren og sannsynlighetsmaksimeringsestimatoren

ST0103 Brukerkurs i statistikk Høsten Momentestimatoren og sannsynlighetsmaksimeringsestimatoren ST0103 Brukerkurs i statistikk Høsten 2016 Momentestimatoren og sannsynlighetsmaksimeringsestimatoren (SME) Boka har bare ett eksempel med sannsynlighetsmaksimeringsestimatoren. Vi gjengir dette nedenfor,

Detaljer

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Eksamen desember 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlege stokastiske variabelen X ha fordelingsfunksjon (sannsynstettleik

Detaljer

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger Fordelinger, mer om sentralmål og variasjonsmål Tron Anders Moger 20. april 2005 1 Forrige gang: Så på et eksempel med data over medisinerstudenter Lærte hvordan man skulle få oversikt over dataene ved

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig

Detaljer

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 20. mars Bjørn H. Auestad Kp. 6: Hypotesetesting

Detaljer

Notasjon. Løsninger. Problem. Kapittel 7

Notasjon. Løsninger. Problem. Kapittel 7 3 Notasjon Kapittel 7 Funksjoner av stokastiske variabler Har n stokastiske variabler, X 1, X 2,..., X n, med kjent fordeling f( 1, 2,..., n ) og kumulativ fordeling F( 1, 2,..., n ). Ser på Y = u(x 1,

Detaljer

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Eksamensoppgave i TMA4240 / TMA4245 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 / TMA4245 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland Tlf: 48 22 18 96 Eksamensdato: 10. august 2017 Eksamenstid (fra til): 09.00-13.00

Detaljer

Kp. 9.8 Forskjell mellom to forventninger

Kp. 9.8 Forskjell mellom to forventninger andeler I analysene skal vi se på situasjonene der σx og σ Y er kjente; normalantakelse a σx og σ Y er ukjente men σ X = σ Y ; normalantakelse og b σx og σ Y er ukjente og σ X σ Y ; normalantakelse 3 og

Detaljer

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår Løsningsforslag ECON 130 Obligatorisk semesteroppgave 017 vår Andreas Myhre Oppgave 1 1. (i) Siden X og Z er uavhengige, vil den simultane fordelingen mellom X og Z kunne skrives som: f(x, z) = P(X = x

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST0 Innføring i statistikk og sannsynlighetsregning. Eksamensdag: Torsdag 9. mai 994. Tid for eksamen: 09.00 5.00. Oppgavesettet

Detaljer

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler STK1000 Uke 36, 2016. Studentene forventes å lese Ch 1.4 (+ 3.1-3.3 + 3.5) i læreboka (MMC). Tetthetskurver Eksempel: Drivstofforbruk hos 32 biler Fra histogram til tetthetskurver Anta at vi har kontinuerlige

Detaljer

TMA4240 Statistikk Høst 2018

TMA4240 Statistikk Høst 2018 TMA4240 Statistikk Høst 2018 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 5 Dette er andre av tre innleveringer i blokk 2. Denne øvingen skal oppsummere pensum

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Å analysere en utvalgsobservator for å trekke slutninger

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Fra første forelesning: Populasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg En delmengde av

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet

Detaljer

Innhold. Innledning. Del I

Innhold. Innledning. Del I Del I Innledning 1 Hva er statistikk?... 19 1.1 Bokas innhold 20 1.1.1 Noen eksempler 20 1.1.2 Historie 23 1.1.3 Bokas oppbygning 25 1.2 Noen viktige begreper 26 1.2.1 Populasjon og utvalg 26 1.2.2 Variasjon

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner

ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner ST0202 Statistikk for samfunnsvitere Kapittel 10: Inferens om to populasjoner Bo Lindqvist Institutt for matematiske fag 2 Kapittel 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to

Detaljer

TMA4240 Statistikk H2015

TMA4240 Statistikk H2015 TMA4240 Statistikk H2015 Funksjoner av stokastiske variabler (kapittel 7+notat) Fokus på start med kumulativ fordeling 7.2 Funksjon av en SV (inkludert en-entydighet). Fordeling til max/min (fra notat).

Detaljer

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent 1 Section 7-2: Estimere populasjonsandelen 2 Section 7-4: Estimere µ når σ er ukjent Kapittel 7 Nå begynner vi med statistisk inferens! Bruke stikkprøven til å 1 Estimere verdien til en parameter i populasjonen.

Detaljer