Hva er statistikk? TMA4240 Statistikk H2015. Denne forelesningen. Pensum

Like dokumenter
TMA4245 Statistikk Eksamen mai 2017

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

Estimering 1 -Punktestimering

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

TMA4240 Statistikk Høst 2015

Estimering 1 -Punktestimering

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

MOT310 Statistiske metoder 1, høsten 2011

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

ECON240 Statistikk og økonometri

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Høst 2009

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

) = P(Z > 0.555) = > ) = P(Z > 2.22) = 0.013

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Oppsummering

Kapittel 2: Hendelser

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

TMA4245 Statistikk Vår 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

TMA4240 Statistikk Høst 2016

Estimering 2. -Konfidensintervall

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

TMA4240 Statistikk Høst 2015

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

Oppgave 1 Hardheten til en bestemt legering er undersøkt med åtte målinger og resultatene ble (i kg/mm 2 ) som i tabellen til høyre.

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

Løsningsforslag Oppgave 1

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 4

TMA4245 Statistikk Eksamen august 2015

Forelesning Moment og Momentgenererende funksjoner

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

STK1100 våren 2017 Estimering

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

Hypotesetesting, del 4

Kapittel 7: Noen viktige sannsynlighetsfordelinger

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

TMA4240/4245 Statistikk 11. august 2012

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

Statistikk og økonomi, våren 2017

EKSAMEN. Oppgavesettet består av 5 oppgaver, hvor vekten til hver oppgave er angitt i prosent i oppgaveteksten. Alle oppgavene skal besvares.

TMA4240 Statistikk Høst 2016

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

TMA4240 Statistikk Høst 2016

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

Forelesning 4 og 5 Transformasjon, Weibull-, lognormal, beta-, kji-kvadrat -, t-, F- fordeling

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

Kapittel 8: Estimering

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

Kap. 9: Inferens om én populasjon

Forventningsverdi. MAT0100V Sannsynlighetsregning og kombinatorikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

EKSAMENSOPPGAVE. Mat-1060 Beregningsorientert programmering og statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

Econ 2130 Forelesning uke 11 (HG)

Kapittel 7: Noen viktige sannsynlighetsfordelinger

Kap. 9: Inferens om én populasjon

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Løsningsforslag til eksamen i STK desember 2010

Sammendrag i statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 5 Estimering. Målemodellen.

Noen vanlige. Indikatorfordeling: 1, dersom suksess. I mange situasjoner kan fenomenet vi ser på. 0, dersom ikke suksess

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

TMA4240 Statistikk 2014

Oversikt over konfidensintervall i Econ 2130

STATISTIKK :D INNHOLD

Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan

ST1201 Statistiske metoder

Løsningsforslag ST2301 øving 3

0.5 (6x 6x2 ) dx = [3x 2 2x 3 ] 0.9. n n. = n. ln x i + (β 1) i=1. n i=1

Oppgaven består av 9 delspørsmål, A,B,C,., som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<.. >>.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

TMA4245 Statistikk Eksamen 9. desember 2013

Lineær regresjonsanalyse (13.4)

LØSNING: Eksamen 28. mai 2015

UNIVERSITETET I OSLO

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

Modeller og parametre. STK Punktestimering - Kap 7. Eksempel støtfangere. Statistisk inferens. Binomisk fordeling. p X (x) = p x (1 p) n x

Mer om utvalgsundersøkelser

Oversikt over konfidensintervall i Econ 2130

8 (inkludert forsiden og formelsamling) Tegne- og skrivesaker, kalkulator, formelsamling (se vedlagt).

Oppgaver fra boka: X 2 X n 1

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

UNIVERSITETET I OSLO

Transkript:

Hva er statistikk? TMA440 Statistikk H015 Siste forelesig: oppsummerig og avslutig Statistikk har som mål å utvikle vår kuskap basert på isamlig og aalyse av empiriske data. To greer: Sasylighetsteori: matematisk studium av sasylighet for tilfeldige hedelser. Statistisk iferes: modeller og metoder for å samle i, beskrive, aalysere og fortolke umeriske data. Mette Lagaas Istitutt for matematiske fag, NTNU wiki.math.tu.o/emer/tma440/015h/start/ Tegig tatt fra http://www.earigzero.et - som å er flyttet til http://www.lab-iitio.com/ 1 / 63 1 / 63 Pesum Dee forelesige Walpole, Myers, Myers, & Ye 9. utg. Kap 1-3: Hele. Kap 4: 4.1-4.3 (til What if the fuctio is oliear?). Kap 5: Hele. Kap 6: 6.1-6.7. Kap 7: 7.1, 7.: Teorem 1 og Teorem 3, 7.3. Kap 8: 8.1-8.6, 8.8. Kap 9: 9.1-9.6, 9.8-9.1, 9.14. Kap 10: 10.1-10.10 (til og med et-utvalgs test for varias). Kap 11: 11.1-11.6 + estimerig av korrelasjo i 11.1. Notat om ordigsvariabler (www.math.tu.o/ joeid/tma440h11/ordigekstrem.pdf) Øvigee er pesum. Pla: gi e oppsummerig av de 11 temaee (kapitlee i læreboka) - gjeom eksamesspørsmål, formler og oversikter. Avslutte hver av bolk 1 og med e kort quiz. Me, kommer du til å lære oe ytt? Kommer du til å se sammeheger du ikke har sett før? Kommer du til å se hva du ka godt, og hva du må jobbe mer med? Kommer du til å se oe eksamesoppgaver? Kommer det til å bli vaskelig å holde kosetrasjoe ute å være aktiv? / 63 3 / 63

Bolk 1: ordsky Deskriptiv statistikk [1]: forstå data i tall, figurer og tabeller TMA445 Statistikk jui 015 Side 1 av 4 Eksame jui 015: Oppgave 1a (L). Oppgave 1 Dataplott 3 Noe resultater og defiisjoer Addisjossetige 1 P (A1... A ) =! P (Ai )! i<j P (Ai Aj ) + 0 +( 1)+1 P (A1... A ).! i<j<k P (Ai Aj Ak )... 1 Multiplikasjossetige P (A1... A ) = P (A1 )P (A A1 ) P (A A1... A 1 ). 0 1 Setige om total sasylighet 3 4 La B1,..., Bk være av utfallsrommet. Da er Figure 1: partisjo Parvise data fra e simultafordelig. k! P (A) = utfall P (A B (Bi ). variabler X (horisotalt) og Y (verfigur 1 viser parvise av toi )P stokastiske tikalt). a) Hvaregel vil du aslå at korrelasjoe mellom X og Y Bayes 4 / 63 er? Gi e kort begruelse. Forvetigsverdie og stadardavviket for hver av de to variablee har hel(br ) 1 visuelt. (Br A) r )PFigur tallsverdier. AslåPdisse verdiee vedpå(a B studere P (Br A) = P (A) = "k P (A Bi )P (Bi ) 5 / 63 Oppgave hvor B,..., B er e partisjo av utfallsrommet. Hedelser []: Kombiatorikk Hedelser []: Høysue og eksem 1 k Ata at A og C er uavhegige hedelser, og at B og C også er uavhegige hedelser. Vi betrakter e populasjo av 11-årige bar. I dee populasjoe har ma sett på forekomste av høysue og eksem. Defier to hedelser: I E: et tilfeldig valgt bar fra populasjoe har eksem. I H: et tilfeldig valgt bar fra populasjoe har høysue. La oss ata at vi i dee populasjoe har følgede sasyligheter: Setige om dobbelforvetig og -varias a) Ka A B og C være avhegige? Ka A B og C være avhegige? (Hit: Se f.eks. på situasjoe B C =.) E(X) = E{E(X YA )}. Ka A B og C være avhegige dersom A og B er disjukte? Var(X) = E{Var(X Y )} + Var{E(X Y )}. Kombiatorikk! = 1 er atall ma ter a permutere (orde) elemeter.! = ( 1) ( r + 1) er atall ordede utvalg a r r elemeter Pr = ( r)! velges blat ute tilbakeleggig.! Pr ( r ) = r!( r)! = r! = Cr er atall ikke-ordede utvalg a r r elemeter velges blat ute tilbakeleggig. P(E ) = 0.04 P(H) = 0.07 P(E H) = 0.009 Teg et Ve-diagram med de to hedelsee. Er hedelsee E og H uavhegige? Begru svaret. Blat de bara i populasjoe som ikke har eksem, velger vi tilfeldig ut ett bar. Hva er sasylighete for at dette baret ikke har høysue? 3 Eksame desember 010: Oppgave 1a (L). 6 / 63 7 / 63

Stokastisk variabel (SV) [3] Diskret stokastisk variabel Kotiuerlig stokastisk variabel X X Mulige verdier x: Mulige verdier x: Edelig eller tellbart mage Itervall eller hele R Eksempel: Eksempel: {0, 1,..., } [0, 1] eller [0, ) Sasylighetsfordelig: Sasylighetsfordelig: f (x) = P(X = x) for alle mulige x f (x) defiert for alle reelle x ved P(a < X < b) = b a f (x)dx Kumulativ fordelig: Kumulativ fordelig: F (x) = P(X x) = t x f (t) F (x) = P(X x) = x f (t)dt defiert for alle reelle x defiert for alle reelle x P(a < X b) = x (a,b] f (t) P(a < X b) = b a f (x)dx = F (b) F (a) = F (b) F (a) Hvis mulige verdier er heltall: Hvis f er kotiuerlig i x: f (x) = F (x) F (x 1) f (x) = F (x) To SV [3] La X og Y være diskret fordelte stokastiske variabler der X, Y {0, 1, }. La f (x, y) = P(X = x, Y = y) være simulta puktsasylighet for X og Y og ata at f (x, y) er som agitt i følgede tabell. x\y 0 1 0 0.10 0.5 0.15 1 0.06 0.15 0.09 0.04 0.10 0.06 Fi P(X > Y ). Fi (margial) puktsasylighet for X og for Y. Er X og Y uavhegige? Begru svaret! Eksame, august 014, oppgave a (L). 8 / 63 9 / 63 To stokastiske variabler [3] Fuksjoe f (x, y), er simulta sasylighetsfordelig for X og Y. Forvetig og varias [4] Diskret stokastisk variabel Kotiuerlig stokastisk variabel Margialfordeliger: Betigede fordeliger: g(x) = y f (x, y) og h(y) = x f (x, y) diskret g(x) = f (x, y)dy og h(y) = f (x, y)dx kotiuerlig f (y x) = f (x, y)/g(x), g(x) > 0 f (x y) = f (x, y)/h(y), h(y) > 0 Uavhegighet: X og Y uavhegige hvis og bare hvis Forvetig: E(X ), tygdepukt i fordelige, beste gjett på y fremtidig observasjo µ = E(X ) = x xf (x) µ = E(X ) = xf (x)dx µ g(x ) = E[g(X )] = x g(x)f (x) µ g(x ) = E[g(X )] = g(x)f (x)dx E(aX + b) = ae(x ) + b Varias: Var(X ), mål for spredig σ = Var(X ) = E[(X µ) ] = E(X ) µ [1ex] σ = x (x µ) f (x) σ = (x µ) f (x)dx Var(aX + b) = a Var(X ) Stadardavvik: SD(X ) = Var(X ) Mål for spredig på samme skala som origialobservasjoee. f (x, y) = g(x) h(y) for alle (x, y). 10 / 63 11 / 63

E(g(x)) [4] Vis at dersom e stokastisk variabel Y er kji-kvadratfordelt med v frihetsgrader, dvs. har sasylighetstetthet så er f (y) = 1 v v Γ( v )y 1 e y, y 0 E( Y ) = Eksame, august 015, oppgave 3b (M). Lieærkombiasjoer [4] Lieærkombiasjoer La Y = a ix i + b. Daer E(Y )= a i E(X i )+b, Var(Y )= j=1 Γ( v+1 ) Γ( v ). a i a j Cov(X i,x j )= i 1 a i Var(X i )+ a i a j Cov(X i,x j ). i= j=1 Kaskje aller viktigst: forvetig og varias til gjeomsitt av uavhegige, idetisk fordelte SV (tilfeldig utvalg). X 1,..., X u.i.f. med E(X i ) = µ og Var(X i ) = σ. X = 1 X i E( X ) = µ 1 / 63 Avhegighet [4] Defiisjo: Kovarias: Cov(X, Y ) = E[(X µ X )(Y µ Y )] = E(X Y ) µ X µ Y Korrelasjoskoeffisiet: Cov(X,Y ) ρxy = Var(X ) Var(Y ) Når bruker vi kovarias og korrelasjo? Mål på lieær avhegighet (11: lieær regresjo). Tregs år vi skal fie variase til e fuksjo av avhegige stokastiske variabler: Var(aX + by ) = a Var(X ) + b Var(Y ) + abcov(x, Y ). Uavhegighet: X og Y uavh. E[XY ] = E[X ]E[Y ] Hvis X 1,..., X er uavhegige er Cov[X, Y ] E[XY ] E[X ]E[Y ] =0 f (x 1,..., x ) = f (x 1 ) f (x ) = Brukes f.eks. til å fie SME. Fordeliger [5,6] Diskrete fordeliger: f (x i ) Biomisk, multiomisk, egativ biomial, geometrisk, hypergeometrisk, Poisso. Kotiuerlige fordeliger: Uiform, ormal, ekspoesial, gamma, khikvadrat, Studet-t. For hver fordelig: lære situasjoer der fordelige passer forstå hvorda f (x) fremkommer se hva E(X ) og Var(X ) er og forstå hvorfor lære å rege ut f (x), F (x) = P(X x), P(a < X b). 13 / 63 Var( X ) = σ 14 / 63 15 / 63

Tabeller og formeler i statistikk Beroulli-prosess 1 Noediskretesasylighetsfordeliger Biomisk fordelig f(x) =b(x;, p) =( x )px (1 p) x, x =0, 1,...,. E(X) =p, Var(X) =p(1 p), M X (t) =(pe t +1 p). Poissofordelig f(x) =p(x; µ) = µx x! e µ, x =0, 1,,... E(X) =µ, Var(X) =µ, M X (t) =e µ(et 1). 1. Eksperimetet består av gjetatte forsøk.. Hvert forsøk udersøker ma om e hedelse A itreffer (suksess) eller ikke (A =fiasko). 3. Sasylighete for hedelse A (suksess) kaller vi p, og dee er de samme fra forsøk til forsøk. 4. De gjetatte forsøkee er uavhegige av hveradre. Dette leder til tre fordeliger: Atall suksesser er biomisk fordelt. Atall forsøk til og med k suksesser er egativ biomisk fordelt. Atall forsøk til og med første suksess er geometrisk fordelt. Og e fjerde - hvis ma ser idelig i kategorier istedefor suksess/fiasko: multiomisk. 16 / 63 17 / 63 500 meter på skøyter: K015 oppgave a Ved verdesmesterskap på ekeltdistaser på skøyter går hver deltager to 500 meters løp, ett løp hvor deltagere har idre bae i siste svig og ett løp hvor deltagere har ytre bae i siste svig. Rekkefølge av deltagere baserer seg på summe av tidee på de to løpee. Tilsvarede regel beyttes også i olympiske leker. Dee regele ble iført fra og med verdesmesterskapet på Hamar i 1995. Tidligere ble rekkefølge av deltagere basert på ku et løp for hver deltager. Bakgrue for regele om at hver deltager skal gå to løp er at det ka være e fordel å ha siste ytre side løpere har stor fart i siste svig og i idre bae er krumige større e i ytre bae. I et mesterskap med deltagere, la Y i og Z i betege løpstidee for løper ummer i for løpee med heholdsvis siste ytre og siste idre. La videre X være atall av de løpere som har si raskeste løpstid i løpet med siste ytre, dvs. X er atall løpere som har Y i < Z i. Vi atar at X er biomisk fordelt, dvs. P(X = x) = b(x;, p) der p = P(Y i < Z i ). Uremodell Defiisjo: p = atall røde kuler atall kuler Prosedyre: Utfør gager trekk e kule tilfeldig registrer farge legg kula tilbake (ikke legg kula tilbake) Da er atallet røde kuler biomisk (hypergeometrisk) fordelt. Agi hvilke forutsetiger som må være oppfylt i situasjoe beskrevet over for at atagelse om at X er biomisk fordelt skal være korrekt. 18 / 63 19 / 63

Poisso-prosess Vi ser på om e hedelse itreffer eller ikke iefor et itervall eller e regio. 1. Atall hedelser som itreffer i et itervall eller i e spesifisert regio, er uavhegig av atall hedelser som itreffer i ethvert aet disjukt itervall eller regio.. Sasylighete for at e ekelt hedelse itreffer iefor et lite itervall eller lite regio, er proporsjoal med legde av itervallet eller størrelse på regioe, og er ikke avhegig av atallet hedelser som itreffer utefor itervallet eller regioe. χ3. -fordelig Sasylighete (kjikvadratfordelig) for at mer e e hedelse skal itreffe iefor et kort itervall eller lite regio er eglisjerbar. 1 f(x) = Dette leder til treγ(ν/) fordeliger: xν/ 1 e x/, x 0, ν =1,,... ( ) Atall hedelser ie et itervall eller ν/ 1 regio er E(X) =ν, Var(X) =ν, M X (t) = for t< 1 Poisso-fordelt. 1 t. Kommetar: Tid mellom Dersom X 1 to,...,x hedelser er uavhegige er ekspoesielt og ormalfordelte med fordelt. forvetig µ og varias σ har vi at Til til hedelse ummer k er gammafordelt. χ -fordelig (X i (kjikvadratfordelig) µ) er χ -fordelt med frihetsgrader, f(x) = Khikvadrat og (X i Studet-t X) σ 1 ν/ Γ(ν/) xν/ 1 e x/, x 0, ν =1,,... er χ -fordelt med 1 frihetsgrader, ( ) ν/ 1 for t< 1 σ Utledede fordeliger E(X) =ν, Var(X) - brukes =ν omtret, M X (t) bare = år vi starter med u.i.f. 1 t ormalfordelte variabler.. (X i X) og X er uavhegige. Kommetar: Dersom X 1,...,X er uavhegige og ormalfordelte med forvetig µ og varias σ har vi at t-fordelig (Studet t-fordelig) (X i µ) er χ -fordelt med frihetsgrader, σ ) (ν+1)/ Γ[(ν +1)/] f(x) = (1+ (XΓ(ν/) i X) x, <x<. πν ν er χ -fordelt med 1 frihetsgrader, E(X) σ =0hvis ν, Var(X) = ν ν hvis ν 3, M X(t) eksisterer ikke. Spesialtilfeller: (X ν =1gir i X) Cauchyfordelige. og X er uavhegige. ν = gir Normalfordelige. Kommetar: t-fordelig Dersom (Studet Z er stadard t-fordelig) ormalfordelt og V er χ -fordelt med ν frihetsgrader og Z og V er uavhegige, har vi at ) (ν+1)/ Γ[(ν +1)/] f(x) Z = er t-fordelt (1+ Γ(ν/) med ν frihetsgrader. x, <x<. V/ν πν ν Spesielt gir dette E(X) at =0hvis dersom νx, Var(X) = ν ν hvis ν 3, M 1,...,X er uavhegige og ormalfordelte X(t) medeksisterer forvetig ikke. µ og varias σ har vi at Spesialtilfeller: ν =1gir Cauchyfordelige. X µ ν = gir Normalfordelige. S/ er t-fordelt med 1 frihetsgrader, Kommetar: Dersom Z er stadard ormalfordelt og V er χ -fordelt med ν frihetsgrader og Z og V er uavhegige, har vi at der S = 1 1 (X i X). 0 / 63 / 63 Normalfordelig Størrelser som er ormalfordelt: viteskaplige måliger med målefeil, og fysiske størrelser (høyde, temperatur, edbør, oksygeopptak). Probability 0.999 0.997 0.99 0.98 0.95 0.90 0.75 0.50 0.5 0.10 0.05 0.0 0.01 0.003 0.001 Fuksjoer av SV [7] Normal Probability Plot 80 100 10 140 160 180 00 0 Data Vi atar at vi kjeer sasylighetsfordeligee til X 1,..., X. Hva er da sasylighetsfordeligee til Y = max{x 1,..., X } og Y = mi{x 1,..., X }. Y = l(x ) og Y = ax + b. Y = X1 + + X. Hvis vi vet dee, ka vi rege ut viktig iformasjo som for eksempel P(a < Y < b) og E[Y ]. 1 / 63 3 / 63

Fuksjoer av SV [7] 1. Direkte fra kumulativ fordelig P(Y y) = P(g(X ) y) og reg direkte for hvert tilfelle. Trasformasjosformler [kap. 7.: Teorem 7.1 og 7.3] : for fuksjoer av EN stokastisk variabel. Notat om Ordigsvariabler og ekstremvariabler : for flere uavhegige stokastiske variabler.. Ved å gå over i et ae verde (tilsvarede Laplace-trasformasjo fra Matematikk 4) Mometgeererede fuksjoer [kap. 7.3] : for lieærkombiasjoer av flere uavhegige stokastiske variabler. Fuksjoer av SV [7] Mometgeererede fuksjoer: E trasformasjo som tar oss over i et aet rom der er det ekelt å fie fordelige til Y = lieær kombiasjo av uavhegige stokastiske variabler. DEF: M X (t) = E(e tx ). Regeregel: MaX +b (t) = e bt M X (at) Hvis X1, X,..., X er uavhegige stokastiske variabler med mometgeererede fuksjoer M X1 (t), M X (t),..., M X (t), og la Y = X 1 + X + X. Da er M Y (t) = M X1 (t) M X (t) M X (t) Ka også ekelt fie mometer til Y ; d r M X (t) dt r t=0 = µ r. 4 / 63 E(X) = Fuksjoer av SV [7] 0 P (X > x)dx. k-parameter ekspoesiell familie f(x; θ) = h(x)c(θ)e k wi(θ)ti(x). 4 Noe resultater for fuksjoer av stokastiske variabler Trasformasjosformele E variabel: La Y = u(x), der fuksjoe u er stregt mooto og deriverbar for alle verdier av argumetet. La X = u 1 (Y ) = w(y ). Hvis X er kotiuerlig fordelt vil ogsåy være det. La f(x) være sasylighetstetthete til X og la g(y) være sasylighetstetthete til Y. Vi har da sammehege g(y) = f(w(y)) w (y). To variabler: La Y 1 = u 1 (X 1, X ) og Y = u (X 1, X ), der fuksjoee u 1 og u er stregt mootoe og deriverbare for alle verdier av argumetee. La X 1 = w 1 (Y 1, Y ) og X = w (Y 1, Y ). Hvis (X 1, X ) er kotiuerlig fordelt vil også (Y 1, Y ) være det, og vi har g(y 1, y ) = f(w 1 (y 1, y ), w (y 1, y )) J der J er determiate til Jacobi-matrise, J = w 1/ y 1 w 1 / y w / y 1 w / y. Lieærkombiasjoer La Y = a ix i + b. Da er E(Y ) = a i E(X i ) + b, MGF - Resultater (Formelsamlig) [7] Var(Y ) = j=1 a i a j Cov(X i, X j ) = i 1 a i Var(X i ) + a i a j Cov(X i, X j ). i= j=1 La X 1, X,..., X være uavhegige stokastiske variabler 34 Da har vi at for Y = X 1 + + X : Xi (x; µ i, σ i ) Y (y; µ i, σ i ) (Normal). Xi b(x; m i, p) Y b(y; m i, p) (Biomisk). X i p(x; µ i ) Y p(y; µ i) (Poisso). X i χ νi Y χ ν i (Kjikvadrat). Samtidig sier Setralgreseteoremet at e sum Y av uavhegige stokastiske variabler er tilærmet ormalfordelt år er stor (uavhegig av fordelig). 5 / 63 6 / 63 7 / 63

Kosistet estimator Setralgreseteoremet Vi sier at estimator ˆθ for parametere [8] θ er kosistet dersom ˆθ p θ. E estimator vil være kosistet dersom E(ˆθ) θ og Var(ˆθ) 0 år atall observasjoer går mot uedelig. Setralgreseteoremet [8] Setralgreseteoremet La X 1, X,... X være e følge av uavhegige idetisk fordelte stokastiske variabler med E(X i ) = µ og 0 < Var(X i ) = σ <. La X = 1 X i. Da vil for store X E( X) Var( X) = X µ σ/ være tilærmet stadard ormalfordelt. Mer presist: X µ σ/ d Z, der Z er stadard ormalfordelt. Slutskys setig Dersom X p a og g(x) er kotiuerlig i puktet a, så vil g(x ) p g(a). Bolk : ordsky 38 8 / 63 Statistisk iferes 9 / 63 Vi øsker å si oe geerelt om e populasjo basert på et isamlet tilfeldig utvalg fra populasjoe. Devore, side 33. Fra isamlig, bearbeidig, aalyse og fortolkig av umeriske data og måliger: trekke slutiger utover det ma har observert. Bakgru: vår kuskap i sasylighetsregig. 30 / 63 31 / 63

Ituisjo Studere feome i populasjo spirigsgrad av frø oksygeopptak me i Nord-Trødelag Parameter θ i valgt fordelig. suksessadel p i biomisk fordelig forvetet oksygeopptak me i Nord-Trødelag µ i ormalfordelig ˆθ fra ituisjo, SME eller MKE. Beste gjett. [ˆθ L, ˆθ U ] itervall der vi har stor tiltro til at sa θ ligger (kofidesitervall KI) H 0 : θ = θ 0 vs. H 1 : θ θ 0, og vi øsker ete å forkaste eller ikke forkaste H 0. Estimerig [9] Lære om ukjet parameter, θ, i e valgt fordelig (parametrisk), og må bygge på et represetativt tilfeldig utvalg (u.i.f data). E estimator er e fuksjo av stokastiske variabler, ˆθ = ˆθ(X 1, X,..., X ). Vi øsker at estimatore skal være forvetigsrett, dvs. E(ˆθ) = θ. Vi øsker e estimator med mist mulig varias, Var(ˆθ), og vi vil at variase skal avta år atall observasjoer,, øker. Vi fier estimatorer ved ituisjo, ved matematisk metode. Sasylighetsmaksimerigsestimatore (SME) fier det aslaget som gjør at de observasjoee vi har gjort (utvalget) har maksimal rimelighet. I tillegg til puktestimatet ka vi lage et (1 α) 100% kofidesitervall der vi har 95% tillit til at de sae parametere ligger. 3 / 63 33 / 63 Skøyteløp: SME og egeskaper Skriv opp rimelighetsfuksjoe (likelihoodfuksjoe) for p og beytt dee til å vise at sasylighetsmaksimerigsestimatore for p blir p = X. Vis at p er e forvetigsrett estimator for p og at Var( p) = p(1 p)/. K015 oppg b (M/L) SME: steg [9] 1. Øsker estimator for parameter θ, basert på. tilfeldig utvalg fra populasjo beskrevet ved kjet parametrisk fordelig f (x; θ). 3. Rimelighetsfuksjoe; L(x 1, x,..., x, θ) = f (x 1 ; θ)f (x ; θ) f (x ; θ). 4. Skal maksimere rimelighetsfuksjoe, lettere å jobbe med logaritme (grutall e=.718), l(x 1, x,..., x, θ) = l L(x 1, x,..., x, θ) 5. Deriverer logaritme til rimelighetsfuksjoe med hesy på θ. 6. Setter de deriverte lik 0 og løser ut for θ. Dette blir vår sasylighetsmaksimerigsestimator for θ. (Ka også sjekke at dette er maksimum og ikke miimum ved å derivere e gag til og se at dee.deriverte er egativ.) 34 / 63 Vi ka IKKE fie sasylighetsestimatore hvis vi ikke kjeer de parametriske forme av fordelige f (x; θ). 35 / 63

Ett utvalg: pukt- og itervallestimerig [9] Eksempler: høyde, oksygeopptak, IQ,... X 1, X,..., X er et tilfeldig utvalg fra e populasjo som beskrives av e ormalfordelig med forvetig µ og varias σ. ˆµ = X = 1 X i estimator for µ (ituitiv og SME). E(X ) = µ, Var(X ) = σ. Hvis σ er ukjet er S = 1 1 (X i X ) estimator for σ (forvetigsrett, me ikke SME). (1 α)100% kofidesitervall for µ år σ er kjet: [x z α σ, x + z α σ ] (1 α)100% kofidesitervall for µ år σ er ukjet: [x t α,( 1) s, x + t α,( 1) s ] Kofidesitervall for σ og σ For å vurdere øyaktighete av e y måleprosedyre gjør ma måliger av samme størrelse. La X 1, X,..., X betege resultatee av disse måligee, og ata at disse er et tilfeldig utvalg fra e ormalfordelig med forvetig µ og stadardavvik σ. Vi er her iteressert i verdie til σ, me vi skal ata at verdie til µ også er ukjet. La S = 1 1 (X i X ). Fra pesum er det da kjet at S ( 1)/σ er kji-kvadratfordelt med 1 frihetsgrader. Utled et (1 α)100 % kofidesitervall for σ. Utled også et (1 α)100 % kofidesitervall for σ. Eksame K015 Oppgave 3a (M+) 36 / 63 37 / 63 Kofidesitervall Ata X 1, X,..., X er et tilfeldig utvalg fra e populasjo med fordelig f (x; θ), med observerte verdier x 1, x,..., x. Vi vil fie et (1 α) 100% kofidesitervall for θ. 1. Fi estimator ˆθ for θ.. Bestem W = h(θ, ˆθ), der fuksjoe h er slik at W har kjet fordelig (ormal, kjikvadrat, Studet-t) og ikke er avhegig av adre ukjete parametere e θ. 3. Vi vet da at P(w 1 α < W < w α ) = 1 α, der w 1 α er verdie i fordelige til W som har areal α til vestre, og w α har areal α til høyre. 4. Løs ulikhetee mhp θ og sett dem samme igje slik at vi får P(ˆθ L < θ < ˆθ U ) = 1 α. 5. Resultat: (1 α) 100% kofidesitervall for θ er [ˆθ L, ˆθ U ] isatt verdiee x 1, x,..., x. Prediksjositervall for fremtidig observasjo, ormalfordelig [9] For e ormalfordelig med ukjet forvetigsverdi µ, me kjet varias σ, er et (1-α)100% prediksjositervall for e fremtidig observasjo x 0 gitt som x z α σ 1 + 1 < x 0 < x + z α 1 σ + 1 hvor z α er verdie i ormal-fordelige som har areal α til høyre, dvs. P(Z > z α ) = α. For e ormalfordelig med ukjet forvetigsverdi µ, og ukjet varias σ, er et (1-α)100% prediksjositervall for e fremtidig observasjo x 0 gitt som x t α,( 1) s 1 + 1 < x 0 < x + t α,( 1) s 1 + 1 hvor t α,( 1) er verdie i t-fordelige med 1 frihetsgrader som har areal α til høyre, dvs. P(T > t α,( 1) ) = α, og s = (x i x) 38 / 63 39 / 63

Situasjo Vil estimere 1 Ett utvalg Ett utvalg 3 To uavhegige utvalg 4 To uavhegige utvalg 5 To uavhegige utvalg Hva vi har Observator Fordelig µ kjet σ Z = X µ σ/ µ ukjet σ T = X µ S/ µ 1 µ kjete σ1 σ Z = (X 1 X ) (µ 1 µ ) σ 1 / 1 +σ / µ 1 µ ukjete σ1 σ T = (X 1 X ) (µ 1 µ ) S 1 / 1 +S / µ 1 µ ukjet σ 1 = σ = σ T = ormal t med 1 frihetsgr. ormal tilærmet t-fordelt med ν frihetsgr. (X 1 X ) (µ1 µ) t med Sp 1/1 +1/ ( 1 + ) frihetsgr. 6 To parutvalg differase µ d = µ 1 µ 7 Biomisk Adel p Z = 8 Biomisk To adeler p 1 p 9 Ett utvalg T = D µ d S d / P p p(1 p)/ σ - V = ( 1)S σ Z = ( P 1 P ) (p 1 p ) p1 (1 p 1 )/ 1 +p (1 p )/ t med 1 frihetsgr. tilærmet ormal tilærmet ormal Kjikvadrat med 1 frihetsgr. 40 / 63 41 / 63 (Neste) alltid på e eksamesoppgave Skøyteløp: hypotesetest Fi SME for gitt fordeligssituasjo. Vurdere estimator (E og Var). Fi kofidesitervall (helst 95%). Videre i dee oppgave skal vi beytte resultater fra 500 meter for me i olympiske leker i Sochi i Russlad i februar 014 til å vurdere om det er grulag for å hevde at det er e fordel å gå siste ytre. Her var det = 39 løpere som fullførte begge løpee, og av disse var det x = 4 som hadde si raskeste løpstid i løpet med siste ytre. I de videre utregigee ka du om ødvedig gjøre approksimasjoer, me du må i så fall begrue disse. Formuler e hypotesetest for situasjoe. Spesifiser H 0 og H 1, velg e passede testobservator og utled e beslutigsregel år sigifikasivået er α = 0.05. K015 oppg c (M) 4 / 63 43 / 63

Hypoteser, tester og feil Sigifikasivå og teststyrke Nullhypotese (H 0 ): Hypotese vi vil udersøke om vi har grulag fra data for å forkaste. Ieholder e bestemt verdi for e parameter. Alterativ hypotese (H 1 ): Hypotese vi aksepterer dersom vi forkaster ullhypotese. Ofte mer e e verdi for e parameter. Statistisk hypotesetestig: Udersøke om dataee gir tilstrekkelig "bevis" for at de alterative hypotese er sa. To typer tester: To-sidig test: H 0 : θ = θ 0 mot H 1 : θ θ 0 E-sidig test: H0 : θ = θ 0 mot H 1 : θ < θ 0, eller H0 : θ = θ 0 mot H 1 : θ > θ 0 To typer feil:] Type-I og type-ii-feil. H 0 sa H 0 falsk Aksepter H 0 Korrekt Type-II feil Forkast H 0 Type-I feil Korrekt Defierer α = P(Type I-feil) β = P(Type II-feil) Sigifikasivået for e test = P(Type I-feil) = α. Styrke for e test er sasylighete for å forkaste H 0 år et bestemt alterativ er sat (DEF 10.4), dvs. Styrke = 1 P(Type II-feil, bestemt alterativ) = 1 β. Har at Reduserer α β øker og 1 β (styrke) miker. Øker α miker, β miker og 1 β (styrke) øker. 44 / 63 45 / 63 Hypotesetest: steg [10] P-verdi [10] Situasjo (ett eller ut utvalg, ormal eller biomisk, forvetig eller adel eller varias). Bestem ull- og alterativ hypotese. Velg testobservator og forkastigsområde. Beregiger: sett i data og bereg verdi for testobservator. Forkast eller behold ullhypotese. E P-verdi er det laveste ivået hvor de observerte verdie til testobservatore er sigifikat. Utregig: P-verdi = P(for det vi har observert eller oe verre H 0 er sa) Ka brukes til å bestemme om ullhypotese skal forkastes eller beholdes. Er p verdie midre e valgt sigifikasivå forkastes ullhypotese. NB: dette krever at vi ka rege med kumulativ fordelig, og for khikvadrat og Studet-t har vi ikke det i tabellee våre. Derfor blir dette oe gager litt vaskelig å spørre om på eksamesoppgaver. 46 / 63 47 / 63

Teststyrke, illustrasjo [10] Tester hypotese H 1 : µ = µ 0 mot H 1 : µ < µ 0, for X 1, X,..., X ormalfordelt med forvetig µ og kjet varias σ. testobservator: Z 0 = X µ σ. Forkaster H 0 dersom z 0 < z α, eller ekvivalet x < k, der k = µ 0 z α σ/. Ata sa verdi µ = µ 1, hva er teststyrke 1 β? Areal:α Areal:β µ 1 k µ 0 σ Ett utvalg: test for µ, σ kjet [10] Geerell fremgagsmåte Kvalitetskotroll av skruer 0 X 1, X,..., X u.i.f. ormal(µ, σ) der σ er Stikkprøve (utvalg) av = 10 skruer, atar kjet. ormalfordelig og kjeer σ =0.1mm. 1 To-sidig test Er gru til å tro at skruee som produseres ikke er 15 mm lage? H 0 : µ = µ 0 vs. H 1 : µ µ 0 H 0 : µ = 15 vs. H 1 : µ 15 Sigifikasivå α bestemmes. Velger α = 0.05 3 Testobservator Z 0 = X µ 0 σ/ er uder H 0 stadard ormalfordelt Forkast H 0 hvis z 0 > z α eller z 0 < z α. 4TMA440 z α Statistikk z 0.05 = 1.96 Observerer x fra utvalget (stikkprøve) x = 15.05 mm. Side 4 av 5 Bereger z = x µ 0 σ/ z 0 = 15.05 15 0.1/ 10 = 1.58 0 Sammeliger z α, z 0 og z α -1.96<1.58<1.96 Forkast H 0 og kokluder med H 1, eller behold 10 H 0. 5 P-verdi = P(for 0 det vi har observert eller oe verre H 0 er sa) Log likelihood fuctio 30 40 50 Beholder H 0. Har ikke sterke ok bevis for at µ 15mm. P-verdi=0.11 Forkast H[0] Aksepter H[0] 60 48 / 63 70 49 / 63 Test vs. tosidig itervall [10] 80 0 1 3 4 5 6 7 8 9 10 Parameter µ Lieær regresjo [11]: eksame desember 01, oppg 3 Oppgave 3 800 m for me i OL X1, X,..., X er legde på skruer. Ata at X1, X,..., X er u.i.f, med X i (x i ; µ, σ = 0.1). Estimerig Hypotesetest Gi et aslag (puktestimat) og itervall (kofidesitervall) der vi har 95% tillit til at sa Udersøk om det er gru til å tro at de produserte skruee ikke er 15 mm lage (test hypotese). legde for produserte skruer ligger. Bruk sigifikasivå 5%. H 0 : µ = 15 vs. H 1 : µ 15 Z 0 = X µ σ/ er stadard ormalfordelt 95% kofidesitervall for µ. x Forkast H 0 hvis z 0 > z α eller z 0 < z α. Behold H 0 hvis z α < z 0 < z α dvs. behold hvis z α σ < µ < x + z α σ x z α σ < µ 0 < x + z α σ 95 % kofidesitervall: [14.99, 15.11] z 0 = 1.58, z 0.05 = 1.96, dermed ikke forkast H 0. p-verdi 0.11. Hvis et (1 α)100% kofidesitervall ieholder µ0 vil vi med e tosidig hypotesetest med sigifikasivå α ikke forkaste H 0 på ivå α. Hvis et (1 α)100% kofidesitervall ikke ieholder µ0 vil vi med e tosidig hypotesetest med sigifikasivå α forkaste H 0 på ivå α. Figure viser viertidee på 800 m løpig for me i alle Olympiske Leker (OL). Time (Secods) 135 130 15 10 115 110 105 100 1880 1900 190 1940 1960 1980 000 00 Year Totalt er det =8viertider. Vi lar Y i være viertide i OL ummer i, ogx i årstallet for OL ummer i. Viatarfølgederegresjosmodellforviertidee: Y i = α + βx i + ϵ i, ϵ i N(0, σ ). Itilleggatasatstøyleddeeϵ 1,..., ϵ er uavhegige. 50 / 63 51 / 63

Lieær regresjo [11] Modell: Y = α + βx + ε der ε er ormalfordelt med E(ε) = 0 og Var(ε) = σ. Gitt utvalget {(x i, Y i ); i = 1,..., }, så er miste kvadratsum estimatoree A og B for koeffisietee α og β fies ved å miimere kvadratavviket (Y i A Bx i ). B = (x i x)y i (x i x) A = Ȳ B X E forvetigsrett estimator for σ er TMA440 Statistikk Side 5 av 5 Lieær regresjo (forts) a) Gi e kort forklarig av miste kvadraters metode (også kalt miste kvadratsums metode eller method of least squares) for lijetilpasig. Vis at dee metode gir estimatorer: ˆα = Ȳ ˆβ x, ˆβ = xiyi xȳ x i x der gjeomsittee er Ȳ = 1 Yi og x = 1 xi. E alterativ skrivemåte for estimatore av stigigstallet er ˆβ = (xi x)yi (xi x). Det oppgis at Ȳ =109.6, x =1954.5, (xi x)yi = 594 og (xi x) =36517.Et estimat på variase til støyleddee er s =3.40. b) Det ka vises at ( T = ˆβ β) s/ t (xi x) Bruk dette resultatet til å utlede et 95 proset kofidesitervall for β. Reg ut kofidesitervallet ved bruk av tall oppgitt over. Vi vil predikere viertide i este OL: 016 i Brasil. og V = ( )S σ S = (Y i A Bx i ) er kjikvadrat-fordelt med frihetsgrader. c) Reg ut predikert viertid i 016. Fi et 95 proset prediksjositervall for viertide i 016. d) Bruk modelle til å aslå året da 90-sekudersgrese brytes, altså det første året da viertide er uder 90 sekuder. Vurder modellatakelsee som gjøres. Hvilke metoder ka brukes for å udersøke atakelsee? 5 / 63 53 / 63 Iferes i liær regresjo [11] A er ormalfordelt med E(A) = α og Var(A) = t-fordelt med frihetsgrader. σ x i A α (x i x), slik at T = x S i (x i x) B er ormalfordelt med E(B) = β og Var(B) = σ (x i x) (avhegig av desig), slik at B β T = S 1/ er t-fordelt med frihetsgrader. (x i x) Aktuell hypotese: β = 0 betyr ige lieær sammeheg mellom E(Y x) og x. Bestemmelseskoeffisiete R gir et mål på hvor godt de lieære modelle passer til et gitt datasett. R [0, 1], og år R er ær 1 passer de lieære modelle godt. Kofidesitervall for regresjoslije. Prediksjositervall for y observasjo. µ Y x0 [ Y ˆ 0 ± t α/,( ) S 1 + (x 0 x) (x i x) ] Y 0 [ Y ˆ 1 0 t α/,( ) S 1 + + (x 0 x) (x i x) ] er Lieær regresjo [11]: Formelsamlige 6 Noeresultaterfraregresjosaalyse La Y 1,...,Y være uavhegige variabler med samme varias σ og forvetigsverdier E(Y i )=α + βx i, i =1,...,. Miste kvadratsumsestimatoree for α og β er da ˆβ = (x i x)y i (x i x) = (x i x)(y i Ȳ ) (x i x), ˆα = Ȳ ˆβ x, og e forvetigsrett estimator for σ er gitt ved S = 1 (Y i ˆα ˆβx i ). Dersom i tillegg Y 1,...,Y er ormalfordelte vil ( )S = 1 (Y σ σ i ˆα ˆβx i ) være χ -fordelt med frihetsgrader. Det ka også vises at ( )S /σ er uavhegig av ˆα og ˆβ. 54 / 63 55 / 63

Tema (kapittel i læreboka) 1 Beskrivede statistikk (deskriptiv). Hedelser: disjukte, betiget, uavhegige, total sasylighet, Bayes teorem. 3 Stokastisk variabel, sasylighetfordelig f (x), kumulativ sasylighetsfordelig F (x), flerdimesjoale sasylighetsfordeliger, samvariasjo: uavhegighet, kovarias og korrelasjo. 4 Forvetig og varias: forståelse og regeregler 5+6 Diskrete og kotiuerlige sasylighetsfordeliger: forståelse, utregig av puktsasylighet, kumulativ sasylighet, idetifikasjo av fordelig. 7 Fuksjoer av stokastiske variable: trasformasjosformel, ekstremverdier og mometgeererede fuksjoer. 8 Utvalgsfordeliger, setralgreseteoremet, ormalplott. 9 Estimerig: sasylighetsmaksimerigsestimator, evaluerig av estimatorer: forvetigsretthet og mist varias, itervallestimerig: kofidesitervall og prediksjositervall. 10 Hypotesetestig: H 0 og H 1, type I og type II feil, forkastigsområde, p-verdi, styrkefuksjo, atall observasjoer. 11 Lieær regresjo: modell, miste kvadratsums estimatorer, forståelse, hypotesetest og kofidesitervall, prediksjositervall, R. Noe eksamesoppgavespørsmål som er lette (NB: Mettes subjektive meig. Noe ka syes SME er lett?) K015: 1a, a. V015: 1a, a. H014: 1ab, a, 3a. K014: 1ab. V014: ab. H013: a. K013: 1a, a. Har ikke fått sett på de mellom her. H010: 1a, a, 3a, 4a. Hvis du ikke får til disse bør du komme på veiledigtimee vi har satt opp, eller ta kotakt med faglærer, så skal vi sette opp e pla for deg. 56 / 63 Setralt Hedelser; vediagram, betiget sasylighet, total sasylighet. Utregig av puktsasylighet/sasylighetstetthet og kumulativ sasylighet i e-dimesjoal sasylighetsfordelig. Bruk av tabell for ormal, biomisk og Poisso i formelsamlige. Forstå forvetig og varias, og kue rege ut forvetig og varias til liærkombiasjo av stokastiske variabler. Setralgreseteoremet. Forstå begrepet estimerig. Ekel evaluerig av estimatorer (forvetigsrett og mist mulig varias). Forstå at e estimator er e stokastisk variabel. Utlede kofidesitervall for µ i ormalfordelige med kjet varias. Kue sette opp H 0 og H 1 og vite hva type-i- og type-ii-feil er. Kjee modelle for ekel lieær regresjo, og kue rege ut estimat for stigigstall og skjærigspukt (fra formel i formelsamlige). 57 / 63 De vaskeligste temaee - dvs. temaee det er lettest å lage vaskelige oppgaver med. Disjukt, uavhegig, simultafordelig. Trasformasjo av variabler, mi/max, mometgeererede fuksjoer (7). Prediksjositervall? Styrkefuksjo (10). Komplekse situasjoer med lieær regresjo (11). 58 / 63 59 / 63

Noe eksamesoppgavespørsmål som er vaskelige (NB: Mettes subjektive meig. Noe ka syes kombiatorikk og kortspill er vaskelig. Noe syes geerelt tig som skal forklares eller tolkes er vaskelig.) K015: e, 3c. V015: a, 3d. H014: 3de. K014: 3cd. V014: 1cd, e. H013: c. K013: c, 4. Har ikke fått sett på de mellom her. H010: c, 4c. Oppkjørig til eksame Eksameoppgaver med fasit fra www-side. Øvigsoppgaver med lf fra www-side. Videoee fra forelesigee - og pdf-fil med class otes fra halvparte av timee (de Mette har skrevet på smartpodium). Forhåpetligvis blir også oe videoer laget i studio tilgjegelige (fra www-side). Veiledig før eksame: Madagee 3. og 30. ovember, 7. desember kl 10.15-1.00 i S8. Torsdag 10. desember kl 9.15-1 i S8. Fredag 11. desember kl 9.15-1 i S8. Madag 14. desember kl 9.15-1 i S6. Gult A5 ark (ta på forelesig, eller hete i 7. etg, setralbygg ) Orgaiserig av kuskap, sammedrag. Persolig formelsamlig. Trygghet, forståelse fremfor pugg. 61 / 63 60 / 63 Eksame Til slutt Tirsdag 15. desember kl 9.00-13.00. Tillatte hjelpemidler: Gult A5 ark med ege hådskreve otater (stemplet av Istitutt for matematiske fag). Fås på Istituttkotoret matematiske fag, 7.etg., setralbygg. Bestemt ekel kalkulator. Tabeller og formler i statistikk (Tapir). K. Rottma: Matematisk formelsamlig. Etter eksame: Løsigsforslag samme dag fra www-side vår. Rettemal legges ut samme med karakteroversikt. Sjekk selv atall poeg vha rettemale før du ber om begruelse eller klager! Sykdom? Kotiuasjoseksame avholdes i august 016. I dag er siste sjase til å svare på spørreudersøkelse i faget (vier av gavekort trekkes på madag og aoseres på hjemmeside - viere mailes). Oppsummerig av oe av svaree deres vil lekes opp fra hjemmeside. Hvis du (etter eksame) har lyst til å lære mer statistikk - ka vi abefale TMA465 Stokastiske prosesser (H), TMA4455 Avedt statistikk (V- ikke så matematisk) og TMA467 Lieære statistiske modeller (V- matriser, matematisk orietert). Lykke til på eksame! Håper å se deg på veiledigestimee. 6 / 63 63 / 63