(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
|
|
- Halvor Berntsen
- 4 år siden
- Visninger:
Transkript
1 FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b) For klassifikasjon brukes vanligvis 0-1 tap: L(y, ŷ) = I(y = ŷ) der I( ) er indikatorfunksjonen. Den optimale prediktor basert på input variable x er da Ŷ = argmax k Pr(Y = k x). 2 Multippel lineær regresjon (a) Modell: Y i = β 0 + β 1 x i1 + + β p x ip + ɛ i ; i = 1, 2,..., n ; der x ij -ene er kjente tall og ɛ i -ene er uavhengige og N(0, σ 2 )-fordelte. (b) Matriseform: Y = Xβ + ε der Y = (Y 1,..., Y n ) T og β = (β 0,..., β p ) T er henholdsvis n- og (p + 1)- dimensjonale vektorer, og X = {x ij } (med x i0 = 1) er en n (p + 1)-dimensjonal matrise. (c) Minste kvadraters estimator for β er ˆβ = (X T X) 1 X T Y. (d) La ˆβ = ( ˆβ 0,..., ˆβ p ) T. Da er ˆβ j -ene normalfordelte og forventningsrette, og Var( ˆβ j ) = σ 2 c jj og Cov( ˆβ j, ˆβ l ) = σ 2 c jl der c jl er element (j, l) i (p + 1) (p + 1) matrisen C = (X T X) 1. (e) La Ŷi = ˆβ 0 + ˆβ 1 x i1 + + ˆβ p x ik, og sett SSE = n (Y i Ŷi) 2. Da er S 2 = SSE n (p+1) en forventningsrett estimator for σ 2, og [n (p + 1)]S 2 /σ 2 χ 2 n (p+1). Videre er S 2 og ˆβ uavhengige. (f) La SE( ˆβ j ) 2 være den variansestimatoren for ˆβ j vi får ved å erstatte σ 2 med S 2 i formelen for Var( ˆβ j ) i punkt (b). Da er ( ˆβ j β j )/SE( ˆβ j ) t n (p+1). 1
2 (g) Vi kan teste hypotesen H 0 : β 1 = β 2 = = β p = 0 ved å bruke testobservatoren F = (SST SSE)/p SST/(n p 1) der SSE = n (y i ŷ i ) 2 og SST = n (y i ȳ) 2. Under H 0 er F F -fordelt med p og n p 1 frihetsgrader. (h) Vi kan teste hypotesen H 0 : β i1 = β i2 = = β iq = 0 ved å bruke testobservatoren F = (SSE 0 SSE)/q SSE/(n p 1) H 0 Fq,n p 1 der SSE 0 = n (y ŷ i) 2 når ŷ i er beregnet under H 0 mens SSE er tilsvarende for full modell. 3 Maksimum likelihood metoden Anta at Y 1, Y 2,..., Y n har simultan punktsannsynlighet/sannsynlighetstetthet f(y 1, y 2,..., y n θ), der θ = (θ 1,...., θ d ) er en parametervektor (skalar hvis d = 1). Vi antar at f(y 1, y 2,..., y n θ) tilfredsstiller visse deriverbarhetsbetingelser. (a) Gitt observerte verdier Y i = y i ; i = 1,..., n; er likelihood-funksjonen L(θ) = f(y 1, y 2,..., y n θ) og loglikelihood-funksjonen l(θ) = log L(θ). (b) Maksimum likelihood estimatet er den verdien av θ som maksimerer L(θ) eller ekvivalent maksimerer l(θ). Hvis vi erstatter de observerte y i -ene med de stokastiske Y i -ene, får vi maksimum likelihood estimatoren. (c) Maksimum likelihood estimatet ˆθ = (ˆθ 1,...., ˆθ d ) er en løsning av ligningene s j (θ) = 0; j = 1,..., d; der s j (θ) = ( / θ j )l(θ) er score-funksjonene. Vektoren av scorefunksjoner er s(θ) = (s 1 (θ),..., s d (θ)) T. (d) Den observerte informasjonsmatrisen J(θ) er d d matrisen med element (i, j) gitt ved J ij (θ) = 2 θ i θ j l(θ). Den forventede informasjonsmatrisen (eller Fishers informasjonsmatrise) Ī(θ) er d d matrisen med element (i, j) gitt ved Īij(θ) = E[ J ij (θ)]. For uavhengige og identisk fordelte observasjoner har vi at Ī(θ) = ni(θ) der I(θ) er forventet informasjon til én observasjon. (e) Når ligningene i punkt (c) ikke har en eksplisitt løsning, kan vi finne maksimum likelihood estimatet ved å bruke Newton-Raphsons metode: θ (s+1) = θ (s) + J 1 (θ (s) )s(θ (s) ), 2
3 ved å bruke Fishers scoringsalgoritme: θ (s+1) = θ (s) + Ī 1 (θ (s) )s(θ (s) ), eller ved passende modifikasjoner av disse. (f) Når vi har tilstrekkelig mye data, er ˆθ i tilnærmet normalfordelt med forventning θ i og med varians lik det i-te diagonalelementet til Ī 1 (θ). Kovariansen mellom ˆθ i og ˆθ j er tilnærmet lik element (i, j) i Ī 1 (θ). Vi kan estimere varianser/kovarianser ved å sette inn ˆθ for θ i Ī 1 (θ) eller i J 1 (θ). 4 Modell seleksjonskriterier (a) Frihetsgrader: Antall frie parametre i en modell. For modeller der ŷ = Sy, er antall frihetsgrader lik Trase(S) = i S ii. (b) AIC er definert ved AIC = 2l( ˆθ) + 2 θ der θ er antall frie parametre i modellen. (c) BIC er definert ved BIC = 2l( ˆθ) + log(n) θ. 5 Noen andre metoder for regresjon (a) K-nærmeste nabo regresjon er definert ved ˆf(x 0 ) = 1 K x i N 0 y i der N 0 {x 1,..., x n } som inneholder de K nærmeste punkter til x 0. (b) Kjernemetoder (for eksempel lokal regresjon) er konseptuelt som K-nærmeste nabo regresjon, men påvirkning av en observasjon avhenger av avstanden fra interessepunktet, w i = 1 ( ) h w xi x 0 h der x i er observasjonen og x 0 interessepunktet. Typiske kjerner w(z) er Normal, 1 2π exp{( z 2 /2)}, støtte R; Rectangular, 1/2, støtte ( 1, 1); Epanechnikov, 3 4 (1 z2 ), støtte ( 1, 1); Biquadratic, (1 z2 ) 2, støtte ( 1, 1); Tricubic, (1 z 3 ) 3, støtte ( 1, 1); 3
4 (c) Ridge regresjon: Minimer mhp β ( ) 2 n p h(β) = y i β 0 β j x ij + λ (d) Lasso regresjon: Minimer mhp β ( ) 2 n p h(β) = y i β 0 β j x ij + λ p β 2 j p β j (e) Kubisk spline: Stykkevis polynomisk med basisfunksjoner b 0 (x) =1, b 1 (x) = x, b 2 (x) = x 2, b 3 (x) = x 3, b 3+k (x) =(x c k ) 3 +, k = 1,..., K (f) Tre-baserte metoder: f(x) = M m=1 c mi(x R m ) der R p = R 1 R 2 R M og regioner er definert gjennom sekvensiell oppsplitting basert på én variabel om gangen. (g) Bagging og random forrest: ˆf avg (x) = 1 B ˆf b (x) B b=1 der ˆf 1 (x), ˆf 2 (x),..., ˆf B (x) er B ulike prediktorer basert på ordinær bootstrapping (bagging) eller der oppsplitting kun vurderes blandt en delmengde av forklaringsvariablene (random forrest). (h) Nevrale nett med ett latent lag: f(x) = β 0 + M m=1 β kσ(α T mx). 6 Noen metoder for klassifikasjon (a) K-nærmeste nabo klassifikasjon er definert ved Pr(Y = j X = x 0 ) = 1 I(y i = j) K x i N 0 der N 0 {x 1,..., x n } som inneholder de K nærmeste punkter til x 0. (b) Logistisk regresjon: Y {0, 1} og Pr(Y = 1 x) = ext β 1 + e xt β (c) Bruk av Bayes teorem for klassifikasjon Pr(Y = k X = x) = = 1 Pr(Y = 0 x). π kf k (x) K l=1 π lf l (x). (i) LDA: f k (x) = p(x y = k) = N(µ k, Σ). (ii) QDA: f k (x) = p(x y = k) = N(µ k, Σ k ). 4
5 7 Dimensjonsreduksjon (a) Prinsipale komponenter: 1. prinsipale komponent definert gjennom z 1 = φ T 1 x der φ 1 er valgt slik at var(z 1 ) er størst mulig. (b) Partial least squares: Bruker også responsen til å definere de transformerte variable. 8 Hierarkisk klusteranalysen (a) Dekomponering av total dissimilarity-en, d(i, i ) = ij K K d(i, i ) + d(i, i ) k=1 G(i)=k G(i )=k k=1 G(i)=k G(i ) k der G(i) angir gruppen som i-te observagjon tilhører, K er totalt antall grupper od d(i, i ) = i d j(x ij, x i j)) er dissimilarity-en mellom observasjoner i og i. Her er x ij j-ne delen av observasjonen i. (b) Dissimilarity measures mellom grupper: single link, min i G,i G d(i, i ) complete link, max i G,i G d(i, i ) average link, 1 n G n G i G i G d(i, i ). 5
(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
Detaljerj=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.
FORMELSAMLING TIL STK2120 (Versjon av 30. mai 2012) 1 Enveis variansanalyse Anta at Y ij = µ + α i + ɛ ij ; j = 1, 2,..., J i ; i = 1, 2,..., I ; der ɛ ij -ene er uavhengige og N(0, σ 2 )-fordelte. Da
DetaljerFORMELSAMLING TIL STK1100 OG STK1110
FORMELSAMLING TIL STK1100 OG STK1110 (Versjon av 11. november 2017) 1. Sannsynlighet La A, B, A 1, A 2,..., B 1, B 2,... være begivenheter, dvs. delmengder av et utfallsrom Ω. a) Aksiomene: Et sannsynlighetsmål
DetaljerSTK Maskinlæring og statistiske metoder for prediksjon og klassifikasjon
STK2100 - Maskinlæring og statistiske metoder for prediksjon og klassifikasjon Oppsummering av kurset 17. april 2018 Hovedproblem Input x R p. Output y Numerisk: regresjon Kategorisk: Klassifikasjon Gitt
DetaljerTilleggsoppgaver for STK1110 Høst 2015
Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0
DetaljerPrøveeksamen STK2100 (fasit) - vår 2018
Prøveeksamen STK2100 (fasit) - vår 2018 Geir Storvik Vår 2018 Oppgave 1 (a) Vi har at E = Y Ŷ =Xβ + ε X(XT X) 1 X T (Xβ + ε) =[I X(X T X) 1 X T ]ε Dette gir direkte at E[E] = 0. Vi får at kovariansmatrisen
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2100 - FASIT Eksamensdag: Torsdag 15. juni 2017. Tid for eksamen: 09.00 13.00. Oppgavesettet er på 5 sider. Vedlegg: Tillatte
DetaljerPrøveeksamen STK vår 2017
Prøveeksamen STK2100 - vår 2017 Geir Storvik Vår 2017 Oppgave 1 Anta en lineær regresjonsmodell p Y i = β 0 + β j x ij + ε i, j=1 ε i uif N(0, σ 2 ) Vi kan skrive denne modellen på vektor/matrise-form:
DetaljerLøsningsforslag: STK2120-v15.
Løsningsforslag: STK2120-v15 Oppgave 1 a) Den statistiske modellen er: X ij = µ i + ϵ ij, j = 1,, J, i = 1,, I Her indekserer i = 1,, I gruppene og j = 1,, J observasjone innen hver gruppe Feilleddene
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1100 Statistiske metoder og dataanalyse 1 - Løsningsforslag Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30
DetaljerSTK Oppsummering
STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer
DetaljerSTK juni 2016
Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6
DetaljerRidge regresjon og lasso notat til STK2120
Ridge regresjon og lasso notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på noen alternativer til minste kvadraters metode ved lineær regresjon. Metodene er særlig aktuelle
DetaljerEkstraoppgaver for STK2120
Ekstraoppgaver for STK2120 Geir Storvik Vår 2011 Ekstraoppgave 1 Anta X 1 og X 2 er uavhengige med X 1 N(1.0, 1.0) og X 2 N(2.0, 1.5). La X = (X 1, X 2 ) T. Definer c = ( ) 2.0 3.0, A = ( ) 1.0 0.5 0.0
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK2120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 6. juni 2011. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerOppsummering av STK2120. Geir Storvik
Oppsummering av STK2120 Geir Storvik Vår 2011 Hovedtemaer Generelle inferensmetoder Spesielle modeller/metoder Bruk av R Vil ikke bli testet på kommandoer, men må forstå generelle utskrifter Generelle
DetaljerKapittel 6 - modell seleksjon og regularisering
Kapittel 6 - modell seleksjon og regularisering Geir Storvik 21. februar 2017 1/22 Lineær regresjon med mange forklaringsvariable Lineær modell: Y = β 0 + β 1 x 1 + + β p x p + ε Data: {(x 1, y 1 ),...,
DetaljerForelesning 6 STK3100
Scorefunksjon og estimeringsligninger for GLM Forelesning 6 STK3100 29. september 2008 S. O. Samuelsen Plan for forelesning: 1. Observert og forventet informasjon 2. Optimeringsrutiner 3. Iterative revektede
DetaljerTMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK2120 Skisse til løsning/fasit. Eksamensdag: Torsdag 5. juni 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider.
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1110 FASIT. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider. Vedlegg: Tillatte
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Løsningsforslag: Statistiske metoder og dataanalys Eksamensdag: Fredag 9. desember 2011 Tid for eksamen: 14.30 18.30
DetaljerKp. 12 Multippel regresjon
Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt Kp 12 Multippel Bjørn H Auestad Kp 11: Regresjonsanalyse 1 / 46 Kp 12 Multippel ; oversikt Kp 12 Multippel Bruk av Kp 12 Multippel ; oversikt 121 Introduction
DetaljerLøsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010
Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100
DetaljerFORMELSAMLING TIL STK1100 OG STK1110
FORMELSAMLING TIL STK1100 OG STK1110 (Versjon av 16. november 2009) 1. Sannsynlighet La A, B, A 1, A 2,...,B 1, B 2,... være begivenheter, dvs. delmengder av et utfallsrom Ω. a) Aksiomene: Et sannsynlighetsmål
DetaljerIntroduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R
Blanda modellar i R Jorunn Slagstad Universitetet i Bergen 20. desember 2006 1 Introduksjon 2 Lineære blanda modellar 3 Generaliserte lineære blanda modellar 4 Analyser av modellar 5 Eit randproblem 6
DetaljerInferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"
Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.
DetaljerTMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlege stokastiske variabelen X ha fordelingsfunksjon (sannsynstettleik
DetaljerOppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2 Maskinlæring og statistiske metoder for prediksjon og klassifikasjon Eksamensdag: Torsdag 4. juni 28. Tid for eksamen: 4.3
DetaljerLØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 10 LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011 Oppgave 1 Oljeleting a) Siden P(A
DetaljerLøsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007
Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007 Oppgave 1: Pengespill a) For hver deltaker har vi følgende situasjon: Deltakeren får en serie oppgaver. Hver runde har to mulige utfall: Deltakeren
DetaljerTMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer
DetaljerEksponensielle klasser
Eksponensielle klasser, de Jong & Heller, Kap. 3 Eksponensielle klasser STK3100-1. september 2008 Sven Ove Samuelsen En stokastisk variabel Y sies å ha fordeling i den eksponensielle fordelingsklasse dersom
DetaljerSTK2100. Obligatorisk oppgave 1 av 2
14. februar 2018 Innleveringsfrist STK2100 Obligatorisk oppgave 1 av 2 Torsdag 1. mars 2018, klokken 14:30 gjennom Devilry (https:devilry.ifi.uio.no). Praktiske instruksjoner Første side av din innlevering
DetaljerGeneraliserte Lineære Modeller
Eksponensiell klasse Generaliserte Lineære Modeller Y i f(y i ;θ i ) = c(y i ;φ) exp((θ i y i a(θ i ))/φ) µ i = E[Y i ] = a (θ i ) σ 2 i = Var[Y i ] = φa (θ i ) = φv (µ i ) STK3100-4. september 2011 Geir
DetaljerEksamensoppgave i Løsningsskisse TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i Løsningsskisse TMA440 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland a, Sara Martino b Tlf: a 48 18 96, b 99 40 33 30 Eksamensdato: 30. november
DetaljerEksamensoppgave i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806
DetaljerEKSTRAOPPGAVER I STK1110 H2017
EKSTRAOPPGAVER I STK0 H207. Simuleringer for å illustrere store talls lov og sentralgrenseteoremet Oppgave.. I denne oppgaven skal vi bruke kommandoen rbinom(n,size,prob). Kommandoen trekker n tilfeldige
DetaljerGruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk
Gruvedrift Notat for TMA/TMA Statistikk Institutt for matematiske fag, NTNU I forbindelse med planlegging av gruvedrift i et område er det mange hensyn som må tas når en skal vurdere om prosjektet er lønnsomt.
DetaljerKapittel 2: Hendelser
Kapittel 2: Hendelser FENOMEN Eksperiment Utfall Utfallsrom Eksperiment. Utfall. Eksperiment Utfall Hendelse Sannsynlighet: egenskaper, gunstige vs. mulige, relativ frekvens Sannsynlighet for mer enn en
DetaljerHypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:
Hypotesetesting. 10 og fore- Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte for å undersøke hypoteser (påstander) knyttet til parametre i sannsynlighetsfordelinger.
DetaljerForelesning 9 STK3100/4100
p. 1/3 Forelesning 9 STK3100/4100 Plan for forelesning: 18. oktober 2012 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 2/3 Modell med
DetaljerLøsningsforslag eksamen 27. februar 2004
MOT30 Statistiske metoder Løsningsforslag eksamen 7 februar 004 Oppgave a) Y ij = µ i + ε ij, der ε ij uavh N(0, σ ) der µ i er forventa kopperinnhold for legering i og ε ij er feilleddet (tilfeldig variasjon)
DetaljerUNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 4. juni 2007. Tid for eksamen: 14.30 17.30. Oppgavesettet er
DetaljerEKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist, tlf. 975 89 418 EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2100 Maskinlæring g statistiske metder fr prediksjn g klassifikasjn Eksamensdag: Trsdag 15. juni 2017. Tid fr eksamen: 09.00
DetaljerEksamensoppgave i ST1201/ST6201 Statistiske metoder
Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: 20. desember 2016 Eksamenstid (fra til): 09:00
DetaljerOppgave 1: Feil på mobiltelefoner
Oppgave 1: Feil på mobiltelefoner a) Sannsynlighetene i oppgaven blir P (F 1 F 2 ) P (F 1 ) + P (F 2 ) P (F 1 F 2 ) P (F 1 ) + 1 P (F2 C ) P (F 1 F 2 ) 0.080 + 0.075 0.006 0.149 P (F 1 F 2 ) P (F 1 F 2
DetaljerForelesning 9 STK3100/4100
Forelesning 9 STK3100/4100 Plan for forelesning: 17. oktober 2011 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 1 Modell med alle antagelser
DetaljerSTK Oppsummering
STK1100 - Oppsummering Geir Storvik 6. Mai 2014 STK1100 Tre temaer Deskriptiv/beskrivende statistikk Sannsynlighetsteori Statistisk inferens Sannsynlighetsregning Hva Matematisk verktøy for å studere tilfeldigheter
DetaljerTMA4240 Statistikk Høst 2009
TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Oppgave 1 Oppgave 11.5 fra læreboka. Oppgave 2 Oppgave 11.21 fra læreboka. Oppgave
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet
DetaljerEksponensielle klasser og GLM
!! 3 ksponensielle klasser, Dobson, Kap 3 ksponensielle klasser GLM n stokastisk variabel sies å ha fordeling i den eksponensielle fordelingsklasse som tettheten pktsannsh til kan skrives på formen STK3-3
DetaljerForelesning 4 STK3100
! * 2 2 2 Bevis : Anta Forelesning 4 STK3 september 27 S O Samuelsen Plan for annen forelesning: Likelihood-egenskaper 2 Konsistens for ML 3 Tilnærmet fordeling for ML 4 Likelihoodbaserte tester 5 Multivariat
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 202 Statistiske slutninger for den eksponentielle fordelingsklasse. Eksamensdag: Fredag 15. desember 1995. Tid for eksamen:
DetaljerOm eksamen. Never, never, never give up!
I dag I dag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve 3 a og b (inkl SME) Om eksamen (Truleg) 10 punkt.
DetaljerHøgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen
Høgskolen i Telemark Institutt for økonomi og informatikk FORMELSAMLING 6005 Statistikk I Til bruk ved eksamen Per Chr. Hagen . Sannsynlighetsregning. Regneregler Komplementsetningen: Addisjonssetningen:
DetaljerGeneraliserte Lineære Modeller
Lineær regresjon er en GLM Generaliserte Lineære Modeller Responser (Y i -er) fra normalfordelinger Lineær komponent η i = β 0 + β 1 x i1 + + β p x ip E[Y i ] = µ i = η i, dvs. linkfunksjonen g(µ i ) =
DetaljerKapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering
Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering TMA4245 Statistikk Kapittel 8.1-8.5. Kapittel 9.1-9.3+9.15 Turid.Follestad@math.ntnu.no p.1/21 Har sett
DetaljerForelesning 3 STK3100
Eks. Fødselsvekt mot svangerskapslengde og kjønn Forelesning 3 STK3100 8. september 2008 S. O. Samuelsen Plan for forelesning: 1. Generelt om lineære modeller 2. Variansanalyse - Kategoriske kovariater
DetaljerOm eksamen. Never, never, never give up!
Plan vidare Onsdag Gjere ferdig kap 11 + repetisjon Fredag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST110 Statistiske metoder og dataanalyse Eksamensdag: Mandag 30. mai 2005. Tid for eksamen: 14.30 20.30. Oppgavesettet er på
DetaljerOppgave N(0, 1) under H 0. S t n 3
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr 9 (s 1) Oppgave 1 Modell: Y i β 0 + β 1 x i + β 2 x 2 i + ε i der ε 1,, ε n uif N(0, σ 2 ) e) Y Xβ + ε der Y Y 1 Y n, X 1 x 1 x 2 1
Detaljern n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2
TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 12, blokk II Denne øvingen består av oppgaver om enkel lineær regresjon. De handler
DetaljerTMA4240 Statistikk Høst 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 0, blokk II Løsningsskisse Oppgave Surhetsgrad i ferskvann Eksamen august 00, oppgave av 3 a) En god estimator
DetaljerTMA4240 Statistikk Høst 2016
TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 12 Denne øvingen består av oppgaver om enkel lineær regresjon. De handler blant
DetaljerTMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 Ei bedrift produserer elektriske komponentar. Komponentane kan ha to typar
DetaljerKp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt
Bjørn H. Auestad Kp. 11: Regresjonsanalyse 1 / 57 Kp. 11 Regresjonsanalyse; oversikt 11.1 Introduction to Linear Regression 11.2 Simple Linear Regression 11.3 Least Squares and the Fitted Model 11.4 Properties
DetaljerMatematisk statistikk og stokastiske prosesser B, høsten 2006 Løsninger til oppgavesett 5, s. 1. Oppgave 1
Matematisk statistikk og stokastiske prosesser B, høsten 2006 Løsninger til oppgavesett 5, s AR2-modell: Oppgave X t φ X t φ 2 X t 2 Z t Antas å være kausal slik at X t ψ j Z t j er ukorrelert med Z t+,
DetaljerUNIVERSITETET I OSLO Matematisk Institutt
UNIVERSITETET I OSLO Matematisk Institutt Eksamen i: STK 1110 Statistiske metoder og dataanalyse 1 Tid for eksamen: Mandag 28. november 2016, kl. 14:30 18:30 Hjelpemidler: Formelsamling til STK 1100 og
DetaljerForelesning 8 STK3100/4100
Forelesning STK300/400 Plan for forelesning: 0. oktober 0 Geir Storvik. Lineære blandede modeller. Eksempler - data og modeller 3. lme 4. Indusert korrelasjonsstruktur. Marginale modeller. Estimering -
DetaljerAndre sett med obligatoriske oppgaver i STK1110 høsten 2010
Andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Dette er det andre settet med obligatoriske oppgaver i STK1110 høsten 2010. Oppgavesettet består av fire oppgaver. Det er valgfritt om du vil
DetaljerEksamensoppgåve i TMA4267 Lineære statistiske modellar
Institutt for matematiske fag Eksamensoppgåve i TMA4267 Lineære statistiske modellar Fagleg kontakt under eksamen: Øyvind Bakke Tlf: 73 59 81 26, 990 41 673 Eksamensdato: 22. mai 2015 Eksamenstid (frå
DetaljerLøsningsforslag oblig 1 STK1110 høsten 2014
Løsningsforslag oblig STK høsten 4 Oppgave I forbindelse med en studie av antioksidanter og antocyanider, ble innholdet av antocyan i 5 beger med blåbær målt. De målte verdiene var (i mg per gram): 55
Detaljer6.6 Anvendelser på lineære modeller
6.6 Anvendelser på lineære modeller Skal først se på lineær regresjon for gitte punkter i planet: det kan formuleres og løses som et minste kvadraters problem! I mere generelle lineære modeller er man
DetaljerPrøveeksamen i STK3100/4100 høsten 2011.
Prøveeksamen i STK3100/4100 høsten 2011. Oppgave 1 (a) Angi tetthet/punktsannsynlighet for eksponensielle klasser med og uten sprednings(dispersjons)ledd. Nevn alle fordelingsklassene du kjenner som kan
DetaljerDekkes av kap , 9.10, 9.12 og forelesingsnotatene.
Estimering 2 -Konfidensintervall Dekkes av kap. 9.4-9.5, 9.10, 9.12 og forelesingsnotatene. En (punkt-)estimator ˆΘ gir oss et anslag på en ukjent parameterverdi, men gir oss ikke noen direkte informasjon
DetaljerLØSNINGSFORSLAG ) = Dvs
LØSNINGSFORSLAG 12 OPPGAVE 1 D j er differansen mellom måling j med metode A og metode B. D j N(µ D, 0.1 2 ). H 0 : µ D = 0 mot alternativet H 1 : µ D > 0. Vi forkaster om ˆµ D > k Under H 0 er ˆµ D =
Detaljervekt. vol bruk
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: 10. desember 2010. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerEksamensoppgåve i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgåve i TMA4240 Statistikk Fagleg kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet
DetaljerEkstraoppgaver STK3100 h10
Ekstraoppgaver STK3100 h10 Oppgave 1 En-veis variansanalyse modellen kan formuleres som Y ij = µ + α i + ɛ ij (1) der α i = 0 og ɛ ij er i.i.d N(0, σ 2 ). Her representerer er Y ij j te observasjon fra
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-aturviteskapelige fakultet Eksame i STK2120 Statistiske metoder og dataaalyse 2 Eksamesdag: Madag 6. jui 2011. Tid for eksame: 09.00 13.00. Oppgavesettet er på 5 sider.
DetaljerEksamensoppgave i TMA4267 Lineære statistiske modeller
Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 4. juni 2016 Eksamenstid (fra til): 09.00
DetaljerEKSTRAOPPGAVER I STK1110 H2018
EKSTRAOPPGAVER I STK1110 H2018 1. Simuleringer for å illustrere store talls lov og sentralgrenseteoremet Oppgave 1.1. I denne oppgaven skal vi bruke kommandoen rbinom(n,size,prob). Kommandoen trekker n
DetaljerSiden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.
Estimeringsmetoder Momentmetoden La X, X 2,..., X n være uavhengige variable som er rektangulært fordelte på intervallet [0, θ]. Vi vet da at forventningsverdiene til hver observasjon og forventningen
DetaljerEksamensoppgave i ST0103 Brukerkurs i statistikk
Institutt for matematiske fag Eksamensoppgave i ST0103 Brukerkurs i statistikk Faglig kontakt under eksamen: Jarle Tufto Tlf: 99 70 55 19 Eksamensdato: 3. desember 2016 Eksamenstid (fra til): 09:00-13:00
DetaljerModellvalg ved multippel regresjon notat til STK2120
Modellvalg ved multippel regresjon notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på hvordan vi kan velge ut hvilke forklaringsvariabler vi skal ha med i en regresjonsmodell.
Detaljer10.1 Enkel lineær regresjon Multippel regresjon
Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel
DetaljerMOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:
MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,
DetaljerEksamensoppgave i TMA4267 Lineære statistiske modeller
Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Tlf: Eksamensdato: August 2014 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler:
DetaljerFasit og løsningsforslag STK 1110
Fasit og løsningsforslag STK 1110 Uke 36: Eercise 8.4: a) (57.1, 59.5), b) (57.7, 58, 9), c) (57.5, 59.1), d) (57.9, 58.7) og e) n 239. (Hint: l(n) = 1 = 2z 1 α/2 σ/n 1/2 ). Eercise 8.10: a) (2.7, 7.5),
DetaljerOppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)
MOT310 tatistiske metoder 1 Løsningsforslag til eksamen vår 006, s. 1 Oppgave 1 a) En tilfeldig utvalgt besvarelse får F av sensor 1 med sannsynlighet p 1 ; resultatene for ulike besvarelser er uavhengige.
DetaljerTMA4240 Statistikk Høst 2015
TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Oppgave 1 X er kontinuerlig fordelt med sannsynlighetstetthet f(x) = 2xe
DetaljerEKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bokmål Faglig kontakt under eksamen: Håkon Tjelmeland 73 59 35 38 EKSAMEN I EMNE TMA4315 GENERALISERTE LINEÆRE MODELLER
DetaljerEksamensoppgave i ST1201/ST6201 Statistiske metoder
Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Tlf: Eksamensdato: august 2015 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler:
DetaljerTMA4240 Statistikk 2014
TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 12, blokk II Oppgave 1 På ein av vegane inn til Trondheim er UP interessert i å måle effekten
Detaljer