Normalfordelingen. Univariat normalfordeling (Gaussfordelingen): der µ er forventningsverdien og σ 2 variansen. Multivariat normalfordeling:

Like dokumenter
Innledning Beslutningsteori Parametriske metoder Ikke-parametriske metoder Diskriminantfunksjoner Evaluering Ikke-ledet læring Klyngeanalyse Oversikt

Dimensjonalitetsproblemer (3)

Unik4590/Unik9590/TTK Mønstergjenkjenning

Innledning Beslutningsteori Parametriske metoder Ikke-parametriske metoder Diskriminantfunksjoner Evaluering Ikke-ledet læring Klyngeanalyse Oversikt

Generalisering til mange klasser - feilrettingsmetodene

Unik4590/Unik9590/TTK Mønstergjenkjenning

Ekstraoppgaver for STK2120

Seksjon 1.3 Tetthetskurver og normalfordelingen

Bayesisk estimering. Tettheten i punkt x er her gitt ved: der p(q X ) er áposterioriparameterfordelinggitt ved: p(q X )=

FORMELSAMLING TIL STK1100 OG STK1110

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

FORMELSAMLING TIL STK1100 OG STK1110

Transformasjoner av stokastiske variabler

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling

onsdag_19_09_2018_poisson_eksponential_normalfordelng_vikartime_bygg_v2.notebook

LØSNINGSFORSLAG ) = Dvs

NORMALFORDELINGER, KOVARIANSMATRISER OG ELLIPSOIDER

MØNSTERGJENKJENNING. Forelesningsnotater til kurset Unik4590/Unik9590/TTK4205

Løsningsforslag Eksamen S2, høsten 2016 Laget av Tommy Odland Dato: 27. januar 2017

x λe λt dt = 1 e λx for x > 0 uavh = P (X 1 v)p (X 2 v) = F X (v) 2 = (1 e λv ) 2 = 1 2e λv + e 2λv = 2 1 λ 1 2λ = 3

Generaliserte Lineære Modeller

Binomisk sannsynlighetsfunksjon

Tilleggsoppgaver for STK1110 Høst 2015

La U og V være uavhengige standard normalfordelte variable og definer

ST0202 Statistikk for samfunnsvitere

Side av 5 fra matriseteori har vi at en symmetrisk matrise alltid er ortogonalt diagonaliserbar. Det vil si at X kan skrives på formen X = M M (6) der

TMA4240 Statistikk H2015

Econ 2130 uke 16 (HG)

Eksamensoppgave i TMA4267 Lineære statistiske modeller

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Eksamen desember 2015

Foreleses onsdag 8. september 2010

Gammafordelingen og χ 2 -fordelingen

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

Løysingsframlegg/skisse Eksamen TFY 4210 Kvanteteorien for mangepartikkelsystem 24. mai 2011

Matematisk statistikk og stokastiske prosesser B, høsten 2006 Løsninger til oppgavesett 5, s. 1. Oppgave 1

TMA4240 Statistikk H2010

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Eksamensoppgåve i Løsningsskisse TMA4245 Statistikk

Oppfriskningskurs i matematikk Dag 2

TMA4240 Statistikk Høst 2008

TMA4240 Statistikk Høst 2015

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Utvalgsfordelinger (Kapittel 5)

UNIVERSITETET I OSLO

Arne B. Sletsjøe. Oppgaver, MAT 1012

Ikke-separable problemer

FY1006/TFY Løsning øving 3 1 LØSNING ØVING 3. Ikke-stasjonær bokstilstand

Tyngdepunkt. Togforsinkelsen (Eksamen Des2003.1a) I denne oppgaven kan du bruke uten å vise det at. Kapittel 4

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Forelesning 4 STK3100

Generell informasjon om faget er tilgjengelig fra It s learning. 7.1 Stokastisk prosess Lineær prediktor AR-3 prosess...

TMA4240 Statistikk 2014

3.4: Simultanfordelinger (siste rest) 4.1,4.2,4.3: Multivariat del (ferdig med kapittel 3 og 4 etter denne forelesningen)

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

3.1.1 Eksempel: "Student's" t-fordeling Lognormal-fordeling... 7

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Eksamensoppgave i TMA4135 Matematikk 4D

MA0002 Brukerkurs i matematikk B Vår 2016

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Øvingsforelesning i Matlab TDT4105

To-dimensjonale kontinuerlige fordelinger

Medisinsk statistikk Del I høsten 2009:

Forelesning 3. april, 2017

Obligatorisk oppgave nr 4 FYS Lars Kristian Henriksen UiO

Diskrete egenskaper. Egenskapsvektoren x antar kun diskrete verdier: v 1,v 2,...,v m. Endringer fra det kontinuerlige tilfellet er at:

Matematikk 3MX AA6524 og AA6526 Elever og privatister 8. desember 2003

TEK5020/TEK Mønstergjenkjenning

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Løsningsforslag Eksamen S2, våren 2016 Laget av Tommy Odland Dato: 29. januar 2017

Matematisk statistik för D, I, Π och Fysiker

FORMELSAMLING STATISTIKK, HiG

Kapitalverdimodellen

Modifisering av Black & Scholes opsjonsprising ved bruk av NIG-fordelingen

Om eksamen. Never, never, never give up!

FORMELSAMLING STATISTIKK, HiG Versjon per 10. januar 2002, ved Hornæs

6.5 Normalapproksimasjon til. binomisk fordeling

Midtveiseksamen i STK1100 våren 2017

Bioberegninger, ST1301 Onsdag 1. juni 2005 Løsningsforslag

Løsningsforslag Eksamen S2, våren 2017 Laget av Tommy O. Sist oppdatert: 25. mai 2017

Forelesning 3 STK3100

Eksponensielle klasser

Binomisk fordeling. Hypergeometrisk fordeling. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi har følgende situasjon: = = 2

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

STK juni 2006

Om eksamen. Never, never, never give up!

EKSTRAOPPGAVER I STK1110 H2017

Lars Mørkrid NKK-MØTET

Fasit til eksamen i emnet MAT102 - Brukerkurs i matematikk II Mandag 21.september 2015

7.1 forts. Schur triangularisering og spektralteoremet

EKSAMEN I NUMERISK LINEÆR ALGEBRA (TMA4205)

STK1100 våren Forventningsverdi. Forventning, varians og standardavvik

TMA4240/TMA4245 Statistikk Oppsummering diskrete sannsynlighetsfordelinger

1.1.1 Rekke med konstante ledd. En rekke med konstante ledd er gitt som. a n (1) n=m

EKSAMEN BOKMÅL STEMMER. DATO: TID: OPPG. SIDER: VEDLEGG: 3 desember :00-13: FAGKODE: IR Matematikk 1

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Transkript:

Normalfordelingen Univariat normalfordeling (Gaussfordelingen): p(x µ,σ 2 ) = 1 µ)2 (x e 2σ 2 = N(µ,σ 2 ) 2πσ der µ er forventningsverdien og σ 2 variansen. Multivariat normalfordeling: [ 1 p(x µ,σ) = (2π) d/2 exp 1 ] Σ 1/2 2 (x µ)t Σ 1 (x µ) = N(µ,Σ) der µ er forventningsvektoren og Σ er kovariansmatrisen.

Univariat normalfordeling Klassebetinget normalfordeling for klasse ω i, der forventningsverdien er µ i og standardavviket er σ i.

Bivariat normalfordeling

Bivariat normalfordeling (2) µ Bivariat normalfordeling representert ved ellipser med konstant tetthet (og konstant Mahalanobisavstand fra forventningsvektoren).

Diskriminantfunksjoner for multivariat normalfordeling En minimum feilrate beslutningsregel kan uttrykkes ved diskriminantfunksjoner på formen: g i (x) = ln[p(x ω i )P(ω i )] = lnp(x ω i ) + lnp(ω i ). Innsetting av den multivariate normalfordelingen: gir da: p(x ω i ) = 1 (2π) d/2 Σ i 1/2 e 1 2 (x µ i ) t Σ 1 (x µ i ) = N(µ i,σ i ) g i (x) = 1 2 (x µ i ) t Σ 1 i (x µ i ) d 2 ln(2π) 1 2 ln Σ i + lnp(ω i ).

Diskriminantfunksjoner for multivariat normalfordeling (2) Dette er generelt en kvadratisk diskriminantfunksjon som kan skrives på formen: der Desisjonsgrenser: W i = 1 2 Σ 1 i g i (x) = x t W i x + w t x + w i0, i = 1,...,c (d d matrise) w i = Σ 1 i µ t i (d 1 vektor) w i0 = 1 2 µt i Σ 1 i µ i 1 2 ln Σ i + lnp(ω i ) (1 1 skalar) Der g i (x) = g j (x),i j, forutsatt at ingen andre funksjonsverdier er større, Gir hyperkvadratiske flater (eksempelvis sirkler, ellipser, parabler, hyperbler og rette linjer i planet).

Kvadratiske desisjonsgrenser for toklasseproblemet µ 1 µ 2 Kvadratiske desisjonsgrenser for toklasseproblem med ulike (men i dette tilfellet diagonale) kovariansmatriser. Desisjonsgrensene er i dette tilfellet hyperbler (blå kurver).

Like kovariansmatriser Dersom like kovariansmatriser for alle klasser (Σ i = Σ) kan diskriminantfunksjonene forenkles. Den kvadratiske diskriminantfunksjonen: fra det generelle tilfellet reduseres til: g i (x) = x t W i x + w t i + w i0 g i (x) = w t i + w i0 siden det kvadratiske leddet kan fjernes fordi W i = W = 1 2 Σ 1 = konstant. Resultatet er lineære diskriminantfunksjon der: w i = Σ 1 µ i w i0 = 1 2 µt i Σ 1 µ i + lnp(ω i ) (siden 1 ln Σ = konstant). 2

Lineære desisjonsgrenser for toklasseproblemet - like kovariansmatriser µ i x 0 µ j w To klasser med like kovariansmatriser (og her like á priori sannsynligheter).

Diagonale kovariansmatriser med like varianser Anta felles diagonal kovariansmatrise med like varianser, dvs: Σ i = Σ = σ 2 I. En toklasse diskriminantfunksjon mellom ω i og ω j er også her lineær: g(x) = w t x + w 0 med vektvektor forenklet til: og skalarvekt til: w = Σ 1 (µ i µ j ) = (µ i µ j ) σ 2 w (µ i µ j ) w 0 = ( µ i 2 µ j 2 ) 2σ 2 + ln P(ω i) P(ω i ).

Lineære desisjonsgrenser for toklasseproblemet - diagonale kovariansmatriser med like varianser µ i x 0 w µ j Desisjonsgrensen står normalt på linjen mellom forventningsvektorene. Plasseringen bestemt av á priorisannsynlighetene, mens orienteringen er gitt av vektvektoren.