Suffisient observator

Like dokumenter
Diskrete egenskaper. Egenskapsvektoren x antar kun diskrete verdier: v 1,v 2,...,v m. Endringer fra det kontinuerlige tilfellet er at:

Likningssystem for maksimum likelihood løsning

MØNSTERGJENKJENNING. Forelesningsnotater til kurset Unik4590/Unik9590/TTK4205

Bayesisk estimering. Tettheten i punkt x er her gitt ved: der p(q X ) er áposterioriparameterfordelinggitt ved: p(q X )=

Estimering 1 -Punktestimering

Estimering 1 -Punktestimering

KLMED8004 Medisinsk statistikk. Del I, høst Estimering. Tidligere sett på. Eksempel hypertensjon

Modeller og parametre. STK Punktestimering - Kap 7. Eksempel støtfangere. Statistisk inferens. Binomisk fordeling. p X (x) = p x (1 p) n x

Emnenavn: Metode 1, statistikk deleksamen. Eksamenstid: 4 timer. Faglærer: Bjørnar Karlsen Kivedal

Estimering 2. -Konfidensintervall

LØSNINGSFORSLAG TILEKSAMEN I FAG TMA4240/TMA4245 STATISTIKK 10. august 2005

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan

LØSNING, EKSAMEN I STATISTIKK, TMA4240, DESEMBER Anta at sann porøsitet er r. Måling med utstyret gir da X n(x; r, 0,03).

Forelesning Moment og Momentgenererende funksjoner

Oppgaver fra boka: X 2 X n 1

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

Econ 2130 Forelesning uke 11 (HG)

Forelesning 4 og 5 Transformasjon, Weibull-, lognormal, beta-, kji-kvadrat -, t-, F- fordeling

X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

TMA4245 Statistikk Eksamen mai 2017

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

Kapittel 7: Noen viktige sannsynlighetsfordelinger

TMA4240 Statistikk Høst 2015

211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%

Kapittel 7: Noen viktige sannsynlighetsfordelinger

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

TMA4240 Statistikk Høst 2009

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK 5.august 2004

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

TMA4240 Statistikk Eksamen desember 2015

5 y y! e 5 = = y=0 P (Y < 5) = P (Y 4) = 0.44,

2. Hypotesetesting i ulike sitausjoner: i. for forventingen, μ, i målemodellen med normalantakelse og kjent varians, σ 2.

Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10

ÅMA110 Sannsynlighetsregning med statistikk, våren Kontinuerlige tilfeldige variable, intro. Kontinuerlige tilfeldige variable, intro.

ECON240 Statistikk og økonometri

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Løsningsforslag Oppgave 1

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 2

TMA4240 Statistikk Høst 2016

MOT310 Statistiske metoder 1, høsten 2011

TMA4240 Statistikk Høst 2016

OM TAYLOR POLYNOMER. f x K f a x K a. f ' a = lim x/ a. f ' a z

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Konfidensintervall, innledning. Kp. 5 Estimering.

Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering

Statistikk og økonomi, våren 2017

UNIVERSITETET I OSLO

HØGSKOLEN I SØR-TRØNDELAG Avdeling for teknologi

Kap. 9: Inferens om én populasjon

Noen vanlige. Indikatorfordeling: 1, dersom suksess. I mange situasjoner kan fenomenet vi ser på. 0, dersom ikke suksess

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

Løsningsforslag ST1101/ST6101 kontinuasjonseksamen 2018

Innledning Beslutningsteori Parametriske metoder Ikke-parametriske metoder Diskriminantfunksjoner Evaluering Ikke-ledet læring Klyngeanalyse Oversikt

Oversikt over konfidensintervall i Econ 2130

Mer om utvalgsundersøkelser

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

Rep.: generelle begrep og definisjoner Kp. 10.1, 10.2 og 10.3

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

TMA4245 Statistikk Eksamen 9. desember 2013

Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians

EKSAMENSOPPGAVE. Mat-1060 Beregningsorientert programmering og statistikk

Dimensjonalitetsproblemer (3)

Kap. 9: Inferens om én populasjon

STK1100 våren Konfidensintevaller

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2015

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Kp. 6, del 5

8 (inkludert forsiden og formelsamling) Tegne- og skrivesaker, kalkulator, formelsamling (se vedlagt).

SAMMENLIGNING AV MINSTE KVADRATERS METODE OG SANNSYNLIGHETSMAKSIMERINGSMETODEN I BINÆR REGRESJON. Henrik Dahl *)

TMA4245 Statistikk Eksamen august 2015

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 5 Estimering. Målemodellen.

Kapittel 8: Estimering

UNIVERSITETET I OSLO

Løsningsforsalg til første sett med obligatoriske oppgaver i STK1110 høsten 2018

MA 1410: Analyse Uke 48, aasvaldl/ma1410 H01. Høgskolen i Agder Avdeling for realfag Institutt for matematiske fag

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

Uke 12 IN3030 v2019. Eric Jul PSE-gruppa Ifi, UiO

Løsningsforslag ST2301 øving 3

Estimering og hypotesetesting. Estimering og hypotesetesting. Estimering og hypotesetesting. Kapittel 10. Ett- og toutvalgs hypotesetesting

TMA4240 Statistikk Høst 2016

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk. Kp. 5 Estimering.

Oversikt over konfidensintervall i Econ 2130

Deskriptiv statistikk for sentrum og spredning i fordelingen. Gjennomsnitt og standardavvik. eller

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007 Kp. 6, del 5. Hypotesetesting, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008 Kp. 6, del 5

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 5

n 2 +1) hvis n er et partall.

UNIVERSITETET I OSLO

OPPGAVE 4 LØSNINGSFORSLAG OPPGAVE 5 LØSNINGSFORSLAG UTVIKLING AV REKURSIV FORMEL FOR FIGURTALL SOM GIR ANDREGRADSFUNKSJONER

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

FØLGER, REKKER OG GJENNOMSNITT

Transkript:

Iledig Beslutigsteori Parametriske metoder Ikke-parametriske metoder Diskrimiatfuksjoer Evaluerig Ikke-ledet lærig Klygeaalyse Suffisiete observatorer Suffisiet observator Statistisk størrelse s som ieholder tilstrekkelig iformasjo fra treigssettet X for estimerig av parametervektore q. Ka vises at: s er suffisiet ) p(q s,x )=p(q s), slik at s ieholder all ødvedig iformasjo fra X. Eksempel: s = m = 1 Â x k for de multivariate ormalfordelige N(µ, ). Faktoriserigsteoremet sier at: s er suffisiet for q hvis og bare hvis p(x q)=g(s, q)h(x ). Suffisiete observatorer er yttige dersom s og g(s, q) er ekle og mest mulig av likelihoodfuksjoe ka skilles ut i faktore h(x ). Uik4590/Uik9590/TTK405 - Møstergjekjeig Idar Dyrdal (idar@uik.o)

Iledig Beslutigsteori Parametriske metoder Ikke-parametriske metoder Diskrimiatfuksjoer Evaluerig Ikke-ledet lærig Klygeaalyse Suffisiete observatorer Bruk av suffisiete observatorer Maksimum likelihood estimerig: Skal maksimalisere likelihoodfuksjoe p(x q)=g(s, q)h(x ) mht. q, dvs. tilstrekkelig å maksimalisere g(s, q) mht. q og glemme h(x ). Bayesisk estimerig: Må først fie á posteriori parameterfordelig p(q X )= p(x q)p(q) R = p(x q)p(q)dq g(s, q)h(x )p(q) R = g(s, q)h(x )p(q)dq g(s, q)p(q) R. g(s, q)p(q)dq Dersom p(q) er uiform (eller = ) ka dee fordelige uttrykkes ved: p(q X )= g(s, q) R g(s, q)dq = g(s, q) (kjeretetthete til g), Dersom >> 1vilp(q X ) g(s, q) selv om p(q) ikke er uiform, slik at: Z Z p(x X )= p(x q)p(q X )dq p(x q) g(s, q)dq der p(x q) er e kjet fuksjo av x og q, og g ka fies i lærebøker. Uik4590/Uik9590/TTK405 - Møstergjekjeig Idar Dyrdal (idar@uik.o)

Iledig Beslutigsteori Parametriske metoder Ikke-parametriske metoder Diskrimiatfuksjoer Evaluerig Ikke-ledet lærig Klygeaalyse Suffisiete observatorer Ekspoesialfamilie Familie av kjete fordeliger på forme: der maksimum likelihood fuksjoe blir: p(x q) = p(x q)=a(x)exp[a(q)+b(q) t c(x)], a(x k )exp[a(q)+b(q) t c(x k )] " ( Â )# = exp a(q)+b(q) t 1 c(x k ) a(x k ). {z } {z } g(s,q) h(x ) = g(s, q)h(x ), der de suffisiete observatore er gitt ved s = 1 Â c(x k ). Uik4590/Uik9590/TTK405 - Møstergjekjeig Idar Dyrdal (idar@uik.o)

Iledig Beslutigsteori Parametriske metoder Ikke-parametriske metoder Diskrimiatfuksjoer Evaluerig Ikke-ledet lærig Klygeaalyse Parametriske fordeliger Ekspoesialfamilie (oe eksempler) Nav Fordelig Parametre Suffisiet observator g(s,q) Uivariat ormal r q p(x q)= p e 1 q(x q1 = µ q1) q = s > 0 s1 = 1 s = 1 q / e q(s q1s1+q 1 ) Multivariat ormal p(x q)= 1 (p) d/ e 1 (x q 1)t (x q 1) q 1 = µ = 1, > 0 s1 = 1 S = 1 xk t / e [Tr ( )s q t 1 s1+q t 1 q1] Ekspoesial ( qe qx x 0 p(x q)= 0 ellers q > 0 s = 1 q e qs Gamma p(x q)= 8 >< q q1+1 (q1 + 1) x q1 e qx x 0 >: 0 ellers q1 > 1 q > 0 s1 = s = 1! 1/ xk " # q q1+1 (q1 + 1) sq1 1 e qs Poisso P(x q)= q x x! e q, der x = 0,1,,... q > 0 s = 1 q s e q Multiomial d P(x q)=m! q xi i xi!, der 8 >< xi = 0,1,...,m d >: Â xi = m qi,,...,d der 8 >< 0 < qi < 1 d >: Â qi = 1 s = 1 d q si i Adre eksempler er Rayleigh-, Maxwell-, beta-, Beroulli- og biomialfordeligee. Uik4590/Uik9590/TTK405 - Møstergjekjeig Idar Dyrdal (idar@uik.o)

Iledig Beslutigsteori Parametriske metoder Ikke-parametriske metoder Diskrimiatfuksjoer Evaluerig Ikke-ledet lærig Klygeaalyse Begresiger Begresiger ved parametriske metoder Uimodal fordelig Parametriske metoder har visse begresiger: Tetthetsfuksjoee har som oftest ukjet form slik at gal eller dårlig atakelse om forme gir suboptimalt resultat. De fleste kjete (ekle) fordeliger har bare é mode, slik at de passer dårlig til mage virkelige fordeliger med flere moder (multimodale fordeliger). Tetthetsfuksjoee ka være kjete, me beregigsmessig kompliserte; de ka f.eks. bestå av e bladig av uimodale kompoeter. Multimodal fordelig Uik4590/Uik9590/TTK405 - Møstergjekjeig Idar Dyrdal (idar@uik.o)

Iledig Beslutigsteori Parametriske metoder Ikke-parametriske metoder Diskrimiatfuksjoer Evaluerig Ikke-ledet lærig Klygeaalyse Oversikt Ihold i kurset Beslutigsteori (desisjosteori) Parametriske metoder Ikke-parametriske metoder Lieære og geeraliserte diskrimiatfuksjoer Feilrateestimerig og evaluerig av klassifikatorer Ikke-ledet lærig Klygeaalyse. Uik4590/Uik9590/TTK405 - Møstergjekjeig Idar Dyrdal (idar@uik.o)

Iledig Beslutigsteori Parametriske metoder Ikke-parametriske metoder Diskrimiatfuksjoer Evaluerig Ikke-ledet lærig Klygeaalyse Oversikt Ikke-parametriske metoder I ikke-parametriske metoder gjøres det ige atakelser om forme på tetthetsfuksjoee. I stedet brukes treigssettet direkte til å estimere tetthete eller á posteriori sasylighete i ethvert pukt x av iteresse (dvs. egeskapsvektoree til ukjet sampler). Vi skal se på følgede metoder: Tetthetsestimerig (puktestimerig): Vidumetoder, Nærmeste-abo metoder. Estimerig av á posteriori sasylighet: Nærmeste-abo (NN) regele, K-ærmeste-abo (knn) regele. Uik4590/Uik9590/TTK405 - Møstergjekjeig Idar Dyrdal (idar@uik.o)

Iledig Beslutigsteori Parametriske metoder Ikke-parametriske metoder Diskrimiatfuksjoer Evaluerig Ikke-ledet lærig Klygeaalyse Metoder Tetthetsestimerig x Tetthete i x estimeres ved: p (x) = k / V for et treigssett X med sampler. x k V x1 Her er: R - vilkårlig regio omkrig puktet x, k - atall sampler (observasjoer) fra X iefor regioe, V - volumet av regioe. Uik4590/Uik9590/TTK405 - Møstergjekjeig Idar Dyrdal (idar@uik.o)

Iledig Beslutigsteori Parametriske metoder Ikke-parametriske metoder Diskrimiatfuksjoer Evaluerig Ikke-ledet lærig Klygeaalyse Vidumetode Vidumetode Tetthetsestimatet uttrykkes her som e sum av vidufuksjoer setrert omkrig treigssamplee: j x xi j h p (x)= k / = 1 V Â 1 x j V h Vidufuksjoee ka være rektagulære (geerelt hyperkubiske), me ka geeraliseres, f.eks. ved: xi Rektagulære vidufuksjoer. x xi j h 1 p p e 1 x x i h j(u)= 1 (p) 1/ e 1 u Uik4590/Uik9590/TTK405 - Møstergjekjeig Gaussisk vidufuksjo. Idar Dyrdal (idar@uik.o)