MAT-INF 2360: Obligatorisk oppgave 3. Løsningsforslag

Like dokumenter
MAT-INF 2360: Obligatorisk oppgave 3

Nicolai Kristen Solheim

Løsningsforslag MAT102 Vår 2018

Notat 6 - ST februar 2005

Løsningsforslag til Obligatorisk innlevering 7

Alle svar skal grunngis. Alle deloppgaver har lik vekt.

Bioberegninger - notat 4: Mer om sannsynlighetsmaksimering

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Løsningsforslag oblig 1 STK1110 høsten 2014

Fasit til eksamen i emnet MAT102 - Brukerkurs i matematikk II Mandag 21.september 2015

Alle svar skal grunngis. Alle deloppgaver har lik vekt.

STK juni 2016

1. Finn egenverdiene og egenvektorene til matrisen A = 2 1 A =

a) f(x) = 3 cos(2x 1) + 12 LF: Vi benytter (lineær) kjerneregel og får f (x) = (sin(7x + 1)) (sin( x) + x) sin(7x + 1)(sin( x) + x) ( sin(x) + x) 2 =

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Fasit MAT102 juni 2016

Innlevering Matematikk forkurs HIOA Obligatorisk innlevering 3 Innleveringsfrist Onsdag 15. november 2017 kl 14:30 Antall oppgaver: 8

TMA4240 Statistikk H2010

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE

Ekstraoppgaver for STK2120

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Fasit til utvalgte oppgaver MAT1110, uka 11/5-15/5

Gammafordelingen og χ 2 -fordelingen

Newtons metode er en iterativ metode. Det vil si, vi lager en funksjon. F x = x K f x f' x. , x 2

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Xxxdag xx. juni 2008 Tid: 09:0013:00

TMA4240 Statistikk Høst 2016

Løsningsforslag i matematikk

ST0103 Brukerkurs i statistikk Høsten Momentestimatoren og sannsynlighetsmaksimeringsestimatoren

TMA4245 Statistikk Eksamen desember 2016

MA1102 Grunnkurs i analyse II Vår 2014

Løsningsforslag, midtsemesterprøve MA1101, 5.oktober 2010

Heldagsprøve i matematikk. Svar og løsningsforslag

Oppgave Iterasjonen ser ut til å konvergere sakte mot null som er det eneste fikspunktet for sin x.

3x ( x. x 1 x a 3 = 1 2 x2. a) Bestem rekkens kvotient og rekkens første ledd.

UNIVERSITETET I OSLO

Løsningsforslag til eksamen i MAT1110, 13/6-07

Matematikk Øvingsoppgaver i numerikk leksjon 7 Løsningsforslag

STK juni 2018

LØSNING, KOMMENTAR & STATISTIKK

UNIVERSITETET I OSLO

Prøveeksamen STK vår 2017

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Fasit til obligatorisk oppgave i MAT 100A

Løsningsforslag til eksamen i TMA4245 Statistikk 7. juni 2007

Løsningsforslag til underveisvurdering i MAT111 vår 2005

BYFE DAFE Matematikk 1000 HIOA Obligatorisk innlevering 4 Innleveringsfrist Fredag 11. mars 2016 Antall oppgaver: Løsningsforslag

Løsningsforslag: Eksamen i MAT111 - Grunnkurs i Matematikk I

MA2501 Numeriske metoder

MAT-INF 2360: Obligatorisk oppgave 2

L12-Dataanalyse. Introduksjon. Nelson Aalen plott. Page 76 of Introduksjon til dataanalyse. Levetider og sensurerte tider

Høgskolen i Oslo og Akershus. a) Finn den deriverte av disse funksjonene: b) Finn disse ubestemte integralene: c) Finn disse bestemte integralene:

UNIVERSITETET I OSLO

Bootstrapping og simulering Tilleggslitteratur for STK1100

UNIVERSITETET I OSLO

LØSNINGSFORSLAG. Skriv følgende komplekse tall både på kartesisk form som a + bi og på polar form som re iθ (r 0 og 0 θ < 2π). a) 2 + 3i.

MAT-INF 2360: Obligatorisk oppgave 2

Prøve i Matte 1000 ELFE KJFE MAFE 1000 Dato: 02. desember 2015 Hjelpemiddel: Kalkulator og formelark

Om plotting. Knut Mørken. 31. oktober 2003

MAT-INF 1100: Obligatorisk oppgave 2

UNIVERSITETET I OSLO

= x lim n n 2 + 2n + 4

STK 2000 høsten 2006 Oblig I

Eksamensoppgave i Løsningsskisse TMA4240 Statistikk

Løsningsforslag til utvalgte oppgaver i kapittel 5

Høgskolen i Oslo og Akershus. i=1

Matematikk Øvingsoppgaver i numerikk leksjon 6 Løsningsforslag

Oppgave x d 1.0 for n from 1 by 1 to 200 do x d sin x end do

Notat 4 - ST februar 2005

TMA4240 Statistikk Eksamen desember 2015

UNIVERSITETET I OSLO

Løsningsforslag øving 8, ST1301

Eksamensoppgave i TMA4240 Statistikk

Løsningsforslag Eksamen M001 Våren 2002

Eksempel: s d taylor sin x, x = 0, 9

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Biseksjonsmetoden. biseksjonsmetode. Den første og enkleste iterativ metode for ikke lineære likninger er den så kalt

Løsningsforslag Eksamen M100 Høsten 1998

Løsningsforslag. Prøve i Matematikk 1000 BYFE DAFE 1000 Dato: 29. mai 2017 Hjelpemiddel: Kalkulator og formelark. Oppgave 1 Gitt matrisene.

UNIVERSITETET I OSLO

n=0 n=1 n + 1 Vi får derfor at summen er lik 1/2. c)

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

Prøve i Matte 1000 BYFE DAFE 1000 Dato: 03. mars 2016 Hjelpemiddel: Kalkulator og formelark. Alle svar skal grunngis. Alle deloppgaver har lik vekt.

Løsningsforslag MAT102 - v Jon Eivind Vatne

Mer om Markov modeller

En (reell) funksjon f fra en (reell) mengde D er en regel som til hvert element x D tilordner en unik verdi y = f (x).

Kontinuerlige sannsynlighetsfordelinger.

Punktestimator. STK Bootstrapping og simulering - Kap 7 og eget notat. Bootstrapping - eksempel Hovedide: Siden λ er ukjent, bruk ˆλ:

Løsningsforslag Eksamen S2, høsten 2016 Laget av Tommy Odland Dato: 27. januar 2017

Løsningsforslag. og B =

3x + 2y 8, 2x + 4y 8.

Eksamensoppgave i TMA4275 Levetidsanalyse

UNIVERSITETET I OSLO

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Lørdag 4. juni 2005 Tid: 09:00 13:00

UNIVERSITETET I BERGEN

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Hypotesetesting. Formulere en hypotesetest: Når vi skal test om en parameter θ kan påstås å være større enn en verdi θ 0 skriver vi dette som:

Transkript:

MAT-INF 2360: Obligatorisk oppgave 3. Løsningsforslag I kapittel 9 i kompendiet forklarte vi at maximum-likelihood er en av de viktige anvendelsene av ikke-lineær optimering. Vi skal se litt mer på hva dette innebærer i praksis. Utgangspunktet er at man har en sannsynlighetstetthetsfunksjon p(x; α, β,...) for et eller annet fenomen, der α, β,... er ukjente parametre (det kan være mange flere parametre enn det vi har listet opp her). Vi skal se på en modell fra fysikk for desintregrering av myoner. Vinkelen θ i elektronstråling ved desintregrering av myoner har en fordeling med sannsynlighetstetthet p(x; α) = 1 + αx (1) 2 for x [ 1, 1], der x = cos θ, og der α er en ukjent parameter i [ 1, 1]. Målet vårt er å estimere α ved hjelp av n målinger x = (x 1,..., x n ). I metoden for maximum likelihood gjøres dette ved at vi maksimerer likelihoodfunksjonen g(α) = n p(x i; α). Oppgave 1 Forklar hvorfor det å maksimere g er det samme som å maksimere ln g. Svar: Vi har at (ln g) = g g, slik at g (x) = 0 hvis og bare hvis (ln g) (x) = 0. Dette viser at funksjonene har de samme stasjonære punktene. Det viser seg at det ofte er enklere å maksimere ln g enn g selv, siden logaritmen til et produkt er summen av logaritmene. Vi skal derfor jobbe med ln g, som kalles for log-likelihoodfunksjonen. Mer presist skal vi jobbe med funksjonen f(α) = ln g(α), siden å finne maksimum til g er det samme som å finne minimum til f, og siden kompendiet er formulert for å finne minimum til funksjoner. Vi skal med andre ord minimere funksjonen ( n ) f(α) = ln g(α) = ln p(x i ; α) = ln((1 + αx i )/2). (2) 1

Oppgave 2 Regn ut f (α) og f (α). Tegn et fortegnskjema for f (α) (tegn det gjerne over hele R, selv om f er kun definert på [ 1, 1]), og bruk dette til å skissere minimumspunktene til f (men du skal ikke regne dem ut!). Hva kan du si om minimum til f i [ 1, 1] (igjen, du skal ikke regne dem ut)? Svar: Vi har at f (α) = f (α) = x i /2 (1 + αx i )/2 = x 2 i (1 + αx i ) 2 Vi ser umiddelbart at f (α) 0 når α ±. Siden x i 1 + αx i x i 1+αx i = 1 1/x i +α ser vi også at f (α) når α 1/x i nedenfra, og f (α) når α 1/x i ovenfra. Vi ser også at f (α) > 0, slik at f er konveks. Det er dermed klart at f har nøyaktig ett minimum i hvert intervall av formen [ 1/x i, 1/x i+1 ] når vi lister opp x i i voksende rekkefølge. Det er ikke sikkert at dette minimum ligger innenfor [ 1, 1] i det hele tatt. Hvis alle målepunktene har samme fortegn vil det garantert ikke gjøre det. I så fall vil minimum være et av endepunktene i intervallet. Ovenfor skal du ha funnet at f er konveks, dermed kan vi bruke resultater fra kompendiet til å begrunne at Newtons metode konvergerer mot minimum, så lenge vi starter nær nok. Siden vi allerede har regnet ut den deriverte og andrederiverte for f kan vi sette disse direkte inn i Newton s metode for å finne minimum til f (nullpunkt til f ). Oppgave 3 I seksjon 12 i kompendiet forklares det hvordan man kan lage en litt mer avansert variant av Newtons metode som fungerer for funksjoner i flere variable, og som bruker det vi kaller backtracking line search. I Oppgave 12.2.10 bli du bedt om å programmere denne. Koden fra denne oppgaven kan du finne i funksjonen newtonbacktrack, som ligger på det vanlige området for matlabkode for kurset (http://folk.uio.no/oyvindry/matinf2360/matlab/). Kommenter denne koden, ut fra teorien i Kapittel 12. 2

Oppgave 4 Funksjonen newtonbacktrack kaller en annen funksjon, armijorule, som implementerer Likning (12.7) i kompendiet, og som du også kan finne på det vanlige området for matlabkode for kurset. Hva vil kunne gå galt i denne funksjonen hvis 2 f er negativ definit (det vil si at alle egenverdiene til 2 f er negative)? Merk at dette ikke vil skape problemer for funksjonen f(α) vi bruker her, siden den er konveks (slik at 2 f er positiv definit)? Hint: Sett inn Taylorapproksimasjonen f(x k + β m sd k ) f(x k ) + f(x k ) T (β m sd k ) i (12.7), og husk at σ der er valgt slik at σ < 1. Svar: Vi vet fra før at f(x k ) f(x k + β m sd k ) β m s f(x k ) T d k. Skal (12.7) holde for store m må derfor Hvis 2 f er negativ definit vil β m s f(x k ) T d k σβ m s f(x k ) T d k. f(x k ) T d k = f(x k ) T 2 f(x k ) f(x k ) > 0. Deler vi med β m s f(x k ) T d k > 0 i ulikheten får vi derfor at 1 σ, som gir at σ 1. Men dette er ikke kompatibelt med σ = 10 3, som det står i kompendiet. Med andre ord, når 2 f er negativ definit kommer vi fort i situasjoner der armijorule går i en uendelig løkke. Dette lager ikke problemer for funksjonen vår siden f er konveks (positiv definit). Oppgave 5 Kjør funksjonen newtonbacktrack med f, f, og f som parametre når n = 10 og x = (0.4992, 0.8661, 0.7916, 0.9107, 0.5357, 0.6574, 0.6353, 0.0342, 0.4988, 0.4607) Bruk startverdi α 0 = 0 for Newtons metode. Husk at du kan sende inn en funksjon som f(x) = x 2 som parameter ved å sende med @(x)x.^2 som parameter. Hvilket estimat for minimumspunktet til f, og dermed til α, fikk du? Svar: Med x og f definert som over så kan denne oppgaven løses slik: 3

x=[0.4992; -0.8661; 0.7916; 0.9107; 0.5357; 0.6574; 0.6353; 0.0342; 0.4988; -0.4607]; [xopt,numit]=newtonbacktrack(... @(alpha)( -sum(log(1+alpha*x)/2) ),... @(alpha)( -sum(x./(1+alpha*x)) ),... @(alpha)( sum( x.^2./(1+alpha*x).^2) ),... 0) Svaret vi får da blir 0.7230. De ti punktene over ble generert fra en sannsynlighetsfordelig der α = 0.5. Svaret du fikk i Oppgave 5 viste seg å være gansk langt fra dette. La oss også se på hvor mange måleverdier vi bør bruke for å få ganske presise estimater på α. Du kan bruke funksjonen function ret=randmuon(alpha,m,n) til å generere en m n-matrise med måleverdier generert etter en sannsynlighetsfordeling med gitt verdi for α. Denne funksjonen kan du finne på det vanlige området for matlabkode for kurset. Oppgave 6 Med α = 0.5, generer n = 10 måleverdier ved hjelp av funksjonen randmuon, og finn maximum-likelihood-estimatet som over. Gjenta dette ti ganger, og plott de ti estimatene du har fått. Gjenta for n = 1000, og for n = 100000 (i alle tilfellene skal du altså plotte 10 maximum-likelihood estimater). Hvor mange måleverdier trenger vi for å få en pålitelig maximum-likelihood estimator for α? Legg merke til at det er mulig at maximum-likelihood-estimatene du får her ligger utenfor definisjonsområdet [ 1, 1]. Det trenger du ikke bry deg om. Svar: De ti estimatene vi får for n = 10, n = 1000, og n = 100000 kan plottes slik: for ant=[10 1000 100000] pts=zeros(1,10); for z=1:10 x=randmuon(0.5,ant,1); [xopt,numit]=newtonbacktrack(... @(alpha)( -sum(log(1+alpha*x)/2) ),... 4

pts(z)=xopt; end plot(pts); end @(alpha)( -sum(x./(1+alpha*x)) ),... @(alpha)( sum( x.^2./(1+alpha*x).^2) ),... 0); Vi ser fra figurene vi da får at det er først for n = 100000 at maximumlikelihood estimatene begynner å bli ganske pålitelige. 5