Kvantifisering av operasjonell risiko basert på kombinering av hendelsesdata og subjektive risikovurderinger

Like dokumenter
Regneøvelse 29/5, 2017

DEL 1 GRUNNLEGGENDE STATISTIKK

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

FORMELSAMLING TIL STK1100 OG STK1110

6.5 Normalapproksimasjon til. binomisk fordeling

Eksamensoppgave i TMA4240 Statistikk

Oppfriskning av blokk 1 i TMA4240

TMA4240 Statistikk Høst 2016

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

STK Oppsummering

TMA4240 Statistikk Eksamen desember 2015

Eksamen STK2400, 6/ Løsningsforslag

TMA4240 Statistikk H2010

Punktestimator. STK Bootstrapping og simulering - Kap 7 og eget notat. Bootstrapping - eksempel Hovedide: Siden λ er ukjent, bruk ˆλ:

Bootstrapping og simulering Tilleggslitteratur for STK1100

FORMELSAMLING TIL STK1100 OG STK1110

A) B) 400 C) 120 D) 60 E) 10. Rett svar: C. Fasit: ( 5 6 = 60. Hvis A, B, C er en partisjon av utfallsrommet S, så er P (A B) lik.

TMA4245 Statistikk Eksamen desember 2016

STK juni 2018

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

TMA4240 Statistikk 2014

Observatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU

ST0103 Brukerkurs i statistikk Høsten Momentestimatoren og sannsynlighetsmaksimeringsestimatoren

TMA4240 Statistikk Høst 2015

Forelesning 27. mars, 2017

TMA4240 Statistikk Høst 2008

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4240 Statistikk Høst 2007

Kapittel 4.4: Forventning og varians til stokastiske variable

Kap. 6, Kontinuerlege Sannsynsfordelingar

6.1 Kontinuerlig uniform fordeling

Eksamensoppgave i TMA4250 Romlig Statistikk

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Xxxdag xx. juni 2008 Tid: 09:0013:00

Kontinuerlige sannsynlighetsfordelinger.

EKSAMEN I EMNE TMA4265/SIF5072 STOKASTISKE PROSESSER Onsdag 10. august 2005 Tid: 09:00 13:00

Dekkes av kap , 9.10, 9.12 og forelesingsnotatene.

TMA4240 Statistikk Eksamen desember 2015

Eksamensoppgave i TMA4240 Statistikk

Kap. 6, Kontinuerlege Sannsynsfordelingar

EKSAMEN I EMNE SIF5072 STOKASTISKE PROSESSER Lørdag 16. august 2003 Tid: 09:00 14:00

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Ekstreme bølger. Geir Storvik Matematisk institutt, Universitetet i Oslo. 5. mars 2014

Oppgave 1 Vi lar X være antall tankskip som ankommer havnen i løpet av en dag. Vi har fått oppgitt at X poisson(λ) med

L12-Dataanalyse. Introduksjon. Nelson Aalen plott. Page 76 of Introduksjon til dataanalyse. Levetider og sensurerte tider

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

UNIVERSITETET I OSLO

Kapittel 2: Hendelser

TMA4240 Statistikk Høst 2018

TMA4240 Statistikk H2010

3.1 Stokastisk variabel (repetisjon)

ECON Statistikk 1 Forelesning 4: Stokastiske variable, fordelinger. Jo Thori Lind

TMA4240 Statistikk H2015

UNIVERSITETET I OSLO

TMA4245 Statistikk Eksamen august 2014

UNIVERSITETET I OSLO Matematisk Institutt

SIF5072 Stokastiske prosesser Side 2 av 7 Gitt at en pasient er symptomfri ved tidspunkt t, hva er sannsynligheten for at han er symptomfri i hele per

Forelesning 3. april, 2017

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

TMA4240 Statistikk 2014

Første sett med obligatoriske oppgaver i STK1110 høsten 2015

HØGSKOLEN I STAVANGER

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

Eksamensoppgåve i TMA4250 Romleg Statistikk

Bootstrapping og stokatisk simulering Tilleggslitteratur for STK1100

TMA4240 Statistikk 2014

Forelesning 13. mars, 2017

Eksamen - INF 283 Maskinlæring

Prøveeksamen STK2100 (fasit) - vår 2018

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

UNIVERSITETET I OSLO

Løsning eksamen desember 2017

Matematisk statistikk og stokastiske prosesser B, høsten 2006 Løsninger til oppgavesett 5, s. 1. Oppgave 1

Oppgave 1: Feil på mobiltelefoner

LØSNINGSFORSLAG TIL EKSAMEN I FAG SIF5045 NUMERISK LØSNING AV DIFFERENSIALLIGNINGER

Bernoulli forsøksrekke og binomisk fordeling

Regneøvelse 22/5, 2017

To-dimensjonale kontinuerlige fordelinger

Mer om Markov modeller

ÅMA110 Sannsynlighetsregning med statistikk, våren

UNIVERSITETET I OSLO

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Eksamen i SIF5036 Matematisk modellering Onsdag 12. desember 2001 Kl

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Lørdag 4. juni 2005 Tid: 09:00 13:00

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

TFY4215 Kjemisk fysikk og kvantemekanikk - Øving 1 1 ØVING 1. En liten briefing om forventningsverdier, usikkerheter osv

Bootstrapping og simulering

Optimal long-term investment in general insurance

SIGNERT DOMINASJON OG RETTEDE MATROIDESYSTEMER

FY1006/TFY4215 Innføring i kvantefysikk - Øving 1 1 ØVING 1. En liten briefing om forventningsverdier, usikkerheter osv

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

TMA4245 Statistikk Eksamen desember 2016

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

EKSAMEN I EMNE TTM4110 PÅLITELIGHET OG YTELSE MED SIMULERING LØSNINGSFORSLAG. Mandag 14. desember 2005 Tid: 09:00 13:00

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

UNIVERSITETET I OSLO

Transkript:

Kvantifisering av operasjonell risiko basert på kombinering av hendelsesdata og subjektive risikovurderinger Arne Bang Huseby 1 and Jan Thomsen 2 1 University of Oslo, Norway 2 Norges Bank Investment Management, Norway ESRA-seminar, Universitet i Oslo, 3. februar 2016

Kombinering av hendelsesdata and subjektive risikovurderinger Incidents Risk factors HENDELSER: Observasjoner av hendelser som har inntruffet med tilhørende konsekvenser (f.eks. økonomisk tap) RISIKO FAKTORER: Et ekspertpanel identifiserer potensielle risiko faktorer. For hver risikofaktor anslås hendelsesfrekvens og konsekvensfordeling.

Hovedutfordringer Bare nyere hendelser kan betraktes som relevante når man skal vurdere mulige fremtidige hendelser. Dette betyr at vi har relativt begrenset med data. Hovedpoenget med å inkludere de subjektivt identifiserte risikofaktorene er å ta hensyn til potensielle risikohendelser som ennå ikke har inntruffet. Det vil typisk være overlapp mellom type hendelser som har inntruffet, og de identifiserte risikofaktorene. Hendelsesdataene er i en form som gjør det umulig å sammenholde disse direkte med de subjektivt identifiserte risikofaktorene. Dette betyr at graden av overlapp er usikker. Det er erfaringsvis store forskjeller mellom de observerte hendelsene og de identifiserte risikofaktorene.

Sammensatte Poisson-prosesser N(t) = Antall hendelser i intervallet [0, t) X i = Konsekvensen av ite hendelse N(t) X i Z (t) = Hovedantagelser i=1 P(N(t) = n) = (λt)n e λt, n = 0, 1, 2,... n! X 1, X 2,... er uavhengige og identisk fordelte stokastiske variable med felles kumulativ sannsynlighetsfordeling F.

Summer av uavhengige sammensatte Poisson-prosesser Antall hendelser: N s (t) Po(λ s t), Konsekvenser: X s1, X s2,... F s, Z s (t) = X s1 + + X s,ns(t), s = 1,..., r s = 1,..., r s = 1,..., r Z (t) = Z 1 (t) + + Z r (t) Da er Z (t) en sammensatt Poisson-prosess. Antall hendelser er Po(λt)-fordelt, der λ = λ 1 + + λ r, og konsekvensfordeling: F(x) = r s=1 λ s λ F s(x), dvs. en blanding av konsekvensfordelingene for Z 1 (t),..., Z r (t).

MC simulering av uavhengige sammensatte Poisson-processer METODE 1 STEP 1. Trekk N(t) Po(λt) STEP 2. Trekk X 1,..., X N(t) F(x) = r s=1 λs λ F s(x) N(t) X i Z (t) = i=1 METODE 2 STEP 1. Trekk N s (t) Po(λ s t), s = 1,..., r. STEP 2. Trekk X s1,..., X s,ns(t) F s (x), s = 1,..., r Z (t) = r Z s (t) = s=1 r s=1 N s(t) i=1 X si

Usikkerhet knyttet til hendelsesintensiteter Apriorifordeling for λ π(λ) = Aposteriorifordeling for λ βα Γ(α) λα 1 e βλ, λ > 0. π(λ τ, ν) = (β + τ)α+ν Γ(α + ν) λα+ν 1 e (β+τ)λ, λ > 0. der τ er lengden på intervallet prosessen har blitt observert i og ν er antall observerte hendelser i dette intervallet. BEMERK: Parameteren β kan fortolkes som et mål for styrken i den apriori innsikten. Mer presist: den apriori innsikten er sammenlignbar med å ha observert prosessen over et intervall av lengde β.

Usikkerhet knyttet til konsekvensfordelingen La F betegne den sanne konsekvensfordelingen for en gitt hendelse, la Y 1,..., Y ν betegne de tilgjengelige data, og innfør: S ν (x) = ν I(Y j x) = ν ˆF ν (x). j=1 Da følger det at: S ν (x) F(x) Bin(ν, F(x)). For hver x > 0 har vi også et apriori estimat for F(x), betegnet φ(x). For å kombinere dette med data, må vi utvide dette til en full apriorifordeling: F(x) Beta(cφ(x), c(1 φ(x))), x > 0, der c > 0 en passende valgt konstant.

Usikkerhet knyttet til konsekvensfordelingen (forts.) Vi får da at: E[F(x)] = φ(x), Var[F(x)] = φ(x)(1 φ(x)). c + 1 Bemerk at høye verdier for c medfører at Var[F(x)] er liten. Hvis dette er tilfelle, indikerer dette at den apriori innsikten er sterk.

Usikkerhet knyttet til konsekvensfordelingen (forts.) Ved å benytte Bayes teorem får vi dermed at: F(x) S ν (x) Beta(cφ(x)+S ν (x), c(1 φ(x))+ν S ν (x)), x > 0. Forventningen i aposteriorifordelingen er da: E[F(x) S ν (x)] = cφ(x) + S ν(x) c + ν = c c + ν φ(x) + ν c + ν ˆF ν (x), For enkelhets skyld, betegner vi E[F(x) S ν (x)] med φ (x), og bruker dette som vå oppdaterte konsekvensfordeling.

Usikkerhet knyttet til konsekvensfordelingen (forts.) Apriori-estimatet for konsekvensfordelingen kan selv være en blandingsfordeling: der λ = λ 1 + + λ r. φ(x) = r s=1 λ s λ φ s(x), Vi får dermed følgende aposteriori-estimat for konsekvensfordelingen: φ (x) = c c + ν r s=1 λ s λ φ s(x) + ν c + ν ˆF ν (x).

Simulering av s uavhengige sammensatte Poisson-prosesser med usikkerhet - APRIORI I hver iterasjon i Monte Carlo simuleringen gjøres følgende: STEP 1. Trekk λ s fra Gamma(α s, β s ), s = 1,..., r. STEP 2. Trekk N s (t) fra Po(λ s t), s = 1,..., r. STEP 3. Trekk X s1,..., X s,ns(t) fra φ s (x), s = 1,..., r. STEP 4. Beregn: Z (t) = r s=1 N s(t) i=1 X si.

Simulering av s uavhengige sammensatte Poisson-prosesser med usikkerhet - APOSTERIORI I hver iterasjon i Monte Carlo simuleringen gjøres følgende: STEP 1. Trekk λ s from Gamma(α s + ν s, β s + τ), s = 1,..., r. STEP 2. Beregn λ s = λsc (c+ν s) og µ s = STEP 2. Trekk N s (t) fra Po( λ s t), s = 1,..., r. STEP 3. Trekk M s (t) fra Po( µ s t), s = 1,..., r. λsνs (c+ν s), s = 1,..., r. STEP 4. Trekk X s1,..., X s,ns(t) fra φ s (x), s = 1,..., r. STEP 5. Trekk Y s1,..., Y s,ms(t) fra ˆF νs (x), s = 1,..., r. STEP 6. Beregn: Z (t) = N r s(t) M s(t) ( X si + Y si ). s=1 i=1 i=1

Simulering av s uavhengige sammensatte Poisson-prosesser med usikkerhet (forts.) Bemerk at metoden vi nettopp har beskrevet forutsetter at vi er i stand til å fordele de observerte hendelsene på de ulike risikofaktorene, slik at ν s hendelser tilskrives ste risikofaktor. I praksis vil det ikke være mulig å fordele de observerte hendelsene på denne måten. I stedet må man ta hensyn til at det er usikkerhet knyttet til en slik klassifisering. Løsningen på dette problemet blir for komplisert å beskrive her, så vi henviser til forskningsrapporten vår for en detaljert gjennomgang av denne situasjonen.

To separate delmodeller Den totale simuleringsmodellen for kombinering av hendelsesdata og risikofaktorer består av to separate delmodeller: DELMODELL 1: Den rene hendelsesdatamodellen Denne modellen er ment å inkludere data for alle hendelser som ikke relateres til de subjektivt identifiserte risikofaktorene. DELMODELL 2: Risikofaktormodellen Denne modellen inkluderer de subjektivt identifiserte risikofaktorene, og oppdateres i lys av data som relateres til disse (dvs. de data som ikke er inkludert i den rene hendelsesdatamodellen).

Fordeling av hendelsesdata mellom den rene hendelsesmodellen Vi antar at vi har observert ν hendelser med tilhørende konsekvenser: W 1,..., W ν. La så R i = 1 dersom ite hendelse skal inkluderes i risikofaktormodellen, og 0 ellers, i = 1,..., ν. R 1,..., R ν er stokastiske variable med fordeling: P(R i = 1) = 1 e ρw i, i = 1,..., ν Vi innfører også følgende indeksmengder: Ω R = {i : R i = 1}, Ω I = {i : R i = 0} Ω R er indeksmengden for de data som skal inkluderes i risikofaktormodellen, og Ω I er indeksmengden for de data som skal inkluderes i den rene hendelsesdatamodellen.

Simulering av totalmodellen I hver iterasjon i Monte Carlo simuleringen gjøres følgende: STEP 1. Trekk R i slik at P(R i = 1) = 1 e ρw i, i = 1,..., ν, and bestem indeksmengdene Ω R and Ω I. STEP 2. Simuler risikofaktormodellen basert på observasjoner med indekser i Ω R. STEP 3. Simuler den rene hendelsesdatamodellen basert på observasjoner med indekser i Ω I. STEP 4. Beregn den totale konsekvensen ved å legge sammen resultatene fra begge modeller.

Numeriske eksempler Hendelsesdatabasen inneholder data fra en periode på τ = 5 år med totalt ν = 460 observerte hendelser. Risikofaktormodellen inneholder r = 30 risikofaktorer. Vi antar at λ s Gamma(α s, β R ), s = 1,..., 30. To tilfeller betraktes: β R = 0.2 (svak apriori innsikt) β R = 1.0 (moderat apriori innsikt). I sannsynlighetsfordelingen P(R i = 1) = 1 e ρw i ser vi på tre tilfeller: ρ = 0.005 (nesten alle dataene benyttes i den rene hendelsesdatamodellen) ρ = 0.5 (dataene fordeles omtrent likt mellom de to modellene) ρ = 50 (nesten alle dataene benyttes i risikofaktormodellen).

Numeriske eksempler Table: Mean and standard deviations for the case when β R = 0.2. ρ = 0.005 ρ = 0.5 ρ = 50 Incidence model Mean 172.07 32.72 0.05 St.dev. 67.14 7.81 0.05 Risk factor model Mean 40.47 174.43 207.1 St.dev. 68.71 91.45 91.48 Combined model Mean 212.54 207.15 207.17 St.dev. 93.23 91.76 91.48

Simulerte resultater når β R = 0.2 Figure: Estimated cumulative distributions for the accumulated consequences using ρ = 0.005 (red curve), ρ = 0.5 (green curve) and ρ = 50 (blue curve), β R = 0.2.

Numeriske eksempler Table: Mean and standard deviations for the three models for the case when β R = 1.0 ρ = 0.005 ρ = 0.5 ρ = 50 Incidence model Mean 172.07 32.72 0.05 St.dev. 67.14 7.81 0.05 Risk factor model Mean 84.06 199.40 227.87 St.dev. 92.67 105.86 105.86 Combined model Mean 256.13 232.11 227.93 St.dev. 112.23 106.10 105.86

Simulerte resultater når β R = 1.0 Figure: Estimated cumulative distributions for the accumulated consequences using ρ = 0.005 (red curve), ρ = 0.5 (green curve) and ρ = 50 (blue curve), β R = 1.0.

Konklusjoner Vi har utviklet en modell for hvordan man kan kombinere hendelsesdata med subjektivt identifiserte risikofaktorer. Modellen består av to delmodeller: den rene hendelsesdatamodellen og riskofaktormodellen. Modellen kan håndtere usikkerhet knyttet til graden av overlapp mellom de to delmodellene. Modellen kan håndtere usikkerhet knyttet til hendelsesrater for de ulike risikofaktorene, og lar oss oppdatere denne usikkerheten basert på tilgjengelige observerte hendelser. Modellen kan håndtere usikkerhet knyttet til konsekvenser for de ulike risikofaktorene, og lar oss oppdatere denne usikkerheten basert på tilgjengelige observerte konsekvenser.