Copula goodness-of-fit testing

Like dokumenter
Par-copula konstruksjoner: Et fleksibelt verktøy for å modellere multivariat avhengighet

L12-Dataanalyse. Introduksjon. Nelson Aalen plott. Page 76 of Introduksjon til dataanalyse. Levetider og sensurerte tider

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE

DCC-GARCH-modeller med ulike avhengighetsstrukturer

Prosjektnummer: /I99 Prosjekttittel: Methodological developments in the analysis of financial risk called for by industry needs

Bootstrapping og simulering Tilleggslitteratur for STK1100

TMA4240 Statistikk H2010

Velkommen til MA1103 Flerdimensjonal analyse

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

Eksamensoppgave i TMA4267 Lineære statistiske modeller

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Methodological developments in the analysis of risk called for by industry needs

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

Matlab-tips til Oppgave 2

Obligatorisk oppgave. Gjennomgang

Eksamensoppgave i TMA4275 Levetidsanalyse

i=1 t i +80t 0 i=1 t i = 9816.

Punktestimator. STK Bootstrapping og simulering - Kap 7 og eget notat. Bootstrapping - eksempel Hovedide: Siden λ er ukjent, bruk ˆλ:

STK Oppsummering

Eksamensoppgave i TMA4275 Levetidsanalyse

Bootstrapping og stokatisk simulering Tilleggslitteratur for STK1100

UNIVERSITETET I OSLO

Dimensjonering av betongbruer i bruksgrensetilstand

UNIVERSITETET I OSLO

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

TMA4240 Statistikk Høst 2007

EKSAMEN I NUMERISK LINEÆR ALGEBRA (TMA4205)

1 + γ 2 X i + V i (2)

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4245 Statistikk

EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Lørdag 4. juni 2005 Tid: 09:00 13:00

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Energy Calibration for the Forward Detector at WASA-at-COSY

UNIVERSITETET I OSLO

Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget

Bootstrapping og simulering

Seminaroppgave 10. (a) Definisjon: En estimator θ. = θ, der n er et endelig antall. observasjoner. Forventningsretthet for β: Xi X ) Z i.

7 Global Linkages and Economic Growth

Hypotesetest: generell fremgangsmåte

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Løsningsforslag for Obligatorisk Oppgave 2. Algoritmer og Datastrukturer ITF20006

Fakultet for informasjonsteknologi, Institutt for matematiske fag EKSAMEN I EMNE ST2202 ANVENDT STATISTIKK

UNIVERSITETET I OSLO Det matematisk naturvitenskapelige fakultet

α =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)

UNIVERSITETET I OSLO

Gammafordelingen og χ 2 -fordelingen

Modifisering av Black & Scholes opsjonsprising ved bruk av NIG-fordelingen

Eksamensoppgave i TMA4267 Lineære statistiske modeller

LØSNINGSFORSLAG ) = Dvs

Notat 3 - ST februar 2005

vekt. vol bruk

Ekstraoppgaver for STK2120

v(t) = r (t) = (2, 2t) v(t) = t 2 T(t) = 1 v(t) v(t) = (1 + t 2 ), t 2 (1 + t 2 ) t = 2(1 + t 2 ) 3/2.

EKSAMEN I FAG ST2202 ANVENDT STATISTIKK

Elektrisk potensial/potensiell energi

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

Kapittel 10: Hypotesetesting

Matematisk statistikk og stokastiske prosesser B, høsten 2006 Løsninger til oppgavesett 5, s. 1. Oppgave 1

Abstract. i x + a x +. a = (a x, a y ) z γ + 1 γ + z )

Eksamen TFY 4210 Kvanteteorien for mangepartikkelsystem, våren 2012

UNIVERSITETET I OSLO

TFY4104 Fysikk Eksamen 28. november 2016 Side 13 av 22

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

3.A IKKE-STASJONARITET

Fasit og løsningsforslag STK 1110

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

UNIVERSITETET I OSLO

(1 + x 2 + y 2 ) 2 = 1 x2 + y 2. (1 + x 2 + y 2 ) 2, x 2y

UNIVERSITETET I OSLO Matematisk Institutt

TFY4104 Fysikk Eksamen 28. november 2016 Side 13 av 22

EKSAMEN I FAG SIF4002 FYSIKK. Mandag 5. mai 2003 Tid: Sensur uke 23.

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

Generelle lineære modeller i praksis

EKSAMEN I FAG TMA4255 FORSØKSPLANLEGGING OG ANVENDTE STATISTISKE METODER

Systemidentifikasjon Oppgaver

TDT4105 IT Grunnkurs Høst 2014

A.3.e: Ortogonale egenfunksjonssett

Forelesning 11 STK3100/4100

NTNU. MA1103 Flerdimensjonal Analyse våren Maple-øving 2. Viktig informasjon. Institutt for matematiske fag. maple02 28.

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk

Forelesning 7 STK3100/4100

UNIVERSITETET I OSLO

TFY4102 Fysikk Eksamen 16. desember 2017 Foreløpig utgave Formelside 1 av 6

Løsningsforslag Eksamen i Fys-mek1110 våren 2010

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Forelesning 7 STK3100/4100

Weibullfordelingen. Kjetil L. Nielsen. Innhold. 1 Teori. 1.1 Tetthetsfunksjon og fordelingsfunksjon

Løsningsforslag Eksamen i MIK130, Systemidentifikasjon (10 sp)

Forelesning 9 STK3100/4100

Estimatorar. Torstein Fjeldstad Institutt for matematiske fag, NTNU

Forelesning 4 STK3100

år i alder x i tid y i i=1 (x i x) 2 = 60, 9

Eksamensoppgave i TMA4295 Statistisk inferens

Bivariate analyser. Analyse av sammenhengen mellom to variabler. H 0 : Ingen sammenheng H 1 : Sammenheng

Transkript:

Daniel Berg Universitetet i Oslo & Norsk Regnesentral DET 14. NORSKE STATISTIKERMØTET Sommarøya 19. -21. Juni 2007

Outline 1. 2. 2.1 Lovende tester 2.2 Cpit2-testen 3. 4. 5.

C n C ρ C ρν v u v u v u C δ C θ C ξ v u v u v u

1. Passer vår modell til dataene? Univariat Anderson-Darling eller QQ-plot Multivariat færre alternativer Grensefordelingen til en copula GoF test avhenger av parameteren p-verdi estimeres via tunge parametriske bootstrap prosedyrer Fokus i litteraturen er nesten utelukkende bivariat

GoF tester Cpit2-testen 2. Flere teknikker har blitt foreslått: Diskretisering av sannsynlighets rommet (binning) Multivariat glatting Dimensjonsreduksjon Konstruksjoner for å teste for en spesifikk copula Generelle tester for å teste enhver copula

GoF tester Cpit2-testen 2.1 Lovende tester n{c n (u) C θn (u)}, u = u 1,..., u d, n{k n (u) K θn (u)}, K(t) = P(C(u) t), n{l n (u) L θn (u)}, L(t) = P( d i=1 u i t), Rosenblatt s transformasjon test for uavhengighet.

GoF tester Cpit2-testen 2.1.1 Eksempel på K n -plott t K(t) 0.30 0.20 0.10 0.00 t Figure: Eksempel på K-plot (t K(t), 95% ci)

GoF tester Cpit2-testen 2.2 Cpit2-testen (Berg and Bakken, 2007) n observasjoner av en d-dimensjonal vektor X Pseudo-observasjoner Z U(0, 1) d Rosenblatt s transformasjon (cpit) basert på Z V Teste V for uavhengighet

GoF tester Cpit2-testen 2.2 Cpit2-testen Breymann et al. (2003): W G = d i=1 Φ 1 (V i ) 2 Two problems: 1. Vekt funksjonen Φ 1 ( ) for ekstrem - problem for liten n 2. Oppdager ikke radiell asymmetri (Φ 1 (0.2) 2 = Φ 1 (0.8) 2 ) Rosenblatt s transformasjon på V H W B = d i=1 Γ V (V (i) ; α) Γ H (H i ; α) Eksempler på Γ(X ): Φ 1 (X ) 2, X 0.5, (X 0.5) α, α = (2, 4,...) Spesialtilfelle: Γ V (X ) = Φ 1 (X ) 2 og Γ H (X ) = 1

W v2 Outline GoF tester Cpit2-testen 2.2 Cpit2-testen W B = d i=1 Φ 1 (V (i) ): v1

W v2 Outline GoF tester Cpit2-testen 2.2 Cpit2-testen W B = d i=1 V (i) 0.5 : v1

W v2 Outline GoF tester Cpit2-testen 2.2 Cpit2-testen W B = d i=1 V (i) 0.5 H i 0.5 : v1

3. (1/3) H 0 H 1 B 2,0 C n K n L n Gauss Gauss 0.048 0.051 0.046 0.049 Student t4 0.022 0.075 0.055 0.046 Clayton 0.011 0.728 0.638 0.405 Gumbel 0.016 0.221 0.204 0.078 Student t4 Gauss 0.049 0.049 0.063 0.054 Student t4 0.051 0.049 0.054 0.055 Clayton 0.070 0.705 0.682 0.532 Gumbel 0.081 0.184 0.210 0.093 Clayton Gauss 0.075 0.854 0.691 0.605 Student t4 0.205 0.820 0.566 0.534 Clayton 0.051 0.048 0.051 0.046 Gumbel 0.238 0.990 0.922 0.911 Gumbel Gauss 0.047 0.287 0.372 0.175 Student t4 0.058 0.248 0.305 0.115 Clayton 0.057 0.988 0.998 0.850 Gumbel 0.048 0.057 0.050 0.054 Table: Styrke (%) til copula GoF tester, d = 2, n = 100, τ = 0.5.

3. (2/3) H 0 H 1 B 2,0 C n K n L n Gauss Gauss 0.058 0.053 0.051 0.053 Student t4 0.642 0.205 0.147 0.116 Clayton 0.046 0.943 0.924 0.570 Gumbel 0.024 0.660 0.903 0.962 Student t4 Gauss 0.049 0.052 0.052 0.046 Student t4 0.054 0.053 0.053 0.055 Clayton 0.624 0.964 0.875 0.690 Gumbel 0.486 0.372 0.882 0.974 Clayton Gauss 0.188 0.999 0.448 0.975 Student t4 0.932 0.987 0.157 0.879 Clayton 0.049 0.049 0.052 0.051 Gumbel 0.444 0.996 0.915 1.000 Gumbel Gauss 0.055 0.999 0.983 0.737 Student t4 0.764 0.983 0.982 0.644 Clayton 0.175 1.000 1.000 1.000 Gumbel 0.027 0.052 0.039 0.049 Table: Styrke (%) til copula GoF tester, d = 5, n = 200, τ = 0.25.

3. (3/3) H 0 H 1 B 2,0 C n K n L n Gauss Gauss 0.052 0.057 0.053 0.050 Student t4 1.000 0.668 0.383 0.411 Clayton 0.159 0.998 0.995 0.957 Gumbel 0.098 0.979 1.000 1.000 Student t4 Gauss 0.044 0.053 0.051 0.051 Student t4 0.059 0.052 0.053 0.047 Clayton 1.000 1.000 0.964 0.988 Gumbel 1.000 0.932 1.000 1.000 Clayton Gauss 0.236 1.000 0.858 0.998 Student t4 1.000 1.000 0.277 0.950 Clayton 0.042 0.052 0.051 0.051 Gumbel 0.642 1.000 1.000 1.000 Gumbel Gauss 0.155 1.000 1.000 1.000 Student t4 1.000 1.000 1.000 0.998 Clayton 0.568 1.000 1.000 1.000 Gumbel 0.044 0.052 0.045 0.052 Table: Styrke (%) til copula GoF tester, d = 5, n = 1000, τ = 0.15.

4. GoF test basert på to estimatorer av θ, f.eks. n{ρ 1 (ρ n ) τ 1 (τ n )} Hvilken effekt har parameter estimator på styrken til en test: n{cn C ρ 1 (ρ n)} vs. n{c n C τ 1 (τ n)} Lokal styrke ved små pertubasjoner fra H 0 : Q δn = (1 δ n )C + δ n D, δ n = δ/ n, δ n Hvilken effekt har bootstrap parametre på styrken til en test. Kan vi finne optimale valg (tommelfinger regler)? FGoF?

H n n{cn C θ } τ 1 (H 0 = Clayton) Clayton Frank Gumbel-Hougaard Gaussian 250 0.1 0.0530 0.1517 0.9971 0.0636 n{cn C 0 } 0.2 0.0533 0.6316 1.0000 0.2536 0.3 0.0514 0.9697 1.0000 0.7100 0.1 0.0487 0.2295 0.1212 0.1094 n{cn C ρ} 0.2 0.0493 0.6874 0.3730 0.3175 0.3 0.0483 0.9425 0.6746 0.6076 0.1 0.0484 0.2339 0.1169 0.1081 n{cn C τ } 0.2 0.0513 0.6846 0.3652 0.3125 0.3 0.0531 0.9487 0.6677 0.5870 0.1 0.0438 0.0860 0.0619 0.0466 n{cn C PL } 0.2 0.0509 0.5161 0.3366 0.2010 0.3 0.0536 0.8717 0.7240 0.4988 2500 0.1 0.0526 0.6669 1.0000 0.2606 n{cn C 0 } 0.2 0.0499 0.9992 1.0000 0.8772 0.3 0.0480 1.0000 1.0000 0.9997 0.1 0.0515 0.5541 0.2282 0.1868 n{cn C ρ} 0.2 0.0512 0.9956 0.8133 0.7390 0.3 0.0506 1.0000 0.9941 0.9858 0.1 0.0512 0.5495 0.2238 0.1962 n{cn C τ } 0.2 0.0492 0.9967 0.8147 0.7369 0.3 0.0505 1.0000 0.9934 0.9853 0.1 0.0477 0.6234 0.4573 0.3298 n{cn C PL } 0.2 0.0500 0.9967 0.9461 0.8339 0.3 0.0501 1.0000 0.9996 0.9927

5. Flere gode tester, dimensjonsreduksjon mest lovende, spesielt for høyere dimensjoner Cpit2-testen, basert på Rosenblatt s transformasjon Styrke sammenligning: n{c n C θn } svært god Mye spennende å jobbe videre med TITAN - 800 cpus - ikke mulig foruten!

References Contact Referanser Berg, D. and H. Bakken (2007). A copula goodness-of-fit test based on the probability integral transform. Submitted. Breymann, W., A. Dias, and P. Embrechts (2003). Dependence structures for multivariate high-frequency data in finance. Quantitative Finance 1, 1 14.

References Contact Contact details Daniel Berg, Universitetet i Oslo & Norsk Regnesentral, daniel@danielberg.no www.danielberg.no