NGF 2008 Ekstreme hendelser sett med en statistikers øyne



Like dokumenter
TMA4240 Statistikk 2014

TMA4240 Statistikk Høst 2013

0:7 0:2 0:1 0:3 0:5 0:2 0:1 0:4 0:5 P = 0:56 0:28 0:16 0:38 0:39 0:23

Klassisk ANOVA/ lineær modell

Dean Zollman, Kansas State University Mojgan Matloob-Haghanikar, Winona State University Sytil Murphy, Shepherd University

Medisinsk statistikk, KLH3004 Dmf, NTNU Styrke- og utvalgsberegning

Checking Assumptions

Gruppe 5: Klimamodellering og analyse. Nils Gunnar Kvamstø David B. Stephenson

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

Klima i Norge 2100 Kunnskapsgrunnlag for klimatilpassing

IPCC, From emissions to climate change

Accuracy of Alternative Baseline Methods

Checking Assumptions

Logistisk regresjon 2

Klimaendringer betydningen for dimensjoneringsgrunnlaget for hydrotekniske systemer i. landbruket Atle Hauge Bioforsk

Dekkes av pensumsidene i kap. lesingsnotatene. Hypotesetesting er en systematisk fremgangsmåte

Lineære modeller i praksis

SOS 301 og SOS31/ SOS311 MULTIVARIAT ANALYSE

FNs klimapanel som institusjon og prosess. Tora Skodvin, Vitenskapsakademiet, 20. februar 2010

Oppgave. føden)? i tråd med

Solceller og bærekraft Kulturhuset 19. juni 2019

Perpetuum (im)mobile

Klimaendringer og klimarisiko. Borgar Aamaas For Naturviterne 10. november 2016

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

FINAL EXAM IN STA-2001

Klimaendringer og konsekvenser for småkraftverk Blir det mer eller mindre behov for magasiner?

0:6 0:3 0:1 0:4 0:2 0:4

INF5820 Natural Language Processing - NLP. H2009 Jan Tore Lønning

By Bioforsk RECOCA Team Per Stålnacke Csilla Farkas Johannes Deelstra

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

Skog som biomasseressurs: skog modeller. Rasmus Astrup

Andrew Gendreau, Olga Rosenbaum, Anthony Taylor, Kenneth Wong, Karl Dusen

Generalization of age-structured models in theory and practice

UNIVERSITETET I OSLO

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4245 STATISTIKK 6.august 2004

Er det mulig at flertallet av førere er sikrere enn gjennomsnittsføreren?

Slope-Intercept Formula

Vekstkonferansen: Vekst gjennom verdibaserte investeringer. Thina Margrethe Saltvedt, 09 April 2019

Tidlig behandling med de mest effektive medikamentene. Øivind Grytten Torkildsen

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Internasjonalt samarbeid og nye kunnskapsmuligheter

Bedriftenes møteplass. Thina Margrethe Saltvedt, 02 April 2019

Presisjonsseismologi: Nøyaktig lokalisering av Nord-Koreas prøvesprengninger

Analysis of ordinal data via heteroscedastic threshold models

UNIVERSITETET I OSLO

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Eksamen i : STA-1002 Statistikk og. Eksamensdato : 26. september Sted : Administrasjonsbygget. Tillatte hjelpemidler : - Godkjent kalkulator

Heuristiske søkemetoder III

KROPPEN LEDER STRØM. Sett en finger på hvert av kontaktpunktene på modellen. Da får du et lydsignal.

SOS 31 MULTIVARIAT ANALYSE

Bærekraftig utvikling og klimaforandringer. Foredrag i RE RK ved Eivald M.Q.Røren 4.nov Innholdsfortegnelse

Databases 1. Extended Relational Algebra

Verifiable Secret-Sharing Schemes

Page 1 EN DAG PÅ HELSESTASJONEN. Lises klassevenninnner. Formelen: Du har en hypotese om vanlig høyde

Dagens tema: Eksempel Klisjéer (mønstre) Tommelfingerregler

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Certificates of Release to Service(CRS)

Moving Objects. We need to move our objects in 3D space.

Besvar tre 3 av følgende fire 4 oppgaver.

Vær og klima fram mot Vil været spille på lag med logistikkbransjen?

Tips for bruk av BVAS og VDI i oppfølging av pasienter med vaskulitt. Wenche Koldingsnes

Klimatesting av massivtreelementer

Spøkelsesjakten. Introduksjon

Exploratory Analysis of a Large Collection of Time-Series Using Automatic Smoothing Techniques

Eksamen PSY1010 PSYC1100 Forskningsmetode I vår 2013

Eksamensoppgave i PSY2017/PSYPRO4317 Statistikk og kvantitative forskningsmetoder

Karbonfangst. Den teknologiske utviklingen Polyteknisk forening 17/ Espen Olsen, 1.aman, energifysikk

6.2 Normalfordeling. Høyde kvinner og menn. 6.1 Kontinuerlig uniform fordeling. Kapittel 6

MAT1030 Diskret matematikk

1 8-1: Oversikt : Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet

Model Description. Portfolio Performance

5 E Lesson: Solving Monohybrid Punnett Squares with Coding

Multisample Inference del 2 (Rosner ) Øyvind Salvesen

Sannsynlighet, frekvens, usikkerhet hvordan forstå og formidle risiko?

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Kompleksitetsanalyse Helge Hafting Opphavsrett: Forfatter og Stiftelsen TISIP Lærestoffet er utviklet for faget LO117D Algoritmiske metoder

Neural Network. Sensors Sorter

Exercise 1: Phase Splitter DC Operation

Hvorfor har IPCC-rapportene så stor betydning i klimaforskning?

MAT-INF1100 Oblig 1. Teodor Spæren, brukernavn teodors. September 16, 2015

NKKN typeforslag versjon Definisjon av grunntypene

Eksamensoppgave i TMA4265 Stokastiske prosesser

Fra sekvensielt til parallelt

MOT310 Statistiske metoder 1, høsten 2010 Løsninger til regneøving nr. 11 (s. 1) der

0:4 0:4 0:2 0:2 0:6 0:2 P = Moreover, it is informed that 0:28 0:46 0:26 0:24 0:50 0:26 0:24 0:41 0:35

1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent

Bakgrunn. KLMED 8006 Anvendt medisinsk statistikk - Vår 2008 Repeterte målinger. Overvekt: løp for livet

Frankering og computer-nettverk

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Øving 1 - Gjennomgang

EKSAMENSOPPGAVER SV SØ 232: METODE II

Klimaproblemer etter min tid?

Klimascenarier og effekter for snøforhold i Norge i framtiden

Repeterte målinger. Repeterte målinger. Eirik Skogvoll. Gjentatte observasjoner på samme individ:

Paris avtalen, klimapolitikk og klimapartnere Rogaland - Hvorfor er fokus på klima og miljø lønnsomt for Rogaland?

1. Rullende navn, s 3 2. Smilefjes, s 5 3. Skritteller, s 7 4. Orakel, s 9 5. Stein, saks og papir, s Kompass, s 14

Transkript:

NGF 2008 Ekstreme hendelser sett med en statistikers øyne Magne Aarset Handelshøyskolen BI Høyskolen i Ålesund 1

FN s klimapanel IPCC The Intergovernmental Panel on Climate Change Forecasts by Scientists vs Scientific Forecasts Beregning av prognoser som fagområde Ekstremal-prosesser Beslutningsfeller 2

Granli-utvalget (1976) Utvalget skulle være «bredt sammensatt» av både «eksperter og samfunnsengasjerte ikke-eksperter», ifølge Stortinget. Hva dette egentlig skulle innebære, ble det i praksis opp til Industridepartementet å bestemme. Det ble et «ja» til kjernekraft, men et «nei» til kjernekraft på 1980-tallet. NVE anbefalte 12 kjernekraftverk. 3

Prognosemodellering Forskjellige fremgangsmåter K.E.Trenberth: Klimapanelet har 20.000 30.000 variable i sine modeller. CO 2 inkludert i 1997 Påvirkning frå rommet? Usikkerhet knyttet til prognosene. Statistikere går (vanligvis) ut fra 140 prognoseprinsipper. 89 kunne testes i IPCC WP1. 71 var ikke fulgt! 4

K.E. Trenberth In fact there are no predictions at all. And there never has been. The IPCC instead offers what if projections of future climate that correspond to certain emissions scenarios. None of the models used by the IPCC are initialized to the observed state and none of the climate states in the models correspond even remotely to the current observed climate. In particular, the state of the oceans, sea ice, and soil moisture has no relationship to the observed state at any recent time in any of the IPCC 5 models.

Domestic passengers 600 000 500 000 400 000 300 000 200 000 100 000 0 1970 1975 1980 1985 1990 1995 2000 6

International passengers 600 000 500 000 400 000 300 000 200 000 100 000 0 1970 1975 1980 1985 1990 1995 2000 7

Levealder = β 0 + β 1 Kjøtt + ε Forventet levealder Rike land Andre land U-land Konsumert rødt kjøtt per person

Eksempel Y = Demand for brasilian coffee p bc = Price on brasilian coffee p t = Price on tea y d = Mean disposable income Ŷ = 9.1 + 7.8 p bc + 2.4 p t + 0.0035 y d

Eksempel Y = Demand for brasilian coffee p bc = Price on brasilian coffee p t = Price on tea y d = Mean disposable income p cc = Price on Columbian coffee Ŷ = 9.1 + 7.8 p bc + 2.4 p t + 0.0035 y d Ŷ = 10.0 + 8.0 p cc -5.6 p bc + 2.6 p t + 0.003 y d

Y = β 0 + β 1 + ε Outlier Leverage point Begge deler

Estimeringsteknikker Y = β 0 + β 1 + ε Finn det par (β 0, β 1 ) som minimerer ρ(e i ) = Σ ω i e i LAD: ω i = 1 MKM: ω i = e i...

Minste kvadratavvik ˆβ 1 n ( i = i= 1 n i= 1 )( y ( i i ) 2 y) ˆ0 β = y β ˆ 13

14 = = n i i i i y y w 1 1 ) ( ˆβ = = n i i i i w 1 2 2 ) ( ) ( der Minste kvadratavvik

Estimeringsmetoder Least Absolute Deviation Regression (Boscowitch, 1757) Least Squares Regression (Gauss,1795 & Legendre,1805) Bayesian Regression (Bayes, 1760) Sufficiency Principle (Fisher, 1922) Invariance Principle (Hotelling, 1931 & Pitman, 1938) Non-parametric Regression (Jeffreys, 1939) Conditional Principle (Fisher, 1956) Maimum Likelihood Principle (Fisher, 1956) Ridge Regression (Hoerl, 1962) M-, L- og R-Regression (Huber, 1964 & 1981) Principal Components Regression (??)

Standard avvik i N(μ,σ 2 ) 0,6 0,4 0,2 0-4 -3-2 -1 0 1 2 3 4 1 SD 68,3 % 2 SD 95,4 % 3 SD 99,7 % 16

The subeponential distributions lim P{ X + X +... + X > } 1 2 n = P{ma( X, X,..., X ) > } 1 2 n 1 17

18 Ma(X 1,,X n ) Ma(X 1,,X n ) Gumbel: Fréchet: Weibull: 0 ; ) ( ) ( = = e X P F α 0 ; ) ( ) ( ) ( = = e X P F α e X P F e = = ; ) ( ) (

Ekstremalprosesser X 1,, X n iid. A record X n occurs if X n > ma(x 1,, X n-1 ) X 1 is by definition a record. 19

The record counting process N 1 = 1 N n = 1 + n i= 2 I{ X n > ma( X1,..., X )} n 1 Then EN n = n i= 1 1 i VarN n = 1 i 1 n ( 2 i= 1 i ) 20

The record counting process n=10 k k= 1 2 3 4 5 6 7 8 9 EN n 2.9 5.2 7.5 9.8 12.1 14.4 16.7 19.0 21.3 The number of records of iid data grows very slowly! 21

Probability distributions The subeponential distributions as realistic models for heavy-tailed random variables. The α-stable distributions for α<2 as the limit laws for sums of infinite-variance iid random variables. The Fréchet, the Weibull, and the Gumbel distributions, as limit laws for maima of iid random variables. The Normal distribution as limit law for sums of iid, finite variance random variables. 22

Stochastic processes Poisson process α-stable processes (0<α<2) and Brownian motion More general processes using the above as input. 23

Bruk av informasjon Wason Wason (1966) (1966) 2 4 6 Hvilken regel ligger bak denne rekken med tall? Prøv en ny rekke med tre tall. Jeg skal fortelle om den er riktig eller ikke. a < b < c Bare 25 % klarte oppgaven. Man lette etter bevis for å bekrefte den regel de opprinnelig trodde var riktig. De prøvde ikke eksempler som ville motbevise denne regelen. Etter at de fikk vite at foreslått regel var gal, prøvde 50 % 24 fremdeles å få bekreftet at deres foreslåtte regel var riktig.

Bruk av informasjon Vi kan bruke tilgjengelig informasjon feil, og vi kan la være å bruke tilgjengelig informasjon. Vi lager oss kun et lite antall mulige diagnoser, gjerne basert på kun en begrenset del av den tilgjengelige informasjon. Vi avviser/ignorerer informasjon som peker i en annen retning. Vi velger ut informasjon som bekrefter de antagelser vi har. Vi har en selektiv og forsterkende oppfatning. 25

Müller - Lyer figurene

Forankring Svar i løpet av 5 sekunder. Hva er 8 7 6 5 4 3 2 1? Median = 2 250 Hva er 1 2 3 4 5 6 7 8? Median = 512 Korrekt svar = 40 320

Forankring Hvor stor andel av landene i FN er afrikanske? Gruppe 1 Median = 25% 10% ble tilfeldig valgt som utgangspunkt. Gruppe 2 Median = 45%. 65% ble tilfeldig valgt som utgangspunkt.