Statistikk og havressurser

Like dokumenter
Forelesning 8 STK3100/4100

Oppsummering av STK2120. Geir Storvik

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2

UNIVERSITETET I OSLO

STK Oppsummering

UNIVERSITETET I OSLO

MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:

Forelesning 7 STK3100/4100

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO

Anvendt medisinsk statistikk, vår Repeterte målinger, del II

Tilleggsoppgaver for STK1110 Høst 2015

UNIVERSITETET I OSLO

Mette Skern-Mauritzen

MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ

10.1 Enkel lineær regresjon Multippel regresjon

Prøveeksamen STK vår 2017

UNIVERSITETET I OSLO

Forelesning 10 STK3100

Forelesning 9 STK3100/4100

UNIVERSITETET I OSLO

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Introduksjon til Generaliserte Lineære Modeller (GLM)

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Generelle lineære modeller i praksis

Rekrutteringsfunksjoner for sild, torsk og lodde

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Forelesning 9 STK3100/4100

STK2100. Obligatorisk oppgave 1 av 2

Forelesning 11 STK3100/4100

Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller

EKSAMENSOPPGAVE. B154 «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Kapittel 6 - modell seleksjon og regularisering

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

TMA4245 Statistikk Eksamen desember 2016

UNIVERSITETET I OSLO

Fiskeri. Innholdsfortegnelse. Side 1 / 5

Variansanalyse og lineær regresjon notat til STK2120

Bred profil på statistikk?

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

Hvor allsidig er bardehvalenes kosthold?

Forelesning 3 STK3100

Fasit og løsningsforslag STK 1110

Eksamensoppgave i TMA4255 Anvendt statistikk

UNIVERSITETET I OSLO

Prøveeksamen i STK3100/4100 høsten 2011.

Eksamensoppgave i TMA4240 Statistikk

TMA4240 Statistikk Høst 2016

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Ekstraoppgaver for STK2120

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Romlig fordeling av hval i Barentshavet

HØGSKOLEN I STAVANGER

De pelagiske fiskebestandene: Dynamikken mellom dem, effekter av fiskeriene og samspillet mellom Norskehavet og Barentshavet

Løsningsforslag eksamen 25. november 2003

Anbefalingene er basert på toktindekser fra kystbrislingtoktet, landingene og erfaringene fra 2016 fisket i Sognefjorden.

ST0202 Statistikk for samfunnsvitere Kapittel 13: Lineær regresjon og korrelasjon

«Marine ressurser i 2049»

Bootstrapping og simulering Tilleggslitteratur for STK1100

Kolmule i Barentshavet

Oppgave N(0, 1) under H 0. S t n 3

STK Oppsummering

n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Kolmule i Barentshavet

Klassisk ANOVA/ lineær modell

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

Bestandsvurdering av norsk. Hva fokuserer vi på fremover? vårgytende sild. Aril Slotte. Pelagisk medlemsmøte Fiskebåt Gardemoen 10.

Kp. 12 Multippel regresjon

EKSAMENSOPPGAVE. «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark (4 sider) med egne notater. Godkjent kalkulator.

TMA4245 Statistikk Eksamen desember 2016

REFERANSEFLÅTEN. samarbeid mellom næring og forskning

Flerbestandsforvaltning Hva tenker vi i Norge om dette?

ST0202 Statistikk for samfunnsvitere

HAVFORSKNINGSINSTITUTTET

EKSAMENSOPPGAVER STAT100 Vår 2011

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

EKSAMEN I TMA4255 ANVENDT STATISTIKK

Foreløpige råd for tobisfiskeriet i norsk økonomisk sone 2016

Biomasse og produksjon av planteplankton i Barentshavet

Introduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R

Transkript:

Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012

Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker. Fiskeri og havbruksnæringen er en av Norges største eksportnæringer Det eksporteres sjømat fra Norge til mer enn 150 land over hele verden Økende andel av oppdrett, men fangst av villfisk fremdeles en svært viktig del. Fastsetting av fiskekvoter viktig for å opprettholde bærekraftige bestander Viktig element: Hvor mye fisk er det i havet idag Også alderssammensetning er viktig Store mengder data samles inn for å estimere dette.

Fiskeri-data Fiskeri-baserte data: Total fangst (i vekt) for hvert år fra ulike sesonger, områder og fangstredskap Vekt og alder på utvalg av enkeltfisk Forskningsbaserte data Fangst av fisk i forhold til område trål har søkt Ekko-lodd (total biomasse) Mageinnhold på enkeltfisk Egg/larve forekomster Forklaringsvariable (temperatur, saltinnhold etc) Stort behov for statistiske for analyse av data

Modeller for populasjonsdynamikk av fisk N y (a) = antall fisk av alder a ved start av år y. Vanlig modell N y (a) = N y 1 (a 1)[1 e My 1(a 1) ] C y 1 (a 1) der C y 1 (a 1) er antall fisk fanget e M y 1(a 1) er dødelighetsrate (ofte satt til 0.2!) Viktig input: C y 1 (a 1). Problem: Fangst kun gitt i total vekt. Statistisk probl: Estimere antall i hver aldersgruppe fra total vekt.

Tilnærming C y (a) = W y w y f y (a) W y =Total vekt i år y w y =Gjennomsnittsvekt i år y f y (a) =Andel av fisk i aldersgruppe a For stort antall fisk: Estimat C y (a) W y µ y p y (a) µ y =Forventet vekt i år y p y (a) =Sannsynlighet for fisk i aldersgruppe a Ĉ y (a) = W y ˆµ y ˆp y (a)

Estimering Data: n y fisk trukket tilfeldig og veid og spesifisert alder (w y,i, a y,i ) Enkle estimater: ˆµ y = 1 n y n y i=1 n y w y,i ˆp y (a) = 1 I (a y,i = a) n y i=1 Usikkerhet: Bootstrapping Ikke opplagt hvordan bootstrappe her!

Total vekt ca 35.000 tonn - enkle estimater

Kompliserende faktorer Forventet vekt og sannsynlighet for alder varierer med år y sesong s område r fangstredskap g Ønsker estimat av fangst for hver kombinasjon (y, s, r, g) Ĉ y,s,r,g (a) = W y,s,r,g ˆµ y,s,r,g ˆp y,s,r,g (a) Har ikke data for alle kombinasjoner!

Modellering - Regresjon Vi har (innen år) µ s,r,g =E[vekt s,r,g ] = a E[vekt s,r,g Alder s,r,g = a]p s,r,g (a) Trenger (innen år) Modell for vekt som avhenger av alder, sesong, region, fangsredskap Modell for alder som avhenger av sesong, region, fangsredskap

Vekt i forhold til alder Rimelig med lineær sammenheng mellom log(vekt) og log(alder) Avhenger av sesong (4 eller 12) Område (5 områder her) Fangstredskap (5 ulike)

Model for vekt gitt alder Modell for vekt gitt alder: log(w i ) = α season s(i) + α region r(i) + α gear g(i) + β log(a i) + ε i Regresjonsmodell med både kategoriske og kontinuerlige forklaringsvariable > names(d) [1] "age" "weight" "seas" "gear" "area" > fit = lm(log(weight)~seas+gear+area+log(age),data=d) > summary(fit) Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 5.152081 0.028011 183.930 < 2e-16 *** seas2 0.060459 0.009687 6.241 4.52e-10 *** seas3 0.110064 0.012305 8.945 < 2e-16 *** seas4 0.230152 0.011290 20.386 < 2e-16 *** gear2-0.203309 0.007993-25.435 < 2e-16 *** gear3-0.244350 0.015735-15.529 < 2e-16 *** gear4-0.203702 0.009375-21.729 < 2e-16 *** gear5-0.166376 0.010679-15.580 < 2e-16 *** area2 0.041056 0.008438 4.866 1.16e-06 *** area3 0.096197 0.010191 9.440 < 2e-16 *** area4 0.266066 0.010291 25.854 < 2e-16 *** area5 0.098465 0.023282 4.229 2.37e-05 *** log(age) 1.555111 0.013420 115.882 < 2e-16 ***

Alder og kategoriske forklaringsvariable Varierer tilsvarende med sesong og område

Modell for alder Hvordan modellere kategorisk respons? Mulig modell: Merk Pr(a i = a) = exp{x T i γ a } 1 +, a = 1,..., A 1 A 1 a =1 exp{xt i γ a } Pr(a i = a a i {a, A}) = exp{xt i γ a } 1 + exp{x T i γ a } Kan estimere γ a ene ved gjentatte logistiske regresjoner I vår situasjon: x T i γ a = γ season s(i),a + γregion r(i),a + γgear g(i),a

Total weight ca 35.000 tonn - Regresjonsbaserte estimater

Båt-korrelasjoner Data samlet inn fra ulike båter Høy korrelasjon innen båter Mulig tilnærming log(w i ) =α season s(i) η h uavh N(0, σ 2 h ) + α region r(i) Bootstrapping: Bruke båt som enhet! + α gear g(i) + β log(a i) + η h(i) + ε i

Fangst-estimater

Populasjonsestimater N y (a) = N y 1 (a 1)[1 e M y 1 (a 1) ] Ĉy 1(a 1)

Manglende aldersmålinger Vektmålinger er enkle og billige Aldersmålinger er kompliserte og dyre Telling av årringer i otolitter Samles inn vektmålinger på mange flere fisk enn aldersmålinger. Statistisk analyse med ukomplette data Metoder tilgjengelig basert på imputering av manglende data Anslå alder fra vekt Utfordring: Ta hensyn til usikkerhet i ukomplette data Kan også innkludere feil i aldersregisteringer

Andre kompliserende faktorer Usikkerhet i artstype Kyst-torsk, atlantisk torsk Stratifiserte utvalg Estimering av dødelighet Optimal høstingsstrategi Interaksjon mellom arter

Interaksjoner Classical food-web: species is the unit grønlandssel vågehval sjøfugl fiske torsk bunndyr lodde ungsild andre pelagiske dyreplanktonspisere dyreplankton KLIMA planteplankton Centre for Ecological and Centre for Ecological and Evolutionary Synthesis; A Centre of Excellence founded by the Research Council of Norway Evolutionary Synthesis