Matematisk evolusjonær genetikk (ST2301)

Like dokumenter
Matematisk evolusjonær genetikk, ST2301 Onsdag 15. desember 2004 Løsningsforslag

Løsningsforslag ST2301 Øving 4

Løsningsforslag ST2301 Øving 11

Løsningsforslag ST2301 Øving 6

Løsningsforslag ST2301 Øving 9

Løsningsforslag ST2301 Øving 10

Løsningsforslag ST2301 Øving 7

Løsningsforslag ST2301 Øving 2

Løsningsforslag ST2301 Øving 6

Løsningsforslag ST2301 Øving 2

Løsningsforslag ST2301 Øving 5

La U og V være uavhengige standard normalfordelte variable og definer

Løsningsforslag ST2301 Øving 9

Øving 12, ST1301 A: B:

BIO 1000 LAB-ØVELSE 2. Populasjonsgenetikk 20. september 2005

MA0002 Brukerkurs i matematikk B Vår 2013

Obligatorisk innlevering 3kb vår 2004

FLERVALGSOPPGAVER EVOLUSJON

Løsningsforslag øving 12, ST1301

MA0002 Brukerkurs i matematikk B Vår 2016

TMA4245 Statistikk Eksamen desember 2016

Økologiske og genetiske prosesser i naturlige bestander

TMA4240 Statistikk Høst 2008

FoU prosjekt Elghund Marte Wetten Geninova

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4240 Statistikk Høst 2015

Prosjektoppgaver om diusjonsprosesser og diusjonstilnærmelse

TMA4245 Statistikk Eksamen desember 2016

ST0202 Statistikk for samfunnsvitere

EKSAMENSOPPGAVE I BI3010 (POPULASJONSGENETIKK)

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Kapittel 10, del 2: Klassisk genetikk: Mendels arvelover. -forhold som influerer fenotypen slik at den avviker fra det Mendel observerte:

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2009

TMA4265 Stokastiske prosesser

TMA4240 Statistikk Høst 2007

TMA4240 Statistikk Høst 2015

EKSAMENSOPPGAVE I BI3010 Populasjonsgenetikk (Population genetics) BOKMÅL SPØRSMÅL 1-7 VEIER LIKT

Eksamensoppgave i TMA4240 Statistikk

Mendelsk Genetikk (kollokvium )

Prosjektoppgaver om diusjonsprosesser og diusjonstilnærmelse

MA0002 Brukerkurs i matematikk B Vår 2017

FLERVALGSOPPGAVER ARV

Løsningsforslag, eksamen statistikk, juni 2015

STK juni 2006

EKSAMEN I TMA4285 TIDSREKKEMODELLER Fredag 7. desember 2012 Tid: 09:00 13:00

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Løsningsforslag til obligatorisk oppgave i ECON 2130

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

HØGSKOLEN I STAVANGER

Ny kunnskap i avlsprogram. Anna K. Sonesson

Løsningsforslag ST2301 Øving 8

MA0002 Brukerkurs i matematikk B Vår 2013

Kapittel 4.4: Forventning og varians til stokastiske variable

LØSNINGSFORSLAG TIL EKSAMEN I FY1003 ELEKTRISITET OG MAGNETISME TFY4155 ELEKTROMAGNETISME Onsdag 3. juni 2009 kl

TMA4265 Stokastiske prosesser

TMA4100 Matematikk 1 Høst 2014

EKSAMEN I EMNE TTM4110 PÅLITELIGHET OG YTELSE MED SIMULERING LØSNINGSFORSLAG. Mandag 14. desember 2005 Tid: 09:00 13:00

To-dimensjonale kontinuerlige fordelinger

LABØVELSER BIO 1000 H-2003 MENDELSK GENETIKK OG POPULASJONSGENETIKK. Tirsdag 2 sept og tirsd 9 sept

BIO 1000 LAB-ØVELSE 1

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Eksamensoppgåve i TMA4240 Statistikk

TMA4240 Statistikk 2014

Eksamensoppgave i TMA4240 / TMA4245 Statistikk

Poissonprosesser og levetidsfordelinger

ST0202 Statistikk for samfunnsvitere

TMA4240 Statistikk Høst 2016

Forelening 1, kapittel 4 Stokastiske variable

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

EKSAMEN I TMA4285 TIDSREKKJEMODELLAR Fredag 7. desember 2012 Tid: 09:00 13:00

Demodex (hårsekkmidd) Det latinske navnet på hunders hårsekkmidd. Sykdommen, som er en midd, forårsaker demodekose.

MA0002 Brukerkurs i matematikk B Vår 2014

Eksamensoppgave i TMA4295 Statistisk inferens

= 5, forventet inntekt er 26

Fasit for tilleggsoppgaver

statistikk, våren 2011

ST0103 Brukerkurs i statistikk Høst 2014

Prøveeksamen i MAT0100V våren 2017

STK1100 våren Forventningsverdi. Forventning, varians og standardavvik

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

Genetisk variasjon i naturlige populasjoner. grunnlag for foredling. Mari Mette Tollefsrud. Foto: Arne Steffensrem

Heuristisk søk 1. Prinsipper og metoder

Forelesning 13. mars, 2017

Farge avl på spælsau

Eksamensoppgåve i TMA4240 / TMA4245 Statistikk

UNIVERSITETET I AGDER

Løsningsforslag. MOT 110 Matematisk statistikk og stokastiske prosesser B, høst Oppgave 1

ST0103 Brukerkurs i statistikk Høst 2014

ST0202 Statistikk for samfunnsvitere

UNIVERSITETET I OSLO

Testobservator for kjikvadrattester

AVLSDATA FRA FØLLFESTIVALEN DEL 1 av Unn Reierstad, cand.scient (NLH/UMB), veterinær (NVH) / RR Reierstad Ridehest

Løsningsforslag til eksamen i MA0002, Brukerkurs i matematikk B

TMA4265 Stokastiske prosesser ST2101 Stokastisk simulering og modellering

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

I = (x 2 2x)e kx dx. U dv = UV V du. = x 1 1. k ekx x 1 ) = x k ekx 2x dx. = x2 k ekx 2 k. k ekx 2 k I 2. k ekx 2 k 1

Svar til oppgaver i Hartwell

ECON240 VÅR / 2016 BOKMÅL

Transkript:

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 9 Matematisk evolusjonær genetikk (ST2301) Tirsdag 19. mai 2009 Løsningsforslag (For flere av oppgavene finnes det også alternative fremgangsmåter) Oppgave 1 a) Først gjør vi om til relative fitnesser, For dette tilfellet har vi formelen Genotype Relativ fitness A 1.2 a 1. p A (t) p a (t) = (1 + p A(0) s)t p a (0), der s = 0.2. Setter inn verdiene fra oppgaveteksten, og finner 2/3 1/3 1.2 t = 2 = (1 + 0.2)t 0.5 0.5 t = ln 2 ln 1.2 = 3.801784.

Side 2 av 9 b) Vi har at p A (t) = A p A (t 1), og tilsvarende for frekvensen av a. Det gir ( ) pa (t) u(t) = ln p a (t) ( ) A p A (t 1) = ln a p a (t 1) ( ) ( ) A pa (t 1) = ln + ln a p a (t 1) ( ) A = ln + u(t 1) ( a ) A = 2 ln + u(t 2) =... = t ln a ( A a ) + u(0). Variabelen u(t) vokser altså lineært med t, som vist i figuren under (for parameterverdier fra oppgave 1 a). u(t) 0 1 2 3 4 0 5 10 15 20 t

Side 3 av 9 c) Sannsynligheten for å trekke en hulepartner med genotype A eller a er hhv p A = p og p a = (1 p). Vi kan definere en midlere relativ fitness A for A-individene, ved å bruke loven om total sannsynlighet og betinge på om hulepartneren har genotype A eller a. Dermed får vi for A-individene at A = p AA + (1 p) Aa. Tilsvarende får vi for individene med genotype a at a = p aa + (1 p) aa. Gjennomsnittlig fitness for hele populasjonen blir da = p A + (1 p) a = p 2 AA + p(1 p)( Aa + aa ) + (1 p) 2 aa. For å finne neste års frekvens av A kan vi bruke samme type argumentasjon som for det diploide tilfellet (likning II-31 til II-33), men vi må huske på at Aa generelt ikke er lik aa i denne modellen. Neste års frekvens av A blir p = A p = p 2 AA + p(1 p) Aa p 2 AA + p(1 p)( Aa + aa ) + (1 p) 2 aa d) For å finne likevektene kan vi (for eksempel) undersøke når p = 0. Her er endringen i genfrekvens p gitt ved

Side 4 av 9 p = p p = p A = p p AA + (1 p) Aa p 2 AA + p(1 p)( Aa + aa ) + (1 p) 2 aa = p(1 p) p AA + (1 p) Aa [p aa + (1 p) aa ] = p(1 p) A a Vi får altså likevekt for p = 0 (bare a-individer), p = 1 (bare A-individer), samt for alle p e som oppfyller A = a ( er ikke noen reell mulighet). For den siste muligheten har vi A = a p AA + (1 p) Aa = p aa + (1 p) aa aa Aa p e =. AA + aa Aa aa For at denne likevekten skal eksistere må den ligge mellom 0 og 1, dvs vi må ha at aa Aa AA + aa Aa aa samt at fortegnet til teller og nevner må være det samme. Dersom aa > Aa og AA > aa, dvs hvis alle individene gir en større fitnessfordel til hulepartnere av samme genotype enn til hulepartnere med motsatt genotype, så vil likevekten eksistere men være ustabil (vi vil ende opp i p = 1 eller p = 0 avhengig av hvilken som er størst av A og a ). Dersom aa < Aa samt AA < aa, dvs hvis alle individer gir større fitnessfordel til en hulepartner av motsatt genotype enn til en hulepartner av samme genotype, så vil likevekten eksistere og være stabil. e) Denne modellen er ikke helt ekvivalent med det diploide tilfellet for over- og underdominans. Det kan f.eks. hende A har større fordel av å bo med a enn omvendt, slik at vi generelt har to ulike fitnesser for heterozygotene (ulike hulepartnere). I det diploide tilfellet er begge allelene i samme individ, og vi skiller derfor ikke mellom Aa- og aaindivider. For huleboer-organismen ser vi at dersom to individer av ulik genotype får samme fitness når de deler hule, altså hvis Aa = aa, så får vi en situasjon som tilsvarer over- og underdominans.

Side 5 av 9 Oppgave 2 Setter navn på allelene som nedarves: a) For det autosomale tilfellet kan vi bruke løkkemetoden for å finne innavlskoeffisienten til J, f J. Det er to løkker i dette stamtreet. ( ) 6 1 P (JHECBDIJ) = 2 ( ) 6 1 P (JHGCBDIJ) =. 2 Det gir f J = ( 1 6 ( 2) + 1 ) 6 2 = 1 = 0.03125. Dersom locuset er kjønnskoplet blir innavlskoeffisienten til J lik 0, fordi dette individet er en hann og derfor har kun én kopi av hvert 32 kjønnskoplede gen. b) Slektskapskoeffisienten F ij mellom to individ i og j er sannsynligheten for at to tilfeldig valgte alleler fra hhv i og j er IBD ( identical by descent ). Vi ser fra stamtreet at individ D er onkelen til individ E. Slektskapskoeffisienten mellom disse blir

Side 6 av 9 F DE =P (e c b b d) = 1 16 = 0.0625. Individ D og H er i slekt ved at D er onkel til både E og G, som er foreldre til H. Her får vi F DH =P (h e c b b d) + P (h g c b b d) = 1 16 = 0.0625. Slektskapskoeffisientene F DE og F DH blir altså her like, dette skyldes at foreldrene til H er halvsøsken. c) Ved innsetting i formlene i boka (kap 9) finner vi µ = p 2 a 11 + 2p(1 p)a 12 + (1 p) 2 a 22 = 0.5 2 2 + 2 0.5 0.5 6 + 0.5 2 5 = 4.75 α 1 = pa 11 + (1 p)a 12 µ = 0.5 2 + 0.5 6 4.75 = 0.75 α 2 =... = 0.75 δ 11 = a 11 2α 1 µ = 2 2 ( 0.75) 4.75 = 1.25 δ 22 =... = 1.25 δ 12 =... = 1.25 Det gir additiv varians

Side 7 av 9 V A = 2(pα 2 1 + (1 p)α 2 2) = 2(0.5 ( 0.75) 2 + 0.5 0.75 2 ) = 1.125, og dominansvariansen er gitt ved V D = p 2 δ 2 11 + 2p(1 p)δ 2 12 + (1 p) 2 δ 2 22 = 0.5 2 ( 1.25) 2 + 2 0.5 0.5 1.25 2 + 0.5 2 ( 1.25) 2 = 1.5625. d) Fra punkt b vet vi at slektskapskoeffisienten mellom D og E er 1. I tillegg trenger vi å 16 finne P 2 ( coefficient of fraternity ), sannsynligheten for at begge alleler i D er IBD med alleler i E. Vi ser imidlertid av stamtreet at maksimalt ett allelpar fra disse individene kan være IBD, siden fedrene til E og D (som ikke er tegnet i stamtreet) ikke er i slekt (allelene som nedarves fra disse er helt sikkert ikke IBD). Dermed blir P 2 = 0. Lar vi X of Y være fenotypene til E og D, får vi dermed Cov(X, Y ) = 2F V A + P 2 V D 1 = 2 16 1.125 0.14 Vi kan ikke bruke samme metode til å finne F DH, fordi vi da måtte tatt hensyn til innavl (foreldrene til D og H er halvsøsken). For systemer uten innavl trenger vi kun å vurdere P 0, P 1 og P 2 (sannsynlighetene for at hhv 0, 1, eller 2 av allelene i det ene individet er IBD med et allel hos slektningen). Men når vi har innavl får vi flere muligheter for nedarving av allelene. I dette eksempelet kan individ H f.eks motta samme genkopi fra mor og far. Det er også mulig å regne på slike tilfeller med innavl, men det gir komplikasjoner som ikke tas hensyn til i boka (kap 9).

Side 8 av 9 Oppgave 3 a) Vi antar at populasjonsstørrelsen er konstant hver generasjon. For å finne effektiv populasjonsstørrelse trenger vi variansen i antall gameter som et individ viderefører til neste generasjon. Dette tilsvarer her variansen i antall avkom, men siden selvfertilisering er mulig må vi anta at avkom produsert ved selvfertilisering teller som to avkom. Ser på et vilkårlig individ og lar X være antall avkom det får i løpet av livet. Siden det bare er to muligheter (0 eller 10 avkom) tilsvarer det et Bernoulliforsøk. La Y = 1 dersom individet overlever vinteren (sannsynlighet for dette er 0.2) og Y = 0 ellers. Bruker vi loven om total forventning får vi E[X] = 10 0.2 + 0 0.8 = 2 E[X 2 ] = 100 0.2 + 0 0.8 = 20 Var(X) = E[X 2 ] E[X] 2 = 16. Dermed blir effektiv populasjonsstørrelse N e = 4N 2 2 + Var(X) = 400 2 2 + 16 22.1. b) Siden vi har drift uten seleksjon blir forventet allelfrekvens lik startfrekvensen, altså E[p t ] = p 0 = 0.6. Variansen er gitt ved Etter 20 generasjoner får vi [ ( Var(p t ) = p 0 (1 p 0 ) 1 1 1 ) ] t 2N e [ ( = 0.6(1 0.6) 1 1 1 ) ] t. 2 22.1 Var(p 20 ) = 0.6(1 0.6) [ 1 ( 1 1 ) ] 20 0.09. 2 22.1

Side 9 av 9 c) Vi starter med en andel på 0.48 heterozygoter (fra HW). Etter 20 generasjoner er denne andelen blitt ( 1 1 ) 20 0.48 0.30. 2 22.1