Løsningsforslag ST2301 Øving 10

Løsningsforslag ST2301 Øving 10 Kapittel 5 Exercise 6 Hva er innavlskoeffisienten for individ I i følgende stamtre? Svar: Her er det best å bruke en annen metode enn løkkemetoden. Slektskapskoeffisientmetoden beskrevet i kapittel V.6 er mer systematisk. Slektskapskoeffisienten mellom to individer er sannsynligheten for at et tilfeldig valgt allel hos det ene individet er identical by descent (IBD) med et tilfeldig valgt allel hos det andre individet. 1

Dersom A og B er foreldre til E, og C og D er foreldre til G, slik som på figuren over, har vi følgende regneregler: 1. Ved å bruke loven om total sannsynlighet blir F EG = 1 4 F AD + 1 4 F AC + 1 4 F BC + 1 4 F BD Denne setningen gjelder også dersom A eller B er samme individ som C eller D. 2. Slektskapskoeffisienten til individ E er F EE = 1 2 + 1 2 f E = 1 2 (1 + f E) = 1 2 (1 + F AB) Disse reglene kan brukes på stamtreet i oppgava, ved å starte øverst og så regne ut koeffisienter nedover treet. Det gir: F CC = 1 2 (1 + F AB) = 1 2 F CD = 1 4 F AA + 1 4 F BB + 1 4 F AB + 1 4 F AB = 1 4 F GG = 1 2 (1 + F CD) = 5 8 F GJ = 1 4 F CD + 1 4 F CE + 1 4 F DD + 1 4 F DE = 1 4 1 4 + 1 4 1 4 + 1 4 1 2 + 1 4 1 4 = 5 16 Fortsetter man å regne nedover i treet, finner man tilslutt at f i = 41 64 0.64. Figuren under viser slektskapskoeffisientene. 2

Exercise 8 For dette regulære innavls-systemet, finn rekursjonslikningene som trengs for å analysere det. Svar: Figuren over viser slektskapskoeffisienter og innavlskoeffisienter for ulike generasjoner. Har at 1. F t = f t 2. G t = g t 3. Loven om total sannsynlighet gir F t+1 = P r(ibd a, d) P r(a, d) + P r(ibd c, d) P r(c, d) + P r(ibd (a c) (b d)) P r((a c) (b d)) = 1 4 F t + 1 4 1 2 (1 + F t) + ( 1 4 G t + 1 4 G t) = 3 8 F t + 1 2 G t + 1 8 3

4. Loven om total sannsynlighet gir G t+1 = 1 2 1 2 (1 + G t) + 1 2 F t+1 = 1 2 F t+1 + 1 4 G t + 1 4 Setter 3 inn i 4, og får at G t+1 = 1 3 2 8 F t + 1 1 2 2 G t + + 1 1 2 8 + 1 4 G t + 1 4 = 3 16 F t+1 + 1 2 G t + 5 16 På matriseform blir likningssystemet [ Ft+1 G t+1 ] = [ 3 8 3 16 1 2 1 2 ] [ Ft G t ] + [ 1 8 5 16 ] En partikulærløsning av dette systemet er x p = [ Ft ] [ 1 = G t 1 ] Den generelle løsningen av systemet er på formen 4

x(t) = c 1 λ 1 y 1 + c 2 λ 2 y 2 + x p der λ 1 og λ 2 er gitt ved 3 8 λ 1 2 3 1 16 2 λ = 0 ( ) ( ) 3 1 8 λ 2 λ 3 32 = 0 λ 2 7 8 λ + 3 32 = 0 λ 1 = 1 2 λ 2 = 1 2 ( 7 ) 49 8 + 64 12 = 3 32 4 ) 49 64 12 = 1 32 8 ( 7 8 Den første (største) egenverdien λ 1 bestemmer hvor raskt x(t) nærmer seg x p asymptotisk. Sannsynligheten for at to allel ikke er IBD, dvs (1 F t ) og (1 G t ), vil altså reduseres med 25% hver generasjon. Exercise 9 Ser på et locus med et recessivt allel a, med frekvens 0.01. Anta at vi deler populasjonen i to og deretter innavler hver subpopulasjon inntil innavlskoeffisienten er f. Som funksjon av f, 1. Hva er den forventa frekvensen av aa i en subpopulasjon? 2. Hva er den forventa frekvensen av aa i F 1 -krysningen (individer med én forelder fra hver subpopulasjon) mellom de to subpopulasjonene? 3. Hva er den forventa frekvensen av aa i F 2 -krysningen (individer der foreldrene er to ulike F 1 -individer) mellom de to subpopulasjonene? Svar: 1. I hver subpopulasjon er startfrekvensen av a p 0 = 0.01. For hver subpopulasjon har vi at P aa,i = p 2 0(1 f) + p 0 f = 0.01 2 (1 f) + 0.01f = 0.0001 + 0.0099f 5

2. Sannsynligheten for at to tilfeldig valgte gener fra hver subpopulasjon er IBD, er null (ingen felles opphav). Derfor må P aa,f1 = P r(trekke a fra pop 1)P r(trekke a fra pop 2) = p 2 0 = 0.0001 3. I F 1 -krysningen er innavlskoeffisienten lik 0. Sannsynligheten for at to tilfeldig valgte gener stammer fra samme subpopulasjon er 1 2. Slektskapskoeffisienten til F 1 -krysningen er dermed F 1 = 1 2 f + 1 2 0 Innavlskoeffisienten til et avkom i F 2 -krysningen er lik slektskapskoeffisienten til foreldrene i F 1 -krysningen. f 2 = F 1 = 1 2 f Dermed blir forventa frekvens av aa i F 2 -krysningen P aa,f2 = p 2 0(1 f 2 ) + p 0 f 2 = 0.01 2 (1 f 2 ) + 0.01f 2 = 0.0001 + 0.00495f 6

Kapittel 1 Complement 14 Med tre loci, hvert med to allel, se om du kan finne et sett gametfrekvenser (tre av åtte mulige gameter) som gir D AB = 0, D BC = 0 og D AC = 0, men der gametene ikke er i koplingslikevekt, slik at for eksempel P ABC p A p B p C. Kan vi gi gametfrekvensene ved å spesifisere p A, p B, p C, D AB, D BC og D AC? Vis ved eksempler hvorfor dette er/ ikke er mulig. Svar: Anta at p A = p B = p C = 0.1 og at P AB = P BC = P AC = 0.01 slik at D AB = 0, D BC = 0 og D AC = 0. Vi påstår at det er mulig at P ABC = 0 p A p B p C ( ) Figuren under viser Venn-diagrammet for utfallsrommet. 7

Hvis ( ) er oppfylt blir sannsynlighetene for hvert av de åtte områdene i Venndiagrammet P r(a B C) = 0 P r(a B C) = 0.1 0.01 0.01 = 0.08 P r(a B C) = 0.08 P r(a B C) = 0.08 P r(a B) = P r(a B C) P r(a B C) = 0.01 P r(a B C) = 0.01 P r(a B C) = 0.01 P r(a B C) = 1 3 0.08 3 0.01 = 0.61 Siden alle gametfrekvenser ligger mellom 0 og 1 så er ( ) mulig. Vi har i utgangspunktet åtte frie variable (8 = 2 3 gametfrekvenser). Spesifiserer vi p A, p B, p C, D AB, D BC og D AC med tilleggskravet at ijk P ijk = 1, får vi sju likninger med åtte ukjente, slik at ikke alle gametfrekvenser P ijk er bestemt. 8