Genetikk og bioteknologi. Litt historikk et perspektiv. Forelesning # 6. Publiserte genomsekvenser (2003) Bioteknologi etableres... Lars O.

Like dokumenter
Hva er bioinformatikk? Introduksjon til bioinformatikk. Summary. Menneskets genom. Prokaryoter og eukaryoter. Lars O. Baumbusch

FLERVALGSOPPGAVER ARV

Kapittel 10, del 2: Klassisk genetikk: Mendels arvelover. -forhold som influerer fenotypen slik at den avviker fra det Mendel observerte:

5 E Lesson: Solving Monohybrid Punnett Squares with Coding

Obligatorisk innlevering 3kb vår 2004

GRUNNLEGGENDE GENETISKE BEGREPER Del I - en serie om kattegenetikk

FLERVALGSOPPGAVER GENETIKK

Genkartlegging. Hva er egentlig et genkart? Genetisk og fysisk kartlegging

Klinisk molekylærmedisin (4): Indirekte diagnostikk ved koblingsanalyser

FARGEGENETIKK. av Cecilie Schleer

Oppgave 2b V1979 Hvor i cellen foregår proteinsyntesen, og hvordan virker DNA og RNA i cellen under proteinsyntesen?

UNIVERSITETET I OSLO

FYS 3710 Biofysikk og Medisinsk Fysikk, DNA, RNA, Translasjon, Transkripsjon Proteinsyntese, Cellesyklus

Oversikt over kap. 11. Kap. 11 Den direkte påvisning av genotype skiller individuelle genomer. Fire klasser av DNA polymorfismer.

Examination paper for (BI 2015) (Molekylærbiologi, laboratoriekurs)

UNIVERSITETET I OSLO

UNIVERSITETET I AGDER

FLERVALGSOPPGAVER GENETIKK

Mendelsk Genetikk (kollokvium )

Holder cytoplasmaet på plass. Regulerer transporten inn i og ut av cellen og har kontakt med naboceller.

Flervalgsoppgaver: Arvestoffet

LEKSJON 4: BIOTEKNOLOGI HVORDAN VI BRUKER NATURENS EGNE MEKANISMER TIL VÅR FORDEL, OG UTFORDRINGENE SOM FØLGER MED

Unit Relational Algebra 1 1. Relational Algebra 1. Unit 3.3

Bioteknologi i dag muligheter for fremtiden

UNIVERSITETET I OSLO

Slope-Intercept Formula

EKSAMENSOPPGAVE I BI1001 CELLE- OG MOLEKYLÆRBIOLOGI

FLERVALGSOPPGAVER GENETIKK

Dynamic Programming Longest Common Subsequence. Class 27

Institutt for biologi Faglig kontaktperson under eksamen: Berit Johansen ( ) EKSAMEN I: BI1001 Celle- og molekylærbiologi BOKMÅL

ML-208, generell informasjon

Mal for vurderingsbidrag

Naturfag for ungdomstrinnet

Løsningsforslag ST2301 Øving 2

Faglig kontaktperson under eksamen: Jens Rohloff (mob )

FAKULTET FOR TEKNOLOGI OG REALFAG EKSAMEN

Farge avl på spælsau

Institutt for biologi Faglig kontaktperson under eksamen: Berit Johansen, EKSAMEN I: BI1001 Celle- og molekylærbiologi BOKMÅL

Cellesyklus. Medisin stadium IA, 17. september 2012

Hovedområde: Bioteknologi Eksamensoppgaver fra skriftlig eksamen Naturfag (NAT1002).

Databases 1. Extended Relational Algebra

Hvor er responsen når vi ikke bruker den? Tore Vignes og Stein Evensen

FLERVALGSOPPGAVER EVOLUSJON

DNA - kroppens byggestener

UNIVERSITETET I OSLO

EKSAMENSOPPGAVE I BI1001 Celle og molekylærbiologi

KROPPEN LEDER STRØM. Sett en finger på hvert av kontaktpunktene på modellen. Da får du et lydsignal.

BIO 1000 LAB-ØVELSE 1

Resistent lakselus - kvifor er det eit problem og korleis diagnostisere resistens?

Svar til oppgaver i Hartwell

Boken er utgitt med støtte fra norsk faglitterær forfatter- og oversetterforening.

Løsningsforslag ST2301 Øving 4

FLERVALGSOPPGAVER BIOTEKNOLOGI

Eksamensoppgave i LGU53004 Naturfag , Emne 1 Biologi

Løsningsforslag ST2301 Øving 2

Løsningsforslag ST2301 Øving 10

Genomkartlegging er det noe nyttig for havbruksnæringen?

Han Ola of Han Per: A Norwegian-American Comic Strip/En Norsk-amerikansk tegneserie (Skrifter. Serie B, LXIX)

UNIVERSITY OF OSLO. Make sure that your copy of this examination paperis complete before answering.

Figurer kapittel 8: Bioteknologi Figur s

Kontinuasjonseksamen, MEDSEM2/ODSEM2/ERNSEM2 høst 2007 Onsdag 20. februar 2008 kl. 09:00-15:00

EKSAMENSOPPGAVE I BI2014 MOLEKYLÆRBIOLOGI

Status i forskning: Demens og arvelighet. Arvid Rongve Psykiatrisk Klinikk Helse Fonna

Faglig kontaktperson under eksamen: 1.aman. Hans K. Stenøien ( )

ML-208, generell informasjon

Avl for auka produktivitet. QTL som nytt hjelpemiddel i avlsarbeidet.

BI Celle- og molekylærbiologi

Eksamensoppgåve i LGU53004 Naturfag , Emne 1 Biologi

Bruk av genteknologiske analyser ved diagnostikk av luftveisinfeksjoner. Gardermoen Svein Arne Nordbø

Repetisjonsark til vurdering i naturfag Celler og arv. Kap.1 Celler og arv Kjenneteikn på levande organismar S. 7-8

Genetisk variasjon i naturlige populasjoner. grunnlag for foredling. Mari Mette Tollefsrud. Foto: Arne Steffensrem

Bokmål. Eksamensoppgaver i genetikk våren Side 1 av 7

Nedarving autosomal recessiv - en stor fordel i avl La oss på en forenklet måte se litt på hvordan denne defekten nedarves.

Klinisk molekylærmedisin (3): DNA-sekvensering

Født Født sånn sånn eller blitt sånn? Monica Cheng Munthe-Kaas, OUS

Hvordan føre reiseregninger i Unit4 Business World Forfatter:

Den som gjør godt, er av Gud (Multilingual Edition)

Neural Network. Sensors Sorter

Genetikk i vår tid: Et paradigmeskifte. Kaja Selmer Avd. for medisinsk genetikk NK-SE

Kap 12. Det eukaryote kromosom. En organelle for pakking og styring av DNA

Arabidopsis thaliana, vårskrinneblom

Mathematics 114Q Integration Practice Problems SOLUTIONS. = 1 8 (x2 +5x) 8 + C. [u = x 2 +5x] = 1 11 (3 x)11 + C. [u =3 x] = 2 (7x + 9)3/2

EN Skriving for kommunikasjon og tenkning

UNIVERSITETET I OSLO

VEDLIKEHOLD AV EGENSKAPER OG FORBEDRINGER

Foreleser: Eivind Coward, kontor 5. etg. Datablokken. Gruppeleder: Harald Barsnes

Plan. Pensum i bioinformatikk. Hva er bioinformatikk?

Trigonometric Substitution

Matematisk evolusjonær genetikk (ST2301)

FASMED. Tirsdag 21.april 2015

Det matematisk-naturvitenskapelige fakultet

BINGO - Kapittel 1. kroppsceller hos menn (XY) Arvelærens far (G. J. Mendel) Forkortelse for genmodifiserte organismer (GMO)

Flervalgsoppgaver: proteinsyntese

Universitetet i Bergen Det matematisk-naturvitenskapelige fakultet Eksamen i emnet Mat131 - Differensiallikningar I Onsdag 25. mai 2016, kl.

Exercise 1: Phase Splitter DC Operation

stjerneponcho for voksne star poncho for grown ups

Sandefjordskolen BREIDABLIKK UNGDOMSSKOLE ÅRSPLAN FOR FORESATTE NATURFAG 10.TRINN SKOLEÅR Side 1 av 7

UNIVERSITY OF OSLO. Faculty of Mathematics and Natural Sciences

Eksamensoppgave i BI1001 Celle og Molekylærbiologi

Transkript:

Genetikk og bioteknologi Forelesning # 6 Lars O. Baumbusch Senter for Bioinformatikk, IFI, UiO Rikshospitalet - Radiumhospitalet Medical Centre Lars O. Baumbusch INF3350/INF4350 Høst 2007 1 Litt historikk et perspektiv 1866... Grunnprinsippene for arv* 1910 Arveanleggene ("genene") ligger på kromosomer 1940... Arveanleggene (genene) består kjemisk av DNA* 1953 Dobbeltheliks strukturen til DNA avklares* 1957 Det sentrale dogmet: DNA > Protein* Det er rekkefølgen av baser i DNA-sekvensen som bestemmer rekkefølgen av aminosyrer i proteinet 1960 Informasjonen overføres fra DNA til protein via budbringeren mrna 1961 Den genetiske koden "knekkes": nå vet man hvordan en DNA-sekvens oversettes til en proteinsekvens 1965 Et "atlas" over alle kjente proteinsekvenser utgis jevnlig* 1970 Endel proteiner er nå sekvensert, og nå kommer de første metoder for å sammenstille sekvenser Lars O. Baumbusch INF3350/INF4350 Høst 2007 2 Bioteknologi etableres... Publiserte genomsekvenser (2003) 1970 Første restriksjonsenzymer ble oppdaget 1971 Genkloning og starten på moderne bioteknologi 1972 Protein DataBank etableres (med 10 proteiner!) 1977 De første metoder for å sekvensere DNA utvikles 1980... Automatiserte metoder for å sekvensere DNA 1988 Mer effektive metoder for sekvenssammenstilling, NCBI (National Center for Biotechnology Information) etableres 1995 Første levende organisme ferdig sekvensert 1997 E.coli ferdig sekvensert (en bakterie) 1999 Første høyere organisme ferdig sekvensert (bananflue) 1999 Første humane kromosom ferdig sekvensert (#22) 2001 Frist draft av menneskets genom ferdig sekvensert Status per september 2003: 16 archae-bakterier 121 bakterier 12 eukaryoter (heriblant mennesket)... og mer enn 600 andre genomer er på vei Lars O. Baumbusch INF3350/INF4350 Høst 2007 3 Lars O. Baumbusch INF3350/INF4350 Høst 2007 4 1

Grunnprinsippene for arv Mendels lover (1866): Loven om uavhengig utvelgelse Uavhengige karaktertrekk (f.eks. høyde og farge på en blomst) arves uavhengig av hverandre Loven om uavhengig segregering Ulike former av et gen kalles alleler. Hvert individ har to alleler for hvert gen: Gregor Mendel en allel fra far og en fra mor. Hver forelder overfører en av de to allelene for hvert gen til hvert barn Loven om dominans For hvert karaktertrekk (gen) er det en allel som er dominant og en som er recessiv, og disse forekommer i forholdet 3:1 Genene består av DNA Fram til 1940-årene så man på gener som diskrete arvepartikler på kromosomene, som genererer enzymer på en eller annen måte Det var en vanlig oppfatning at genene måtte være proteiner (siden de var kompliserte nok) I 1944 klarte Avery m.fl. å transformere en ufarlig bakterie til en dødelig variant ved å kombinere den ufarlige varianten med en inaktivert form av den farlige varianten De klarte så å vise at den transformerende substansen var DNA Oswald Avery Lars O. Baumbusch INF3350/INF4350 Høst 2007 5 Lars O. Baumbusch INF3350/INF4350 Høst 2007 6 DNA er en dobbeltheliks Det sentrale dogmet I 1953 foreslo Watson og Crick en struktur for DNA hvor to enkelttråder med DNA er bundet til hverandre (C til G, og A til T) og tvinnet som en heliks Modellen var basert på Chagraff s regler (A=T og C=G) og radiologiske undersøkelser fra Rosalin Franklin Watson & Crick with DNA model I 1957 presenterte Crick noen ideer som skulle få stor betydning innen biologi Han argumenterte for at genenes primære rolle er å produsere proteiner Rekkefølgen av baser i DNA er en kode som forteller rekkefølgen av aminosyrer i et protein. Minst tre baser må til for å kode for en bestemt aminosyre (siden det er 20 ulike) Francis Crick Dette ga umiddelbart en ide til hvordan DNA kunne replikeres (kopieres) når en celle skal dele seg Informasjon overføres fra DNA (og RNA) til proteiner, men ikke andre veien Rosalind Franklin with X-ray image of DNA Lars O. Baumbusch INF3350/INF4350 Høst 2007 7 Lars O. Baumbusch INF3350/INF4350 Høst 2007 8 2

Bioinformatikk: Atlas over proteinsekvenser Grunnlager i biologi - livssyklusen I 1965 var endel proteinsekvenser allerede kjent, selv om arbeidet med å finne hver av dem kunne kreve årevis med arbeid Dayhoff m.fl. ga dette året ut en liten bok med sekvensinformasjon for 65 proteiner. Dette var det første registeret over sekvenser Dette registeret som ble oppdatert med jevnlige mellomrom var med å legge grunnlaget for moderne sekvensanalyse som er en sentral aktivitet i bioinformatikk Margaret Dayhoff n 2n n mitose Meiose (2) befruktning Mitose (1) differensiering morfogenese apoptose Ved meiose (2) dannes det haploide kjønnsceller fra diploide celler Ved befruktning danner to haploide kjønnsceller til sammen en diploid zygote Ved gjentatte mitoser (1) dannes flere identiske celler Gjennom et komplisert program dannes et nytt individ Lars O. Baumbusch INF3350/INF4350 Høst 2007 9 Lars O. Baumbusch INF3350/INF4350 Høst 2007 10 Celle-deling Cellesyklusen 1. Mitotiske celle-deling Normal celledeling Resulterer i diploide datterceller Dattercellene er genetisk like 2. Meiotiske celle-deling (reduktiv deling) Gjelder kun primære eggceller og spermatocyter; gir som resultat gameter (spermceller og eggceller) Resulterer i haploide datterceller Dattercellene er genetisk ulike 2n 2n 2n 2n n n n n G 1 S G 2 normal celletilstand; ikke-delende celler forblir i denne tilstanden (da ofte kalt G 0 ) forstadium til mitose; DNA replikeres forstadium til mitosen M mitose (1); cellen deler seg i to genetisk like datterceller Lars O. Baumbusch INF3350/INF4350 Høst 2007 11 Lars O. Baumbusch INF3350/INF4350 Høst 2007 (fra: www.bioalgorithms.info) 12 3

Mitose (1) trinn for trinn Profase: kromosomer kondenserer og blir synlige; bipolar spindel utvikles Metafase: kromosomer fullt kondensert og lokaliseres i ekvatorialplanet Anafase: sentromerene deler seg og søsterkromatider dras mot hver sin pol Telofase: kromosomer dekondenserer og cytoplasma starter å dele seg i to (From: Molecular Lars O. Baumbusch Cell Biology, by Lodish INF3350/INF4350 et al., 2000, Freeman Høst 2007 & Co.) 13 DNA-replikasjon Ved celledeling må genomet dupliseres. Dette skjer ved en prosess som kalles DNA-replikasjon Etter DNA-replikasjon er DNA-dobbelthelixen erstattet av to nye og identiske DNA-dobbelthelixer. Hver av de to nye DNA-molekylene har fått en tråd fra det opprinnelige DNAmolekylet. Leading og lagging strand bruker to forskjellige mekanismer for DNA replikasjon Lars O. Baumbusch INF3350/INF4350 Høst 2007 14 2n 2n 4n 2n n n n n Meiose (2) trinn for trinn Interfase (DNA-replikasjon) Meiose I Meiose II Profase 1 Metafase 1 Anafase 1 Telofase 1 Profase 2 Metafase 2 Anafase 2 Telofase 2 Lars O. Baumbusch INF3350/INF4350 Høst 2007 15 Meiosis (2) MeioseI: Celle separasjon Profase 1: Kromosomer kondenserer, homologe kromosomer søker sammen og danner en tetrade. Utveksling av genetisk materiale (rekombinasjon) kan skje ved overkrysning = chiasma Metaphase 1: Kromosomer lokaliseres i ekvatorialplaten Anaphase 1: Homologe kromosomer separeres (søsterkromatider forblir sammen) Telophase 1: To søsterceller er dannet med et homologe kromosom i hver søstercelle MeioseII: Kjønnscelle formasjon Prophase 2: DNA repliserer ikke Metaphase 2: Kromosomer stiller seg opp langs den i ekvatorialplaten Anaphase 2: Centromere deler seg og søsterkromatider migrerer separat til polen Telophase 2: Celledeling er avsluttet. Fire haploide søsterkromatider havner i hver sin haploide celle Lars O. Baumbusch INF3350/INF4350 Høst 2007 16 4

Mendels prinsipper Gener forekommer i ulike varianter eller alleler Vi har alle to utgaver av hvert gen. Disse kan være ulike alleler (heterozygot) eller samme allel (homozygot) Segregeringsprinsippet: Hver kjønnscelle (og følgelig hvert avkom) får en av de to utgavene og det er tilfeldig hvilken av dem det er. Prinsippet om uavhengig utplukk: Hvilken utgave vi får av et gen har ingen innvirkning på hvilken utgave vi får av et annet gen, forutsatt at genene ligger på forskjellige kromosomer. Lars O. Baumbusch INF3350/INF4350 Høst 2007 17 Genotype og fenotype Et gen (arveanlegg) er et DNA-segment som koder for et funksjonelt produkt Et allel er en variant av et gen. Ulike alleler koder for litt forskjellige varianter av samme funksjonelle produkt Et DNA-segment (f.eks. et gen) er polymorft dersom det forekommer i flere varianter i en populasjon På grunn av polymorfi trenger ikke to individer fra samme populasjon å ha identisk DNA. Hvert individ har sin DNAvariant eller genotype Ulike genotyper gir opphav til ulike individegenskaper. Hvert individ har sitt uttrykk eller fenotype Lars O. Baumbusch INF3350/INF4350 Høst 2007 18 Haploide og diploide celler Haploid celle (n) Celle med ett sett av kromosomer og gener. (Eksempler: bakterier, gameter = kjønnsceller) Diploid celle (2n) Celle med to sett av kromosomer, dvs kromosomene foreligger i par hvor begge har de samme genene Kromosomene i et par sies å være homologe og kan inneholde ulike varianter av de samme genene (Eksempler: de fleste celler i mennesket og i andre høyere organismer) Heterozygot og homozygot For diploide organismer er genotypen for et bestemt gen gitt ved et par av alleler (allel 1, allel 2 ), siden hver av de to homologe kromosomene har "sin versjon" av genet En organisme/celle er homozygot med hensyn til et gen/en egenskap dersom de to allelene i et genpar er identiske I motsatt fall er organismen/cellen heterozygot med hensyn til dette genet/denne egenskapen gen 1 gen 2 Polyploid celle (3n, 4n,...) Bl.a. er laks og noen planter tetraploide (4n) (det ser vi i fortsettelsen bort fra og antar eukaryot=diploid) Heterozygot: ulike varianter av gen 1 Homozygot: samme variant av gen 2 Lars O. Baumbusch INF3350/INF4350 Høst 2007 19 Lars O. Baumbusch INF3350/INF4350 Høst 2007 20 5

Dominansmønstre Hvordan oversettes et allelpar (allel 1, allel 2 ) til en fenotype? Flere muligheter: Dominans: den ene allelen har prioritet over den andre (dvs allelene er dominant og recessiv) og bestemmer fenotypen alene (ex: fiolett + hvit = fiolett) Kodominans: fenotypen har trekk fra begge de to homozygote fenotypene (ex: flekket + prikket = flekket og prikket) Ufullstendig dominans: fenotypen har trekk som ligger mellom de to homozygote fenotypene (ex: rød + hvit = rosa) Imprinting: fenotypen er bestemt av allelen som ble arvet fra mor (evt far) - (sjelden) Lars O. Baumbusch INF3350/INF4350 Høst 2007 21 Illustrasjon: monohybrid krysning Krysning av erter med to alleler for form: A = rund (dominant) og a = rynkete (recessiv) Krysser to homozygoter (A,A)=AA og (a,a)=aa: P-generasjonen AA Gameter: A F 1 -generasjonen Lars O. Baumbusch INF3350/INF4350 Høst 2007 22 x Aa F 2 -generasjonen AA Aa Aa aa 0.25% 0.25% 0.25% 0.25% 3 : 1 a aa Alle avkom i F 1 blir runde Illustrasjon: dihybrid krysning Illustrasjon: dihybrid krysning Krysning av erter med to alleler for form og to for farge: A = rund (dominant) og a = rynkete (recessiv) B = gul (dominant) og b = grønn (recessiv) Krysser doble homozygoter AABB og aabb: F 1 -generasjonen AaBb x AaBb P-generasjonen AABB x aabb AB Ab ab ab Gameter AB Ab ab ab Gameter: AB AaBb F 1 -generasjonen Alle avkom i F 1 blir gule og runde ab Hva skjer når vi krysser erter i F 1? F 2 -generasjonen: 9 blir gul, rund 3 blir gul, rynkete 3 blir grønn, rund 1 blir grønn, rynkete Dvs de fordeler seg 9:3:3:1 AB Ab ab ab AB Ab ab ab Lars O. Baumbusch INF3350/INF4350 Høst 2007 23 Lars O. Baumbusch INF3350/INF4350 Høst 2007 24 6

Genotypen bestemmer fenotypen Rekombinasjon er en nesten ubegrenset kilde til genetisk variasjon genotype fenotype Rekombinasjon = utveksling og nykombinasjon av gener ( gene shuffling ) Eksempel: AB0-blodtypesystemet: Genotype (A, A) (A, 0) (B, B) (B, 0) (A, B) (0, 0) Fenotype A A B B AB 0 Komplikasjon: ikke alle fenotyper er bestemt av ett gen! Utgangspunkt: diploid celle med n kromosompar og seksuelt paring (M 1,P 1 ),..., (M n,p n ) (n=23 for mennesker) Under meiosen dannes haploide kjønnsceller med n kromosomer M 1 eller P 1 eller en rekombinasjon av dem M 2 eller P 2 eller en rekombinasjon av dem osv. Utveksling skje ved overkrysning = chiasma (crossing over) Dette gir nærmest ubegrenset genetisk diversitet til et individ, en enestående kombinasjon fra begge foreldrene og over mange generasjoner i en art Lars O. Baumbusch INF3350/INF4350 Høst 2007 25 Lars O. Baumbusch INF3350/INF4350 Høst 2007 26 Genetisk variasjon og mutasjon Mutasjonstyper Mutasjoner er svert sjelden skje under DNA replikasjon er tilfeldig forandrer DNA sekvens/kode > ny variasjon er dårlig for enkeltindivid sjeldne, trenges flere andre faktorer i tillegg for å transformere en art Lars O. Baumbusch INF3350/INF4350 Høst 2007 27 Lars O. Baumbusch INF3350/INF4350 Høst 2007 28 7

Genetic variation: Mouse and human Pause Mus har 2.1 x 10 9 baseparer versus 2.9 x 10 9 i mensker Rundt 95% av alt genetisk materialet er identisk 99% av alle 30.000 gener er delt De 300 gener som viser ingen homologi mellom de to arter er involvert i immunologi, detoksifisering, luktesans og sex (Scientific American Dec. 5, 2002) Lars O. Baumbusch INF3350/INF4350 Høst 2007 29 (http://jokes4all.net/funpics/random/funpic_222.html) Lars O. Baumbusch INF3350/INF4350 Høst 2007 30 Hvordan finner man gener? Slektstre av en sjelden recessiv fenotype/sykdom Noen ganger er en fenotype eller en sykdom knyttet til et bestemt gen - første trinn er da å finne ut hvor genet ligger Vi trener tilgang til genetisk materiale fra flere generasjoner fra familier som er rammet Lars O. Baumbusch INF3350/INF4350 Høst 2007 31 (From: An Introduction to Genetic Analysis by A.J.F. Griffiths et al., 2000, Freeman & Co.) Lars O. Baumbusch INF3350/INF4350 Høst 2007 32 8

Kartlegging av genomer Et genomkart forteller hva som befinner seg hvor i genomet Ved konstruksjon av genetiske kart benytter en seg av lovmessigheten for arv: overføring av genetiske materiale fra en generasjon til neste Genomkart kan variere fra kart som bare angir relativ posisjon av gener eller markører på et kromosom til kart som angir posisjon i antall nukleotider (basepar) fra starten av et kromosom: > Genetiske kart og fysiske kart La A,B,C være de maternale og a,b,c være de paternale allelene for de tre genene. Genetisk kopling 1 2 3 Aa Bb Cc Forutsatt at chiasmata (= overkrysning) oppstår med like stor sannsynlighet alle steder langs et kromosom, er det mer sannsynlig med en overkrysning mellom gen 2 og gen 3 enn det er mellom gen 1 og gen 2. Da forventer vi flere gameter med (A,B,c) eller (a,b,c) enn med (A,b,c) eller (a,b,c). Lars O. Baumbusch INF3350/INF4350 Høst 2007 33 Lars O. Baumbusch INF3350/INF4350 Høst 2007 34 Genetisk kopling 1 2 3 A B C a b c mindre hyppig Overkrysning mellom gen 1 og gen 2: mer hyppig Overkrysning mellom gen 2 og gen 3: A b c A B c + + a B C a b C Konstruksjon av genetiske kart Betrakt to genetiske markører på hvert sitt kromosom: A a kromosom 1 kromosom 2 Genotype AB Ab ab ab 0.25 0.25 0.25 B b Frekvens 0.25 Homologer Genene segregerer uavhengig av hverandre, og genotypen som overføres til et avkom vil derfor følge disse frekvensene: Lars O. Baumbusch INF3350/INF4350 Høst 2007 35 Lars O. Baumbusch INF3350/INF4350 Høst 2007 36 9

Konstruksjon av genetiske kart Betrakt to genetiske markører på samme kromosom: A a B b kromosom 1 Fordelingen til genotypene avhenger av antall rekombinasjoner mellom genene: Genetiske markører Vi prøver nå å finne en kjent genetisk markør i nærheten av genet og som er genetisk koplet til genet, slik at vi kan plassere genet på et genetisk kart Genetiske variasjoner (i gener) som gir observerbart utslag på individets fysiske trekk (f.eks. øyenfarge) Genotype AB Ab ab Ingen rekombinasjon 50% 0% 0% En rekombinasjon 25% 25% 25% To rekombinasjoner 50% 0% 0% DNA-markører hvor biokjemiske tester kan detektere hvilke variant som er tilstede (f.eks. SNPs, mikrosatellitter, RFLPs) ab 50% 25% 50% Lars O. Baumbusch INF3350/INF4350 Høst 2007 37 Lars O. Baumbusch INF3350/INF4350 Høst 2007 38 Genetiske markører SNPs (single nucleotide polymorphisms) Individual point mutations, or substitutions of a single nucleotide, that do not change the overall length of the DNA sequence in that region. SNPs occur throughout an individual's genome. Mikrosatellitter (Microsatellite polymorphisms) Defined by a variable number of repetitions of a very small number of base pairs within a sequence. Oftentimes, these repeats consist of the nucleotides, or bases, cytosine and adenosine. RFLP (Restriction Fragment Length Polymorphism) RFLPs are variations in the restriction map of a given locus. RFLPs can result from: Point mutation creating or destroying a restriction site, insertion or deletions altering the length of a given restriction fragment. Lars O. Baumbusch INF3350/INF4350 Høst 2007 39 Rekombinasjonsfrekvens Ved å telle opp antall parentale og antall rekombinante individer i et krysningsforsøk med to gener, kan en finne rekombinasjonsfrekvensen mhp de to genene: antall rekombinante θ = antall rekombinante + antall parentale To gener eller mer generelt: loci på samme kromosom med rekombinasjonsfrekvens θ = 0.01 sies å ha genetisk avstand lik 1 centimorgan (cm). A a 1cM Lars O. Baumbusch INF3350/INF4350 Høst 2007 40 B b 1% av avkommet er rekombinanter 10

Mapping-funksjoner Ulike måter å definere genetisk avstand (i centimorgan) ut fra rekombinasjonsfrekvens: θ = rekombinasjonsfrekvens x = genetisk avstand (cm) Genetiske kart Genetiske kart angir posisjonen til genetiske markører på et kromosom. Morgan: Haldane: Kosambi: x = θ 1 x = ln(1 2 θ ) 2 x = 1 ln[(1 + 2 θ ) /(1 2 θ )] 4 Måles i centimorgan (cm) 1 cm = rekombinasjonsfrekvens 1% Lars O. Baumbusch INF3350/INF4350 Høst 2007 41 Lars O. Baumbusch INF3350/INF4350 Høst 2007 42 Genetisk kart - fysiske kart Genetiske kart viser hvordan et sett med genetiske markører ligger i forhold til hverandre langs et kromosom kan bare brukes til å kartlegge genetiske markører av et generelt dårlig oppløsning ingen enkel sammenheng mellom genetisk avstand og fysisk avstand: forholdet varierer med organisme, kromosom og kromosomlokasjon og kompliseres av fenomener som recombination hotspots Fysiske kart viser den fysiske posisjonen til et sett med elementer angir fysisk posisjon til markører (ikke begrenset til polymorfe DNA-segmenter) varierer i oppløsning, fra cytogenetiske kart til sekvenskart Eksempel: Entrez Map Viewer Tilstedeværelse av ulike typer markører Integrerte genomkart = Genetiske kart + Fysiske kart Lars O. Baumbusch INF3350/INF4350 Høst 2007 43 Kartlegging av to sett med markører Avstander Andel individer som er heterozygote i centimorgan for denne markøren Lars O. Baumbusch INF3350/INF4350 Høst 2007 44 11

Bioteknologi etableres... basis for bioinformatikk 1970 Første restriksjonsenzymer ble oppdaget 1971 Genkloning og starten på moderne bioteknologi 1972 Protein DataBank etableres (med 10 proteiner!) 1977 De første metoder for å sekvensere DNA utvikles 1980... Automatiserte metoder for å sekvensere DNA 1988 Mer effektive metoder for sekvenssammenstilling, NCBI (National Center for Biotechnology Information) etableres 1995 Første levende organisme ferdig sekvensert 1997 E.coli ferdig sekvensert (en bakterie) 1999 Første høyere organisme ferdig sekvensert (bananflue) 1999 Første humane kromosom ferdig sekvensert (#22) 2001 Frist draft av menneskets genom ferdig sekvensert Lars O. Baumbusch INF3350/INF4350 Høst 2007 45 Basics of biotechnology methods Cutting and pasting DNA Restriction enzymes Cloning Copying DNA Polymerase Chain Reaction Measuring DNA length Electrophoresis DNA sequencing Hybridization Southern blotting Microarrays Lars O. Baumbusch INF3350/INF4350 Høst 2007 46 Restriction enzymes: Cutting DNA Cutting DNA Restriction enzymes are discovered in the early 1970 s Used as a defense mechanism by bacteria to break down the DNA of attacking viruses They cut the DNA into small fragments Restriction Enzymes cut DNA cut specific at particular sequence patterns Restriction Enzyme A Cutting Sites Restriction Enzyme B Cutting Sites Can also be used to cut the DNA of organisms This allows the DNA sequence to be in a more manageable bite-size pieces It is then possible using standard purification techniques (electrophoresis) to single out certain fragments and duplicate them to macroscopic quantities DNA contains thousands of these sites Applying different restriction enzymes creates fragments of varying size A and B fragments overlap Restriction Enzyme A & Restriction Enzyme B Cutting Sites Lars O. Baumbusch INF3350/INF4350 Høst 2007 47 Lars O. Baumbusch INF3350/INF4350 Høst 2007 48 12

Pasting DNA Cut and paste: Cloning DNA Two pieces of DNA can be fused together Hybridization = complementary base-pairing DNA cloning: Insert the fragment into the genome of a living organism and multiply Vector DNA Ligation = fixing bonds with single strands Lars O. Baumbusch INF3350/INF4350 Høst 2007 49 Lars O. Baumbusch INF3350/INF4350 Høst 2007 50 Assembling genomes for sequencing genomes Major: Polymerase chain reaction (PCR) Important for sequencing projects Make a DNA library Some of the fragments will overlap Fit overlapping sequence fragments together to get complete sequence Separate the two DNA strands with heat Add primer sequences, and DNA Polymerase Creates double stranded DNA from a single strand Primer create a start from which double stranded DNA grows You get two copies Repeat x : Amount of DNA grows exponentially: 1 2 4 8 16 32 64 128 256 Lars O. Baumbusch INF3350/INF4350 Høst 2007 51 Lars O. Baumbusch INF3350/INF4350 Høst 2007 52 13

Fundamental: Electrophoresis = gel A polymer of agarose or polyacryl amide, forms a gel with pores sizes dependent upon the concentration of the polymer The phosphate backbone of DNA is highly negatively charged, therefore DNA will migrate in an electric field The size of DNA fragments can then be determined by comparing their migration in the gel to known size standards Sequencing: Reading DNA Given a DNA molecule it is possible to obtain all fragments that end in either A, or T, or G, or C and these can be sorted in a gel experiment DNA or RNA molecules are charged and move to a definite direction by applying an electric field DNA molecules are labeled with radioisotopes or fluorescent dyes (with a laser beam fluorescent probes can be read by automatically) Lars O. Baumbusch INF3350/INF4350 Høst 2007 53 Lars O. Baumbusch INF3350/INF4350 Høst 2007 54 Chain termination sequencing or dideoxy sequencing Dideoxynucleotides (ddntps) > interrupt chain elongation Assembling Genomes sequencing problems DNA fragments contain sequencing errors Synthesize a complimentary chain*: Add target DNA and primer Divide sample among four test tubes: "G" tube: all four dntp's, ddgtp "A" tube: all four dntp's, ddatp "T" tube: all four dntp's, ddttp "C" tube: all four dntp's, ddctp Add DNA polymerase Run 4 lanes gel and read * Primer or nucleotides are labeled with radioactivity or fluorescence Two complements of DNA Need to take into account both directions of DNA Repeat problem 50% of human DNA is just repeats If you have repeating DNA, how do you know where it goes? Genome (sequencing, annotation and in reality) is quite dynamic (http://lifesciences.asu.edu/resources/ Lars O. Baumbusch INF3350/INF4350 Høst 2007 mamajis/sequencing/sequencing.html) 55 Lars O. Baumbusch INF3350/INF4350 Høst 2007 56 14

Hybridization Hybridization: Microarrays Single-stranded DNA (and RNA) naturally binds to complementary strands Hybridization is used to locate genes, measurement of gene expression regulation, and determine the degree of similarity between DNA from different sources Used for Southern blotting and microarrays Microarray exploits the ability of single-stranded RNA/DNA to hybridize to complementary strands An array containing thousands of probes (BAC, cdnas or oligos) allows the measurement of thousands of genes at the same time By scanning, the amount of RNA/DNA bound to the spots on the microarray is precisely measured, generating a profile of gene expression (RNA) or DNA copy number profiles (DNA) Lars O. Baumbusch INF3350/INF4350 Høst 2007 57 Lars O. Baumbusch INF3350/INF4350 Høst 2007 58 Microarrays for gene expression and copy number analysis Biotechnology and Bioinformatics tissue samples reference RNA tumor RNA label with fluorescent dyes hybridize probe to microarray scan red/green intensity analysis & clustering (after: Lars Brown O. Baumbusch PO and Botstein D 1999 INF3350/INF4350 and Perou Høst CM 2007 et al., 2000) 59 Lars O. Baumbusch INF3350/INF4350 Høst 2007 (http://www.accessexcellence.org) 60 15