Frå DNA til Protein Medisin stadium IA, 9. september 2016 Astrid Lægreid
http://www.doegenomes.org/ Celler inneheld DNA arvematerialet i dei fleste levande system Genomet er organismen sitt komplette sett av DNA som er organisert i kromosom DNAet inneheld gen med info om korleis og når protein skal syntetiserast Protein utøver essensielle funksjonar i levande organismar, og samarbeider ofte i molekylære maskinar Molekylære maskinar virkar sammen i komplekse nettverk i cellene Samfunn av celler finn vi i ei samling av mikrober i ein bakteriekoloni eller i samspelet mellom cellene i eit menneske.
Kva er eit gen? Alt DNA som trengs for å lage et protein 19xx: Eitt gen ein fenotype 1940: Beadle og Tatum Eitt gen eitt enzym. Nobelpris i 1958. 2000: Eit gen er alt DNA som trengst for å lage eit genprodukt; anten eit polypeptid eller strukturelt/katalytisk RNA 2015: meir komplekst.
HUGO the HUman GenOme project http://doegenomes.org/ Sekvensering av det humane genomet Starta 1990 av US Department of Energy og National Institute of Health (NIH), ferdig 2003. The International Human Genome Sequencing Consortium 20 akademiske laboratoriar Genomet vart samtidig sekvensert av det private firmaet Celera Genomics 2001 (90%) HUGO Celera april 2003 (99%) 50 år sidan Watson & Crick publiserte DNA dobbelthelix 99% av det humane genomet sekvensert med 99.99% nøyaktighet
HUGO the HUman GenOme project http://doegenomes.org/ Det humane genomet er representert av 3 milliardar nukleotid (A, C, T, and G). Talet på gen er estimert til ca 25,000 99.9% av nukleotidsekvensen er identisk i alle menneske Funksjonen er ukjent for meir enn halvparten av genene som er oppdaga Mindre enn 2% av DNA i ei celle kodar for protein Repeterte sekvensar som ikkje kodar for protein ("junk DNA") utgjør minst halvparten av det humane genomet Mykje av det ikkje-kodande DNAet blir transkribert til RNA med regulatoriske funksjonar
Forstå korleis biologiske fenomen (molekyl, reaksjonar, strukturar) samspelar over fleire nivå multiscale US DOE, strategiplan 2014
Kva er eit gen? All DNA som trengst for å lage eit protein metafase-kromosom interfase-kromosom
DNA deoxy-ribonukleotidsyre basane Adenin, Guanin, Cytosin og Thymin RNA ribonukleotidsyre basene Adenin, Guanin, Cytosin og Uracil polymerar av nukleotid bundne sammen med fosfodiester-bindingar frå det tredje karbonatomet i eitt ribosemolekyl (3 ) til det femte karbonatomet (5 ) i neste ribosemolekyl dvs 3 5 -retning nukleinsyretråden har retning (er asymmetrisk) viktig grunnlag for informasjon
Byggesteinar i DNA og RNA
motståande nukleotidar i to DNA trådar kan danne hydrogenbindingar cytosin guanin: 3 hydrogenbindingar: thymin - adenin: 2 hydrogenbindingar: C --- G T -- A
base-paring i dobbelttråd DNA komplementær A T eller C - G antiparalell (motsatt retning, 5-3, 3-5 )
DNA struktur - dobbelthelix - A-T, C-G - antiparallell G T C G C A C G C G 3.4 nm 5 end Hydrogen bond T A 3 end G C C G G C A T 1 nm T A C G C G C G G C A T A T T A A T 0.34 nm 3 end 5 end
DNA hybridisering påvising av ein bestemt DNA sekvens Nesten alle teknikkane vi brukar til å manipulere DNA (og RNA) bygger på sekvens-spesifikk binding av to komplementære nukleinsyre-trådar (DNA eller RNA). DNA sekvensering, PCR (polymerase kjedereaksjon), genuttrykkmåling (mrna) etc. Hydrogenbindingane mellom to DNA-tråder kan brytast ved å heve temperaturen. Smeltetemperaturen (dvs. der hydrogenbindingane mellom to komplementære tråder brytest) blir hovedsakeleg bestemt av G/C versus A/T innhaldet Smeltetemperaturen for en kort DNA-tråd (~20 nukleotid) kan finnast med formelen:: Tm ( C) = 4 x (# C/G) + 2 x (#A/T)
DNA hybridisering påvising av ein bestemt DNA sekvens Hydrogenbindingane mellom to DNA-tråder kan brytast ved å heve temperaturen. Smeltetemperaturen (dvs. der hydrogenbindingane mellom to komplementære tråder brytest) blir hovedsakeleg bestemt av G/C versus A/T innhaldet Smeltetemperaturen for en kort DNA-tråd (~20 nukleotid) kan finnast med formelen:: Tm ( C) = 4 x (# C/G) + 2 x (#A/T) e.g. Tm ~ 4 x 9 + 2 x 11 = 58 C Ved ein temperatur like under smeltetemperaturen vil denne korte DNA-tråden ikkje binde nokon andre DNA-sekvensar
Det sentrale dogmet i biologien Transkripsjon (omskriving) Translasjon (oversetting) DNA RNA Protein Deoxyribonukleinsyre - deoxy-ribose + basane A, T, C, G - dobbelttråd Ribonukleinsyre - ribose + basane A, U, C, G - enkelttråd - mrna, trna, rrna, snrna, sirna Polypeptid - 20 aminosyrer, peptidbindinger - enkelttråd - eit protein er ei funksjonell eining oppbygd av eitt eller fleire polypeptid
Transkripsjon: DNA RNA Det blir laga ein RNA-kopi av ein del av DNA-tråden som kodar for eit polypeptid eller eit RNA. DNA-tråden fungerer som mal = templat
Transkripsjon: DNA RNA DNA RNA pol II RNA pol I RNA pol III mrna: Budbringar RNA (messenger RNA) Kodar for protein rrna: Ribosomalt DNA 4 ulike storleikar (5s, 5.8s, 18s, 28s) Dannar ribosom sammen med protein trna: Transfer RNA «Les» av genetisk kode og overfører aminosyrer Transkripsjon i 4 trinn: 1. Initiering 2. Forlenging (elongering) 3. Terminering 4. Prosessering
Transkripsjon: Initiering Eit gen har ein regulatorisk del og ein kodande del Promotor = regulatorisk del av eit gen direkte oppstraums (5 ) for transkripsjonsstart Transkripsjon Transkripsjonsfaktorar er DNAbindande protein som regulerer transkripsjon
Transkripsjon: RNA Prosessering I eukaryote celler må primær-transkriptet prosesserast før mrna er ferdig. 5 cap av 7-metylguanosine i trifosfatbinding. 3 poly-a hale: 80-350 adenosin Vernar mot degradering, bidrar i transport av mrna ut av kjernen og til initiering av proteinsyntese (translasjon)
Transkripsjon: RNA Prosessering Eukaryote gen: kodande DNA sekvensar exon (av expressed = uttrykt) er avbrotne av ikkje-kodande sekvensar intron (intervening sequences) Frå primærtranskriptet blir intron kutta ut og exon limt sammen (spleisa) til eit mrna som inneheld ein sammenhengande proteinkodande sekvens. Denne prosessen kallast RNA spleising.
Transkripsjon: RNA Prosessering
Transkripsjon: DNA RNA Ulikheiter i eukaryot og prokaryot genuttrykk (transkripsjon og translasjon) er utgangspunktet for behandling med ei rekke antibiotika
Translasjon: RNA polypeptid Etter at mrna er ferdig danna i cellekjernen, blir det transportert ut av kjernen til cytoplasma der proteinsyntesen skjer på ribosom. Eitt mrna-molekyl er templat for mange kopiar av eitt protein
Polypeptid er sette sammen av aminosyrer Aminosyrene er haldne sammen av kovalente bindingar - peptidbindingar
Dyreceller brukar 20 ulike aminosyrer som byggesteinar i protein Sidegruppene (R) er ulike > spesifikke fysiokjemiske eigenskapar i polypeptidkjeda
Aminosyrene i eit protein bestemmer struktur og funksjon
Den genetiske koden DNA = deoxyribonukleinsyre - deoxy-ribose + basene A, T, C, G RNA = ribonukleinsyre - ribose + basene A, U, C, G Kodon 3 nukleotid i DNA (RNA) kodar for ein aminosyre = trippelkoden
Den genetiske koden Etter startkodon (AUG) blir triplettane de-koda (lesne) i eitt drag heilt fram til stoppkodon; kallast open leseramme. Leserammen kan endrast av mutasjonar i DNA. Normal AUG GCA UUA CAG GUA UUA CUA CGA GGC ACA CCU GAA... functional gene Met Ala Leu Gln Val Leu Leu Arg Gly Thr Pro Glu protein insertion AUG GCA UUU ACA GGU AUU ACU ACG AGG CAC ACC UGA... premature Met Ala Phe Arg Gly Ile Thr Thr Arg His Thr Stop termination deletion AUG GCA UAC AGG UAU UAC UAC GAG GCA CAC CUG AAA... different Met Ala Tyr Arg Tyr Tyr Tyr Glu Ala His Leu Lys protein altered base AUG GCA UUA CAG GAA UUA CUA CGA GGC ACA CCU GAA... single amino Met Ala Leu Gln Glu Leu Leu Arg Gly Thr Pro Glu acid change altered base AUG GCA UUA CAG GUA UUA CUG CGA GGC ACA CCU GAA... no change Met Ala Leu Gln Val Leu Leu Arg Gly Thr Pro Glu
Figure 8-52 Molecular Biology of the Cell ( Garland Science 2008)
Translasjon: mrna Protein Proteinsyntesen skjer på ribosom: 2 subeiningar, 40s og 60s 4 rrna (5s, 5.8s, 18s, 28s) og protein Cytosol eller på ER Translasjon er prosessen der nukleotidsekvensen i mrna blir translatert (oversett, de-koda) til aminosyresekvensen i ei polypeptidkjede trna transporterer aminosyrene til ribosom og les den genetiske koden Aminosyrene kjedast sammen til polypeptid som blir transporterte til ulike deler i cella eller ut av cella
Flagellum Centrosome CYTOSKELETON: Microfilaments Intermediate filaments Microtubules Microvilli Peroxisome ENDOPLASMIC RETICULUM (ER) Rough ER Smooth ER Nuclear envelope Nucleolus Chromatin NUCLEUS Plasma membrane Ribosomes Golgi apparatus Mitochondrion Lysosome
Translasjonsmaskineriet: trna Eitt trna for kvart kodon (sett bort frå stopp-kodona)
Translasjonsmaskineriet: trna
Translasjonsmaskineriet: Ribosom
Translasjon: Initiering Første kompleks 40S subeininga av ribosomet og trna-met bind 5 cap på mrna Scanning Initierings-komplekset flyttar seg langs mrna til første AUG (start) kodon. Fullstendig ribosom 60S subeininga av ribosomet bind og ribosomet er klart for forlenging av polypeptidkjeda
Translasjon: Forlenging (elongering) Peptidyl transferase 3 1 2 4
Translasjon: Terminering 2 1 3
Protein targeting Polypeptid som skal bli membranprotein eller som skal eksporterast ut av cella har ein N-terminal signalsekvens som induserer ribosomet til å fullføre translasjonen på endoplasmatisk retikulum (ER)
Protein targeting: Sekretorisk protein SRP (Signal Recognition Particle) bind seg til signalsekvensen på polypeptid, og translasjonen stoppar opp. SRP har ein reseptor på ERmembranen, og etter binding av komplekset til ER, blir SRP frigjort og syntesen av proteinet held fram gjennom ein pore i ER-membranen.
Protein targeting: Membranprotein
Protein targeting
Post-translasjonell modifisering Glykosylering (sukkerkjeder) og interne bindingar i ER og Golgi Trimming, spalting, aktivering av propeptid (proteolytisk prosessering) pga post-translasjonell modifisering og alternativ spleising, går ein ut frå at proteomet (alle mulege protein) er minimum 10 X større enn genomet.
-omics -- > systemmedisin 1990-åra genomsekvensering functional genomics menneskeleg arvemasse 3 x 10 9 basepar ~25.000 gen > 1.000.000 genprodukt (protein, RNA) differensiell spleising, post-translasjonelle modifikasjonar genomskala screening (-omics) systems biology - genom, transkriptome, proteome - anna phenome systembiology systemmedisin 2020-åra
Storleik arvemasse: stor variasjon mellom artar
Arvemassen har ulike kategoriar DNA-sekvensar
Figure 4-17 Molecular Biology of the Cell ( Garland Science 2008)
Alle celler med kjerne har samme DNA korleis oppstår forskjellar? Regulering kva, kor mykje og når? dvs. regulering av gen-uttrykk
Regulering av genuttrykk: Transkripsjonsfaktorar Regulering av transkripsjon er effektivt: Kor mykje av og når eit polypeptid skal lagast blir ofte styrt på transkripsjonsnivå, dvs det er ofte ein sammenheng mellom mengde mrna for eit polypeptid og mengda av sjølve polypeptidet ei celle Regulatoriske DNA-sekvensar: promotor ligg direkte 5 for transkripsjonsstart enhancersekvensar er ofte mykje lengre unna intron kan innehalde regulatoriske sekvensar Transkripsjonsfaktorar er DNA-bindande protein som regulerer transkripsjon ved å regulere aktiviteten til RNA polymerase Aktivatorar og repressorar
Regulering av genuttrykk : Transkripsjonsfaktorar Aktivering Hemming Forekomsten av transkripsjonsfaktorar i ei celle bestemmer genuttrykket dvs. kva slags polypeptid som blir nysyntetisert på eit kvart tidspunkt
Regulering av genuttrykk: RNA Prosessering Eitt gen kan gi opphav til variantar av ei polypeptidkjede ved alternativ spleising av exon. Døme: endringar i antistoff frå i B-lymfocyttar under modning av immunrespons Udifferensierte B-celler: membranbunde antistoff i B-cellene Modne plasmaceller: løyseleg antistoff utskild til blod og vev antistoff antistoff DNA mrna-1 Udifferensierte celler mc ms mm TM TM An mrna-2 Modne plasmaceller An
Regulering av genuttrykk : Signal utanfrå
Regulering av genuttrykk : Signal innanfrå sirna small inhibitory RNA
Alle celler med kjerne har samme DNA korleis oppstår forskjellar? Regulering Genotype --- fenotype Genotype kva for eit genom (sum av gener) ein organisme eller celle har Fenotype korleis organismen (eller ei celle) er, oppfører seg og ser ut
Alle celler med kjerne har samme DNA korleis oppstår forskjellar? Regulering sentrale dogmet
Det sentrale dogmet i biologien status i dag: Post-translasjonell modifisering av protein
omics -- > systemmedisin -- > persontilpassa medisin Shrager J, Tenenbaum JM. Nat Rev Clin Oncol. 2014; 11:109
omics -- > systemmedisin -- > persontilpassa medisin Shrager J, Tenenbaum JM. Nat Rev Clin Oncol. 2014; 11:109 Hanahan, Weinberg, Cell, 2011, 144:646
Forstå korleis biologiske fenomen (molekyl, reaksjonar, strukturar) samspelar over fleire nivå multiscale US DOE, strategiplan 2014
Det sentrale dogmet i biologien status i dag: Post-translasjonell modifisering av protein