OM GENOM OG GENOMSEKVENSERING Svein-Ole Mikalsen Náttúruvísindadeildin Megindeildin fyri náttúru- og heilsuvísindi Fróðskaparsetur Føroya
Det humane genomet: 23 par kromosomer Bilde fra Wikipedia / US National Institutes of Health
Hvorfor er vi interessert i genomet? Vårt genetiske arvemateriale: DNA Bestemmer våre genetiske arveegenskaper Påvirker våre andre egenskaper Helse Personlighet DL Hartl (2011) Essential Genetics 5ed. Jones and Bartlett Publsihers
Arveegenskapene er kodet i DNA: Det viktigste molekylet i alle organismer Vi deler genomet med våre slektninger 50% med din mor 50% med din far 100% med din eneggede tvilling Gjennomsnittlig 50% med dine andre søsken Gradvis mindre deling utover i slektstreet Etiske perspektiver: Du sekvenserer ikke bare deg selv, du sekvenserer også delvis dine slektninger DL Hartl (2011) Essential Genetics 5ed. Jones and Bartlett Publsihers
DNA har en struktur og et alfabet Består av en dobbeltspiral: to tråder DNA har et 4-bokstav alfabet: A, T, C, G To og to bokstaver holder alltid sammen A og T henger sammen som AT eller TA G og C henger sammen som GC eller CG JD Watson and FHC Crick (1953) Nature 171, 737-738.
DNA sekvensering: Å finne rekkefølgen av bokstaver i tråden 5 -...GTAACGGTCA...-3 Kan lese av en kort sekvens Kan lese av hele genomet
Hvor mye DNA har mennesket? Total lengde på 2 meter per celle 6,4 milliarder bokstavpar totalt per celle ATCTGTCTGAAACGGTCCCTGGCTAAACTCCACCCATGGGTTGGCCAGCCTTGCCTTGACCAATAGCCTTGACAAGGCAAACTTGACCAATAGTCTTAGAGTATCCAGTGAGGCCAGGGGCCGGCGGCTGGC TAGGGATGAAGAATAAAAGGAAGCACCCTTCAGCAGTTCCACACACTCGCTTCTGGAACGTCTGAGGTTATCAATAAGCTCCTAGTCCAGACGCCATGGGTCATTTCACAGAGGAGGACAAGGCTACTATCA CAAGCCTGTGGGGCAAGGTGAATGTGGAAGATGCTGGAGGAGAAACCCTGGGAAGGTAGGCTCTGGTGACCAGGACAAGGGAGGGAAGGAAGGACCCTGTGCCTGGCAAAAGTCCAGGTCGCTTCTCAGGAT TTGTGGCACCTTCTGACTGTCAAACTGTTCTTGTCAATCTCACAGGCTCCTGGTTGTCTACCCATGGACCCAGAGGTTCTTTGACAGCTTTGGCAACCTGTCCTCTGCCTCTGCCATCATGGGCAACCCCAA AGTCAAGGCACATGGCAAGAAGGTGCTGACTTCCTTGGGAGATGCCATAAAGCACCTGGATGATCTCAAGGGCACCTTTGCCCAGCTGAGTGAACTGCACTGTGACAAGCTGCATGTGGATCCTGAGAACTT CAAGGTGAGTCCAGGAGATGTTTCAGCACTGTTGCCTTTAGTCTCGAGGCAACTTAGACAACTGAGTATTGATCTGAGCACAGCAGGGTGTGAGCTGTTTGAAGATACTGGGGTTGGGAGTGAAGAAACTGC AGAGGACTAACTGGGCTGAGACCCAGTGGCAATGTTTTAGGGCCTAAGGAGTGCCTCTGAAAATCTAGATGGACAACTTTGACTTTGAGAAAAGAGAGGTGGAAATGAGGAAAATGACTTTTCTTTATTAGA TTTCGGTAGAAAGAACTTTCACCTTTCCCCTATTTTTGTTATTCGTTTTAAAACATCTATCTGGAGGCAGGACAAGTATGGTCATTAAAAAGATGCAGGCAGAAGGCATATATTGGCTCAGTCAAAGTGGGG AACTTTGGTGGCCAAACATACATTGCTAAGGCTATTCCTATATCAGCTGGACACATATAAAATGCTGCTAATGCTTCATTACAAACTTATATCCTTTAATTCCAGATGGGGGCAAAGTATGTCCAGGGGTGA GGAACAATTGAAACATTTGGGCTGGAGTAGATTTTGAAAGTCAGCTCTGTGTGTGTGTGTGTGTGTGTGCGCGCGTGTGTTTGTGTGTGTGTGAGAGCGTGTGTTTCTTTTAACGTTTTCAGCCTACAGCAT ACAGGGTTCATGGTGGCAAGAAGATAACAAGATTTAAATTATGGCCAGTGACTAGTGCTGCAAGAAGAACAACTACCTGCATTTAATGGGAAAGCAAAATCTCAGGCTTTGAGGGAAGTTAACATAGGCTTG ATTCTGGGTGGAAGCTTGGTGTGTAGTTATCTGGAGGCCAGGCTGGAGCTCTCAGCTCACTATGGGTTCATCTTTATTGTCTCCTTTCATCTCAACAGCTCCTGGGAAATGTGCTGGTGACCGTTTTGGCAA TCCATTTCGGCAAAGAATTCACCCCTGAGGTGCAGGCTTCCTGGCAGAAGATGGTGACTGGAGTGGCCAGTGCCCTGTCCTCCAGATACCACTGAGCTCACTGCCCATGATGCAGAGCTTTCAAGGATAGGC TTTATTCTGCAAGCAATCAAATAATAAATCTATTCTGCTAAGAGATCACACATGGTTGTCTTCAGTTCTTTTTTTATGTCTTTTTAAATATATGAGCCACAAAGGGTTTTATGTTGAGGGATGTGTTTATGT GTATTTATACATGGCTATGTGTGTTTGTGTCATGTGCACACTCCACACTTTTTTGTTTACGTTAGATGTGGGTTTTGATGAGCAAATAAAAGAACTAGGCAATAAAGAAACTTGTACATGGGAGTTCTGCAA GTGGGAGTAAAAGGTGCAGGAGAAATCTGGTTGGAAGAAAGACCTCTATAGGACAGGACTCCTCAGAAACAGATGTTTTGGAAGAGATGGGGAAAGGTTCAGTGAAGGGGGCTGAACCCCCTTCCCTGGATT GCAGCACAGCAGCGAGGAAGGGGCTCAACGAAGAAAAAGTGTTCCAAGCTTTAGGAAGTCAAGGTTTAGGCAGGGATAGCCATTCTATTTTATTAGGGGCAATACTATTTCCAACGGCATCTGGCTTTTCTC AGCCCTTGTGAGGCTCTACAGGGAGGTTGAGGTGTTAGAGATCAGAGCAGGAAACAGGTTTTTCTTTCCACGGTAACTACAATGAAGTGATCCTTACTTTACTAAGGAACTTTTCATTTTAAGTGTTGACGC ATGCCTAAAGAGGTGAAATTAATCCCATACCCTTAAGTCTACAGACTGGTCACAGCATTTCAAGGAGGAGACCTCATTGTAAGCTTCTAGGGAGGTGGGGACTTAGGTGAAGGAAATGAGCCAGCAGAAGCT CACAAGTCAGCATCAGCGTGTCATGTCTCAGCAGCAGAACAGCACGGTCAGATGAAAATATAGTGTGAAGAATTTGTATAACATTAATTGAGAAGGCAGATTCACTGGAGTTCTTATATAATTGAAAGTTAA TGCACGTTAATAAGCAAGAGTTTAGTTTAATGTGATGGTGTTATGAACTTAACGCTTGTGTCTCCAGAAAATTCACATGCTGAATCCCCAACTCCCAATTGGCTCCATTTGTGGGGGAGGCTTTGGAAAAGT AATCAGGTTTAGAGGAGCTCATGAGAGCAGATCCCCATCATAGAATTATTTTCCTCATCAGAAGCAGAGAGATTAGCCATTTCTCTTCCTTCTGGTGAGGACACAGTGGGAAGTCAGCCACCTGCAACCCAG GAAGAGAGCCCTGACCAGGAACCAGCAGAAAAGTGAGAAAAAATCCTGTTGTTGAAGTCACCCAGTCTATGCTATTTTGTTATAGCACCTTGCACTAAGTAAGGCAGATGAAGAAAGAGAAAAAAATAAGCT TCGGTGTTCAGTGGATTAGAAACCATGTTTATCTCAGGTTTACAAATCTCCACTTGTCCTCTGTGTTTCAGAATAAAATACCAACTCTACTACTCTCATCTGTAAGATGCAAATAGTAAGCCTGAGCCCTTC TGTCTAACTTTGAATTCTATTTTTTCTTCAACGTACTTTAGGCTTGTAATGTGTTTATATACAGTGAAATGTCAAGTTCTTTCTTTATATTTCTTTCTTTCTTTTTTTTCCTCAGCCTCAGAGTTTTCCACA TGCCCTTCCTACTTTCAGGAACTTCTTTCTCCAAACGTCTTCTGCCTGGCTCCATCAAATCATAAAGGACCCACTTCAAATGCCATCACTCACTACCATTTCACAATTCGCACTTTCTTTCTTTGTCCTTTT TTTTTTTAGTAAAACAAGTTTATAAAAAATTGAAGGAATAAATGAATGGCTACTTCATAGGCAGAGTAGACGCAAGGGCTACTGGTTGCCGATTTTTATTGTTATTTTTCAATAGTATGCTAAACAAGGGGT AGATTATTTATGCTGCCCATTTTTAGACCATAAAAGATAACTTCCTGATGTTGCCATGGCATTTTTTTCCTTTTAATTTTATTTCATTTCATTTTAATTTCGAAGGTACATGTGCAGGATGTGCAGGCTTGT TACATGGGTAAATGTGTGTCTTTCTGGCCTTTTAGCCATCTGTATCAATGAGCAGATATAAGCTTTACACAGGATCATGAAGGATGAAAGAATTTCACCAATATTATAATAATTTCAATCAACCTGATAGCT TAGGGGATAAACTAATTTGAAGATACAGCTTGCCTCCGATAAGCCAGAATTCCAGAGCTTCTGGCATTATAATCTAGCAAGGTTAGAGATCATGGATCACTTTCAGAGAAAAACAAAAACAAACTAACCAAA AGCAAAACAGAACCAAAAAACCACCATAAATACTTCCTACCCTGTTAATGGTCCAATATGTCAGAAACAGCACTGTGTTAGAAATAAAGCTGTCTAAAGTACACTAATATTCGAGTTATAATAGTGTGTGGA CTATTAGTCAATAAAAACAACCCTTGCCTCTTTAGAGTTGTTTTCCATGTACACGCACATCTTATGTCTTAGAGTAAGATTCCCTGAGAAGTGAACCTAGCATTTATACAAGATAATTAATTCTAATCCACA GTACCTGCCAAAGAACATTCTACCATCATCTTTACTGAGCATAGAAGAGCTACGCCAAAACCCTGGGTCATCAGCCAGCACACACACTTATCCAGTGGTAAATACACATCATCTGGTGTATACATACATACC TGAATATGGAATCAAATATTTTTCTAAGATGAAACAGTCATGATTTATTTCAAATAGGTACGGATAAGTAGATATTGAGGTAAGCATTAGGTCTTATATTATGTAACACTAATCTATTACTGCGCTGAAACT GTGGCTTTATAGAAATTGTTTTCACTGCACTATTGAGAAATTAAGAGATAATGGCAAAAGTCACAAAGAGTATATTCAAAAAGAAGTATAGCACTTTTTCCTTAGAAACCACTGCTAACTGAAAGAGACTAA GATTTGTCCCGTCAAAAATCCTGGACCTATGCCTAAAACACATTTCACAATCCCTGAACTTTTCAAAAATTGGTACATGCTTTAGCTTTAAACTACAGGCCTCACTGGAGCTAGAGACAAGAAGGTAAAAAA CGGCTGACAAAAGAAGTCCTGGTATCCTCTATGATGGGAGAAGGAAACTAGCTAAAGGGAAGAATAAATTAGAGAAAAACTGGAATGACTGAATCGGAACAAGGCAAAGGCTATAAAAAAAATTAGCAGTAT
Likheten mellom ditt og mitt genom? ~ 99.5% identitet mellom personer ~ 1 av 1000 enkeltbokstaver er forskjellig hos to personer (SNPs, single nucleotide polymorphisms) ~ 200 000 indels fra 2 bp to 39 kb ~ 20 copy number variations fra 26 kb til 1.6 Mb Wheeler et at (2008) Nature 452, 872-876 Levy et al (2007) PLOS Biology 5, 2113-2144
Den tekniske utvikling Timer US $ Pris (US $) per genom 1,00E+10 1,00E+09 1,00E+08 1,00E+07 1,00E+06 1,00E+05 1,00E+04 1,00E+03 1,00E+02 2000 2005 2010 2015 100000,00 10000,00 Sekvenseringshastighet (en maskin, ett genom, en gang) 1000,00 100,00 10,00 1,00 0,10 2000 2005 2010 2015 https://www.genome.gov/27565109/the-cost-of-sequencing-a-human-genome/
...men hva er gener?......og hvor er de?...
Et gen har en bestemt plass i genomet SLC22A5
Gen Et område av genomet som koder for et protein eller et RNA molekyl som har en eller flere funksjoner i kroppen Genomsekvens Gen 1 Gen 2 Oversettelse 1 Oversettelse 1 ikke-kodende RNA mrna ( kodende RNA) Oversettelse 2 Protein
Hvor mange gener har mennesket? Fremdeles noe usikkert! 20 441 protein-kodende gener ~ 1.5% av genomet 22 219 ikke-kodende RNA gener Data pr. 10 september 2016 (www.ensembl.org)
Hver av oss kan ha to varianter av et gen Mor kromosomet kan ha én variant av et gen Far kromosomet kan samme variant, eller annen variant
Genvariasjonene gir individuelle genetiske egenskaper og genetiske sykdommer (I) Et gen kan ha flere normale varianter Et gen kan ha flere sykdoms -varianter Noen egenskaper skyldes ett gen (som kan finnes i flere varianter) Gir klassisk Mendelsk arvelighet Mange genetiske sykdommer skyldes variasjoner i bestemte gener >10 000 monogeniske sykdommer (www.who.int) Færøyske eksempler på monogeniske sykdommer CTD GSD Føroyasjuka Bardet-Biedl syndrom Cystisk fibrose Familiær hyperkolesterolemi
Genundersøkelser: ypperlige for monogeniske sykdommer Målrettede undersøkelser av en spesifikk genetisk variasjon en liten del av et enkelt gen et enkelt gen Svært høy kvalitet på undersøkelsene
V Y L G A Y D R F L P Y I L M G S L T I L T A I L T L F L P E S F G T P L P D T GTTTACCTTGGTGCCTACGACCGCTTCCTGCCCTACATTCTCATGGGAAGTCTGACCATCCTGACAGCCATCCTCACCTTGTTTCTCCCAGAGAGCTTCGGTACCCCACTCCCAGACACC SLC22A5: Forandring av en enkelt bokstav i gensekvensen ( mutasjon ) kan gi CTD M R D Y D E V T A F L G E W G P F Q R L I F F L L S A S I I P N G F T G L S S V ATGCGGGACTACGACGAGGTGACCGCCTTCCTGGGCGAGTGGGGGCCCTTCCAGCGCCTCATCTTCTTCCTGCTCAGCGCCAGCATCATCCCCAATGGCTTCACCGGCCTGTCCTCCGTG F L I A T P E H R C R V P D A A N L S S A W R N H T V P L R L R D G R E V P H S TTCCTGATAGCGACCCCGGAGCACCGCTGCCGGGTGCCGGACGCCGCGAACCTGAGCAGCGCCTGGCGCAACCACACTGTCCCACTGCGGCTGCGGGACGGCCGCGAGGTGCCCCACAGC C R R Y R L A T I A N F S A L G L E P G R D V D L G Q L E Q E S C L D G W E F S TGCCGCCGCTACCGGCTCGCCACCATCGCCAACTTCTCGGCGCTTGGGCTGGAGCCGGGGCGCGACGTGGACCTGGGGCAGCTGGAGCAGGAGAGCTGTCTGGATGGCTGGGAGTTCAGT Q D V Y L S T I V T E W N L V C E D D W K A P L T I S L F F V G V L L G S F I S CAGGACGTCTACCTGTCCACCATTGTGACCGAGTGGAACCTGGTGTGTGAGGACGACTGGAAGGCCCCACTCACAATCTCCTTGTTCTTCGTGGGTGTGCTGTTGGGCTCCTTCATTTCA G Q L S D R F G R K N V L F V T M G M Q T G F S F L Q I F S K N F E M F V V L F GGGCAGCTGTCAGACAGGTTTGGCCGGAAGAATGTGCTGTTCGTGACCATGGGCATGCAGACAGGCTTCAGCTTCCTGCAGATCTTCTCGAAGAATTTTGAGATGTTTGTCGTGCTGTTT V L V G M G Q I S N Y V A A F V L G T E I L G K S V R I I F S T L G V C I F Y A GTCCTTGTAGGCATGGGCCAGATCTCCAACTATGTGGCAGCATTTGTCCTGGGGACAGAAATTCTTGGCAAGTCAGTTCGTATAATATTCTCTACGTTAGGAGTGTGCATATTTTATGCA F G Y M V L P L F A Y F I R D W R M L L V A L T M P G V L C V A L W W F I P E S TTTGGCTACATGGTGCTGCCACTGTTTGCTTACTTCATCCGAGACTGGCGGATGCTGCTGGTGGCGCTGACGATGCCGGGGGTGCTATGCGTGGCACTCTGGTGGTTCATCCCTGAGTCC P R W L I S Q G R F E E A E V I I R K A A K A N G I V V P S T I F D P S E L Q D CCCCGATGGCTCATCTCTCAGGGACGATTTGAAGAGGCAGAGGTGATCATCCGCAAGGCTGCCAAAGCCAATGGGATTGTTGTGCCTTCCACTATCTTTGACCCGAGTGAGTTACAAGAC L S S K K Q Q S H N I L D L L R T W N I R M V T I M S I M L W M T I S V G Y F G CTAAGTTCCAAGAAGCAGCAGTCCCACAACATTCTGGATCTGCTTCGAACCTGGAATATCCGGATGGTCACCATCATGTCCATAATGCTGTGGATGACCATATCAGTGGGCTATTTTGGG L S L D T P N L H G D I F V N C F L S A M V E V P A Y V L A W L L L Q Y L P R R CCTTTCGCTTGATACTCCTAACTTGCATGGGGACATCTTTGTGAACTGCTTCCTTTCAGCGATGGTTGAAGTCCCAGCATATGTGTTGGCCTGGCTGCTGCTGCAATATTTGCCCGGCGC Y S M A T A L F L G G S V L L F M Q L V P P D L Y Y L A T V L V M V G K F G V T TATTCCATGGCCACTGCCCTCTTCCTGGGTGGCAGTGTCCTTCTCTTCATGCAGCTGGTACCCCCAGACTTGTATTATTTGGCTACAGTCCTGGTGATGGTGGGCAAGTTTGGAGTCACG A A F S M V Y V Y T A E L Y P T V V R N M G V G V S S T A S R L G S I L S P Y F GCTGCCTTTTCCATGGTCTACGTGTACACAGCCGAGCTGTATCCCACAGTGGTGAGAAACATGGGTGTGGGAGTCAGCTCCACAGCATCCCGCCTGGGCAGCATCCTGTCTCCCTACTTC S G
http://www.arup.utah.edu/
http://www.arup.utah.edu/
Genvariasjonene gir individuelle genetiske egenskaper og genetiske sykdommer (II) De fleste egenskaper skyldes mange gener i fellesskap Høyde Fordeling mellom godt og dårlig kolesterol i blodet De fleste folkesykdommer og mange andre sykdommer Diabetes Hjerte-karsykdommer Psykiatriske lidelser Vi er mer enn bare det humane genomet Samspill mellom gener og miljø Det humane mikrobiomet
Genomundersøkelser Undersøkelser av hele genomet, eller vesentlige deler av genomet Helgenom-sekvensering: lese sekvensen i hele genomet Exom-sekvensering: lese sekvensen i proteinkodende del av genomet Transkriptomsekvensering Undersøke kun på kjente sekvensforskjeller mellom individer ( SNP microarrays eller genome-wide association study ) Andre typer undersøkelser
Vevnaðarroynd, blóð Reinsan av DNA Klárgering av roynd til sekvensering Sekvensering Rásekvensir (1-10 milliardir av stuttum sekvensur, sum hava millum 50-150 nukleotidir hvør) Samanseting av sekvensum til eitt genom Sjúka við ókendum mutatiónum Samanbering við frískt tilvísingargenom Sjúka við kendum mutatiónum Samanbering við kendar og vandaleysar variantar 3-4 milliónir munir Miðvís kanning við kendum mutatiónum í kendum sekvensum 50.000-100.000 ókendir og møguliga vandamiklir variantar Fund? Diagnosa Einki fund? Sálding við eina røð av teknum, til dømis: - í proteinkotandi økjum, broytir ikki aminosýrusekvens Møguliga vandaleys - í proteinkotandi økjum, broytir aminosýrusekvens Møguliga vandamikil - á markinum millum proteinkotandi og ikki kotandi økjum Møguliga vandamikil - í genregulerandi sekvensum Møguliga vandamikil - strukturellar broytingar Møguliga vandamikil - uttanfyri gen og regulerandi sekvensir Møguliga vandaleys 50-200 variantar til einsæris meting Váttandi kanning Møgulig diagnosa Eingin diagnosa
Formål med genomsekvensering Forskning Diagnostisk sekvensering Rutinemessig sekvensering av friske personer
Feil og usikkerheter (I) Hvor mye feil og usikkerheter er akseptabelt ved forskning? ved klinisk bruk av data ved diagnostisk sekvensering? ved rutinemessig bruk av genomdata i klinikken? Kan og bør vi stille samme krav til sekvenseringen ( kvalitet ) i alle tilfeller?
Feil og usikkerheter (II) Sekvenseringen inneholder feil JD Wall et al (2014) Genome Res 24,1734-39 M Schirmer et al (2015) Nucleic Acids Res 43, e37 Bioinformatikken er ikke perfekt D Earl et al (2014) Genome Res 24, 2077-89 KR Bradnam et al (2013) Gigasci 2, 10 Vet lite om nytten av genomdata for friske personer til klinisk bruk
Ingen(?) publiserte analyser for nytte av friske personers genomdata: betydningen for helsemessig gevinst betydning effektiviteten i helsevesenet betydning for økonomien i helsevesenet
Helsemessig gevinst?
Sekvensdata sammenholdt med mutasjons/sykdomsdatabaser Hver person har ~54 varianter som er registrert som årsak til genetisk sykdom Hver person har ~0,89 varianter som skulle gi en dominant genetisk sykdom 9 av 192 (4,7%) utvalgte sykdomsvarianter ble funnet å ha tilstrekkelig evidens til å støtte en sykdomsassosiasjon Lek et al (2016) Nature 536, 285-291
The implications are broad: these variant data already guide diagnoses and treatment. Leder, Nature 18 august 2016
Alle har variasjoner som skulle gi genetisk sykdom Sykeliggjøring av friske mennesker Overbehandling Det er sannsynligvis (mange) feil i mutasjons/sykdomsdatabasene
Evidens-nytte perspektiv Evidens Sterk Evidens-basert medisin Diagnostisk genomsekvensering Svak Negativt Genomsekvensering av friske mennesker til klinisk bruk Ingen Nytte Positivt
Mange problemstillinger ved helsevesenets bruk av friske personers genomsekvens Kvalitetsmessige problemstillinger med sekvenseringen med bioinformatikken med grunnlagsdataene (databasene) Etiske problemstillinger Juridiske problemstillinger Sikkerhetsmessige problemstillinger
Takk for oppmerksomheten!