Et virus assosiert med HSMB er kartlagt. Del 2: Metodikk og potensiale. Torstein Tengs

Like dokumenter
Arabidopsis thaliana, vårskrinneblom

Den komplette DNA sekvens fra en organisme.

Hva kan vi bruke WGS til?

Kapittel 14: Det eukaryote genom og dets uttrykksregulering

Problembakterier karakterisering og genotyping. André Ingebretsen Avdeling for smittevern og Avdeling for mikrobiologi Oslo universitetssykehus

UNIVERSITETET I OSLO

Hva viser genanalyser av muskulatur hos laks med mørke flekker. Aleksei Krasnov, Hooman Moghadam Nofima, Ås

Oversikt over kap. 11. Kap. 11 Den direkte påvisning av genotype skiller individuelle genomer. Fire klasser av DNA polymorfismer.

Karakterisering av PISCINE MYOCARDITIS VIRUS (PMCV)

Klinisk molekylærmedisin (3): DNA-sekvensering

(12) Translation of european patent specification

FYS3710 Molekylærbiologi

LEKSJON 4: BIOTEKNOLOGI HVORDAN VI BRUKER NATURENS EGNE MEKANISMER TIL VÅR FORDEL, OG UTFORDRINGENE SOM FØLGER MED

FLERVALGSOPPGAVER BIOTEKNOLOGI

Sammenligningen mellom Arabidopsis thaliana genomet og de kjente genomene fra cyanobakterier, gjær, bananflue og nematode, viser bl. a.

Genkartlegging. Hva er egentlig et genkart? Genetisk og fysisk kartlegging

Genressurser i moderne planteforedling og forskning

Amplifikasjonsteknikker - andre metoder

ML-208, generell informasjon

FHF prosjekt nr : Multifaktorielle sykdommer i norsk lakseoppdrett. Lill-Heidi Johansen

Vil laksegenomet løse sykdomsproblematikken i akvakulturnæringen? Unni Grimholt CEES, Biologisk Institutt, UiO

Immunstimulanter for potensiering av torskens naturlige immunsystem

1. En ikke-naturlig forekommende eller konstruert sammensetning omfattende:

Bioteknologi i dag muligheter for fremtiden

Bruk av genteknologiske analyser ved diagnostikk av luftveisinfeksjoner. Gardermoen Svein Arne Nordbø

PBM 233 Mikrobiologi for farmasøyter

Tverrfaglige studier av HSMB nye veier til sykdomsforebyggende kunnskap. FHF prosjekt nr : Multifaktorielle sykdommer i norsk lakseoppdrett

Zebrafish as a model for human development and disease. Jon Vidar Helvik

Examination paper for Bi2014 Molecular Biology

LINEZOLIDRESISTENS HOS GRAM-POSITIVE KOKKER

Utbytte og utnytte av resultater fra et storstilt CMS-prosjekt

Vegard Eldholm. Molekylær TB epidemiologi

ML-208, generell informasjon

Introduksjon til RNA & Transkriptomikk

Genetikk i vår tid: Et paradigmeskifte. Kaja Selmer Avd. for medisinsk genetikk NK-SE

Hurtige metoder for analyse av mikrobiell forurensning

ILA virus HPR0 i norsk oppdrettslaks fylogeografi

UNIVERSITETET I OSLO

Klipp og lim: Genredigering med CRISPR teknologi

Luftveisinfeksjoner - PCR-basert diagnostikk. Anne-Marte Bakken Kran Overlege, førsteamanuensis Mikrobiologisk avd. UOS Ullevål

Hvordan standardisere en metode for isolering av plasmid til syntese av diabetes antigener?

Nytt fotopigment funnet hos fisk

(12) Translation of european patent specification

Vi som står bak prosjektet er Eirik Krogstad og Petter Hannevold. Vi har gjort et prosjekt sammen med Microbial Evolution Research Group (MERG) ved

Så, hvordan lager man nye nerveceller?

1. Medfødt og ervervet immunitet. Karl Schenck, V2015

Introduksjon av genteknologi i akvakultur: etiske og økologiske implikasjoner for vitenskap og forvaltning

Molekylærbiologi: Nøkkelen til alle levende organismer

Effekter av PRV-infeksjon på robusthet hos laks mer enn HSMB?

UNIVERSITETET I OSLO

(74) Agent or Attorney ZACCO NORWAY AS, Postboks 2003 Vika, 0125 OSLO, Norge

Hva GMO er, utbredelse og forventede nye produkter. Professor Hilde-Gunn O Hoen-Sorteberg

Gensøk. Oppsummering. Typer av sammenstillinger. Sammenstilling av sekvenser. To prinsipper for søking etter gener i DNA:

(12) Translation of european patent specification

Født sånn eller blitt sånn: om gener, søppel-dna og epigenetikk

Genetiske undersøkelser av biologisk materiale

UNIVERSITETET I OSLO

Hva er Immunterapi? Anders Sundan Senter for myelomforskning, NTNU

(12) Translation of european patent specification

Molekylær patologi Amplifikasjonsmetoder

Figurer kapittel 8: Bioteknologi Figur s

Foreleser: Eivind Coward, kontor 5. etg. Datablokken. Gruppeleder: Harald Barsnes

I lys av akkreditering Overgang fra Sanger sekvensering til dypsekvensering innen genetisk sykdomsdiagnostikk

Kapittel 12: FRA DNA TIL PROTEIN:

Risikofaktorer assosiert med piscine reovirus (PRV) smitte hos Atlantisk laks fanget i norske elver

Resistent lakselus - kvifor er det eit problem og korleis diagnostisere resistens?

Hvordan kan kartleggingen av laksens genom bidra til å løse utfordringene i norsk havbruksnæring

Kromosomer, gener og DNA

Kokeboka, oppskriften og kirsebærpaien

Grunnleggende og anvendt biovitenskap. Are Halvor Aastveit IKBM

Janus kreftbiobank og mirna forskning

(12) Translation of european patent specification

BIOS 2 Biologi

MOLEKYLÆRBIOLOGISK FAGDAG

Kan ILA virus spres via rogn og melke? Espen Rimstad, NMBU- Veterinærhøgskolen

Utvikling av molekylære metoder

PCR-analyser i rutinediagnostikken Pål A. Jenum

Clostridium difficile - diagnostikk og epidemiologi i Norge

BLAST. Blast. Noen mulige sammenstilling av CHAEFAP og CAETP. Evolusjonær basis for sekvenssammenstilling. Sekvenssammenstilling og statistikken brukt

Flervalgsoppgaver: proteinsyntese

Mikroalger til medisin; krefthemmere

HIV / AIDS -infeksjon - behandling

HIV / AIDS - infeksjon - behandling. PBM 233 Mikrobiologi Siri Mjaaland

Primer og probe design

Lukka og semi-lukka teknologi for økt helse- og sykdomskontroll. Lill-Heidi Johansen Avd. leder, Forebyggende Fiskehelse CtrlAqua SFI Nofima

Trenger vi mer eller mindre forsøksfisk?

NGS (Neste Generasjons Sekvensering) i diagnostikk, erfaringer og resultater

Oversikt over kap.10. Kap 10. Rekonstruksjon av Genomet. Splitt og overvinn strategien imøtekommer de fleste utfordringer

(12) Translation of european patent specification

Kromosomer, gener og DNA

Kan triste mus hjelpe i behandlingen av Huntington sykdom? Depresjon ved HS

Epigenetikk; arvesynden i ny innpakning? Dag O. Hessen University of Oslo, Dept. Biology Center of Ecological and Evolutionary Synthesis (CEES)

Organismer med strekkoder artsbestemming med DNA-sekvenser

Faglig kontaktperson under eksamen: 1.aman. Hans K. Stenøien ( )

trenger ikke GOD MAT GENMODIFISERING SUNN SKEPSIS TIL GMO

Avhengighet og gener - et evolusjonært perspektiv

UNIVERSITETET I OSLO

Supplemental Data. Wiludda et al. Plant Cell. (2012) /tpc

Transkript:

Et virus assosiert med HSMB er kartlagt. Del 2: Metodikk og potensiale Torstein Tengs

Ukjente patogener I alle systemer finnes det sykdommer hvor man mistenker et infektiøst agens, men hvor dette ikke er blitt identifisert Sannsynligvis store mørketall (sykdommer hvor et patogen er involvert men hvor man ikke ennå har data som underbygger dette) Hos menneske er det en rekke kjente sykdommer hvor man har lett etter patogener (lymfomer, astma, MS osv) Sopp, parasitter, protister, virus, bakterier etc.

Hva er problemet? Det er ikke trivielt å plukke rett vev/tidspunkt i sykdomsforløpet. Av og til er det bra å ikke ha detaljert kunnskap om sykdommen... Agens kan ikke dyrkes eller anrikes enkelt Klassiske molekylære metoder fungere ikke (konsensus PCR, subtraksjon etc.) Alternative metoder fungerer ikke/har ikke blitt prøvd: enzymatisk nedbrytning av vert DNA, screening av biblioteker med prober osv Sykdommen er ikke et resultat av, eller bare delvis forårsaket av, en infeksjon (autoimmun?)...

Sekvenserings-basert patogen karakterisering Man kan studere alle levende organismer indirekte ved å studere deres genomer og transkripter (og proteiner ) DNA/RNA må opprenses og prepareres for sekvensering Stor mengder sekvensdata må genereres Datakraft brukes til å fjerne sekvenser man forventer (vertsgenom/transkriptom, kjente kontaminanter osv) Kandidatsekvenser følges opp med videre sekvensering og PCR

Første eksempel: Computational Subtraction Alle sekvenser fra humane transkripter ble lastet ned fra GenBank (>3 millioner EST sekvenser) Humane (og muse) sekvenser ble fjernet ved å bruke BLAST og MegaBLAST 65.839 kandidatsekvenser ble identifisert Weber et al. Identification of foreign gene sequences by transcript filtering against the human genome. Nat Genet. 2002 Feb;30(2):141-2.

Computational Subtraction Se også: Pathogen discovery from human tissue by sequence-based computational subtraction. Xu et al. Genomics. 2003 Mar;81(3):329-35.

Computational Subtraction - GMO Norge har ett av verdens strengeste regelverk når det kommer til genetisk modifiserte organismer. Det er tillatt kun med spormengder i materiale som skal til humant konsum og inntil 5% i dyrefôr (godkjente GMOer). En GMO defineres som en organisme som er blitt genetisk manipulert ved hjelp av molekylærbiologiske metoder. Brorparten av GMOene har fått satt inn et konstrukt: Toksiner som dreper sopp/bakterier/parasitter (men ikke oss ) Toleranse ovenfor sprøytemidler (Økt næringsinnhold, bedre dyrkbarhet etc.)

Analyse av 5455 EST sekvenser fra GMO ris og 75846 mrna sekvenser fra SunUp papaya

Computational Subtraction - GMO 454-sekvensering av mrna fra GMO Arabidopsis thaliana - Fant også en rekke nye gener/splice former Characterization of unknown genetic modifications using high throughput sequencing and computational subtraction. Tengs et al. BMC Biotechnol. 2009 Oct 8;9:87.

Mer data for pengene Man trenger ikke lange sekvenser for å kunne si om noe ser ut til å være en god kandidat eller ikke Tradisjonell Sanger sekvensering (og til en viss grad 454-basert pyrosekvensering) gir egentlig lengre sekvenser ( reads ) enn det man trenger (300-400+ baser) Man kan subsample DNA/RNA ved å kutte det i småbiter og lime det sammen til lange kjeder ved hjelp av molekylærbiologisk akrobatikk (SAGE, RECORD etc.) Man kan da identifisere flere fragmenter per read

Genomic representations using concatenates of Type IIB restriction endonuclease digestion fragments. Tengs et al. Nucleic Acids Res. 2004 Aug 25;32(15):e121. Patent: Nucleic acid representations utilizing Type IIB restriction endonuclease cleavage products. Matthew L. Meyerson and Torstein Tengs. Patent publication number 2005/079357, application number PCT/US2005/004571.

Subtraksjon av sekvens tags Det er ikke trivielt å filtrere bort uønskede sekvenser (Alternativ løsning sammenlign data mot kjente patogen grupper ) Pass på å ikke kast ut barnet med badevannet Viktig å trimme sekvenser for vektor, linkere etc. Bare bruk sekvenser/baser av god kvalitet Masse data i GenBank (og andre steder) er feilannotert og svært mange komplette genomer er lang fra ferdige (inkluder det human genomet )

Lipkins metode Det går an å bruke både polya RNA og genomisk DNA for å lete etter patogener. Det er også mulig å gjøre ting billigere/enklere ved å bruke sekvens tags Man gjør færrest antagelser ved å bruke total RNA som utgangspunkt, men da ender man opp med >90 % rrna reads Lengre reads er bedre enn tags, men dette vil kreve masse ressurser både til sekvensering og analyse Nye sekvenseringsteknologier og raske algoritmer/datamaskiner har i de siste årene allikevel gjort dette mulig! A metagenomic survey of microbes in honey bee colony collapse disorder. Cox-Foster et al. Science. 2007 Oct 12;318(5848):283-7. Microbe hunting in the 21st century. Lipkin WI. Proc Natl Acad Sci U S A. 2009 Jan 6;106(1):6-7.

Lipkins metode - HSMI Total RNA ble isolert fra hjerte og serum fra utbruddsfisk og fisk fra smitteeksperiment (Kongtorp & Taksdal. J Fish Dis. 2009 Mar;32(3):253-62) Total RNA ble revers transkribert og PCR amplifisert ved hjelp av todelte primere (randomisert oktamer og definert primer sekvens) 15 prøver (9 hjerte og 6 serum) ble sekvenser ved hjelp av 454 pyrosekvensering (om lag 100.000 reads per prøve) Sekvenser ble assemblet slik at contigs ble konstruert av overlappende reads Sekvenser som matchet ribosomalt RNA ble fjernet (SILVA database) Sekvenser som matchet sebrafisk (komplett genom tilgjengelig) ble fjernet Resterende contigs ble oversatt i alle leserammer til protein og BLAST et mot GenBank ved hjelp av tblastx (alle leserammer mot alle leserammer) Resultatet ble tabulert med detaljert info (antall reads i hver contig, bit score, taksonomi til treff, lengde på contig osv)

Lipkins metode - HSMI Flere contigs ble funnet fra noe som lignet på et reovirus Ett PCR assay ble designet for et konservert fragment Alle prøvene ble screenet med dette assayet og den prøven som så ut til å ha høyest titer ble sekvensert en runde til ved hjelp av 454 En rekke contigs ble identifisert fra et nytt reovirus og ingen reads fra andre typer virus ble observert (som ikke kunne avskrives som kontaminanter eller feilannotasjoner) Ved hjelp av forskjellige versjoner av BLAST og FASTX i tillegg til FASD ble en rekke contigs identifisert, og RACE ble brukt for å komplettere 10 genom fragmenter FASD (Frequency Analysis of Sequence Data) er en algoritme som sammenligner metainformasjon fra sekvenser; ikke primærsekvens, men (di/tri) nukleotid mønstre, basesammensetning etc.

Bioinformatikk Når det komplette genomet forelå kunne man konstantere: Bare 1.5 % av genomet kunne gjenkjennes som viralt ved hjelp av nukleotid BLAST 54 % av genomet kunne gjenkjennes som viralt ved hjelp av protein blast 1.264 reovirus reads ble generert fra den opprinnelige 454 sekvenseringen Alle (bortsett fra èn) kom fra sekvensering av serum RNA

Fjern alle punktum, komma og mellomrom gruppèr basert på frekvenser av tekstvindu (lengde 9). Alignment-free genome comparison with feature frequency profiles (FFP) and optimal resolutions. Sims et al. Proc Natl Acad Sci U S A. 2009 Feb 24;106(8):2677-82.

Jeg vil takke Veterinærinstituttet Marie Løvoll Torstein Tengs Anja Braathen Kristoffersen Columbia University W. Ian Lipkin Gustavo Palacio Harvard University Matthew Meyerson