Primer og probe design Kurs TH-28973 Molekylærgenetiske metoder i medisinsk mikrobiologi 16.-20.mars 2015 Kåre Bergh Overlege St.Olavs Hospital / professor NTNU
Tema Valg av målsete («target sequence») Primer design Probe design ( evt PCR optimalisering)
Litteratur søk Hva vites om aktuelle agens? Søk litteratur, f.eks Pubmed: http://www.ncbi.nlm.nih.gov/pubmed Finnes et gen som er unik for dette agens? Single-gen eller multi-kopi gen? Publiserte PCR metoder Hvis ja, hvilke gener er benyttet? Hvis ja, hvor gammel publikasjon? Benyttet av andre senere? Hva er gjort på feltet senere år? Publisert nye alleler?
Genbank søk Søk i Genbank for gen-sekvenser http://www.ncbi.nlm.nih.gov/sites/gquery Hvor konservert er aktuelle sekvens? Hvor mange ulike alleler er kjent? Alignment av alle kjente alleler, f.eks v hj a ClustalW http://www.ebi.ac.uk/tools/msa/clustalo/ Konserverte regioner Polymorfismer Passende områder for primere/ probe i konserverte del av genet? Designe primere/ probe(r)
OBS! Fallgruve ved alignment - retningsavhengig CLUSTAL 2.1 multiple sequence alignment 1 CTTCTTCTTCTT 12 2 AAGAAGAAGAAG 12. :. :. :. :
Hjelpemiddel for å omforme sekvenser: F.eks http://www.bioinformatics.org/sms/rev_comp.html Reverse Complement converts a DNA sequence into its reverse, complement, or reverse-complement counterpart. You may want to work with the reverse-complement of a sequence if it contains an ORF on the reverse strand. Paste the raw or FASTA sequence into the text area below. >Sample sequence cttcttcttctt ******* The Sequence Manipulation Suite: Reverse Complement Results for 12 residue sequence "Sample sequence" starting "cttcttcttc". aagaagaagaag
OBS! Fallgruve ved alignment - retningsavhengig CLUSTAL 2.1 multiple sequence alignment CLUSTAL multiple sequence alignment etter sekvens 2 reverse complement 1 cttcttcttctt 2 cttcttcttctt ************ 1 cttcttcttctt 12 2 aagaagaagaag 12. :. :. :. :
Primerparets rolle Startpunkt for initiering av DNA syntese DNA polymeraser trenger en primer for start av DNA syntese Definerer PCR produktstørrelsen Komplementært til templat DNA Essentielt for spesifisitet til PCR reaksjonen
Ulike termer for primere Primer oligonukleotid Sense- Antisense Forward - Reverse Primer 1 -Primer 2
Primer egenskaper Hydrogen bindinger: GC basepar 3 stk AT basepar 2 stk GC mer stabil enn AT
Primer design Ingen eksakt vitenskap. Mye empiri Optimal primer lengde: 18-22 (16-30) nt Primer smeltetemperatur (Tm) Avhengig av lengde og GC-innhold Flere måter på beregne / ulike formler for kalkulering Vanlig, enkel (ofte greit fungerende) metode: Tm = 2(A+T) + 4(G+C) Nearest neighbor method anses ofte best Eksempel web-basert Tm calculator: http://www.sigma-genosys.com/calc/dnacalc.asp Anbefalt primer Tm: 50-60 C Tm differanse mellom primere: < 5 C Tm diff primer vs PCR produkt: < 22 C
Primer design Repeats Ex: ATATATAT Kan medføre slipping av primer Max 4 dinukleotid repeats Runs Ex: AGCGGGGGATGGGG Kan forårsake mispriming Opp til 4 kan være akseptabelt
Primer design 3 -ende stabilitet Beregnes på basis av 5 siste baser i 3 - ende Mispriming mindre hvis 3 -ende ikke er for stabil GC clamp Fare for mispriming til GC-rike områder Maximum 3 G/C i 3 -ende GC-innhold (anbefalt 40-60 %) Fortrinnsvis jevn/balansert fordeling av nt
Fri energi (kcal/mol) Primer design Mål for stabilitet til primer binding Beregnes ofte som Gibbs fri energi (ΔG), men flere metoder benyttes Avhengig av nukleotid sammensetning, elektrolytt konsentrasjon og temperatur Høy stabilitet ved lav ΔG (høy negativ verdi)
Primer design Sekundær-strukturer hårnål / hairpin Bør unngås i 3 -ende Bør ikke være for mange (men usikkert å kalkulere effekten), vurder energi og arbeidstemperatur Primer-dimerer Selv-dimer og kryss-dimer 3 -ende: ingen komplementaritet Intern (< 8nt)
Primer design Vanlig størrelse PCR-produkt: Konvensjonell PCR: 200-1000 bp Real-time PCR: SybrGreen: TaqMan probe: Hyb probe: 80-250(300) bp 50-150 bp 80-800 bp
Primer design Templat sekundær strukturer bør unngås Single strand DNA hybridiserer til seg selv Avhengig av ΔG og templat Tm Noen primer design-software kan beregne dette Viktigst ved design av kvantitativ PCR
Primer design Spesifisitet Perfekt match mellom primer og templat i 3 ende DNA-syntese pga DNA polymerase starter kun når 3 ende av primer festes til templatet Viktig for sikre spesifisitet for annealing til den korrekt målsekvens 5 ende mindre viktig mht spesifisitet Kan endre sekvense ved å legge inn restriksjon sete eller gjøre andre modifikasjoner Så primer BLAST for å sjekke spesifisitet http://blast.ncbi.nlm.nih.gov/
Primer design Resultat fra BLAST S Score Indikerer likhet mellom query sekvens og treffene i sekvuens databasee Score for en match: +2, og -1 for en mismatch E verdi expectation value Antall ulike alignments med score lik S som kan forventes å opptre tilfeldig Jo lavere E-verdi, jo mer signifikant er Score.
Primer design God primer? (mht sensitivitet og spesifisitet basert på BLAST resultater) 100 % komplementaritet til referanse sekvensen Høy Score og lav E-verdi Ulikhet til andre sekvenser som bør ha lavere Score og høyere E-verdi Dårlig primer? (mht spesifisitet basert på BLAST resultater) Komplementaritet med andre targets Lik Score og E-verdi som for referanse sekvensen
GenBank number Hits in GenBank Score the percent of the query length that is included in the aligned segments E-value GenBank number Lenght of hit Desciption of hit Query coverage Which strand Query searching sequence Sbject sequence of hit in the database
Software for primer design Kommersiell software OLIGO primer analysis software (Oligo.net ) AlleleID (Premier Biosoft) + andre Gratis programmer (eksempler) Primer-BLAST http://www.ncbi.nlm.nih.gov/tools/primer-blast/index.cgi?link_loc=blasthome Primer3 http://primer3.wi.mit.edu/ GeneFisher http://bibiserv.techfak.uni-bielefeld.de/genefisher2/
Primer design Degenererte primere Mix av primere 6 bases 2 6 = 64 forskjellige primere AGCTGACTGCTGATGCTAG AGGGGCTTGCTGGTGCTTG AGSKGMYTGCTGRTGCTWG
Probe design Generelle prinsipper (både TaqMan og Hybridiseringsprober Tm for probe(r) må være 5-10 C høyere enn for primerne For å sikre hybridisering av probe før primer annealing Unngå repetitive enheter og strekk av identiske nucleotider (slipping av probe;? Mispriming?) Unngå sekvenser med selv-komplementaritet (evt sekundær strukturer, redusert tilgjengelighet Unngå sekvenser som kan hybridisere til 3 ende av primere Kan danne primer-probe dimerer Blokker 3 ende av probe for å unngå elongering under PCR
Probe design TaqMan probe GC innhold: 30-80 % Ikke G i 5 end Risiko for quenching Konstruerte probe bør ha flere C enn G (evt velge komplementær tråden) FRET probes Begge prober på samme tråd, 1-5 nucleotider fra hverandre, unngå C i gap Energy transfer mellom prober er avhengig av distanse Donor probe merkes med fluorescein i 3 end Akseptor probe merkes med fluorophore i 5 end
Probe design Unngå clustre av G og C i noen ende Proben kan bindes for sterkt til target Unngå ekstremt purin (A/G) -rike sekvenser Kan gi dårlig hybridisering Spesielle momenter for deteksjon av mutasjoner Sensor probe dekke predikert sete for mutasjonen Anchor probe producer fluorescens signalet Tm sensor < Tm anchor Sikre at proben som dekker mutasjonssetet vil kontrollere dannelsen av fluorescens signalet
Etablering av en nypcr Optimalisering av parametre som affiserer PCR reaksjonen Denaturering: temperatur og tid Annealing : temperatur og tid Ekstensjon : temperatur og tid MgCl 2 konsentrasjon Sensitivitet og spesifisitet Effektivitet Hvordan detektere / måle PCR produkt? Hvordan forbedre en dårlig PCR? Checkboard analysis (primer kons.c vs MgCl kons.)
Eksempler på noen modifikasjoner: - PNA - LNA - DPO
PNA (Peptide Nucleic Acid) prober Polyamid N-(2-aminethyl)-glycin skjelett istedet for sukker-fosfat i DNA / RNA Nt kovalent bundet til den uladete polyamid hydrofob ikke fosfat - mindre elektrostatisk repulsjon - sterkere binding - kortere prober - meget sensitiv for mismatcher
PNA prober Andre egenskaper: høy affinitet rask hybridiseringskinetikk bedre penetrasjon gj den hydrofobe bakterieveggen? økt resistens mot nukleaser/proteaser stabil over vidt ph område Betydelig økte kostnader
LNA: Locked Nucleic Acid Modifisert RNA nt Bro mellom 2 O og 4 C «locks in 3 endo-pos» Øker hybridiseringsegenskaper (+ antatt andre gunstige egenskaper som økt sensitivitet og spesifisitet) Mest brukt i DNA microarray og FISH, også som real-time PCRprimere og -prober
DPO: dual priming oligonucleotide: Hensikt hindre mismatch priming og uspesifikk priming
Teoretisk fordel med DPO: Første priming; stabilizer lokalisere primerbindings område, den andre «determiner» gir mulighet for kritisk spesifisitet. Sies å ha en «større komfortsone» (mindre optimalisering, mindre kritisk mht sekundærstrukturer, hairpins, kryss- og selv-komplementaritet)