Tittel: TAL-EFFEKTOR-FORMIDLET DNA-MODIFIKASJON

Størrelse: px
Begynne med side:

Download "Tittel: TAL-EFFEKTOR-FORMIDLET DNA-MODIFIKASJON"

Transkript

1 V264NO00 EP2096 Tittel: TAL-EFFEKTOR-FORMIDLET DNA-MODIFIKASJON

2 1 Beskrivelse TEKNISK OMRÅDE [0001] Den foreliggende oppfinnelsen vedrører fremgangsmåter for genmålretting, og spesielt fremgangsmåter som inkluderer anvendelsen av transkriberingsaktivatorlignende (TAL) effektorsekvenser. BAKGRUNN [0002] Muligheten til å modifisere kromosomer gjennom homolog rekombinasjon (genmålretting) har vært et lenge etterlengtet mål blant biologer. I planter, f.eks., kan genmålretting bidra til å skjelne funksjonen av plantegener, og åpne opp nye muligheter for avlingsforbedring. F.eks., med genmålretting, er det mulig å gjennomføre den genetiske operasjonen som kreves for å reorkestrere metabolske reaksjonsveier for å skape høye verdiavlinger, inkludert frø med endrede olje- eller karbohydratprofiler, mat med forbedrede ernæringsmessige kvaliteter eller planter med økt motstand mot sykdom og stress. Hos dyr (f.eks. pattedyr), kan genmålretting anvendes for behandling av sykdom. F.eks. kan genmålretting anvendes til å konstruere korreksjoner i gener som er mangelfulle som følge av forskjellige typer mutasjoner. Effektive metoder for slik genmålretting har vært vanskelige å oppnå. OPPSUMMERING [0003] TAL-effektorer av plantesykdomsfremkallende bakterier i slekten Xanthomonas spiller viktige roller i sykdom, eller utløser forsvar, ved å binde verts- DNA og aktivere effektorspesifikke vertsgener (se f.eks. Gu et al. (200) Nature 43:1122; Yang et al. (2006) Proc. Natl. Acad. Sci. USA 3:03; Kay et al. (2007) Science 318:648; Sugio et al. (2007) Proc. Natl. Acad. Sci. USA 4:720; og Römer et al. (2007) Science 318:64). Spesifisitet avhenger av et effektorvariabelt antall ufullkomne, typiske 34-aminosyrerepeteringer (Schornack et al. (2006) J. Plant Physiol. 163:26). Polymorfismer er til stede primært på repeteringsposisjonene 12 og 13, som i dette dokumentet refereres til som den repeteringsvariable di-resten (RVD). [0004] Foreliggende oppfinnelse er delvis basert på det faktum at RVD-ene av TALeffektorer tilsvarer nukleotidene i deres målseter på en direkte, lineær måte, en RVD til ett nukleotid, med en viss degenerering og ingen åpenbar sammenhengsavhengighet. Dette overraskende funnet representerer en ny mekanisme for protein-dnagjenkjenning som muliggjør målseteprediksjon for en ny målspesifikk TAL-effektor. Slik det beskrives i dette dokumentet kan disse proteinene være nyttige i forskning og bioteknologi som målrettede kimære nukleaser som kan lette homolog rekombinasjon i genomteknologi (f.eks. for å legge til eller forsterke trekk nyttige for biodrivstoff eller fornybare bioressurser i planter). Disse proteinene kan også være nyttige som f.eks.

3 transkriberingsfaktorer, og spesielt for terapeutiske anvendelser som krever en meget høy grad av spesifisitet, så som terapeutiske midler mot patogener (f.eks. virus) som ikke-begrensende eksempler. [000] I ett aspekt fremmer foreliggende offentliggjøring en fremgangsmåte for modifisering av det genetiske materialet av en celle, omfattende (a) tilveiebringelse av en celle inneholdende en mål-dna-sekvens; og (b) innføring av et transkriberingsaktivatorlignende (TAL) effektor-dna-modifiserende enzym inn i cellen, det TALeffektor-DNA-modifiserende enzymet er omfattende (i) et DNA-modifiserende enzymdomene som kan modifisere dobbelttrådet DNA, og (ii) et TAL-effektordomene omfattende flere TAL-effektorrepeteringssekvenser som, i kombinasjon, binder til en spesifikk nukleotidsekvens i mål-dna-sekvensen, slik at det TAL-effektor-DNAmodifiserende enzymet modifiserer mål-dna-et inne i eller tilstøtende den spesifikke nukleotidsekvensen i cellen eller avkommet derav. Fremgangsmåten kan videre omfatte å gi en nukleinsyre til cellen omfattende en sekvens som er homolog med minst en del av mål-dna-sekvensen, slik at homolog rekombinasjon forekommer mellom mål-dna-sekvensen og nukleinsyren. Cellen kan være en eukaryot celle, en pattedyrcelle, en plantecelle eller en prokaryot celle. Mål- DNA-et kan være kromosomalt DNA. Innføringen kan omfatte transfektering av cellen med en vektor som koder for det TAL-effektor-DNA-modifiserende enzymet, mekanisk injisering av det TAL-effektor-DNA-modifiserende enzymet inn i cellen som et protein, og levere det TAL-effektor-DNA-modifiserende enzymet inn i cellen som et protein ved hjelp av utskillelsessystemet av bakterietype III, eller å innføre det TALeffektor-DNA-modifiserende enzymet inn i cellen som et protein ved elektroporering. Det DNA-modifiserende enzymet kan være en endonuklease (f.eks. en restriksjonsendonuklease av type II, så som FokI). [0006] TAL-effektordomenet som binder til en spesifikk nukleotidsekvens i mål- DNA-et kan omfatte eller flere DNA-bindende repeteringer, og fortrinnsvis 1 eller flere DNA-bindende repeteringer. Hver DNA-bindende repetering kan inkludere en repeteringsvariabel di-rest (RVD) som bestemmer gjenkjenningen av et basepar i mål- DNA-sekvensen, der hver DNA-bindende repetering er ansvarlig for gjenkjenning av ett basepar i mål-dna-sekvensen, og der RVD-en omfatter én eller flere av: HD for gjenkjenning av C; NG for gjenkjenning av T; NI for gjenkjenning av A; NN for gjenkjenning av G eller A; NS for gjenkjenning av A eller C eller G eller T; N* for gjenkjenning av C eller T, der * representerer et hull i den andre posisjonen av RVDen; HG for gjenkjenning av T; H* for gjenkjenning av T, der * representerer et hull i den andre posisjonen av RVD-en; IG for gjenkjenning av T; NK for gjenkjenning av G; HA for gjenkjenning av C; ND for gjenkjenning av C; HI for gjenkjenning av C; HN for gjenkjenning av G; NA for gjenkjenning av G; SN for gjenkjenning av G eller A; og YG for gjenkjenning av T. Hver DNA-bindende repetering kan omfatte en

4 RVD som bestemmer gjenkjenningen av et basepar i mål-dna-sekvensen, der hver DNA-bindende repetering er ansvarlig for gjenkjenning av ett basepar i mål-dnasekvensen, og der RVD-en omfatter én eller flere av: HA for gjenkjenning av C; ND for gjenkjenning av C; HI for gjenkjenning av C; HN for gjenkjenning av G; NA for gjenkjenning av G; SN for gjenkjenning av G eller A; YG for gjenkjenning av T; og NK for gjenkjenning av G, og ett eller flere av: HD for gjenkjenning av C; NG for gjenkjenning av T; NI for gjenkjenning av A; NN for gjenkjenning av G eller A; NS for gjenkjenning av A eller C eller G eller T; N* for gjenkjenning av C eller T, der * representerer et hull i den andre posisjonen til RVD-en; HG for gjenkjenning av T; H* for gjenkjenning av T, der * representerer et hull i den andre posisjonen til RVD-en; og IG for gjenkjenning av T. [0007] I et annet aspekt fremmer den foreliggende offentliggjøringen en fremgangsmåte for generering av en nukleinsyre som koder for en TAL-effektor spesifikk for en valgt nukleotidsekvens, omfattende: (1) linearisering av et starterplasmid med PspXI, starterplasmidet omfattende en nukleotidsekvens som koder for et første TALeffektor DNA-bindingsrepeteringsdomene som har en repeteringsvariabel di-rest (RVD) spesifikt for det første nukleotidet av den valgte nukleotidsekvensen, der det første TAL-effektor DNA-bindingsrepeteringsdomenet har et unikt PspXI-sete ved 3'- enden sin; (2) ligering inn i startplasmid-pspxi-setet av en DNA-modul som koder for én eller flere TAL-effektor DNA-bindingsrepeteringsdomener som har RVD-er spesifikke for det neste nukleotidet/nukleotidene av den valgte nukleotidsekvensen, der DNA-modulen har XhoI-klebrige ender; og (3) repetering av trinnene (1) og (2) inntil nukleinsyren koder for en TAL-effektor i stand til å binde til den valgte nukleotidsekvensen. Fremgangsmåten kan videre omfatte, etter ligering, å bestemme orienteringen av DNA-modulen i PspXI-setet. Fremgangsmåten kan omfatte å gjenta trinnene (1) og (2) fra en til 30 ganger. [0008] I et annet aspekt offentliggjør den foreliggende oppfinnelsen en fremgangsmåte for generering av en nukleinsyre som koder for en transkriberingsaktivatorlignende effektorendonuklease (TALEN), omfattende (a) å identifisere en første nukleotidsekvens i genomet til en celle; og (b) syntetisering av en nukleinsyre som koder for en TALEN som omfatter (i) flere DNA-bindende repeteringer som, i kombinasjon, binder til den første unike nukleotidsekvensen, og (ii) en endonuklease som genererer et dobbelttrådet snitt ved en posisjon inne i eller tilstøtende den første nukleotidsekvensen, der hver DNA-bindende repetering omfatter en RVD som bestemmer gjenkjenning av et basepar i mål-dna-et, der hver DNAbindingsrepetering er ansvarlig for gjenkjenning av ett basepar i mål-dna-et, og der TALEN omfatter én eller flere av de følgende RVD-ene: HD for gjenkjenning av C; NG for gjenkjenning av T; NI for gjenkjenning av A; NN for gjenkjenning av G eller A; NS for gjenkjenning av A eller C eller G eller T; N* for gjenkjenning av C

5 eller T; HG for gjenkjenning av T; H* for gjenkjenning av T; IG for gjenkjenning av T; NK for gjenkjenning av G; HA for gjenkjenning av C; ND for gjenkjenning av C; HI for gjenkjenning av C; HN for gjenkjenning av G; NA for gjenkjenning av G; SN for gjenkjenning av G eller A; og YG for gjenkjenning av T. [0009] TALEN kan omfatte én eller flere av de følgende RVD-ene: HA for gjenkjenning av C; ND for gjenkjenning av C; HI for gjenkjenning av C; HN for gjenkjenning av G; NA for gjenkjenning av G; SN for gjenkjenning av G eller A; YG for gjenkjenning av T; og NK for gjenkjenning av G, og én eller flere av: HD for gjenkjenning av C; NG for gjenkjenning av T; NI for gjenkjenning av A; NN for gjenkjenning av G eller A; NS for gjenkjenning av A eller C eller G eller T; N* for gjenkjenning av C eller T; HG for gjenkjenning av T; H* for gjenkjenning av T; og IG for gjenkjenning av T. [00] Den første nukleotidsekvensen kan oppfylle minst ett av de følgende kriteriene: i) er minimum 1 baser lang og er orientert fra ' til 3' med en T rett foran setet ved '-enden; ii) ikke har en T i den første (') posisjonen eller en A i den andre posisjonen; iii) ender i T ved den siste (3') posisjonen, og ikke har en G på den nest siste posisjonen; og iv) har en basesammensetning på 0-63 % A, % C, 0-2 % G, og 2-42 % T. [0011] Fremgangsmåten kan omfatte å identifisere en første nukleotidsekvens og en andre nukleotidsekvens i genomet til cellen, der de første og andre nukleotidsekvensene tilfredsstiller minst ett av kriteriene fremsatt ovenfor, og separeres med 1-18 bp. Endonukleasen kan generere et dobbelttrådet snitt mellom de første og andre nukleotidsekvensene. [0012] I en annen utførelsesform fremmer den foreliggende offentliggjøringen en TALEN omfattende et endonukleasedomene og et TAL-effektor-DNA-bindende domene som er spesifikt for et mål-dna, der det DNA-bindende domenet omfatter flere DNA-bindende repeteringer, hver repetering er omfattende en RVD som bestemmer gjenkjenning av et basepar i mål-dna-et, der hver DNA-bindende repetering er ansvarlig for gjenkjenning av ett basepar i mål-dna-et, og der TALEN omfatter én eller flere av de følgende RVD-ene: HD for gjenkjenning av C; NG for gjenkjenning av T; NI for gjenkjenning av A; NN for gjenkjenning av G eller A; NS for gjenkjenning av A eller C eller G eller T; N* for gjenkjenning av C eller T; HG for gjenkjenning av T; H* for gjenkjenning av T; IG for gjenkjenning av T; NK for gjenkjenning av G; HA for gjenkjenning av C; ND for gjenkjenning av C; HI for gjenkjenning av C; HN for gjenkjenning av G; NA for gjenkjenning av G; SN for gjenkjenning av G eller A; og YG for gjenkjenning av T. TALEN kan omfatte én eller flere av de følgende RVD-ene: HA for gjenkjenning av C; ND for gjenkjenning av C; HI for gjenkjenning av C; HN for gjenkjenning av G; NA for gjenkjenning av G; SN for gjenkjenning av G eller A; YG for gjenkjenning av T; og NK for gjenkjenning av

6 G, og ett eller flere av: HD for gjenkjenning av C; NG for gjenkjenning av T; NI for gjenkjenning av A; NN for gjenkjenning av G eller A; NS for gjenkjenning av A eller C eller G eller T; N* for gjenkjenning av C eller T; HG for gjenkjenning av T; H* for gjenkjenning av T; og IG for gjenkjenning av T. Endonukleasedomenet kan være av en type II-restriksjonsendonuklease (f.eks. FokI). [0013] I enda et annet aspekt fremmer den foreliggende oppfinnelsen en TALEN omfattende et endonukleasedomene og et TAL-effektordomene, der aminosyresekvensen til TALEN velges fra gruppen bestående av SEQ ID NO:33 til SEQ ID NO:, SEQ ID NO:72 og SEQ ID NO:73. [0014] Den foreliggende offentliggjøringen fremmer også en fremgangsmåte for generering av et dyr, omfattende: å tilveiebringe en eukaryot celle omfattende en mål- DNA-sekvens som det er ønskelig å innføre en genetisk modifisering i; generering av et dobbelttrådet snitt i mål-dna-sekvensen med en TALEN omfattende et endonukleasedomene og et TAL-effektordomene som binder til mål-dna-sekvensen; og generering av et dyr fra cellen eller avkommet derav, der det har oppstått et dobbelttrådet snitt. Fremgangsmåten kan videre omfatte å innføre en eksogen nukleinsyre omfattende en sekvens som er homolog med minst en del av mål-dna-et inn i cellen, der innføringen er under forhold som muliggjør homolog rekombinasjon å oppstå mellom den eksogene nukleinsyren og mål-dna-sekvensen i cellen eller avkommet derav; og generering av et dyr fra cellen eller avkommet derav der homolog rekombinasjon har funnet sted. Dyret kan være et pattedyr. Genmodifiseringen kan omfatte en substitusjon, en innsetting eller en sletting. [001] I enda et annet aspekt fremmer den foreliggende offentliggjøringen en fremgangsmåte for generering av en plante, omfattende å tilveiebringe en plantecelle omfattende en mål-dna-sekvens som det er ønskelig å innføre en på forhånd valgt genetisk modifikasjon inn i; generering av et dobbelttrådet snitt i mål-dna-sekvensen med en TALEN omfattende et endonukleasedomene og et TAL-effektordomene som binder til mål-dna-sekvensen; og generering av en plante fra cellen eller avkommet derav, der det har oppstått et dobbelttrådet snitt. Fremgangsmåten kan videre omfatte å sette inn en eksogen nukleinsyre i plantecellen omfattende en sekvens som er homolog med minst en del av mål-dna-sekvensen, der innføringen er under forhold som muliggjør homolog rekombinasjon å oppstå mellom den eksogene nukleinsyren og mål-dna-sekvensen i cellen eller avkommet derav; og generering av en plante fra cellen eller avkommet derav der homolog rekombinasjon har funnet sted. [0016] I et annet aspekt fremmer den foreliggende offentliggjøringen en fremgangsmåte for målrettet genetisk rekombinasjon i en celle, omfattende innsetting av en nukleinsyre som koder for en TAL-effektorendonuklease rettet mot en valgt DNAmålsekvens i cellen; indusering av uttrykkingen av TAL-effektorendonukleasen i cellen; og identifisering av en celle der den valgte DNA-målsekvensen oppviser en

7 mutasjon. Mutasjonen kan velges fra gruppen bestående av sletting av genetisk materiale, innsetting av genetisk materiale, og både sletting og innsetting av genetisk materiale. Fremgangsmåten kan videre omfatte innsetting av donor-dna i cellen. Cellen kan være en insektcelle, en plantecelle, en fiskecelle eller en pattedyrcelle. [0017] I et annet aspekt offentliggjør den foreliggende oppfinnelsen en fremgangsmåte for generering av en TAL-effektor som har forbedret målrettingskapasitet for et mål-dna, omfattende generering av en nukleinsyre som koder for en TAL-effektor som omfatter DNA-bindende domene som har et antall DNA-bindende repeteringer, der hver repetering omfatter en RVD som bestemmer repetering av et basepar i mål- DNA-et, der hver DNA-bindende repetering er ansvarlig for gjenkjenning av et basepar i mål-dna-et, der genereringen omfatter innføring av en nukleinsyre som koder for en variant 0. DNA-bindende repeteringssekvens med spesifisitet for A, C eller G, og dermed eliminere behovet for T i posisjon-1 av bindingssetet. [0018] I et annet aspekt offentliggjør den foreliggende oppfinnelsen en fremgangsmåte for generering av en TAL-effektor som har forbedret målrettingskapasitet for et mål-dna, omfattende generering av en nukleinsyre som koder for en TAL-effektor som omfatter DNA-bindende domene som har et antall DNA-bindende repeteringer, der hver repetering omfatter en RVD som bestemmer repetering av et basepar i mål- DNA-et, der hver DNA-bindende repetering er ansvarlig for gjenkjenning av et basepar i mål-dna-et, der genereringen omfatter innføring av én eller flere nukleinsyrer som koder for TAL-effektor-DNA-bindende domener som inneholder RVD-er med forbedret spesifisitet for G, og der RVD-ene velges fra gruppen bestående av RN, R*, NG, NH, KN, K*, NA, NT, DN, D*, NL, NM, EN, E*, NV, NC, QN, Q*, NR, NP, HN, H*, NK, NY, SN, S*, ND, NW, TN, T*, NE, NF, YN, Y* og NQ, der * indikerer et mellomrom ved den andre posisjonen av RVD-en. [0019] Den foreliggende offentliggjøringen fremmer også en fremgangsmåte for fremstilling av et polypeptid som selektivt gjenkjenner minst ett basepar i en mål- DNA-sekvens, omfattende syntetisering av et polypeptid omfattende et repeteringsdomene, der repeteringsdomenet omfatter minst én repeteringsenhet avledet fra en transkriberingsaktivatorlignende (TAL) effektor, der repeteringsenheten omfatter en hypervariabel region som bestemmer gjenkjenning av et basepar i mål-dnasekvensen, der repeteringsenheten er ansvarlig for gjenkjenning av ett basepar i DNAsekvensen, og der den hypervariable regionen omfatter et medlem valgt fra gruppen bestående av: (a) HD for gjenkjenning av C/G; (b) NI for gjenkjenning av A/T; (c) NG for gjenkjenning av T/A; (d) NS for gjenkjenning av C/G eller A/T eller T/A eller G/C; (e) NN for gjenkjenning av G/C eller A/T; (f) IG for gjenkjenning av T/A; (g) N for gjenkjenning av C/G; (h) HG for gjenkjenning av C/G eller T/A; (i) H for gjenkjenning av T/A; og (j) NK for gjenkjenning av G/C. I tillegg fremmer denne oppfinnelsen et polypeptid som produseres av den ovennevnte fremgangsmåten,

8 og et DNA omfattende en kodende sekvens for polypeptidet produsert av fremgangsmåten. Det er også fremmet en uttrykkingskassett omfattende en promotor operativt bundet til det ovennevnte DNA-et, og en ikke-human vertscelle omfattende en uttrykkingskassett. I et annet aspekt fremmer den foreliggende oppfinnelsen en transformert, ikke-human organisme omfattende uttrykkingskassetten. [0020] I enda et annet aspekt fremmer den foreliggende offentliggjøringen en fremgangsmåte for selektiv gjenkjenning av et basepar i en DNA-sekvens av et polypeptid, omfattende å lage et polypeptid omfattende et repeteringsdomene, der repeteringsdomenet omfatter minst én repeteringsenhet avledet fra en TAL-effektor, der repeteringsenheten omfatter en hypervariabel region som bestemmer gjenkjenning av et basepar i DNA-sekvensen, der repeteringsenheten er ansvarlig for gjenkjenning av et basepar i DNA-sekvensen, og der den hypervariable regionen omfatter et medlem valgt fra gruppen bestående av (a) HD for gjenkjenning av C/G; (b) NI for gjenkjenning av A/T; (c) NG for gjenkjenning av T/A; (d) NS for gjenkjenning av C/G eller A/T eller T/A eller G/C; (e) NN for gjenkjenning av G/C eller A/T; (f) IG for gjenkjenning av T/A; (g) N for gjenkjenning av C/G; (h) HG for gjenkjenning av C/G eller T/A; (i) H for gjenkjenning av T/A; og (j) NK for gjenkjenning av G/C. [0021] Den foreliggende offentliggjøringen fremmer også en fremgangsmåte for modulering av uttrykking av et målgen i en celle, der cellene tilveiebringes som inneholder et polypeptid, der polypeptidet omfatter et repeteringsdomene, der repeteringsdomenet omfatter minst én repeteringsenhet avledet fra en TAL-effektor, der repeteringsenheten omfatter en hypervariabel region som bestemmer gjenkjenning av et basepar i en DNA-sekvens, der repeteringsenheten er ansvarlig for gjenkjenningen av et basepar i DNA-sekvensen, og der den hypervariable regionen omfatter et medlem valgt fra gruppen bestående av (a) HD for gjenkjenning av C/G; (b) NI for gjenkjenning av A/T; (c) NG for gjenkjenning av T/A; (d) NS for gjenkjenning av C/G eller A/T eller T/A eller G/C; (e) NN for gjenkjenning av G/C eller A/T; (f) IG for gjenkjenning av T/A; (g) N for gjenkjenning av C/G; (h) HG for gjenkjenning av C/G eller T/A; (i) H for gjenkjenning av T/A; og (j) NK for gjenkjenning av G/C. [0022] I et annet aspekt fremmer den foreliggende offentliggjøringen et polypeptid omfattende et repeteringsdomene, der repeteringsdomenet omfatter minst én repeteringsenhet avledet fra en TAL-effektor, der repeteringsenheten omfatter en hypervariabel region som bestemmer gjenkjenning av et basepar i en DNA-sekvens, der repeteringsenheten er ansvarlig for gjenkjenningen av et basepar i DNA-sekvensen, og der den hypervariable regionen omfatter et medlem valgt fra gruppen bestående av (a) HD for gjenkjenning av C/G; (b) NI for gjenkjenning av A/T; (c) NG for gjenkjenning av T/A; (d) NS for gjenkjenning av C/G eller A/T eller T/A eller G/C;

9 (e) NN for gjenkjenning av G/C eller A/T; (f) IG for gjenkjenning av T/A; (g) N for gjenkjenning av C/G; (h) HG for gjenkjenning av C/G eller T/A; (i) H for gjenkjenning av T/A; og (j) NK for gjenkjenning av G/C. Den foreliggende offentliggjøringen fremmer også et DNA omfattende en kodende sekvens for det ovennevnte polypeptidet. [0023] I et annet aspekt fremmer den foreliggende offentliggjøringen et DNA som er modifisert til å inkludere et basepar som ligger i en mål-dna-sekvens slik at baseparet kan gjenkjennes spesifikt av et polypeptid omfattende et repeteringsdomene, der repeteringsdomenet omfatter minst én repeteringsenhet avledet fra en TAL-effektor, der repeteringsenheten omfatter en hypervariabel region som bestemmer gjenkjenning av et basepar i DNA-sekvensen, der repeteringsenheten er ansvarlig for gjenkjenningen av et basepar i DNA-sekvensen, og der, for å motta en selektivt og bestemt gjenkjenning av den hypervariable regionen, baseparet velges fra gruppen bestående av (a) C/G for gjenkjenning av HD; (b) A/T for gjenkjenning av NI; (c) T/A for gjenkjenning av NG; (d) CT eller A/T eller T/A eller G/C for gjenkjenning av NS; (e) G/C eller A/T for gjenkjenning av NN; (f) T/A for gjenkjenning av IG; (g) C/G eller T/A for gjenkjenning av N; (h) T/A for gjenkjenning av HG; (i) T/A for gjenkjenning av H; og (j) G/C for gjenkjenning av NK. Det er også fremmet en vektor omfattende det ovennevnte DNA-et, en ikke-human vertscelle omfattende DNA-et og en transformert, ikke-human organisme omfattende DNA-et. [0024] I enda et annet aspekt fremmer den foreliggende offentliggjøringen en fremgangsmåte for fremstilling av et DNA omfattende en mål-dna-sekvens som er selektivt gjenkjent av et polypeptid omfattende et repeteringsdomene, der repeteringsdomenet omfatter minst en repeteringsenhet avledet fra en TAL-effektor, der repeteringsenheten omfatter en hypervariabel region som bestemmer gjenkjenning av et basepar i mål-dna-sekvensen, og der repeteringsenheten er ansvarlig for gjenkjenningen av ett basepar i mål-dna-sekvensen, fremgangsmåten er omfattende å syntetisere et DNA omfattende et basepar som er i stand til å bli gjenkjent av repeteringsenheten, der baseparet velges fra gruppen bestående av (a) C/G for gjenkjenning av HD; (b) A/T for gjenkjenning av NI; (c) T/A for gjenkjenning av NG; (d) CT eller A/T eller T/A eller G/C for gjenkjenning av NS; (e) G/C eller A/T for gjenkjenning av NN; (f) T/A for gjenkjenning av IG; (g) C/G eller T/A for gjenkjenning av N; (h) T/A for gjenkjenning av HG; (i) T/A for gjenkjenning av H; og (j) G/C for gjenkjenning av NK. [002] I et annet aspekt fremmer den foreliggende offentliggjøringen en fremgangsmåte for modifisering av det genetiske materialet i en plantecelle. Fremgangsmåten kan inkludere (a) innføring i plantecellen (i) av en første rekombinant nukleinsyre omfattende en modifisert målnukleotidsekvens, der den modifiserte målnukleotidsekvensen omfatter én eller flere modifikasjoner i nukleotidsekvensen med hensyn til

10 en tilsvarende målnukleotidsekvens til stede i plantecellen, og der målnukleotidsekvensen videre omfatter et gjenkjenningssete for en sekvensspesifikk TALeffektorendonuklease (TALEN); og (ii) en andre rekombinant nukleinsyre omfattende en nukleotidsekvens som koder for den sekvensspesifikke transkriberingsaktivatorlignende (TAL) effektorendonukleasen; (b) generering av en plante inneholdende plantecellen; (c) å analysere celler, frø eller vev oppnådd fra planten, eller avkommet derav, for rekombinasjon av målnukleotidsekvensen. Fremgangsmåten kan videre inkludere å innføre i plantecellen (iii) en tredje rekombinant nukleinsyre omfattende en nukleotidsekvens som koder for en selekterbar markør; og å bestemme om planten eller avkommet derav uttrykker den selekterbare markøren. Fremgangsmåten kan videre inkludere trinnet med å screene planten eller avkommet derav for fraværet av seleksjonsmarkøren. Nukleotidsekvensen som koder for den selekterbare markøren kan eventuelt flankeres på den ene eller begge sidene av en sekvens som er lik eller identisk med en sekvens som er endogen til plantecellen (f.eks. en sekvens på setet for spalting for en andre sekvensspesifikk nuklease). Nukleotidsekvensen som koder for den selekterbare markøren kan flankeres på begge sider av gjenkjenningsseter for en sekvensspesifikk rekombinase. Fremgangsmåten kan videre inkludere trinnet å krysspollinere planten, med eller uten trinnet med screening av avkommet av krysspollineringen for fravær av seleksjonsmarkøren. De første og andre rekombinante nukleinsyrene kan innføres samtidig i plantecellen. Én eller begge de rekombinante nukleinsyrene kan lineariseres før innføringstrinnet. De første og andre rekombinante nukleinsyrene kan være til stede i den samme konstruksjonen. [0026] I et annet aspekt fremmer den foreliggende oppfinnelsen en annen fremgangsmåte for modifisering av det genetiske materialet i en celle. Fremgangsmåten kan inkludere å tilveiebringe en primær celle inneholdende kromosomal mål-dna-sekvens der det er ønskelig at en homolog rekombinasjon kan forekomme; tilveiebringe en TALEN omfattende et endonukleasedomene som kan spalte dobbelttrådet DNA, og et TAL-effektordomene omfattende flere TALeffektorrepeterte sekvenser som, i kombinasjon, binder til en spesifikk nukleotidsekvens i mål-dna-et i cellen; og å bringe mål-dna-sekvensen i kontakt med TALEN i cellen slik at TALEN spalter begge trådene av en nukleotidsekvens inne i eller tilstøtende mål-dna-sekvensen i cellen. Fremgangsmåten kan videre inkludere å tilveiebringe en nukleinsyre omfattende en sekvens som er homolog med minst en del av mål-dna-et, slik at homolog rekombinasjon forekommer mellom mål-dnasekvensen og nukleinsyren. Mål-DNA-sekvensen kan være endogen for cellen. Cellen kan være en plantecelle, en pattedyrcelle, en fiskecelle, en insektcelle eller cellelinjer avledet fra disse organismene for in vitro-kulturer eller primære celler tatt direkte fra levende vev og som er etablert for in vitro-kultur. Kontakten kan inkludere å transfektere cellen med en vektor omfattende en TALEN-kodende sekvens og å

11 uttrykke TALEN-proteinet i cellen, mekanisk injisere et TALEN-protein inn i cellen, og levere et TAL-effektorendonukleaseprotein inn i cellen ved hjelp av utskillelsessystemet av bakterietype III eller å innføre et TALEN-protein inn i cellen ved elektroporering. Endonukleasedomenet kan være av en restriksjonsendonuklease (f.eks. FokI) av type II. TAL-effektordomenet som binder til en spesifikk nukleotidsekvens i mål-dna-et kan inkludere eller flere DNA-bindende repeteringer, mer foretrukket 1 eller flere DNA-bindende repeteringer. Cellen kan være fra hvilken som helst prokaryot eller eukaryotisk organisme. [0027] I et annet aspekt fremmer den foreliggende offentliggjøringen en fremgangsmåte for utforming av en sekvensspesifikt TALEN i stand til å spalte DNA på et bestemt sted. Fremgangsmåten kan inkludere å identifisere en første unik endogen kromosomal nukleotidsekvens tilstøtende en andre nukleotidsekvens ved hvilken det er ønskelig å innføre et dobbelttrådet snitt; og å utforme en sekvensspesifikk TALEN omfattende (a) flere DNA-bindende repeteringsdomener som, i kombinasjon, binder til den første unike endogene kromosomale nukleotidsekvensen, og (b) en endonuklease som genererer et dobbelttrådet snitt ved den andre nukleotidsekvensen. [0028] Den foreliggende offentliggjøringen fremmer også en TALEN omfattende et endonukleasedomene og et TAL-effektor DNA-bindende domene som er spesifikt for en bestemt DNA-sekvens. TALEN kan videre inkludere en renselsesmerking. Endonukleasedomenet kan være av en restriksjonsendonuklease (f.eks. FokI) av type II. [0029] I et annet aspekt fremmer den foreliggende offentliggjøringen en fremgangsmåte for generering av et genetisk modifisert dyr som det er innført en ønsket nukleinsyre i. Fremgangsmåten kan inkludere å tilveiebringe en primærcelle omfattende en endogen kromosomal mål-dna-sekvens som det er ønskelig å innføre nukleinsyren i; generering av et dobbelttrådet snitt i den endogene kromosomale mål- DNA-sekvensen med en TALEN omfattende et endonukleasedomene og et TALeffektordomene som binder til den endogene kromosomale mål-dna-sekvensen; innføring av en eksogen nukleinsyre omfattende en sekvens som er homolog med minst en del av det endogene kromosomale mål-dna-et inn i primærcellen under forhold som tillater homolog rekombinasjon å forekomme mellom den eksogene nukleinsyren og det endogene kromosomale mål-dna-et; og generering av et dyr fra den primære cellen der den homologe rekombinasjonen har funnet sted. Dyret kan være et pattedyr. Den homologe sekvensen kan være en nukleotidsekvens valgt fra gruppen bestående av en nukleotidsekvens som forstyrrer et gen etter homolog rekombinasjon, en nukleotidsekvens som erstatter et gen etter homolog rekombinasjon, en nukleotidsekvens som innfører en punktmutasjon i et gen etter homolog rekombinasjon og en nukleotidsekvens som innfører et regulatorisk sete etter homolog rekombinasjon. [0030] I enda et annet aspekt fremmer den foreliggende offentliggjøringen en

12 fremgangsmåte for generering av en genetisk modifisert plante som en ønsket nukleinsyre er blitt innført i. Fremgangsmåten kan inkludere å tilveiebringe en plantecelle omfattende en endogen mål-dna-sekvens som det er ønskelig å innføre nukleinsyren i; generering av et dobbelttrådet snitt i den endogene mål-dnasekvensen med en TALEN omfattende et endonukleasedomene og et TALeffektordomene som binder til den endogene målnukleotidsekvensen; innføring av en eksogen nukleinsyre omfattende en sekvens som er homolog med minst en del av det endogene mål-dna-et inn i plantecellen under forhold som tillater homolog rekombinasjon å forekomme mellom den eksogene nukleinsyren og det endogene mål- DNA-et; og generering av en plante fra plantecellen der homolog rekombinasjon har funnet sted. [0031] I et annet aspekt fremmer den foreliggende offentliggjøringen en fremgangsmåte for målrettet genetisk rekombinasjon i en celle. Fremgangsmåten kan inkludere innføring av et nukleinsyremolekyl som koder for en TALEN målrettet mot en valgt DNA-målsekvens i cellen; indusering av uttrykking av TALEN i cellen; og å identifisere en celle der den valgte DNA-målsekvensen oppviser en mutasjon. Mutasjonen kan velges fra gruppen bestående av en sletting av genetisk materiale, en innføring av genetisk materiale, og både en sletting, og en innsetting av genetisk materiale. Fremgangsmåten kan videre inkludere innføring av donor-dna inn i cellen. Cellen kan være en insektcelle, en plantecelle, en fiskecelle eller en pattedyrcelle. [0032] I enda et annet aspekt fremmer den foreliggende offentliggjøringen en fremgangsmåte for generering av en nukleinsyre som koder for en sekvensspesifikk TALEN, omfattende (1) å velge et starterplasmid omfattende en nukleotidsekvens som koder for et første TAL-effektor-DNA-bindende repeteringsdomene som har en RVD som er spesifikk for det første nukleotidet av en valgt nukleotidsekvens, der det første TAL-effektor-DNA-bindende repeteringsdomenet har et unikt PspXI-sete ved 3'-enden sin; (2) linearisering av startplasmidet med PspXI; (3) ligering inn i PspX I-setet av en DNA-modul som koder for ett eller flere TAL-effektor-DNA-bindende repeteringsdomener som har RVD-er som er spesifikke for det neste nukleotidet/de neste nukleotidene av den valgte nukleotidsekvensen, der DNA-modulen har XhoI-klebrige ender; og (4) repetering av trinnene (2) og (3) inntil nukleinsyren koder for en TALEN i stand til å binde til den valgte nukleotidsekvensen. I enkelte tilfeller kan fremgangsmåten videre inkludere, etter ligering i trinn (3), å kontrollere orienteringen av DNAmodulen i PspXI-setet. [0033] Med mindre annet er definert, har alle tekniske og vitenskapelige termer anvendt i dette dokumentet samme betydning som forstås av en vanlig fagmann på området som denne oppfinnelsen vedrører. Selv om fremgangsmåter og materialer lignende eller ekvivalente med de som beskrives i dette dokumentet kan anvendes til å praktisere oppfinnelsen, er egnede fremgangsmåter og materialer som beskrives

13 nedenfor. I tvilstilfeller skal den foreliggende beskrivelsen, inkludert definisjonene gjelde. I tillegg er materialene, fremgangsmåtene og eksemplene bare illustrerende og ikke ment å være begrensende. [0034] Detaljene i én eller flere utførelsesformer av oppfinnelsen er fremsatt i de medfølgende tegningene og beskrivelsen nedenfor. Andre funksjoner, formål og fordeler med oppfinnelsen vil fremgå fra beskrivelsen og tegningene, og fra kravene. BESKRIVELSE AV TEGNINGENE [003] FIG. 1A-1D avbilder DNA-gjenkjenningskoden for TAL-effektor. FIG. 1A er et diagram av en generisk TAL-effektor, som viser repeteringsregionen (åpne bokser) og en representativ repeteringssekvens (SEQ ID NO: 1) med RVD-en understreket. FIG. 1B er et diagram som viser samsvar for beste mønstre (laventropisammenstillinger) for forskjellige TAL-effektor-RVD-er og målgenpromotorsekvenser (SEQ ID NO:2-11). En stjerne indikerer en sletting ved rest 13. FIG. 1C er et diagram som viser RVD-nukleotidassosiasjoner i sammenstillingene i B, pluss ti flere sammenstillinger oppnådd ved skanning av alle rispromotørene med 40 ekstra X. oryzae-taleffektorer, som for hver effektor beholder den beste sammenstillingen som nedstrømsgenet ble aktivert for i løpet av infeksjonen. FIG. 1D er et diagram som viser flankerende nukleotidfrekvenser for de 20 TAL-effektormålsetene. Posisjonene står i forhold til '-enden av målsetet; N, lengden på målsetet. Logoene ble generert ved anvendelse av WebLogo. FIG. 2A og 2B tilveiebringer bevis for at OsHen1 aktiveres av Tal1c av Xanthomonas oryzae pv. Oryzicola-stammen BLS26. FIG. 2A er et bilde av semikvantitative RT- PCR-resultater, som viser relativt høy transkriberingshyppighet av OsHen1, med et aktingen for referanse, i risblader 24 timer etter inokulajon med BLS26-markørutvekslingsmutanten M1, M1 bærer den tomme kosmidvektoren (ev), M1 bærer kosmidet pijf92, som inneholder tal1a, tal1b og tal1c, og villtypestammen (WTstammen). FIG. 2B er et skjema basert på kartlegging av den enkle markørutvekslingsmutasjonen i M1 ved redning og sluttsekvensering av en markør inneholdende XmaIfragment. Genomregionen, koordinatene for det reddede fragmentet, og koordinatene for det BLS26-genomiske fragmentet som inneholdes i kosmidet pijf92 er vist. FIG. 3 er en referanse-avrbs3-aminosyresekvens (SEQ ID NO: 12). FIG. 4 er en referanse-avrbs3-nukleinsyresekvens (SEQ ID NO: 13). FIG. er et kart over en TAL-nukleaseuttrykkingsvektor. FIG. 6 er et kart over et målrapportørplasmid. FIG. 7 er et diagram over den skjematiske arkitekturen til TAL-nukleaser. Gjenkjenningssetene til det TAL DNA-bindende domenet er presentert som store bokstaver, mens avstandstykkesekvensen er indikert med små bokstaver.

14 FIG. 8 er aminosyresekvensen (SEQ ID NO: 16) av 17 og et halvt tandemrepeteringer av AvrBs3-gjenkjenningsdomenet. De hypervariable aminosyrene i posisjonene 12 og 13 er innrammet. FIG. 9 er et diagram som viser et skjema for en gjæranalyse for å teste TALeffektiviteten. FIG. er en graf som plotter gjæranalyseresultatene til AvrBs3-TAL-nukleasen. FIG. 11 er et diagram som viser en skjematisk fremstilling av enkle, doble eller triple AsvBs3-repeteringsmoduler og en kloningsvektor. FIG. 12A og 12B avbilder en enkelt representativ TAL-effektorrepetering (FIG. 12A), så vel som en representativ avkortet repetering (FIG. 12B) som er til stede ved enden av repeteringsregionen i de fleste TAL-effektorene. Nukleotidsekvenser og kodede aminosyresekvenser som vist. Ns representerer nukleotider som koder for RVD-ene, som er angitt som "XX". Tallene er gitt for aminosyreposisjonene. Sekvensene er tatt fra tal1c. FIG. 13 er et skjema som avbilder tal1c-genet og prosessen der repeteringsregionen ble redusert til en enkelt avkortet repetering, noe som resulterer i pcs487, også vist. MscIsetet; S, SphI-setet. FIG. 14 er et skjema som avbilder innføring av en translasjonell synonym mutasjon ved enden av den opprinnelige avkortede repeteringen i pcs487 for å skape et PspXI- og Xhol-sete, som ga pcs489. Sekvenser av kodonene i den opprinnelige repeteringen (SEQ ID NO:21), og den muterte repeteringen (SEQ ID NO:23) er vist. Den kodede aminosyresekvensen (SEQ ID NO:22) ble ikke forandret ved mutasjonen. De muterte nukleotidene er i kursiv. FIG. 1 er et kart over pcs488, som er et kanamycinresistent plasmid som kun koder for N- og C-endedelene av tal1c, uten repeteringsregionen, i portinngangsvektoren pentr-d (Invitrogen, Carlsbad, CA). FIG. 16 er et kart over det enkle repeteringsstarterplasmidet betegnet pcs493, som koder for en repetering som har RVD-en NI. Tre andre plasmider, utpekt pcs494, pcs49 og pcs496, var identiske med unntak av RVD-ene de koder for (gitt til høyre). FIG. 17A avbilder nukleotidsekvenser og kodede aminosyresekvenser for en enkelt repeteringsmodul med RVD-en NI. Den ' XhoI-kompatible kohesive enden, MscIsetet og den 3'-PspXI/XhoI-kompatible kohesive enden er understreket. RVD-en og nukleotidene som koder for den er i fet skrift. Tre andre repeteringsmoduler ble konstruert som er identiske med de som er vist, bortsett fra de RVD-kodende sekvensene, som koder for henholdsvis HD, NI, og NG. FIG. 17B er et kart av det enkle repeteringsmodulplasmidet betegnet pcs02, som inneholder den repeteringskodende sekvensen vist i FIG. 17A. Plasmider betegnet pcs03, pcs04 og pcs0 ble også generert, og er identiske med pcs02 med unntak av RVD-ene de koder for (gitt til høyre).

15 FIG. 18A avbilder nukleotidsekvenser og kodede aminosyresekvenser for en enkelt repeteringsmodul med RVD NI, der nukleotidsubstitusjonene (kursiv) forhindrer rekonstituering av XhoI-setet ved '-enden etter ligering inn i et PspXI/XhoI-sete og ødelegger det indre Mscl-setet. RVD-en og dets kodende nukleotider er i fet skrift. Ytterligere tre repeteringsmoduler ble konstruert som er identiske med det som er vist, bortsett fra de RVD-kodende sekvensene, som koder for henholdsvis HD, NI, og NG. FIG. 18B er et skjema over en trerepeteringsmodul sammensatt ved sekvensiell ligering av ytterligere repeteringsmoduler i et enkelt repeteringsmodulplasmid. MscIsetet i den første repeteringen og PspXI-setet på 3'-enden forblir unik, og hele modulen flankeres av de to XhoI-setene. FIG. 19 er en liste over det fullstendige settet med en-, to- og trerepeteringsmodulplasmider. FIG. 20 er et flytdiagram som avbilder trinnene i en fremgangsmåte som kan anvendes til å sette sammen hvilken som helst sekvens av repeteringer inn i tal1c-"ryggraden" for å generere et egendefinert (eng.: custom) TAL-effektorgen. FIG. 21A og 21B er skjemaer som avbilder sammensetting av repeteringsmoduler i konstruksjon av TAL-endonukleaser som vil målrette de viste nukleotidsekvensene. I FIG. 21A, tilsettes repeteringsmodulene fra plasmidene betegnet pcs19, pcs24, pcs37, pcs1, pcs83 og pcs29 sekvensielt til sekvensen i startplasmidet betegnet pcs493, noe som resulterer i plasmider betegnet pmat, pmat6, pmat7, pmat8, pmat9 og pmat60. I FIG. 21B tilsettes repeteringsmoduler fra plasmidene betegnet pcs30, pcs33, pcs22 og pcs41 sekvensielt til sekvensen i plasmidet betegnet pmat1, noe som resulterer i plasmider betegnet pmat61, pmat62, pmat63 og pmat64. FIG. 22A er et skjema over et TAL-effektorprotein. BamHI-fragmentene (betegnet av B-er) ble fusert til det katalytiske domenet av FokI-endonukleasen for å lage TALENer. N,N-enden; NLS, kjernelokaliseringssignal; B, BamHI-setet, AD, surt aktiveringdomene. FIG. 22B er en grafplottende aktivitet av TALEN-er konstruert med TALeffektorene AvrBs3 og PthXo1. Avr-Fokl, AvrBs3-TALEN; Pth-Fokl, PthXo1- TALEN, Avr-Fokl og Pth-Fokl, AvrBs3- og PthXo1-fusjonene til en katalytisk inaktiv versjon av Fokl (Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 9:70-7); ZFN, sinkfingernuklease inneholdende det Zif268-DNA-bindende domenet (Porteus and Baltimore (2003) Science 300:763). FIG. 23 er en referanse-pthxo1-aminosyresekvens (SEQ ID NO:31). FIG. 24 er en referanse-pthxo1-nukleinsyresekvens (SEQ ID NO:32). FIG. 2 er et diagram av pfz8-vektoren. Fig. 26 viser aminosyresekvensen til avrbs3_talen (SEQ ID NO:33). FIG. 27 viser aminosyresekvensen til pthxo1_talen (SEQ ID NO:34).

16 FIG. 28A er en graf som plotter aktiviteten av AvrBs3- og PthXo1-TALEN-er på mål med forskjellige avstandsstykkelengder. ZFN, Zif268-avledet sinkfingernuklease. FIG. 28B er en graf som plotter aktiviteten av et heterodimert TALEN. Aktiviteten i gjær inneholdende PthXo1-Fokl- og AvrBs3-Fokl-uttrykkingsvektorene og et plasmid med et mål som består av gjenkjenningsseter for hver, i hode-til-hale orientering separert med 1 bp er vist (Avr-Fokl, Pth-Fokl). Også vist for referanse er aktiviteten av AvrBs3 (Avr-Fokl) og PthXo1 (Pth-Fokl) TALEN-er individuelt og Zif268 (ZFN) på sine respektive mål. Som en negativ kontroll ble en gjærkultur med kun målseteplasmidet for Avr-Fokl, Pth-FokI analysert for LacZ-aktivitet (betegnet som (-)). FIG. 29A er en tabell som viser RVD-sekvensene av individuelt egendefinerte TALEN-er og deres respektive DNA-gjenkjenningssekvenser. FIG. 29B er en graf som plotter aktiviteten av egendefinerte TALEN-er. (-), negativ kontroll med kun målseteplasmider; ZFN, sinkfingernukleasepositiv kontroll. FIG. 30 er en avbildning av nukleotid- og RVD-frekvensene ved endene av 20 mål- og TAL-effektorpar. FIG. 31 er et skjema over Golden Gate-kloningssystemet [Engler et al. (2008) PLoS One 3:e3647; og Engler et al. (2009) PLoS One 4:e3]. FIG. 32A og 32B avbilder et sett av 8 plasmider for sammensetting og kloning av egendefinerte TAL-effektorrepeteringskodende matriser ved hjelp av Golden Gatekloningstilnærming, som beskrives i dette dokumentet. Tet, tetrasyklinresistensgenet, en markør for plasmidvalg; spes., spektinomycinresistensgenet, en markør for plasmidvalg; amp, ampicillinresistensgenet, en markør for plasmidvalg. FIG. 33 er et skjema over en fremgangsmåte for sammensetting og kloning av egendefinerte TAL-effektorrepeteringskodende matriser av Golden Gate-tilnærming ved hjelp av settet av plasmidene som er vist i FIG. 32. For illustrasjonsformål er sammensetting av en vilkårlig repeteringsmatrise vist. spek, spektinomycinresistensgenet, en markør for plasmidvalg; amp, ampicillinresistensgenet, en markør for plasmidvalg. FIG. 34A-34U viser aminosyresekvensene av TALEN-er generert som det som beskrives i eksempel 9 i dette dokumentet. FIG. 34A, telomerase-talen124; FIG. 34B, gridlock-talen; FIG. 34C, adh1-talen8; FIG. 34D, adh1- TALEN63; FIG. 34E, adh1-talen68; FIG. 34F, adh1-talen73; FIG. 34G, adh1- TALEN89; FIG. 34H, gridlock-talen6; FIG. 34I, adh1-talen64; FIG. 34J, adh1-talen69; FIG. 34K, adh1-talen74; FIG. 34L, tt4-talen90; FIG. 34M, telomerase-talen121; FIG. 34N, telomerase-talen126; FIG. 34O, gridlock- TALEN7; FIG. 34P, gridlock-talen117; FIG. 34Q, telomerase-talen 131; FIG. 34R, telomerase-talen 136; FIG. 34S, adh1-talen60; FIG. 34T, tt4- TALEN8; FIG. 34U, gridlock-talen 2.

17 FIG. 3 er en graf som plotter TALEN-aktivitet som målt ved hjelp av gjæranalysen ved anvendelse av egendefinerte TALEN-monomerer med økende lengde (9-, -, 12-, 13-, 1-, 16-, 17- eller 18-merer). TALEN-ene ble målrettet mot Arabidopsis og sebrafiskgener, som angitt. FIG. 36A er et diagram som viser to forskjellige DNA-målsekvenser fra Arabidopsis- ADH1-genet som målrettes ved to TALEN-par. FIG. 36B er en graf som plotter gjæranalysedata for funksjonelle TALEN-par som målretter Arabidopsis-ADH1-genet. FIG. 37A er et skjema over en restriksjonsendonukleaseanalyse anvendt til å påvise TALEN-induserte mutasjoner i Arabidopsis -protoplaster. FIG. 37B viser sekvensene av ni kloner fra ufordøyd DNA i restriksjonsendonukleaseanalysen. Seks av klonene har mutasjoner innført av ikke-homolog endesammenføyning (NHEJ). FIG. 38A viser 0. repeteringssekvenser av flere fylogenetisk distinkte TAL-effektorer, AvrHah1 fra Xanthomonas gardneri, AvrBs3 fra X. campestris pv. vesicatoria, PthXo1 fra X. oryzaepv. oryzae, PthA fra X. citri og Tal1c fra X. oryzae pv. oryzicola. De polymorfe posisjonene er innrammet. FIG. 38B er et skjema som viser de 0. og 1. repeteringene av PthXo1. Den "0." repeteringen som går umiddelbart foran den 1. repeteringen, viser 3 % identitet, og har en tilsvarende forutsagt sekundærstruktur. RVD-en av den 1. repeteringen og de kandidatanaloge restene av den 0. repeteringen er understreket. *, mellomrom; H, heliks; E, utvidet. Strukturen ble forutsagt ved anvendelse av JPred (Cole et al. (2008) Nucl. Acids Res. 36:W197-W201). FIG. 39 viser en western blot av totalt protein isolert fra humane embryonale nyre- 293T-celler transfektert med plasmider som koder for de V-merkede TALeffektorproteinene AvrBs3, PthXo1 og Tal1c, som indikert, etter immunodeteksjonen ved anvendelse av et muse-antiv-antistoff. Immunmerket aktin er vist som en kontroll for tilsvarende lasting i hvert felt. FIG. 40A viser aminosyresekvensen til TALEN HPRT , og FIG. 40B viser aminosyresekvensen til TALEN HPRT r. FIG. 41A er et skjema som viser det TALEN-målrettede setet i det humane kromosomale HPRT-genet. Bindingssetene for HPRT og HPRT r- TALENE, Bpu I-setet i avstandsstykket mellom disse setene, og primersetene for forsterkning av regionen er indikert. Koordinatene nederst gir avstand i basepar fra det første nukleotidet av den kodende sekvensen. FIG. 41B viser resultatene av BpuIfordøyningen av produkter av PCR-amplifisering av regionen vist i FIG. 41A ved anvendelse av genomisk DNA isolert fra TALEN-behandlede og ubehandlede celler som maler. Genomisk DNA ble fordøyd med BpuI før amplifikasjon. DNAfragmentene ble separert av agarosegelelektroforese og visualisert ved anvendelse av etidiumbromid.

18 DETALJERT BESKRIVELSE [0036] Den foreliggende patentsøknaden tilveiebringer materialer og fremgangsmåter knyttet til sekvensspesifikk DNA-gjenkjenning formidlet av TAL-effektorer. Slik det beskrives i dette dokumentet dikterer de primære aminosyresekvensene til TALeffektorene nukleotidsekvensene som de binder til. Oppfinnerne har funnet at forholdet mellom TAL-effektoraminosyresekvensene og deres DNA-målsekvenser er direkte, og muliggjør målseteprediksjon for TAL-effektorer, og gjør det også mulig å tilpasse TAL-effektoren for å binde til bestemte nukleotidsekvenser. Slik forutsigelse og tilpasning kan brukes til en rekke formål. I ett eksempel kan bestemte TALeffektorsekvenser fuseres til endonukleasesekvenser, og muliggjøre endonukleasemålretting mot spesifikke DNA-sekvenser, og etterfølgende kutting av DNA-et ved eller nær de målrettede sekvensene. Kutt (dvs. dobbelttrådede brudd) i DNA kan dramatisk øke hyppigheten av homolog rekombinasjon. Dermed, i kombinasjon med DNA-konstruksjoner som bærer sekvenser som har en høy grad av sekvenslikhet med en bestemt mål-dna-sekvens, kan TALEN-er anvendes til å lette seterettet mutagenese i komplekse genomer, dvs., for å slå ut eller forandre genfunksjon, eller tilføye gener eller andre sekvenser med stor presisjon og høy effektivitet. [0037] Dermed er det i gjenstanden tilveiebrakt i dette dokumentet inkludert blant annet materialer og fremgangsmåter for å lage genmodifiserte organismer (inkludert, uten begrensning, planter, sopp, Drosophila, nematoder, sebrafisk, mus eller andre pattedyr og mennesker). Slike fremgangsmåter kan inkludere, f.eks. å transfektere en celle med flere rekombinante nukleinsyrer. F.eks. kan en celle transformeres (f.eks. en eukaryotcelle) med en første rekombinant nukleinsyrekonstruksjon inneholdende en donornukleotidsekvens som inkluderer endringer i forhold til en tilsvarende målnukleotidsekvens funnet inne i cellen, og en andre rekombinant nukleinsyrekonstruksjon som koder for en TAL-nuklease. I noen utførelsesformer kan cellen også transformeres med en tredje rekombinant nukleinsyrekonstruksjon som koder for en selekterbar markør. En nukleinsyresekvens fra donornukleinsyrekonstruksjonen kan innlemmes i genomet til den transformerte cellen som beskrives i dette dokumentet. F.eks. kan planteceller produsert ved anvendelse av fremgangsmåter som beskrives i dette dokumentet dyrkes for å produsere planter med den endrede donornukleotidsekvensen innført i genomene deres. Frø fra slike planter kan anvendes til å fremstille planter som har en fenotype så som f.eks. en endret vekstkarakteristikk (f.eks. økt resistens eller toleranse overfor forskjellige biotiske og abiotiske belastninger), endret utseende (f.eks. endret farge eller høyde), eller endret sammensetning (f.eks. økte eller reduserte nivåer av karbon, nitrogen, olje, protein, karbohydrat (f.eks. sukker eller stivelse), aminosyre, fettsyre eller sekundære metabolitter) i forhold til umodifiserte planter.

19 Polynukleotider og polypeptider [0038] Det tilveiebringes isolerte nukleinsyrer og polypeptider i dette dokumentet. Termene "nukleinsyre" og "polynukleotid" anvendes om hverandre og refererer til både RNA og DNA, inkludert cdna, genomisk DNA, syntetisk (f.eks. kjemisk syntetisert) DNA, og DNA (eller RNA) inneholdende nukleinsyreanaloger. Polynukleotider kan ha hvilken som helst tredimensjonal struktur. En nukleinsyre kan være dobbelttrådet eller enkelttrådet (dvs. en sensetråd eller en antisenseenkelttråd). Ikke-begrensende eksempler på polynukleotider inkluderer gener, genfragmenter, eksoner, introner, messenger-rna (mrna), overførings-rna, ribosomal RNA, ribozymer, cdna, rekombinante polynukleotider, forgrenede polynukleotider, plasmider, vektorer, isolert DNA fra hvilken som helst sekvens, isolert RNA, av hvilken som helst sekvens, nukleinsyreprober og primere, så vel som nukleinsyreanaloger. [0039] Polypeptidene ifølge den foreliggende oppfinnelsen (så som TAL-effektor- DNA-modifiserende enzym som ikke-begrensende eksempel) kan innføres i en celle ved anvendelse av en vektor som koder for f.eks. polypeptidene eller som polypeptider i og for seg ved anvendelse av leveringsvektorene assosiert eller kombinert med hvilke som helst cellulære permeabiliseringsmetoder som sonoporering eller elektroporering eller derivater av disse metodene. [0040] Som anvendt i dette dokumentet refererer "isolert", i referanse til en nukleinsyre, til en nukleinsyre som separeres fra andre nukleinsyrer som er til stede i et genom, f.eks. et plantegenom, inkludert nukleinsyrer som normalt flankerer den ene eller begge sidene av nukleinsyren i genomet. Termen "isolert" som anvendt i dette dokumentet med hensyn til nukleinsyrer inkluderer også hvilken som helst ikkenaturlig forekommende sekvens, siden slike ikke-naturlig forekommende sekvenser ikke finnes i naturen og har ikke umiddelbart tilstøtende sekvenser i et naturlig forekommende genom. [0041] En isolert nukleinsyre kan f.eks. være et DNA-molekyl, gitt at en av nukleinsyresekvensene som normalt finnes umiddelbart flankerer det DNA-molekylet i et naturlig forekommende genom fjernes eller er fraværende. Dermed inkluderer en isolert nukleinsyre, uten begrensning, et DNA-molekyl som foreligger som et separat molekyl (f.eks. en kjemisk syntetisert nukleinsyre, eller et cdna eller genomisk DNAfragment produsert ved PCR eller restriksjonsendonukleasebehandling) uavhengig av andre sekvenser, så vel som DNA som føres inn i en vektor, et autonomt replikerende plasmid, et virus (f.eks. et pararetrovirus, et retrovirus, lentivirus, adenovirus eller herpesvirus), eller det genomiske DNA-et fra en prokaryot eller eukaryot. I tillegg kan en isolert nukleinsyre inkludere en rekombinant nukleinsyre, som f.eks. et DNAmolekyl som er en del av et hybrid eller fusjonsnukleinsyre. En nukleinsyre som finnes blant hundrevis til millioner av andre nukleinsyrer i f.eks. cdna-biblioteker eller genomiske biblioteker, eller gelskiver inneholdende en genomisk DNA-

20 restriksjonfordøyning, skal ikke anses som en isolert nukleinsyre. [0042] En nukleinsyre kan foretas ved f.eks. kjemisk syntese eller polymerasekjedereaksjon (PCR). PCR refererer til en prosedyre eller metode der målnukleinsyrene amplifiseres. PCR kan anvendes til å amplifisere spesifikke sekvenser fra DNA så vel som RNA, inkludert sekvenser fra totalt genomisk DNA eller total cellulær RNA. Forskjellige PCR-fremgangsmåter beskrives, f.eks. i PCR-primer: A Laboratory Manual, Dieffenbach and Dveksler, red., Cold Spring Harbor Laboratory Press, 199. Generelt benyttes sekvensinformasjon fra endene av regionen av interesse eller utover dette for å utforme oligonukleotidprimere som er identiske eller like i sekvens med motsatte tråder av malen som skal amplifiseres. Forskjellige PCR-strategier er også tilgjengelige der setespesifikke nukleotidsekvensmodifiseringer kan innføres i en malnukleinsyre. [0043] Isolerte nukleinsyrer kan også oppnås ved mutagenese. F.eks. kan en donornukleinsyresekvens muteres ved anvendelse av standardmetoder, inkludert oligonukleotidrettet mutagenese og seterettet mutagenese ved PCR. Se Short Protocols in Molecular Biology, kapittel 8, Green Publishing Associates and John Wiley & Sons, utgitt av Ausubel et al., [0044] Termen "polypeptid" som anvendt i dette dokumentet refererer til en forbindelse av to eller flere underenhetsaminosyrer uavhengig av posttranslasjonell modifikasjon (f.eks. fosforylering eller glykosylering). Underenhetene kan bindes sammen ved hjelp av peptidbindinger eller andre bindinger, så som f.eks. ester- eller eterbindinger. Termen "aminosyre" refererer til enten naturlige og/eller unaturlige eller syntetiske aminosyrer, inkludert D/L-optiske isomerer. [004] Med "isolert" eller "renset" i forhold til et polypeptid er det ment at polypeptidet er adskilt i en viss grad fra de cellulære komponentene med hvilke de normalt finnes i naturen (f.eks. andre polypeptider, lipider, karbohydrater og nukleinsyrer). Et renset polypeptid kan gi et enkelt stort bånd av en ikke-reduserende polyakrylamidgel. Et renset polypeptid kan være minst 7 % rent (f.eks. minst 80 %, 8 %, 90 %, 9 %, 97 %, 98 %, 99 % eller 0 % rent). Rensede polypeptider kan oppnås ved f.eks. ekstraksjon fra en naturlig kilde, ved kjemisk syntese eller ved rekombinant produksjon i en vertscelle eller transgen plante, og renses ved anvendelse av f.eks. affinitetskromatografi, immunoutfelling, størrelseseksklusjonskromatografi og ionebytterkromatografi. Graden av rensing kan måles ved anvendelse av hvilken som helst passende fremgangsmåte, inkludert, uten begrensning, kolonnekromatografi, polyakrylamidgelelektroforese eller høyytelsesvæskekromatografi. Rekombinante konstruksjoner [0046] Rekombinante nukleinsyrekonstruksjoner (f.eks. vektorer) tilveiebringes også i dette dokumentet. En "vektor" er et replikon, så som et plasmid, fag eller kosmid, som

21 et annet DNA-segment kan settes inn i for derved å tilveiebringe replikasjonen av det innsatte segmentet. En vektor er generelt i stand til replikasjon når den forbindes med de riktige kontrollelementene. Egnede vektorryggrader inkluderer f.eks. de som rutinemessig anvendes innen faget, så som plasmider, virus, kunstige kromosomer, BAC-er, YAC-er eller PAC-er. Termen "vektor" inkluderer klonings- og uttrykkingsvektorer, så vel som virale vektorer og integrerende vektorer. En "uttrykkingsvektor" er en vektor som inkluderer en eller flere uttrykkingskontrollsekvenser, og en "uttrykkingskontrollsekvens" er en DNA-sekvens som kontrollerer og regulerer transkribering og/eller translasjon av en annen DNA-sekvens. Egnede uttrykkingsvektorer inkluderer, uten begrensning, plasmider og virusvektorer avledet fra f.eks. bakteriofag, bakulovirus, tobakkmosaikkvirus, herpes virus, cytomegalovirus, retrovirus, vaccinia-virus, adenovirus og adenoassosierte virus. Mange vektorer og uttrykkingssystemer er kommersielt tilgjengelige fra slike selskaper som Novagen (Madison, WI), Clontech (Palo Alto, CA), Stratagene (La Jolla, CA) og Invitrogen/Life Technologies (Carlsbad, CA). [0047] Termene "regulatorisk region", "kontrollelement" og "uttrykkingskontrollsekvens" refererer til nukleotidsekvenser som påvirker transkriberings- eller translasjonsinitiering og hastighet, og stabiliteten og/eller mobiliteten til transkriptet eller polypeptidproduktet. Regulatoriske regioner inkluderer, uten begrensning, promotorsekvenser, forsterkersekvenser, responselementer, proteingjenkjenningsseter, induserbare elementer, promotorkontrollelementer, proteinbindingssekvenser, '- og 3'- utranslaterte regioner (UTR-er), transkriberingsstartseter, termineringssekvenser, polyadenyleringssekvenser, introner og andre regulatoriske regioner som kan ligge innenfor de kodende sekvensene, så som sekretoriske signaler, kjernefysiske lokaliseringssekvenser (NLS) og proteasespaltingsseter. [0048] Som anvendt i dette dokumentet betyr "operativt bundet" innlemmet i en genetisk konstruksjon, slik at uttrykkingskontrollsekvensene effektivt kontrollerer uttrykkingen av en kodende sekvens av interesse. En kodende sekvens er "operativt bundet" og "under kontroll" av uttrykkingskontrollsekvenser i en celle når RNApolymerase er i stand til å transkribere den kodende sekvensen til RNA, som, hvis det er et mrna, deretter kan translateres til proteinet kodet for av den kodende sekvensen. Dermed kan en regulatorisk region modulere, f.eks. regulere, lette eller kjøre, transkribering i plantecellen, planten eller plantevev, der det er ønskelig å uttrykke en modifisert målnukleinsyre. [0049] En promotor er en uttrykkingskontrollsekvens som består av en region av et DNA-molekyl, vanligvis innenfor 0 nukleotider oppstrøms for det punktet der transkriberingen starter (generelt nær initieringssetet for RNA-polymerase II). Promotorer er involvert i gjenkjenning og binding av RNA-polymerase og andre proteiner for å initiere og modulere transkribering. For å bringe en kodende sekvens

22 under kontroll av en promotor, er det vanligvis nødvendig å plassere translasjonsinitieringssetet for den translasjonelle leserammen av polypeptidet mellom en og omtrent femti nukleotider nedstrøms for promotoren. En promotor kan imidlertid plasseres så mye som ca. 000 nukleotider oppstrøms for translasjonsstartsetet eller ca nukleotider oppstrøms for transkriberingsstartsetet. En promotor omfatter typisk minst én kjernepromotor (basal) promotor. En promotor kan også inkludere minst ett kontrollelement, så som et oppstrømselement. Slike elementer inkluderer oppstrøms aktiveringsregioner (UAR-er) og eventuelt andre DNA-sekvenser som påvirker transkriberingen av et polynukleotid så som f.eks. et syntetisk oppstrømselement. [000] Valget av promotorer som skal inkluderes avhenger av flere faktorer, blant annet, men ikke begrenset til, effektivitet, valgbarhet, induserbarhet, ønsket uttrykkingsnivå og celle- eller vevsspesifisitet. Det kan f.eks. anvendes vevs-, organog cellespesifikke promotorer som gir transkribering bare eller hovedsakelig i henholdsvis et bestemt vev, organ og celletype. I noen utførelsesformer kan promotorer spesifikke for vegetative vev så som stengel, parenkym, grunnmeristem, årebunt, kambium, silvev, korteks, skuddapikalt meristem, lateralt skuddmeristem, rotapikalt meristem, lateralt rotmeristem, bladprimordium, bladmesofyll eller bladepidermis være egnede regulatoriske regioner. I noen utførelsesformer kan promotorer som er essensielt spesifikke for frø ("frøforetrukne promotorer") være nyttige. Frøspesifikke promoterer kan fremme transkribering av en operativt bundet nukleinsyre i endospermog kotyledonvev under utvikling av frø. Alternativt kan konstitutive promoterer fremme transkribering av en operativt bundet nukleinsyre i de fleste eller alle vevene til en plante, i hele planteutviklingen. Andre promotorklasser inkluderer, men er ikke begrenset til, induserbare promoterer, så som promoterer som gir transkribering i respons på ytre stimuli, så som kjemiske midler, utviklingsstimuli eller miljømessige stimuli. [001] En basalpromotor er den minimale sekvensen nødvendig for sammensetting av et transkriberingskompleks nødvendig for transkriberingsinitiering. Basale promotorer inkluderer ofte et "TATA-boks"-element som kan lokaliseres mellom ca. 1 og ca. 3 nukleotider oppstrøms fra setet av transkriberingsinitiering. Basalpromotorer kan også inkludere et "CCAAT-boks"-element (typisk sekvensen CCAAT) og/eller en GGGCGsekvens, som kan lokaliseres mellom ca. 40 og ca. 200 nukleotider, typisk ca. 60 til ca. 120 nukleotider, oppstrøms fra transkriberingsstartsetet. [002] Ikke-begrensende eksempler på promotorer som kan inkluderes i nukleinsyrekonstruksjonene tilveiebrakt i dette dokumentet inkluderer blomkålmosaikkvirus-3stranskriberingsinitieringsregionen (CamV-3S-transkriberingsinitieringsregionen), de 1'- eller 2'-promotorene avledet fra T-DNA fra Agrobacterium tumefaciens, promotorer fra et maisbladspesifikt gen som beskrives av Busk ((1997) Plant J. 11: ), kn1-relaterte gener fra mais og andre arter, og transkriberingsinitieringsregioner fra

23 ulike plantegener, så som maisubikitin-1-promotoren. [003] En '-utranslatert region (UTR) transkriberes, men translateres ikke, og ligger mellom startsetet for transkript- og translasjonsinitieringskodonet og kan inkludere +1- nukleotidet. En 3 'UTR kan plasseres mellom translasjonstermineringskodonet og enden av transkriptet. UTR-ene kan ha spesielle funksjoner så som å øke mrnameldingsstabiliteten eller translasjonssvekkelsen. Eksempler på 3 '-UTR-er inkluderer, men er ikke begrenset til, polyadenyleringssignaler og transkriberingstermineringssekvenser. En polyadenyleringsregion ved 3'-enden på en kodende region kan også kobles operativt til en kodende sekvens. Polyadenyleringsregionen kan avledes fra det naturlige genet, fra forskjellige andre plantegener eller fra et Agrobacterium-T-DNA. [004] Vektorene tilveiebrakt i dette dokumentet kan også inkludere f.eks. replikeringsopprinnelser og/eller stillasfesteregioner (SAR-er). I tillegg kan en uttrykkingsvektor inkludere en kodesekvens utformet for å lette manipulering eller deteksjon (f.eks. rensing eller lokalisering) av det uttrykte polypeptidet. Kodesekvenser, som sekvensene for grønt fluorescerende protein (GFP), glutation-stransferase (GST), polyhistidin, c-myc, hemagglutinin eller Flag -merking (Kodak, New Haven, CT) uttrykkes vanligvis som en fusjon med det kodede polypeptidet. Slike merker kan settes inn hvor som helst innenfor polypeptidet, inkludert på enhver ende av karboksyl- eller aminoenden. [00] Med "leveringsvektor" eller "leveringsvektorer" menes enhver leveringsvektor som kan anvendes i den foreliggende oppfinnelsen til å bringes i kontakt med celler eller levere midler/kjemikalier og molekyler (proteiner eller molekyler) inn i cellene eller subcellulære kamre (proteiner eller nukleinsyrer) som trengs i den foreliggende oppfinnelsen. Den inkluderer, men er ikke begrenset til, liposomale leveringvektorer, virusleveringsvektorer, legemiddelleveringsvektorer, kjemiske bærere, polymere bærere, lipoplekser, polyplekser, dendrimerer, mikrobobler (ultralydkontrastmidler), nanopartikler, emulsjoner eller andre egnede overføringsvektorer. Disse leveringsvektorene tillater levering av molekyler, kjemikalier, makromolekyler (gener, proteiner) eller andre vektorer, så som plasmider, peptider utviklet av Diatos. I disse tilfellene er leveringsvektorene molekylbærere. Med "leveringsvektor" eller "leveringsvektorer" menes også leveringmetoder til å utføre transfeksjon. [006] Termene "vektor" eller "vektorer" refererer til et nukleinsyremolekyl som kan transportere en annen nukleinsyre som den har blitt bundet til. En "vektor" i den foreliggende oppfinnelsen inkluderer, men er ikke begrenset til, en virusvektor, et plasmid, en RNA-vektor eller et lineært eller sirkulært DNA- eller RNA-molekyl som kan bestå av kromosomale, ikke-kromosomale, semi-syntetiske eller syntetiske nukleinsyrer. Foretrukne vektorer er de som er i stand til autonom replikasjon (episomal vektor) og/eller uttrykking av nukleinsyrer som de er bundet til (uttrykkingsvektorer). Et stort antall passende vektorer er kjent for fagfolk på området

24 og kommersielt tilgjengelige. [007] Virusvektorer inkluderer retrovirus, adenovirus, parvovirus (f.eks. adenoassosierte virus), coronavirus, negative tråd-rna-virus, så som ortomyksovirus (eng.: orthomyxovirus) (f.eks. influensavirus), rabdovirus (f.eks. rabies og vesikulært stomatittvirus), paramyksovirus (f.eks. meslinger og Sendai ), positivtråd-rna-virus, så som picornavirus og alfavirus og dobbelttrådede DNA-virus, inkludert adenovirus, herpesvirus (f.eks. Herpes Simplex-virustype 1 og -2, Epstein-Barr-virus, cytomegalovirus), og poxvirus (f.eks. vaccinia, fuglekoppe og canarypox). Andre virus inkluderer f.eks. Norwalk-virus, togavirus, flavivirus, reovirus, papovavirus, hepadnavirus og hepatittvirus. Eksempler på retrovirus inkluderer: leukosesarkom hos fugl (eng.: avian leukosis-sarcoma), pattedyr-c-type, B-typevirus, D-typevirus, HTLV- BLV-gruppe, lentivirus, spumavirus (Coffin, J. M., Retroviridae: The viruses and their replication, In Fundamental Virology, tredje utgave, B. N. Fields, et al., red., Lippincott-Raven Publishers, Philadelphia, 1996). [008] Med "lentiviral vektor" menes HIV-baserte lentivirusvektorer som er svært lovende for genlevering på grunn av deres relativt store emballasjekapasitet, redusert immunogenisitet og deres evne til stabilt å transdusere et stort spekter forskjellige celletyper med høy effektivitet. Lentivirusvektorene genereres vanligvis etter transient transfeksjon av tre (emballasje, konvolutt og overføring) eller flere plasmider til produsentceller. Som HIV kommer lentivirale vektorer inn i målcellen via interaksjon av virusoverflateglykoproteiner med reseptorer på celleoverflaten. Ved inntreden gjennomgår virus-rna-et reverstranskribering, som formidles av virusreverstranskriptasekomplekset. Produktet fra reverstranskribering er et dobbelttrådet lineært virus-dna, som er substratet for virusintegrering i DNA-et i infiserte celler. De lentivirale vektorene kan være "ikke-integrerende" eller "integrerende". Med "integrerende lentivirale vektorer (eller LV)", menes slike vektorer som ikke- begrensende eksempel, som er i stand til å integrere genomet til en målcelle. Med det motsatte "ikke-integrerende lentivirale vektorer (eller NILV)" menes effektive gen leveringsvektorer som ikke integrerer genomet til en målcelle ved virkningen av virusintegrasen. [009] En type foretrukket vektor er et episom, dvs. en nukleinsyre i stand til ekstrakromosomal replikering. Foretrukne vektorer er de som er i stand til autonom replikasjon og/eller uttrykking av nukleinsyrer som de bindes til. Vektorer som er i stand til å dirigere uttrykkingen av gener som de er operativt bundet til refereres til som "uttrykkingsvektorer" i dette dokumentet. En vektor ifølge den foreliggende oppfinnelsen omfatter, men er ikke begrenset til, et YAC (kunstig gjærkromosom), en BAC (kunstig bakterie), en baculovirusvektor, en fag, et fagemid, et kosmid, en

25 virusvektor, et plasmid, en RNA-vektor eller et lineært eller sirkulært DNA- eller RNA-molekyl som kan bestå av kromosomal, ikke-kromosomal, semi-syntetisk eller syntetisk DNA. Generelt er uttrykkingsvektorer av nytte i rekombinante DNA-metoder ofte i form av "plasmider" som generelt henviser til sirkulære dobbelttrådede DNAløkker som, i sin vektorform, ikke er bundet til kromosomet. Et stort antall passende vektorer er kjent for fagfolk på området. Vektorer kan omfatte seleksjonsmarkører, f.eks.: neomycinfosfotransferase, histidinoldehydrogenase, dihydrofolatreduktase, hygromycinfosfotransferase, herpes simplex-virustymidinkinase, adenosindeaminase, glutaminsyntetase og hypoksantin-guaninfosforibosyltransferase for eukaryot cellekultur; TRP1 for S.cerevisiae; tetracyclin-, rifampicin- eller ampicillinresistens i E. coli. Fortrinnsvis er vektorene uttrykkingsvektorer, der en sekvens som koder for et polypeptid av interesse plasseres under kontroll av hensiktsmessige transkripsjonelle og translasjonelle kontrollelementer for å tillate produksjon eller syntese av polypeptidet. Derfor omfattes polynukleotidet av en uttrykkingskassett. Nærmere bestemt omfatter vektoren et replikasjonsorigo, en promotor som er operativt bundet til det kodende polynukleotidet, et ribosombindingssete, et RNA-spleisesete (når genomisk DNA anvendes), et polyadenyleringssete og et transkriberingstermineringssete. Den kan også omfatte en forsterker eller demperelementer. Seleksjon av promotoren vil avhenge av cellen der polypeptidet uttrykkes. Egnede promotorer inkluderer vevsspesifikke og/eller induserbare promotorer. Eksempler på induserbare promotorer er: eukaryot metallotioninpromotor som induseres av økte nivåer av tungmetaller, prokaryot lacz-promotor som induseres i respons på isopropyl-β-dtiogalakto-pyranosid (IPTG) og eukaryot varmesjokkpromotor som induseres av økt temperatur. Eksempler på vevsspesifikke promotorer er skjelettmuskelkreatinkinase, prostata-spesifikt antigen (PSA), α-antitrypsinprotease, A- og B-proteiner av human surfaktant (SP), β-kasein og sure hveteproteingener. [0060] Induserbare promotorer kan induseres av patogener eller belastning, mer foretrukket av belastning som kulde, varme, UV-lys eller høye ioniske konsentrasjoner (gjennomgått i Potenza et al. (2004) In vitro Cell Dev Biol 40:1-22). En induserbar promotor kan induseres av kjemikalier [gjennomgått i Moore et al. (2006); Padidam (2003); (Wang et al. (2003); og (Zuo and Chua (2000)]. [0061] Leveringsvektorer og vektorer assosieres eller kombineres med eventuelle cellulære permeabiliseringsmetoder som sonoporering eller elektroporering eller derivater av disse metodene. [0062] Det vil forstås at mer enn én regulatorisk region kan være til stede i et rekombinant polynukleotid, f.eks. introner, forsterkere, oppstrøms aktiveringsregioner og induserbare elementer. [0063] Rekombinante nukleinsyrekonstruksjoner kan inkludere en polynukleotidsekvens satt inn i en vektor som er egnet for transformasjon av celler (f.eks.

26 planteceller eller dyreceller). Rekombinante vektorer kan lages ved anvendelse av f.eks. standard rekombinante DNA-metoder (se f.eks. Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual, 2. red., Cold Spring Harbor Laboratory, Cold Spring Harbor, NY). [0064] En rekombinant nukleinsyresekvens som beskrives i dette dokumentet kan integrere inn i genomet til en celle via illegitim (dvs. tilfeldig, ikke-homolog, ikke setespesifikk) rekombinasjon eller en rekombinant nukleinsyresekvens som beskrives i dette dokumentet kan tilpasses for å integrere inn i genomet til en celle via homolog rekombinasjon. Nukleinsyresekvenser tilpasset for integrasjon via homolog rekombinasjon er flankert på begge sider med sekvenser som er like eller identiske med endogene målnukleotidsekvenser, som letter integrering av den rekombinante nukleinsyren på det minst ene bestemte setet i genomet inneholdende de endogene målnukleotidsekvensene. Nukleinsyresekvenser tilpasset for integrasjon via homolog rekombinasjon kan også inkludere et gjenkjenningssete for en sekvensspesifikk nuklease. Alternativt kan gjenkjenningssetet for en sekvensspesifikk nuklease lokaliseres i genomet av cellen som skal transformeres. Donornukleinsyresekvenser som beskrives nedenfor tilpasses vanligvis for integrasjon via homolog rekombinasjon. [006] I noen utførelsesformer kan en nukleinsyre som koder for en selekterbar markør også tilpasses for å integrere via homolog rekombinasjon, og kan dermed flankeres på begge sider med sekvenser som er like eller identiske med endogene sekvenser innenfor plantegenomet (f.eks. endogene sekvenser på spaltingssetet for en sekvensspesifikk nuklease). I noen tilfeller kan nukleinsyre inneholdende sekvensen som koder for en seleksjonsmarkør også inkludere et gjenkjenningssete for en sekvensspesifikk nuklease. I disse utførelsesformene kan gjenkjenningssetet for den sekvensspesifikke nukleasen være den samme som eller forskjellig fra den som inneholdes i donornukleinsyresekvensen (dvs. kan gjenkjennes av den samme nukleasen som donornukleinsyresekvensen eller gjenkjennes av en forskjellig nuklease enn donornukleinsyresekvensen). [0066] I noen tilfeller kan en rekombinant nukleinsyresekvens innrettes til å integrere i genomet til en celle via setespesifikk rekombinasjon. Som anvendt i dette dokumentet refererer "setespesifikk" rekombinasjon til rekombinasjon som oppstår når en nukleinsyresekvens rettes mot minst ett bestemt sete i et genom, ikke av homologi mellom sekvenser i den rekombinante nukleinsyren og sekvenser i genomet, men heller av virkningen av rekombinaseenzymer som gjenkjenner spesifikke nukleinsyresekvenser og katalyserer den gjensidige utvekslingen av DNA-trådene mellom disse setene. Setespesifikk rekombinasjon refererer dermed til den enzymformidlede spaltningen og ligeringen av to definerte nukleotidsekvenser. Ethvert egnet setespesifikt rekombinasjonssystem kan anvendes, inkludert f.eks. Cre-lox-systemet eller FLP-FRT-systemet. I slike utførelsesformer kan det settes inn en nukleinsyre som

27 26 koder for et rekombinaseenzym i en celle i tillegg til en donornukleotidsekvens og en nukleasekodingssekvens, og i noen tilfeller, en selekterbar markørsekvens. Se f.eks. U.S. patent nr. 4,99, Sekvensspesifikke endonukleaser [0067] Sekvensspesifikke nukleaser og rekombinante nukleinsyrer som koder for de sekvensspesifikke endonukleasene tilveiebringes i dette dokumentet. De sekvensspesifikke endonukleasene kan inkludere TAL-effektor-DNA-bindende domener og endonukleasedomener. Dermed kan nukleinsyrer som koder for slike sekvensspesifikke endonukleaser inkludere en nukleotidsekvens fra en sekvensspesifikk TAL-effektor bundet til en nukleotidsekvens fra en nuklease. [0068] TAL-effektorer er proteiner av plantesykdomsfremkallende bakterier som injiseres av patogenet inn i plantecellen, der de går til kjernen og fungerer som transkriberingsfaktorer for å slå på bestemte plantegener. Den primære aminosyresekvensen til en TAL-effektor bestemmer nukleotidsekvensen som den binder til. Dermed kan målseter forutsies for TAL-effektorer, og TAL-effektorer kan også konstrueres og genereres i den hensikt å binde til spesielle nukleotidsekvenser, slik det beskrives i dette dokumentet. [0069] Fusert til de TAL effektor-kodende nukleinsyresekvensene er sekvenser som koder for en nuklease eller en del av en nuklease, vanligvis et ikke-spesifikt spaltingsdomene fra en restriksjonsendonuklease av type II så som FokI (Kim et al. (1996) Proc. Natl. Acad. Sci. USA 93: ). Andre nyttige endonukleaser kan inkludere f.eks. HhaI, HindIII, NotI, BbvCI, EcoRI, BglI og AlwI. Det faktum at noen endonukleaser (f.eks. FokI) bare fungerer som dimerer kan kapitaliseres på for å forbedre målspesifisiteten til TAL-effektoren. F.eks., i noen tilfeller kan hver FokImonomer fuseres til en TAL-effektorsekvens som gjenkjenner en annen DNAmålsekvens, og bare når de to gjenkjenningssetene er i umiddelbar nærhet kommer de inaktive monomerene sammen for å skape et funksjonelt enzym. Ved å kreve DNAbinding for å aktivere nukleasen, kan det opprettes et svært setespesifikt restriksjonsenzym. [0070] En sekvensspesifikk TALEN som tilveiebrakt i dette dokumentet kan gjenkjenne en bestemt sekvens innenfor en forhåndsvalgt målnukleotidsekvens til stede i en celle. Dermed, i noen utførelsesformer, kan en målnukleotidsekvens skannes for nukleasegjenkjenningsseter, og en bestemt nuklease kan velges basert på målsekvensen. I andre tilfeller kan det konstrueres en TALEN for å målrette en bestemt cellulær sekvens. En nukleotidsekvens som koder for den ønskede TALEN-en kan settes inn i hvilken som helst egnet uttrykkingsvektor, og kan kobles til én eller flere uttrykkingskontrollsekvenser. F.eks. kan en nukleasekodende sekvens bindes operativt til en promotorsekvens som vil føre til konstitutiv uttrykking av endonukleasen i

28 planteartene til planten som skal transformeres. Alternativt kan en endonukleasekodende sekvens bindes operativt til en promotorsekvens som vil føre til betinget uttrykking (f.eks. uttrykking under visse næringsforhold). F.eks. kan en blomkålmosaikkvirus-3s-promotor anvendes for konstitutiv uttrykking. Andre konstitutive promotorer inkluderer, uten begrensning, nopalinsyntasepromotoren, ubikitinpromotoren og aktinpromotoren. I noen utførelsesformer kan en kunstig østrogenindusert promotor anvendes for betinget uttrykking, og det kan oppnås høye nivåer av transkribering når en plante eksponeres for østrogen. Andre betingede promotorer som kan anvendes inkluderer f.eks. varmeinduserbare varmesjokkgenpromotorer, og lysregulerte promotorer, så som det fra genet som koder for den store underenheten av ribulosebifosfatkarboksylase. [0071] For formålet med behandlingen administreres det TAL-effektor-DNAmodifiserende enzymet ifølge den foreliggende oppfinnelsen og en farmasøytisk akseptabel eksipiens i en terapeutisk effektiv mengde. En slik kombinasjon sies å administreres i en "terapeutisk effektiv mengde" hvis den administrerte mengden er fysiologisk signifikant. Et middel er fysiologisk signifikant hvis dets nærvær resulterer i en detekterbar endring i fysiologien til mottakeren. I den foreliggende sammenhengen er et middel fysiologisk signifikant hvis dets nærvær resulterer i en reduksjon i alvorligheten av en eller flere symptomer på den målrettede sykdommen og i en genomkorreksjon av lesjonen eller abnormiteten. Vektorer omfattende målretting av DNA og/eller nukleinsyre som koder for et TAL-effektor-DNA-modifiserende enzym kan føres inn i en celle ved hjelp av forskjellige fremgangsmåter (f.eks. injeksjon, direkte opptak, prosjektilbombardement, liposomer, elektroporering). TAL-effektor- DNA-modifiserende enzymer kan uttrykkes stabilt eller transient inn i celler ved anvendelse av uttrykkingsvektorer. Metoder for uttrykking i eukaryote celler er godt kjent for fagfolk på området. (Se Current Protocols in Human Genetics: kapittel 12 "Vectors For Gene Therapy" og kapittel 13 "Delivery Systems for Gene Therapy"). [0072] I et annet aspekt ifølge den foreliggende oppfinnelsen er det TAL-effektor- DNA-modifiserende enzymet i det vesentlige ikke-immunogent, dvs. medfører liten eller ingen negativ immunologisk respons. En rekke fremgangsmåter for lindring eller eliminering av skadelige immunologiske reaksjoner av denne typen kan anvendes i samsvar med oppfinnelsen. I en foretrukket utførelsesform er det TAL-effektor-DNAmodifiserende enzymet i det vesentlige fritt for N-formylmetionin. En annen måte å unngå uønskede immunologiske reaksjoner på er å konjugere TAL-effektor-DNAmodifiserende enzym til polyetylenglykol ("PEG") eller polypropylenglykol ("PPG") (fortrinnsvis på 00 til dalton gjennomsnittlig molekylvekt (MW)). Konjugering med PEG eller PPG som beskrives av Davis et al. (US 4,179,337) f.eks. kan gi ikke-immunogene, fysiologisk aktive, vannløselige TAL-effektor-DNAmodifiserende enzymkonjugater med anti-virusaktivitet. Lignende fremgangsmåter

29 28 som også anvender en polyetylen--polypropylenglykolkopolymer beskrives i Saifer et al. (US,006,333) Donorvektorer [0073] I dette dokumentet er det også tilveiebrakt rekombinante nukleinsyrer inkludert donornukleotidsekvenser. En donornukleotidsekvens kan inkludere en variantsekvens som har én eller flere modifikasjoner (dvs. substitusjoner, slettinger eller innsettinger) i forhold til en forhåndsvalgt målnukleotidsekvens funnet endogent i genomet av en celle som skal transformeres (også referert til i dette dokumentet som en "modifisert målnukleotidsekvens"). Variantsekvensen innenfor donornukleinsyren flankeres vanligvis på begge sider med sekvenser som ligner på eller er identiske med den endogene målnukleotidsekvensen i cellen. De flankerende sekvensene kan ha hvilken som helst egnet lengde, og er vanligvis minst 0 nukleotider i lengde (f.eks. minst 0 nukleotider, minst 7 nukleotider, minst 0 nukleotider, minst 200 nukleotider, minst 20 nukleotider, minst 300 nukleotider, minst 00 nukleotider, minst 70 nukleotider, minst 00 nukleotider, fra ca. 0 til ca. 000 nukleotider, fra ca. 0 til 200 nukleotider, fra ca. 0 til ca. 00 nukleotider, fra ca. 0 til 00 nukleotider, fra ca. 200 til ca. 00 nukleotider, eller fra ca. 20 til 400 nukleotider). Dermed kan homolog rekombinasjon oppstå mellom den rekombinante donornukleinsyrekonstruksjonen og det endogene målet på begge sider av variantsekvensen, slik at den resulterende cellens genom inneholder variantsekvensen innenfor omfanget av endogene sekvenser fra f.eks. det samme genet. En donornukleotidsekvens kan genereres for å målrette hvilken som helst passende sekvens i et genom. I f.eks. en plante kan en donornukleotidsekvens målrettes mot et lipidbiosyntetisk gen, karbohydratbiosyntetisk gen, frølagringsproteingen, sykdom eller pestresistensgen, stresstoleransegen, tørket toleransegen eller et gen som produserer et antinæringsmiddel. I tillegg inneholder donornukleotidsekvensen et gjenkjenningssete for en sekvensspesifikk nuklease, slik det beskrives i dette dokumentet. Seleksjonsmarkører [0074] Noen av fremgangsmåtene tilveiebrakt i dette dokumentet inkluderer anvendelsen av en tredje rekombinant nukleinsyre som koder for en selekterbar markør eller screenbar markør. En nukleotidsekvens som koder for et polypeptid som resulterer i en selekterbar egenskap kan føres inn i en uttrykkingsvektor inneholdende én eller flere uttrykkingskontrollsekvenser. F.eks. kan en uttrykkingsvektor inkludere sekvensen som koder for en selekterbar markør operativt bundet til en promotorsekvens som vil føre til konstitutiv uttrykking i plantecellen som skal transformeres. Egnede selekterbare markører kan inkludere, uten begrensning, polypeptider som gir resistens mot et antibiotikum, så som kanamycin, G418,

30 bleomycin, ampicillin eller hygromycin, eller et herbicid, så som glufosinat, klorsulfuron eller fosfinotricin. [007] I utførelsesformer for anvendelse i planter, f.eks., kan en selekterbar markør gi resistens mot et herbicid som hemmer vekstpunktet eller meristemet, så som et imidazolinon eller et sulfonylurea. Eksempler på polypeptider i denne kategorien koden for mutante ALS- og AHAS-enzymer som beskrives i f.eks. U.S. patent nr.,767,366 og,928,937. US patent nr. 4,761,373 og,013,69 rettes til plantene resistente mot ulike imidazolinon- eller sulfonamidherbicider. U.S. patent nr. 4,97,374 vedrører planteceller og planter som inneholder et gen som koder for en mutant glutaminsyntetase (GS) resistent overfor hemming av herbicider som er kjent for å hemme GS, f.eks. fosfinotricin- og metioninsulfoksimin. U.S. patent nr.,162,602 offentliggjør plantene som er resistente mot hemming av sykloheksandion- og aryloksyfenoksypropansyreherbicider. Resistensen gis av en endret acetylkoenzym-akarboksylase (ACCase). [0076] Polypeptider for resistens mot glyfosat (som selges under handelsnavnet Roundup ) er også egnet for anvendelse i planter. Se f.eks. U.S. patent nr. 4,940,83 og 4,769,061. US patent nr.,4,798 offentliggjør transgene glyfosfatresistente maisplanter, der resistensen gis av en endret -enolpyruvyl-3-fosfoshikimatsyntase (EPSP-syntase). Slike polypeptider kan gi resistens mot glyfosfatherbicide sammensetninger, inkludert, uten begrensning, glyfosfatsalter så som trimetylsulfoniumsaltet, isopropylaminsaltet, natriumsaltet, kaliumsaltet og ammoniumsaltet. Se f.eks. U.S. patent nr. 6,41,73 og 6,41,732. [0077] Polypeptider for resistens mot fosfonoforbindelser så som glufosinatammonium eller fosfinotricin, og pyridinoksy- eller fenoksypropionsyrer og sykloheksoner er også egnet. Se f.eks. europeisk publikasjon nr , samt U.S. patent nr.,879,903,,276,268 og,61,236. [0078] Andre herbicider inkluderer de som hemmer fotosyntese, så som triazin og benzonitril (nitrilase). Se f.eks. US patent nr. 4,8,648. Andre ugressmidler (herbicider) inkluderer 2,2-diklorpropionsyre, setoksydim, haloksyfop, imidazolinonherbicider, sulfonylureaherbicider, triazolopyrimidinherbicier, s-triazinherbicider og bromoksynil. Også egnet er herbicider som gir resistens mot et protoksenzym. Se f.eks. U.S. patentpublikasjon nr og U.S. patent nr. 6,084,1. [0079] I noen utførelsesformer kan en rekombinant nukleinsyre som koder for en selekterbar markør innrettes til å integrere i genomet til en celle (f.eks. en plantecelle eller en dyrecelle) ved setespesifikk rekombinasjon. F.eks. kan en sekvens som koder for en selekterbar markør flankeres av gjenkjenningssekvenser for en rekombinase, så som f.eks. Cre eller FLP. I andre utførelsesformer kan en rekombinant nukleinsyre som koder for en selekterbar markør tilpasses for integrering i et plantegenom ved homolog

31 rekombinasjon. I slike nukleinsyrer kan sekvensen som koder for den selekterbare markøren flankeres av sekvenser som er like eller identiske med endogene nukleotidsekvenser funnet innenfor genomet til plantecellen som den rekombinante nukleinsyren skal føres inn i. Minst én av de endogene sekvensene kan være på spaltningssetet for en sekvensspesifikk nuklease. Nukleinsyren som koder for den selekterbare markøren kan også inneholde et gjenkjenningssete for en sekvensspesifikk nuklease. Nukleasen kan være den samme sekvensspesifikke nukleasen som den som målrettes til donornukleotidsekvensen eller en sekvensspesifikk nuklease som er forskjellig fra den som målrettes mot donornukleotidsekvensen. I enda andre utførelsesformer kan en rekombinant nukleinsyre som koder for en selekterbar markør tilpasses for integrasjon inn i genomet til en plantecelle ved illegitim rekombinasjon. Slike nukleinsyrer mangler vanligvis de flankerende sekvensene og nukleasegjenkjenningssetene som inneholdes i nukleinsyrer innrettet for homolog eller setespesifikk rekombinasjon slik det beskrives i dette dokumentet. Fremgangsmåter [0080] Ett eller flere av konstruksjonene tilveiebrakt i dette dokumentet kan anvendes til å transformere celler og/eller et DNA-modifiserende enzym kan føres inn i cellene, slik at det genereres en genetisk modifisert organisme (f.eks. en plante eller et dyr). Dermed tilveiebringes også genetisk modifiserte organismer og celler inneholdende nukleinsyrene og/eller polypeptidene som beskrives i dette dokumentet. I noen utførelsesformer har en transformert celle en rekombinant nukleinsyrekonstruksjon integrert inn i genomet sitt, dvs. kan transformeres stabilt. Stabilt transformerte celler beholder vanligvis den innførte nukleinsyresekvensen med hver celledeling. En konstruksjon kan integreres på en homolog måte, slik at en nukleotidsekvens som er endogent for den transformerte cellen erstattes av konstruksjonen, der konstruksjonen inneholder en sekvens som korresponderer med den endogene sekvensen, men som inneholder én eller flere modifiseringer med hensyn til den endogene sekvensen. Det skal bemerkes at mens en plante eller et dyr inneholdende en slik modifisert endogen sekvens kan kalles en "genetisk modifisert organisme" (GMO) i dette dokumentet, anses ikke den modifiserte endogene sekvensen som et transgen. En konstruksjon kan også integreres på en illegitim måte, slik at det integreres tilfeldig inn i genomet til den transformerte cellen. [0081] Alternativt kan en celle transformeres transient, så som at konstruksjonen ikke integreres i genomet sitt. F.eks. kan en plasmidvektor inneholdende en TALENkodende sekvens føres inn i en celle, slik at den TALEN-kodende sekvensen uttrykkes, men vektoren integreres ikke stabilt i genomet. Transient transformerte celler mister vanligvis noe av eller hele den innførte nukleinsyrekonstruksjonen med hver celledeling, slik at den innførte nukleinsyren ikke kan påvises i datterceller etter et

32 tilstrekkelig antall celledelinger. Ikke desto mindre er uttrykkingen av den TALENkodende sekvensen tilstrekkelig til å oppnå homolog rekombinasjon mellom en donorsekvens og en endogen målsekvens. Både transient transformerte og stabilt transformerte celler kan være nyttige i fremgangsmåtene som beskrives i dette dokumentet. [0082] Med særlig hensyn til genetisk modifiserte planteceller kan celler som anvendes i fremgangsmåtene som beskrives i dette dokumentet utgjøre deler eller en hel plante. Slike planter kan dyrkes på en måte som er egnet for artene som betraktes, enten i et vekstkammer, et drivhus, eller i et felt. De genetisk modifiserte plantene kan avles som ønsket for et bestemt formål, f.eks. for å innføre en rekombinant nukleinsyre i andre linjer, for å overføre en rekombinant nukleinsyre til andre arter, eller for ytterligere utvalg av andre ønskelige egenskaper. Alternativt kan de genetisk modifiserte plantene forplantes vegetativt for de artene som er mottagelige for slike metoder. Avkom inkluderer etterkommere av en individuell plante eller lineær plante (eng.: plant line). Avkom fra en individuell plante inkluderer frø dannet på F 1, F 2, F 3, F 4, F, F 6 og planter av påfølgende generasjoner eller frø dannet på BC 1, BC 2, BC 3 og planter av påfølgende generasjoner eller frø dannet på F 1 BC 1, F 1 BC 2, F 1 BC 3 og planter av påfølgende generasjoner. Frø produsert av en genetisk modifisert plante kan dyrkes og deretter selvpollineres (eller krysspollineres og selvpollineres) for å oppnå frø som er homozygote for nukleinsyrekonstruksjonen. [0083] Genetisk modifiserte celler (f.eks. planteceller eller dyreceller) kan dyrkes i suspensjonskultur eller vev eller organkultur, om ønskelig. For formålene av fremgangsmåtene tilveiebrakt i dette dokumentet kan det anvendes metoder for fast og/eller flytende vevskultur. Ved anvendelse av fast medium, kan cellene plasseres direkte på mediet eller kan plasseres på en filterfilm som deretter plasseres i kontakt med mediet. Ved anvendelse av det flytende mediet kan cellene plasseres på en flyteanordning, f.eks. en porøs membran som kommer i kontakt med det flytende mediet. Fast medium lages vanligvis av flytende medium ved tilsetning av agar. F.eks. kan et fast medium være Murashige og Skoog (MS)-medium inneholdende agar og en egnet konsentrasjon av en auksin, f.eks. 2,4-diklorfenoksyeddiksyre (2,4-D), og en egnet konsentrasjon av et cytokinin, f.eks. kinetin. [0084] En celle kan transformeres med en rekombinant nukleinsyrekonstruksjon eller med flere (f.eks. 2, 3, 4 eller ) rekombinante nukleinsyrekonstruksjoner. Hvis det benyttes flere konstruksjoner kan de transformeres samtidig eller sekvensielt. Metoder for å transformere en rekke arter er kjent i teknikken. Polynukleotidene og/eller de rekombinante vektorene som beskrives i dette dokumentet kan føres inn i genomet av en vert ved hjelp av hvilken som helst av en rekke kjente fremgangsmåter, inkludert elektroporering, mikroinjeksjon og biolistiske fremgangsmåter. Alternativt kan

33 polynukleotidene eller vektorene kombineres med egnede T-DNA-flankerende regioner og føres inn i en konvensjonell Agrobacterium tumefaciens-vertsvektor. Slike Agrobacterium tumefaciens-formidlede transformasjonsmetoder, inkludert frakobling og anvendelse av binære vektorer, er godt kjent innen teknikken. Andre genoverførings- og transformasjonsmetoder inkluderer protoplasttransformasjon gjennom kalsium eller PEG, elektroporeringsformidlet opptak av nakent DNA, liposomformidlet transfeksjon, elektroporering, virusvektorformidlet transformasjon og mikroprosjektilbombardement (se f.eks. U.S. patentene,38,880,,204,23,,91,616 og 6,329,71). Dersom en plantecelle eller vevskultur anvendes som mottakervevet for transformasjon, kan plantene regenereres fra transformerte kulturer ved anvendelse av metoder kjent for fagfolk på området. [008] I noen utførelsesformer kan et DNA-modifiserende enzym (f.eks. en TALEN) føres direkte inn i en celle. F.eks. kan et polypeptid føres inn i en celle ved mekanisk injeksjon, ved levering via et utskillelsessystem av bakterietype III, ved elektroporering eller ved Agrobacteriumformidlet overføring. Se f.eks. Vergunst et al. (2000) Science 290: for en omtale av Agrobacterium VirB/D4 transportsystemet og dens anvendelse til å formidle overføring av et nukleoprotein-t-kompleks inn i planteceller. [0086] Med videre hensyn til planter kan polynukleotidene, vektorene og polypeptidene som beskrives i dette dokumentet føres inn i en rekke enfrøbladede og tofrøbladede planter og plantecellesystemer, inkludert tofrøbladede planter så som saflor, alfalfa, soyabønne, kaffe, amarant, raps (vanlig eller rik på erukasyre), peanøtt eller solsikke, samt enfrøbladede planter så som oljepalme, sukkerrør, banan, sudangress, mais, hvete, rug, bygg, havre, ris, hirse eller sorghum. Også egnet er gymnospermer så som edelgran og furu. [0087] Dermed kan fremgangsmåtene som beskrives i dette dokumentet benyttes med tofrøbladede planter som f.eks. hører til ordenene Magniolales, Illiciales, Laurales, Piperales, Aristochiales, Nymphaeales, Ranunculales,Papeverales, Sarraceniaceae, Trochodendrales, Hamamelidales, Eucomiales, Leitneriales, Myricales, Fagales, Casuarinales, Caryophyllales, Batales, Polygonales, Plumbaginales, Dilleniales, Theales, Malvales, Urticales, Lecythidales, Violales, Salicales, Capparales, Ericales, Diapensales, Ebenales, Primulales, Rosales, Fabales, Podostemales, Haloragales, Myrtales, Cornales, Proteales, Santales, Rafflesiales, Celastrales, Euphorbiales, Rhamnales, Sapindales, Juglandales, Geraniales, Polygalales, Umbellales, Gentianales, Polemoniales, Lamiales, Plantaginales, Scrophulariales, Campanulales, Rubiales, Dipsacales og Asterales. Fremgangsmåtene som beskrives i dette dokumentet kan også benyttes med enfrøbladede planter som de som hører til ordenene Alismatales, Hydrocharitales, Najadales, Triuridales, Commelinales, Eriocaulales, Restionales, Poales, Juncales, Cyperales, Typhales, Bromeliales, Zingiber ales, Arecales, Cyclanthales, Pandanales, Arales, Lilliales, og Orchidales

34 eller med planter som hører til Gymnospermae, f.eks. Pinales, Ginkgoales, Cycadales og Gnetales [0088] Fremgangsmåtene kan anvendes over et bredt spekter av plantearter, inkludert arter fra de tofrøbladede slektene Atropa, Alseodaphne, Anacardium, Arachis, Beilschmiedia, Brassica, Carthamus, Cocculus, Croton, Cucumis, Citrus, Citrullus, Capsicum, Catharanthus, Cocos, Coffea, Cucurbita, Daucus, Duguetia, Eschscholzia, Ficus, Fragaria, Glaucium, Glycine, Gossypium, Helianthus, Hevea, Hyoscyamus, Lactuca, Landolphia, Linum, Litsea, Lycopersicon, Lupinus, Manihot, Majorana, Malus, Medicago, Nicotiana, Olea, Parthenium, Papaver, Persea, Phaseolus, Pistacia, Piston, Pyrus, Prunus, Raphanus, Ricinus, Senecio, Sinomenium, Stephania, Sinapis, Solanum, Theobroma, Trifolium, Trigonella, Vicia, Vinca, Vitis og Vigna; de enfrøbladede slektene Allium, Andropogon, Aragrostis, Asparagus, Avena, Cynodon, Elaeis, Festuca, Festulolium, Heterocallis, Hordeum, Lemna, Lolium, Musa, Oryza, Panicum, Pannesetum, Phleum, Poa, Secale, Sorghum, Triticum og Zea; eller gymnospermslekten Abies, Cunninghamia, Picea, Pinus og Pseudotsuga. [0089] En transformert celle, kallus, vev eller plante kan identifiseres og isoleres ved å velge eller screene de manipulerte cellene for bestemte egenskaper eller aktiviteter, f.eks. de som er kodet for av markørgener eller antibiotikaresistensgener. Slike screenings- og utvelgelsesmetoder er godt kjente for de som har vanlige kunnskaper på området. I tillegg kan fysikalske og biokjemiske metoder anvendes til å identifisere transformanter. Disse inkluderer Southern-analyse eller PCR-amplifisering for påvisning av et polynukleotid; Northern-blott, S1 RNase-beskyttelse, primerutvidelse eller RT-PCR-amplifisering for påvisning av RNA-transkripter; enzymatiske analyser for påvisning av enzym- eller ribozymaktiviteten til polypeptider og polynukleotider; og proteingelelektroforese, Western-blott, immunutfelling og enzymbundne immunanalyser for å detektere polypeptider. Andre metoder så som in situhybridisering, enzymfarging og immunofarging kan også anvendes til å påvise nærværet eller uttrykkingen av polypeptider og/eller polynukleotider. Fremgangsmåter for utførelse av alle de refererte metodene er godt kjent. Polynukleotider som føres stabilt inn i planteceller kan føres inn i andre planter ved hjelp av f.eks. standard avlsmetoder. [0090] I sammenheng med den foreliggende oppfinnelsen refererer "eukaryote celler" til en sopp-, gjær-, plante- eller dyrecelle eller en cellelinje avledet fra organismene oppført nedenfor og som er etablert for in vitro-kultur. Mer foretrukket kan soppen være av slekten Aspergillus, Penicillium, Acremonium, Trichoderma, Chrysoporium, Mortierella, Kluyveromyces eller Pichia. Mer foretrukket kan soppen være av artene Aspergillus niger, Aspergillus nidulans, Aspergillus oryzae, Aspergillus terreus, Penicillium chrysogenum, Penicillium citrinum, Acremonium chrysogenum, Trichoderma reesei, Mortierella alpine, Chrysosporium lucknowense, Kluyveromyces

35 lactis, Pichia pastoris eller Pichia ciferrii. [0091] I den foreliggende oppfinnelsen kan planten være fra slekten Arabidospis, Nicotiana, Solanum, Lactuca, Brassica, Oryza, Asparagus, Pisum, Medicago, Zea, Hordeum, Secale, Tritium, Capsicum, Cucumis, Cucurbita, Citrullis, Citrus eller Sorghum. Mer foretrukket kan planten være fra artene Arabidospis thaliana, Nicotiana tabaccum, Solanum lycopersicum, Solanum tuberosum, Solanum melongena, Solanum esculentum, Lactuca saliva, Brassica napus, Brassica oleracea, Brassica rapa, Oryza glaberrima, Oryza sativa, Asparagus officinalis, Pisum sativum, Medicago sativa, Zea mays, Hordeum vulgare, Secale cereal, Tritium aestivum, Triticum durum, Capsicum sativus, Cucurbita pepo, Citrullus lanatus, Cucumis melo, Cirrus aurantifolia, Citrus maxima, Citrus media eller Citrus reticulata. [0092] I den foreliggende oppfinnelsen kan dyrecellen være av slekten Homo, Rattus, Mus, Sus, Bos, Danio, Canis, Felis, Equus, Salmo, Oncorhynchus, Galls, Meleagris, Drosophila eller Caenorhabditis; mer foretrukket kan dyrecellen være av artene Homo sapiens, Rattus norvegicus, Mus musculus, Sus scrofa, Bos taurus, Danio rerio, Canis lupus, Felis catus, Equus caballus, Oncorhynchus mykiss, Gallus eller Meleagris gallopavo; dyrecellen kan være en fiskecelle fra Salmo salar, egentlige beinfisk eller sebrafiskarter som ikke-begrensende eksempler. Dyrecellen i den foreliggende oppfinnelsen kan også være en insektscelle fra Drosophila melanogaster som et ikke-begrensende eksempel; dyrecellen kan også være en ormcelle fra Caenorhabditis elegans som et ikke-begrensende eksempel. [0093] I den foreliggende oppfinnelsen kan cellen være en plantecelle, en pattedyrcelle, en fiskecelle, en insektcelle eller cellelinjer avledet fra disse organismene for in vitro-kulturer eller primære celler tatt direkte fra levende vev og etablert for in vitrokultur. Som ikke-begrensende eksempler kan cellelinjer velges fra gruppen bestående av CHO-K1-celler; HEK293-celler; Caco2-celler; U2-OS-celler; NIH 3T3-celler; NSO-celler; SP2-celler; CHO-S-celler; DG44-celler; K-62-celler, U-937-celler; MRC-celler; IMR90-celler; Jurkat-celler; HepG2-celler; HeLa-celler; HT-80-celler; HCT-116-celler; Hu-h7-celler; Huvec-celler; Molt 4-celler. [0094] Alle disse cellelinjene kan modifiseres av fremgangsmåten ifølge den foreliggende oppfinnelsen for å tilveiebringe cellelinjemodeller for å produsere, uttrykke, kvantifisere, detektere, studere et gen eller et protein av interesse; disse modellene kan også anvendes til å screene biologisk aktive molekyler av interesse for forskning og produksjon i ulike felt så som innen kjemiske felt, biodrivstoff, legemidler og agronomi som ikke-begrensende eksempler. [009] Den foreliggende offentliggjøringen tilveiebringer også fremgangsmåter som kan brukes på de sekvensspesifikke DNA-bindende domenene i TAL-effektorene for å f.eks. endre det genetiske materialet i cellene, å modulere genuttrykkingen og å

36 målrette patogene sekvenser i f.eks. anti-virusbehandlinger. F.eks., i noen utførelsesformer tilveiebringer den foreliggende offentliggjøringen fremgangsmåter for å modifisere cellulært genetisk materiale. I noen utførelsesformer inkluderer fremgangsmåtene innføring av et polypeptid inneholdende et TAL-effektor-DNAbindende domene eller en nukleinsyre som koder for et slikt polypeptid, i en celle. Det TAL-effektor-DNA-bindende domenet kan fuseres til hele eller en del av et DNAmodifiserende enzym (f.eks. en endonuklease). I noen utførelsesformer inkluderer fremgangsmåtene innføring av to eller flere rekombinante nukleinsyrer i en celle. En første rekombinant nukleinsyre inneholder en donornukleotidsekvens som inkluderer én eller flere modifikasjoner (dvs. substitusjoner, slettinger eller innsettinger) med hensyn til en tilsvarende, forhåndsvalgt målnukleotidsekvens som finnes i cellen. Donornukleotidsekvensen kan gjennomgå homolog rekombinasjon med den endogene målnukleotidsekvensen, slik at den endogene sekvensen eller en del av den erstattes med donorsekvensen eller en del av den. Målnukleotidsekvensen inkluderer vanligvis et gjenkjenningssete for en sekvensspesifikk TALEN. I noen tilfeller kan en målnukleotidsekvens inkludere gjenkjenningsseter for to eller flere distinkte TALEN-er (f.eks. to motstående målsekvenser som er forskjellige, slik at TALEN-ene som har forskjellig DNA-sekvensbindende spesifisitet kan anvendes). I slike tilfeller kan spesifisiteten av DNA-spaltningen økes sammenlignet med tilfeller der det bare anvendes en målsekvens (eller flere kopier av den samme målsekvensen). [0096] En annen rekombinant nukleinsyre inneholder en nukleotidsekvens som koder for en sekvensspesifikk TALEN som binder til gjenkjenningssetet i målnukleotidsekvensen. I noen tilfeller kan donornukleotidsekvensen og nukleotidsekvensen som koder for den sekvensspesifikke nukleasen være inneholdt i det samme nukleinsyrekonstruksjonen. Alternativt kan donornukleotidsekvensen og den TALEN-kodende sekvensen være inneholdt i separate konstruksjoner eller TALEN-polypeptidet kan fremstilles og føres direkte inn i en celle. [0097] I noen utførelsesformer kan det også anvendes en tredje rekombinant nukleinsyre inneholdende en nukleotidsekvens som koder for en seleksjonsmarkør også. De andre og tredje rekombinante nukleinsyrene kan gjennomgå rekombinasjon med endogene sekvenser og dermed integreres inn i genomet til cellen. Disse rekombinasjonshendelsene kan være ulovlige (dvs. tilfeldige) eller de kan oppstå gjennom homolog rekombinasjon eller gjennom setespesifikk rekombinasjon. De rekombinante nukleinsyrene kan transformeres samtidig eller sekvensielt inn i cellen, og kan lineariseres før transformasjonen. [0098] Når cellen er en plantecelle kan fremgangsmåtene tilveiebrakt i dette dokumentet videre inkludere trinn så som: generering av en plante inneholdende den transformerte cellen, generering av avkommet av planten, valg eller screening etter planter som uttrykker den selekterbare markøren (hvis inkludert), generering av avkom

37 av de valgte plantene, og testing av plantene (f.eks. vev, frø, forløperceller, eller hele planter) eller avkom av plantene for rekombinasjon i målnukleotidsekvensen. I noen tilfeller kan fremgangsmåtene inkludere krysspollinering av de valgte plantene for å fjerne den selekterbare markøren og/eller screening av de valgte eller krysspollinerte plantene for fravær av den sekvensspesifikke nukleasen. [0099] I noen utførelsesformer tilveiebringer den foreliggende offentliggjøringen fremgangsmåter for modifisering av det genetiske materialet i en celle, f.eks. en prokaryot celle, en dyrecelle eller en plantecelle. Fremgangsmåtene kan inkludere innføring av en første rekombinant nukleinsyre inneholdende en modifisert målnukleotidsekvens inn i cellen som inkluderer én eller flere modifikasjoner i nukleotidsekvensen med hensyn til en tilsvarende målnukleotidsekvens til stede i cellen, så vel som et gjenkjenningssete for et sekvensspesifikt TALEN, og en andre rekombinant nukleinsyre inneholdende en nukleotidsekvens som koder for den sekvensspesifikke TALEN-en. Når cellen er en plantecelle kan det genereres en plante som inneholder cellen, og celler, frø eller vev oppnådd fra planten (eller avkom av disse) kan analyseres for rekombinasjon ved målnukleotidsekvensen. De første og andre rekombinante nukleinsyrene kan transformeres samtidig eller serielt inn i cellen, og én eller begge kan lineariseres før transformasjonen. I noen tilfeller kan de første og andre rekombinante nukleinsyrene være til stede i det samme konstruksjonen. [00] I noen tilfeller kan fremgangsmåten også inkludere innføring i cellen av en tredje rekombinant nukleinsyre inneholdende en nukleotidsekvens som koder for en selekterbar markør, og å bestemme hvorvidt cellen, en organisme generert fra cellen eller avkommet av denne, uttrykker den selekterbare markøren. Fremgangsmåten kan videre inkludere screening av cellen, organismen eller avkommet av denne for fravær av seleksjonsmarkøren. Nukleotidsekvensen som koder for den selekterbare markøren kan eller kan ikke flankeres på begge sider av nukleotidsekvensene som er like eller identiske med nukleotidsekvenser som er endogene med cellen på spaltingssetet for en andre sekvensspesifikk nuklease, eller av gjenkjenningsseter for en sekvensspesifikk rekombinase. I enkelte tilfeller kan fremgangsmåten også inkludere trinnet krysspollinering av organismen. Avkommet av krysspollineringen screenes for fravær av seleksjonsmarkøren. [01] Den foreliggende offentliggjøringen tilveiebringer også fremgangsmåter for modifisering av det genetiske materialet i en celle (f.eks. en plantecelle eller en dyrecelle), omfattende tilveiebringelse av en celle inneholdende en mål-dna-sekvens, f.eks. en kromosomal, mitokondriell eller kloroplastsekvens, der det er ønskelig at homolog rekombinasjon forekommer, noe som gir en TALEN som inneholder et DNAmodifiserende enzymdomene (f.eks. et endonukleasedomene) og et TAL-effektordomene som har flere TAL-effektorrepeteringer, som i kombinasjon, binder til en spesifikk nukleotidsekvens i mål-dna-sekvensen, og gir en nukleinsyre inneholdende

38 en sekvens som er homolog med minst en del av mål-dna-et, og å bringe mål-dnasekvensen i cellen i kontakt med TAL-endonukleasen, slik at begge trådene av en nukleotidsekvens innenfor eller tilstøtende mål-dna-sekvensen i cellen spaltes. En slik spaltning kan øke frekvensen av homolog rekombinasjon i mål-dna-sekvensen. Mål-DNA-sekvensen kan være endogen for cellen. Fremgangsmåtene kan inkludere å føre en vektor som inneholder et cdna som koder for TAL-endonukleasen og uttrykker et TAL-endonukleaseprotein inn i cellen. I noen tilfeller kan TALendonukleaseproteinet i seg selv føres inn i cellen, f.eks. ved mekanisk injeksjon, ved levering via et utskillelsessystem av bakterietype III, ved elektroporering eller ved Agrobacterium-formidlet overføring. [02] Fremgangsmåtene som beskrives i dette dokumentet kan anvendes i en rekke situasjoner. I f.eks. landbruket er fremgangsmåtene som beskrives i dette dokumentet nyttige for å lette homolog rekombinasjon på et målsete og kan anvendes til å fjerne et tidligere integrert transgen (f.eks. et herbicidresistenstransgen) fra en lineær plante, variantplante eller hybridplante. Fremgangsmåtene som beskrives i dette dokumentet kan også anvendes til å modifisere et endogent gen, slik at enzymet som kodes for av genet overfører herbicidresistens, f.eks. modifikasjon av et endogent -enolpyruvylshikimat-3-fosfatsyntasegen ((-EPSP)-syntasegen), slik at det modifiserte enzymet gir resistens mot glyfosatherbicider. Som et annet eksempel er fremgangsmåtene som beskrives i dette dokumentet nyttige for å lette homolog rekombinasjon på regulatoriske regioner for ett eller flere endogene gener i en planteeller pattedyrmetabolisk reaksjonsvei (f.eks. fettsyrebiosyntese), slik at uttrykkingen av slike gener modifiseres på en ønsket måte. Fremgangsmåtene som beskrives i dette dokumentet er nyttige for å lette homolog rekombinasjon i et dyr (f.eks. en rotte eller en mus) i ett eller flere endogene gener av interesse som er involvert i, som ikkebegrensende eksempler, metabolske og interne signalreaksjonsveier, så som de som koder for celle-overflatemarkører, gener som er identifisert som å være knyttet til en bestemt sykdom, og eventuelle gener som er kjent for å være ansvarlige for en bestemt fenotype av en dyrecelle. [03] Den foreliggende offentliggjøringen tilveiebringer også fremgangsmåter for utforming av sekvensspesifikke TAL-effektorer som er i stand til interaksjon med bestemte DNA-sekvenser (f.eks. TALEN-er som er i stand til å spalte DNA ved spesifikke steder). Fremgangsmåtene kan inkludere identifisering av en målnukleotidsekvens (f.eks. en endogen kromosomsekvens, en mitokondrisk DNA-sekvens eller en DNA-sekvens fra en kloroplast) der det er ønskelig å ha TAL-effektorbinding (f.eks. en sekvens inntil en andre nukleotidsekvens der det er ønskelig å innføre et tostrenget utsnitt) og utforming av en sekvensspesifikk TAL-effektor som inneholder flere DNAbindende repeteringer som, i kombinasjon, binder til målsekvensen. Slik det beskrives i dette dokumentet inkluderer TAL-effektorene en rekke ufullkomne repeteringer som

39 38 bestemmer spesifisiteten som de interagerer med DNA i. Hver repetering binder til en enkelt base, avhengig av den spesielle di-aminosyresekvensen ved restene 12 og 13 av repeteringen. Dermed kan det målrettes mot bestemte DNA-seter ved å manipulere repeteringene i en TAL-effektor (f.eks. ved anvendelse av standardmetoder eller metodene som er som beskrives i dette dokumentet). Slike manipulerte TAL-effektorer kan f.eks. anvendes som transkriberingsfaktorer målrettet mot bestemte DNAsekvenser. Et diagram av en generisk TAL-effektor er vist i FIG. 1A, med repeteringsregionen indikert med åpne bokser, og RVD-en i den representative repeteringssekvensen (SEQ ID NO: 1) understreket. [04] Eksempler på RVD-er og deres tilsvarende målnukleotider er vist i tabell 1A (se også PCT-publikasjon nr. WO20/079430). RVD HD NG NI NN NS Nukleotid C T A G eller A A eller C eller G N* C eller T HG T H* T IG T Tabell 1A *Betegner et mellomrom i repetisjonssekvensen som tilsvarer en mangel på en aminosyrerest ved den andre posisjonen av RVD-en. 1 [0] Andre RVD-er og deres tilsvarende målnukleotider er vist i tabell 1B RVD HA ND NK HI Tabell 1B Nukleotid C C G C

40 39 RVD HN NA SN YG Nukleotid G G G eller A T [06] Når det er ønskelig å ha sekvensspesifikk DNA-spaltning kan det f.eks. uformes en sekvensspesifikk TALEN for å inneholde (a) flere DNA-bindende repeteringsdomener som, i kombinasjon, binder til den endogene kromosomale nukleotidsekvensen og (b) en endonuklease som genererer et dobbelttrådet snitt ved den andre nukleotidsekvensen. Slik sekvensspesifikk DNA-spalting kan være nyttig for å øke homolog rekombinasjon, slik det beskrives i dette dokumentet. Andre bruksområder for TALEN-er inkluderer f.eks. legemidler mot virus. TALEN-er kan konstrueres for å målrette bestemte virussekvenser, som spalter virus-dna-et og reduserer eller avskaffer virulens. [07] Materialene og fremgangsmåtene tilveiebrakt i dette dokumentet kan anvendes til å modifisere sekvensen av et bestemt gen på en målrettet måte. Et gen kan inneholde flere sekvenser som en manipulert TAL-effektor kan målrettes mot. Slik det beskrives i dette dokumentet kan imidlertid visse målsekvenser målrettes mer effektivt. Som f.eks. fremsatt i eksempel 9 kan sekvenser som har bestemte egenskaper målrettes mer effektivt av TAL-effektorer. Dermed kan fremgangsmåtene tilveiebrakt i dette dokumentet inkludere identifisering av målsekvenser som oppfyller spesielle kriterier. Disse inkluderer sekvenser som: i) har en lengde på minst 1 baser og en orientering fra ' til 3' med en T umiddelbart før setet på '-enden; ii) ikke har en T i den første (')-posisjonen eller en A i den andre posisjonen; iii) ende i T i den siste (3')-posisjonen og ikke har en G på den nest siste posisjonen; og iv) har en basesammensetning på 0-63 % A, % C, 0-2 % G og 2-42 % T. [08] Siden TALEN-er som beskrives i dette dokumentet generelt fungerer som dimerer, kan noen utførelsesformer av fremgangsmåtene tilveiebrakt i dette dokumentet inkludere identifisering av en første genomnukleotidsekvens og en andre genomnukleotidsekvens i en celle, der de første og andre nukleotidsekvensene oppfyller minst ett av kriteriene fremsatt ovenfor, og separeres med 1 til 18 bp. I noen tilfeller kan et TALEN-polypeptid binde til hver nukleotidsekvens, og endonukleasen inneholdt i TALEN-en kan spalte innenfor 1-18 bp-avstandsstykket. [09] Den foreliggende offentliggjøringen tilveiebringer også fremgangsmåter for generering av genetisk modifiserte dyr inn i hvilken det er blitt ført inn en ønsket nukleinsyre. Slike fremgangsmåter kan inkludere oppnåelse av en celle inneholdende

41 en endogen kromosomal mål-dna-sekvens som det er ønskelig å føre nukleinsyren inn i, innføring av en TALEN i cellen for å generere et dobbelttrådet snitt i den endogene kromosomale mål-dna-sekvensen, innføring i cellen av en eksogen nukleinsyre inneholdende en sekvens som er homolog med minst en del av det endogene kromosomale mål-dna-et, der innføringen skjer under forhold som muliggjør homolog rekombinasjon å oppstå mellom den eksogene nukleinsyren og det endogene kromosomale mål-dna-et, og generering av et dyr fra den primære cellen der homolog rekombinasjon har funnet sted. Den homologe nukleinsyren kan inkludere f.eks. en nukleotidsekvens som forstyrrer et gen etter homolog rekombinasjon, en nukleotidsekvens som erstatter et gen etter homolog rekombinasjon, en nukleotidsekvens som innfører en punktmutasjon i et gen etter homolog rekombinasjon eller en nukleotidsekvens som innfører et regulatorisk sete etter homolog rekombinasjon. [01] Fremgangsmåtene tilveiebrakt i dette dokumentet kan også anvendes til å generere genmodifiserte planter der det er blitt innført en ønsket nukleinsyre. Slike fremgangsmåter kan inkludere oppnåelse av en plantecelle som inneholder en endogen mål-dna-sekvens inn i hvilken det er ønskelig å innføre nukleinsyren, innføre en TALEN for å generere et dobbelttrådet snitt i den endogene mål-dna-sekvensen, innføring i plantecellen av en eksogen nukleinsyre syre inneholdende en sekvens som er homolog med minst en del av det endogene mål-dna-et, der innføringen er under forhold som tillater homolog rekombinasjon å oppstå mellom den eksogene nukleinsyren og det endogene mål-dna-et, og generering av en plante fra plantecellen der homolog rekombinasjon har oppstått. [0111] DNA-et i celler som genereres av de TALEN-lettede homologrekombinasjonsfremgangsmåtene tilveiebrakt i dette dokumentet modifiseres sammenlignet med celler som ikke har gjennomgått slike fremgangsmåter, og cellene som inneholder det modifiserte DNA-et refereres til som "genetisk modifiserte". Det skal imidlertid bemerkes at organismer som inneholder slike celler ikke kan anses som GMO for regulatoriske formål, siden en slik modifikasjon involverer en homolog rekombinasjon og ikke tilfeldig integrering av et transgen. Dermed kan anvendelse av de TALENmuliggjorte fremgangsmåtene som beskrives i dette dokumentet for å generere genetiske modifikasjoner være fordelaktig ved at man kan unngå f.eks. standard reguleringsprosedyrer sammen med deres forbundne tid og kostnad. [0112] Andre fremgangsmåter for målrettet genetisk rekombinasjon, som tilveiebrakt i dette dokumentet, kan inkludere innsetting i en celle (f.eks. en plantecelle, insektcelle, en celle av egentlige beinfisk eller dyrecelle) av et nukleinsyremolekyl som koder for en TALEN målrettet mot en valgt DNA-målsekvens, indusering av uttrykkingen av TALEN-en inne i cellen, og identifisering av en rekombinant celle der den valgte DNA-målsekvensen oppviser en mutasjon (f.eks. en sletting av genetisk materiale, en innsetning av genetisk materiale, eller både en sletting og en innsetting av genetisk

42 materiale). Et donor-dna kan også settes inn i cellen. [0113] I noen utførelsesformer kan det anvendes en monomer TALEN. TALEN-er som beskrives i dette dokumentet fungerer vanligvis som dimerer på tvers av et todelt gjenkjenningssete med et avstandsstykke, slik at to TAL-effektordomener hver fuseres til et katalytisk domene av FokI-restriksjonsenzymet, DNA-gjenkjenningssetene for hver resulterende TALEN separeres av en avstandsstykkesekvens, og binding av hver TALEN-monomer til gjenkjenningssetet tillater FokI å dimerisere og lage et dobbelttrådbrudd inne i avstandsstykket (se f.eks. Moscou and Bogdanove (2009) Science 326:1). Monomere TALEN-er kan også konstrueres, men imidlertid slik at enkle TAL-effektorer fuseres til en nuklease som ikke krever dimerisering for å fungere. En slik nuklease er f.eks. en enkeltkjedet variant av FokI, der de to monomerene uttrykkes som et enkelt polypeptid (Minczuk et al. (2008) Nucleic Acids Res. 36: ). Andre naturlig forekommende eller manipulerte monomere nukleaser kan også ha denne rollen. DNA-gjenkjenningsdomene som anvendes for en monomer TALEN kan avledes fra en naturlig forekommende TAL-effektor. Alternativt kan DNA-gjenkjenningsdomenet konstrueres for gjenkjenning av et spesifikt DNAmål. Det kan være lettere å konstruere og utplassere manipulerte enkeltkjede-talener, ettersom de bare krever ett manipulert DNA-gjenkjenningsdomene. [0114] I noen utførelsesformer kan det genereres en dimer DNA-sekvensspesifikk nuklease ved anvendelse av to forskjellige DNA-bindende domener (f.eks. et TALeffektorbindende domene og ett bindende domene fra et annet type molekyl). Som fremsatt ovenfor fungerer TALEN-ene som beskrives i dette dokumentet vanligvis som dimerer på tvers av et todelt gjenkjenningssete med et avstandsstykke. Denne nukleasearkitekturen kan også anvendes for målspesifikke nukleaser generert fra f.eks. en TALEN-monomer og en sinkfingernukleasemonomer. I slike tilfeller kan DNAgjenkjenningssetene for TALEN-en og sinkfingernukleasemonomerene separeres med et avstandsstykke av passende lengde. Binding av de to monomerene kan tillate FokI å dimerisere og lage et dobbelttrådet brudd innenfor avstandsstykkesekvensen. DNAbindende domener, andre enn sinkfingrene, så som homeodomener, myb-repeteringer eller leucin-zippere (eng.: leucine zippers), kan også fuseres til FokI og fungere som en partner med en TALEN-monomer for å skape en funksjonell nuklease. [011] I noen utførelsesformer kan det anvendes en TA- effektor til å målrette andre proteindomener (f.eks. ikke-nukleaseproteindomener) til spesifikke nukleotidsekvenser. F.eks. kan en TAL-effektor bindes til et proteindomene fra, uten begrensning, et DNA-interagerende enzym (f.eks. en metylase, en topoisomerase, en integrase, en transposase eller en ligase), transkriberingsaktivatorer eller transkriberingsundertrykkere, eller et protein som interagerer med eller modifiserer andre proteiner så som histoner. Anvendelser av slike TAL-effektorfusjoner inkluderer f.eks. oppretting eller endring av epigenetiske regulatoriske elementer, noe som lager

43 setespesifikke innsettinger, slettinger eller reparasjoner i DNA, kontrollerer genuttrykking og modifiserer kromatinstrukturen. [0116] I noen utførelsesformer kan avstandsstykket av målsekvensen velges eller varieres for å modulere TALEN-spesifisitet og aktivitet. Resultatene presentert i dette dokumentet for TALEN-er som fungerer som dimerer på tvers av et todelt gjenkjenningssete med et avstandsstykke demonstrerer at TALEN-er kan fungere over et område av avstandsstykkelengder, og at aktiviteten til TALEN-er varierer med avstandsstykkelengden. Se f.eks. eksempel 6 nedenfor. Fleksibiliteten i avstandsstykkelengden indikerer at avstandsstykkelengden kan velges for å målrette bestemte sekvenser (f.eks. i et genom) med høy spesifisitet. Videre indikerer variasjonen i aktivitet observert for forskjellige lengder av avstandsstykket at avstandsstykkelengden kan velges for å oppnå et ønsket nivå av TALEN-aktivitet. [0117] I noen utførelsesformer kan TALEN-aktiviteten moduleres ved å variere antallet og sammensetningen av repeteringer i det minst ene DNA-bindende domenet. Som det beskrives i eksempel 7 i dette dokumentet viste f.eks. et PthXoI-basert TALEN større aktivitet enn et AvrBs3-basert TALEN. PthXoI skiller seg fra AvrBs3 både i antall og RVD-sammensetning av dens repeteringer. I tillegg avviker de naturlig forekommende DNA-gjenkjenningssetene for disse proteinene i deres divergens fra de respektive gjenkjenningssekvensene forutsatt basert på TAL-effektor-DNA-koden som beskrives av Moscou og Bogdanove (ovenfor). Videre hadde flere tilpassede TALENer av samme lengde (12 RVD-er), men med ulik RVD-sammensetning ulik aktivitet, og et 13 RVD-tilpasset TALEN hadde høyere aktivitet enn et 12 RVD-tilpasset TALEN. Dermed kan ikke bare TALEN-er konstrueres for å gjenkjenne en DNA-sekvens av interesse, men (1) antallet repeteringer kan varieres for å modulere aktivitet, (2) forskjellige bindingsseter kan velges for å oppnå forskjellige nivåer av aktivitet, og (3) sammensetningen av RVD-ene og deres tilpasning til målsetet (ifølge koden) kan varieres for å modulere TALEN-aktivitet. [0118] Når TALEN-en er i en heterodimer form, f.eks. med to forskjellige monomerer som hver inkluderer et TAL-effektordomene og et FoKl-nukleasekatalytisk domene, kan RVD-ene finnes i tilsvarende tall i hver av de to TAL-effektordomenene eller hvert domene kan vise forskjellige antall RVD-er. F.eks., hvis totalt 22 RVD-er anvendes til å binde DNA i et bestemt heterodimert TALEN, kan 11 repeteringer finnes i hver av de to TAL-effektordomenene; alternativt kan repeteringer finnes i én av de to TALeffektordomenene og 12 i det andre. Den foreliggende oppfinnelsen omfatter også TALEN med DNA-modifiserende enzymdomene som virker som en monomer. I dette tilfellet kan alle RVD-ene finnes i et enkelt TAL-effektordomene, som fuseres til det monomere enzymet. I dette tilfellet, for å ha en effektiv binding, må antallet RVD-er være tilsvarende det totale antallet RVD-er som vil bli funnet i et tilsvarende dimerisk TALEN. F.eks., i stedet for å ha repeteringer på to forskjellige TAL-effektor-

44 domener (som i tilfellet for et dimerisk TALEN), ville man ha 20 repeteringer i et enkelt TAL-effektordomene (som i tilfellet for et monomerisk TALEN). [0119] I et ytterligere aspekt av oppfinnelsen er det totale antallet repeteringer i den dimere eller monomere TALEN-en minst 14. I et annet ytterligere aspekt ifølge oppfinnelsen er det totale antallet repeteringer i den dimere eller monomere TALEN-en minst 20. I et annet ytterligere aspekt ifølge oppfinnelsen er det totale antallet repeteringer i den dimere eller monomere TALEN-en minst 24. I et annet ytterligere aspekt ifølge oppfinnelsen er det totale antallet repeteringer innenfor den dimere eller monomere TALEN-en minst 30. [0120] Denne patentsøknaden tilveiebringer også fremgangsmåter for generering av TAL-effektorproteiner som har forbedret målrettingskapasitet for et mål-dna. Fremgangsmåtene kan f.eks. inkludere generering av en nukleinsyre som koder for en TAL-effektor som har et DNA-bindende domene med flere DNA-bindende repeteringer, hver repetering inneholder et RVD som bestemmer gjenkjenning av et basepar i mål-dna-et, der hver DNA-bindende repetering er ansvarlig for gjenkjenning av ett basepar i mål-dna-et. Slik det beskrives i eksempel 12 nedenfor kan målrettingskapasiteten for konstruerte TAL-effektorproteiner bli bedre hvis det ikke stilles så strenge krav til T i posisjon -1 på bindingssetet. Dermed kan generering av en TAL-effektorkodende nukleinsyre inkludere innføring av en nukleinsyre som koder for en variant 0. DNA-bindende repeteringssekvens med spesifisitet for A, C eller G, og dermed eliminere behovet for T i posisjon -1 av bindingssetet. [0121] I tillegg tilveiebringes det fremgangsmåter i dette dokumentet for generering av TAL-effektorer som har forbedret målrettingskapasitet for et mål-dna. Slike fremgangsmåter kan inkludere generering av en nukleinsyre som koder for en TALeffektor som omfatter DNA-bindende domene som har flere DNA-bindende repeteringer, hver repetering inneholder et RVD som bestemmer gjenkjenning av et basepar i mål-dna-et. Som beskrevet i eksempel 12 nedenfor synes spesifisiteten av NN (den vanligste RVD-en som gjenkjenner G) å være generelt svak og kan variere med konteksten, men visse RVD-er kan ha forbedret spesifisitet for G. Dermed kan fremgangsmåter tilveiebrakt i dette dokumentet inkludere anvendelse av alternative RVD-er som kan ha mer robust spesifisitet for G. Det kan f.eks. anvendes én eller flere RVD-er valgt fra gruppen bestående av RN, R*, NG, NH, KN, K*, NA, NT, DN, D*, NL, NM, EN, E*, NV, NC, QN, Q*, NR, NP, HN, H*, NK, NY, SN, S*, ND, NW, TN, T*, NE, NF, YN, Y* og NQ, der stjernen angir et hull ved den andre posisjonen av RVD-en. Produksjonsartikler [0122] Den foreliggende offentliggjøringen tilveiebringer produksjonsartikler, f.eks. nukleinsyremolekyler som koder for TALEN-er, TALEN-polypeptider,

45 44 1 sammensetninger inneholdende slike nukleinsyremolekyler eller polypeptider, eller TAL-endonukleasemanipulerte cellelinjer. Slike elementer kan anvendes, f.eks. som forskningsverktøy eller terapeutisk. [0123] I noen utførelsesformer kan en produksjonsartikkel inkludere frø fra planter som genereres ved hjelp av fremgangsmåter som tilveiebringes i dette dokumentet. Frøene kan kondisjoneres ved hjelp av metoder kjent på området og pakkes ved hjelp av innpakningsmateriale godt kjent i teknikken for å fremstille en produksjonsartikkel. En frøpakke kan ha en etikett, f.eks. en merking eller etikett festet til emballasjematerialet, en merkelapp trykket på pakningsmaterialet eller en etikett som er satt inn i pakken. Etiketten kan indikere at frøene som inneholdes i pakken kan produsere en avling av genmodifiserte planter, og kan beskrive egenskapene som er endret av den genetiske modifiseringen, i forhold til umodifiserte planter. Andre definisjoner [0124] Aminosyrerester eller subenheter i en polypeptidsekvens betegnes i dette dokumentet i henhold til en-bokstavkoden, der f.eks. Q betyr Gln eller glutaminrest, R betyr Arg eller argininrest og D betyr Asp eller asparaginsyrerest. Aminosyresubstitusjon betyr erstatning av en aminosyrerest med en annen, f.eks. er erstatningen av en argininrest med en glutaminrest i en peptidsekvens en aminosyresubstitusjon. Nukleotider betegnes som følger: en-bokstavkoden anvendes for å betegne basen av et nukleosid: a er adenin, t er tymin, c er cytosin og g er guanin. For de degenererte nukleotidene representerer r g eller a (purinnukleotider), k representerer g eller t, s representerer g eller c, w representerer a eller t, m representerer a eller c, y representerer t eller c (pyrimidinnukleotider), d representerer g, a eller t, v representerer g, a eller c, b representerer g, t eller c, h representerer a, t eller c og n representerer g, a, t eller c. Uttrykket "DNA-modifiserende enzym" refererer til hvilket som helst protein som er i stand til å modifisere det genetiske materialet i en celle, uansett graden av DNA-modifikasjon (spalting, kovalent interaksjon, vannformidlet interaksjon...). DNA-interagerende proteiner (f.eks. en metylase, en topoisomerase, en integrase, en transposase eller en ligase), transkriberingsaktivatorer eller repressor, andre proteiner så som histoner og nukleaser er ment å være inkludert i betydningen av "DNA-modifisert enzym". Når omfattet i et TAL-effektor-DNA-modifiserende enzym refereres det DNA-modifiserende enzymet til som det DNA-modifiserende enzymdomenet.

46 Termen "nuklease" er ment å inkludere eksonukleaser og endonukleaser. Termen "endonuklease" refererer til hvilket som helst villtype eller variantenzym i stand til å katalysere hydrolysen (spalting) av bindinger mellom nukleinsyrer i et DNA- eller RNA-molekyl, fortrinnsvis et DNA-molekyl. Ikkebegrensende eksempler på endonukleaser inkluderer restriksjonsendonukleaser av type II så som FokI, HhaI, HindIII, NotI, BbvCI, EcoRI, BglI og AlwI. Endonukleasene omfatter også sjeldent kuttede endonukleaser når de vanligvis har et polynukleotidgjenkjenningssete på omtrent 12-4 basepar (bp) i lengde, mer foretrukket fra 14-4 bp. Sjeldent kuttede endonukleaser øker HR vesentlig ved å indusere DNA-dobbelttrådbrudd (DSB-er) ved en definert lokus (Rouet, Smih et al. 1994; Rouet, Smih et al. 1994; Choulika, Perrin et al. 199; Pingoud and Silva 2007). Sjeldent kuttede endonukleaser kan f.eks. være en målsøkende endonuklease (Paques and Duchateau 2007), en kimær Sink-Finger-nuklease (ZFN) som følge av fusjonen av de manipulerte sink-fingerdomenene med det katalytiske domenet til et restriksjonsenzym så som Fokl (Porteus and Carroll 200) eller en kjemisk endonuklease (Eisenschmidt, Lanio et al. 200; Arimondo, Thomas et al. 2006; Simon, Cannata et al. 2008). I kjemiske endonukleaser konjugeres en kjemisk eller peptidisk spalter enten til en polymer av nukleinsyrer eller til et annet DNA som gjenkjenner en spesifikk målsekvens, og målretter derved spaltingsaktiviteten til en spesifikk sekvens. Kjemiske endonukleaser omfatter også syntetiske nukleaser som konjugater av ortofenantrolin, et DNA-spaltende molekyl og tripleksdannende oligonukleotider (TFO-er), kjent for å binde spesifikke DNA-sekvenser (Kalish and Glazer 200). Slike kjemiske endonukleaser er omfattet i termen "endonuklease" følge den foreliggende oppfinnelsen. Eksempler på slike endonukleaser inkluderer I-Sce I, I-Chu I, I-Cre I, I-Csm I, PI-Sce I, PI-Tli I, PI- Mtu I, I-Ceu I, I-Sce II, I-Sce III, HO, PI-Civ I, PI-Ctr I, PI-Aae I, PI-Bsu I, PI- Dha I, PI-Dra I, PI-Mav I, PI-Mch I, PI-Mfu I, PI-Mfl I, PI-Mga I, PI-Mgo I, PI-Min I, PI-Mka I, PI-Mle I, PI-Mma I, PI-Msh I, PI-Msm I, PI-Mth I, PI-Mtu I, PI-Mxe I, PI-Npu I, PI-Pfu I, PI-Rma I, PI-Spb I, PI-Ssp I, PI-Fac I, PI-Mja I, PI-Pho I, PI-Tag I, PI-Thy I, PI-Tko I, PI-Tsp I, I-MsoI. [012] Endonukleasene ifølge den foreliggende oppfinnelsen kan være en del av en transkriberingsaktivatorlignende (TAL) effektorendonuklease (TALEN). 3 Med "TALEN" menes et protein omfattende et transkriberingsaktivatorlignende (TAL)-effektorbindende domene og et endonukleasedomene, fusjonen av begge domenene resulterer i et "monomert TALEN". Noen monomere TALEN-er kan være funksjonelle per se og andre krever dimerisering med en annen monomer TALEN. Dimeriseringen kan resultere i et homodimert TALEN når begge de

47 monomere TALEN-ene er identiske, eller kan resultere i et heterodimert TALEN når de monomere TALEN-ene er forskjellige. To monomere TALENer er forskjellige når f.eks. deres RVD-tall er forskjellige og/eller når innholdet (dvs. aminosyresekvensen) til minst ett RVD er forskjellig. Med "TAL-effektor- DNA-modifiserende enzym" menes et protein omfattende et transkriberingsaktivatorlignende effektorbindende domene og et DNA-modifiserende enzymdomene. [0126] Med "variant" menes et "variant"-protein, dvs. et protein som ikke naturlig finnes i naturen og som ikke oppnås ved genmanipulering eller ved tilfeldig mutagenese, dvs. et manipulert protein. Dette variantproteinet kan f.eks. oppnås ved substitusjon av minst én rest i aminosyresekvensen til et naturlig forekommende villtypeprotein med en annen aminosyre. Substitusjonen(e) kan f.eks. innføres ved seterettet mutagenese og/eller ved tilfeldig mutagenese. [0127] Med "celle" eller "celler" menes alle prokaryote eller eukaryote levende celler, cellelinjer avledet fra disse organismene for in vitro-kulturer, primære celler fra dyreeller planteopphav. [0128] Med "primær celle" eller "primære celler" menes celler hentet direkte fra levende vev (dvs. biopsimateriale) og etablert for vekst in vitro, som har gjennomgått svært få befolkningsdoblinger og er derfor mer representative for de viktigste funksjonelle komponentene og egenskapene til vev som de avledes fra, i forhold til kontinuerlige tumorigene eller kunstig udødeliggjorte cellelinjer. Disse cellene representerer dermed en mer verdifull modell for in vivo-tilstanden som de henviser til. Med "homolog" menes en sekvens med tilstrekkelig identitet til en annen for å føre til homolog rekombinasjon mellom sekvensene, nærmere bestemt som har minst 9 % identitet, fortrinnsvis 97 % identitet og mer foretrukket 99 %. "Identitet" refererer til sekvenslikhet mellom to nukleinsyremolekyler eller polypeptider. Identitet kan bestemmes ved å sammenligne en posisjon i hver sekvens som kan innrettes for sammenligningsformål. Når en posisjon i den sammenlignede sekvensen opptas av den samme basen er molekylene identiske i denne posisjonen. En grad av likhet eller identitet mellom nukleinsyreeller aminosyresekvenser er en funksjon av antallet identiske eller samsvarende nukleotider ved posisjonene som deles av nukleinsyresekvensene. Det kan anvendes forskjellige sammenstillingsalgoritmer og/eller programmer for å beregne identiteten mellom to sekvenser, inkludert FASTA eller BLAST som er tilgjengelig som en del av GCG-sekvensanalysepakken (University of Wisconsin, Madison, WI), og kan anvendes med f.eks. standardinnstillingen. Med "mutasjon" menes substitusjon, sletting, innsetning av én eller flere nukleotider/aminosyrer i et polynukleotid (cdna-gen) eller en polypeptid-

48 47 sekvens. Mutasjonen kan påvirke den kodende sekvensen til et gen eller dens regulatoriske sekvens. Den kan også påvirke strukturen til den genomiske sekvensen eller strukturen/stabiliteten til det kodede mrna-et. Med "gen" menes den grunnleggende enheten av arvelighet, som består av et segment av DNA anordnet på en lineær måte langs et kromosom, som koder for et spesifikt protein eller segment av protein. Et gen inkluderer vanligvis en promotor, en '-ikketranslatert region, én eller flere kodende sekvenser (eksoner), eventuelt introner, en 3'-ikke-translatert region. Genet kan videre omfatte en terminator, forsterkere og/eller dempere Termen "gen av interesse" refererer til hvilken som helst nukleotidsekvens som koder for et kjent eller antatt genprodukt. Som anvendt i dette dokumentet er termen "lokus" den spesifikke fysiske plasseringen av en DNA-sekvens (f.eks. av et gen) på et kromosom. Termen "lokus" refererer vanligvis til den spesifikke fysiske plasseringen av en målsekvens på et kromosom. Med "fusjonsprotein" menes resultatet av en godt kjent prosess innen teknikken som består av å sammenføye to eller flere gener som opprinnelig koder for separate proteiner, der translasjonen av "fusjonsgenet" resulterer i et enkelt polypeptid med funksjonelle egenskaper avledet fra hver av de opprinnelige proteinene. Med "katalytisk domene" menes proteindomenet eller modulen av et enzym inneholdende det aktive setet til enzymet; ved aktivt sete menes den delen av enzymet der katalyse av substratet forekommer. Enzymer, men også deres katalytiske domener, klassifiseres og navngis i henhold til reaksjonen de katalyserer. Enzymkommisjonsnummeret (EC-nummeret) er en numerisk klassifiseringsordning for enzymer, basert på de kjemiske reaksjonene de katalyserer (World Wide Web ved chem.qmul.ac.uk/iubmb/enzyme/). I omfanget til den foreliggende offentliggjøringen kan hvilket som helst katalytisk domene anvendes som en partner og fuseres til et TAL-effektordomene for å generere et kimært fusjonsprotein som resulterer i et TAL-effektor-DNAmodifiserende enzym. Ikke-begrensende eksempler på slike katalytiske domener kan være domenene til MmeI, EsaSSII, CstMI, NucA, EndA fra Escherichia coli, NucM, EndA-pneumokokk (eng.: Streptococcus pneumonia), gule stafylokokker (eng.: SNase Staphylococcus aureus), SNase Staphylococcus hyicus, SNase shigella flexneri, yncb fra Bacillus subtilis, endodeoksyribonuklease I fra enterobakteriofag T7, bovint EndoG, ttsmr-dna-feilreparasjonsproteinet muts, spaltingsdomenet til Metnase.

49 [0129] Utførelsen av den foreliggende oppfinnelsen vil benytte, dersom ikke annet er angitt, konvensjonelle metoder for cellebiologi, cellekultur, molekylær biologi, transgen biologi, mikrobiologi, rekombinant DNA og immunologi, som er innenfor området til fagmannen. Slike metoder er fullstendig forklart i litteraturen. Se f.eks. Current Protocols in Molecular Biology (Ausubel, 2000, Wiley and son Inc, Library of Congress, USA); Molecular Cloning: A Laboratory Manual, tredje utgave, (Sambrook et al, 2001, Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press); Oligonucleotide Synthesis (M. J. Gait, red., 1984); U.S. pat. nr. 4,683,19; Nucleic Acid Hybridization (Harries and Higgins, red. 1984); Transcription and Translation (Hames and Higgins, red. 1984); Culture of Animal Cells (Freshney, Alan R. Liss, Inc., 1987); Immobilized Cells and Enzymes (IRL Press, 1986); Perbal, A Practical Guide to Molecular Cloning (1984); the series, Methods in Enzymology (Abelson and Simon, red.-in-chief, Academic Press, Inc., New York), spesifikt bind 14 og 1 (Wu et al., red.) og bind 18, "Gene Expression Technology" (Goeddel, red.); Gene Transfer Vectors For Mammalian Cells (Miller and Calos, red., 1987, Cold Spring Harbor Laboratory); Immunochemical Methods in Cell and Molecular Biology (Mayer and Walker, red., Academic Press, London, 1987); Handbook of Experimental Immunology, bind I-IV (Weir and Blackwell, red., 1986); og Manipulating the Mouse Embryo, (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1986). [0130] Den ovennevnte skrevne beskrivelsen av oppfinnelsen tilveiebringer en måte og prosess for fremstilling og anvendelse av den slik at hvilken som helst fagmann på dette området er i stand til å lage og anvende den, idet denne aktiveringen tilveiebringes særlig for gjenstanden i de vedlagte kravene, som utgjør en del av den originale beskrivelsen. [0131] Som anvendt ovenfor inkluderer uttrykkene "valgt fra gruppen bestående av", "valgt fra," og lignende blandinger av de spesifiserte materialene. [0132] Når det angis en tallfestet grense eller område, er endepunktene inkludert. Dessuten er alle verdier og underområdet innenfor en tallfestet grense eller område inkludert spesifikt som om de var skrevet eksplisitt. [0133] Beskrivelsen ovenfor er presentert for å muliggjøre at en person med kunnskap på området kan fremstille og anvende oppfinnelsen, og er tilveiebrakt i sammenheng med en spesiell anvendelse og dens krav. Dermed er ikke denne oppfinnelsen ment å begrenses til de viste utførelsesformene, men skal gis det bredeste omfanget i samsvar med prinsippene og trekkene som er offentliggjort i dette dokumentet. [0134] Etter generelt å ha beskrevet denne oppfinnelsen kan det oppnås en ytterligere forståelse ved referanse til visse spesifikke eksempler, som er tilveiebrakt i dette dokumentet kun for illustrasjonsformål, oppfinnelsen beskrives ytterligere i de følgende eksemplene, som ikke begrenser omfanget av oppfinnelsen som beskrives i kravene, med mindre annet er spesifisert.

50 49 EKSEMPLER Eksempel 1 En DNA-kode gir gjenkjenningen for TAL-effektor [013] For å avgjøre om det er en en-til-en, lineær korrespondanse mellom RVD-er og sammenhengende nukleotider i TAL-målsetet, ble den spådde promotorregionen (dvs. de 00 bp umiddelbart foran det anmerkede translasjonsstartsetet) til det kjente målgenet for hver av ti TAL-effektorer skannet med TAL-effektor-RVD-sekvensen for sammenstillinger som minimerte entropien (tilfeldigheten) i RVD-nukleotidassosieringene. Den følgende formelen ble anvendt til å kvantifisere entropi, der R er settet av RVD-er for effektoren, D er settet av fire nukleotider (A, C, G, T), og fi.j representerer den observerte frekvensen som den i. RVD-en forbinder med det j. - nukleotidet: [0136] Flere laventropiseter var til stede i hver promotor. For effektoren AvrBs3 er imidlertid bare ett laventropisete kartlagt til promotorfragmentet upa20 på 4 bp, identifisert som tilstrekkelig og nødvendig for aktivering, og det falt sammen med UPA-boksen som er felles for gener direkte aktivert av AvrBs3 (Kay et al., ovenfor). Også for effektorene PthXo1 og AvrXa27, overlappet bare ett sete hver en polymorfisme mellom de aktiverte og ikke-aktiverte allelene for sine respektive mål, Os8N3 og Xa27. Over sammenstillingene av disse tre setene, var RVDnukleotidassosieringene konsistente, så de resterende sammenstillingene ble valgt basert på disse forbindelsene, noe som resulterer i nøyaktig ett sete per TALeffektormålpar (FIG. 1B og tabell 2). Hvert sete innledes (eng.: is preceded) med en T (FIG. 1D). [0137] For å bedømme spesifisiteten gitt av RVD-nukleotidassosieringene, ble en vektmatrise først generert basert på frekvensene til alle RVD-nukleotidassosieringene observert på tvers av de ti minimale entropi-tal-effektor-målsetesammenstillingene (FIG. 1B). Vektmatrisen ble deretter anvendt til å skanne promotorregionen, de 00 bp forut for den translasjonelle starten, av hver ikke-redundante genmodell i ris, Oryza sativa spp. japonica cv. Nipponbare (Osal, frigjøring 6.0, rice.plantbiology.msu.edu) for beste samsvar med de fem TAL-effektorene av rispatogenet Xanthomonas oryzae (AvrXa27, PthXo1, PthXo6, PthXo7 og Tallc). For AvrXa27 ble sekvensen oppstrøms Xa27 (GenBank-aksesjon AY986492) inkludert. Denne oppstrøms sekvensen er ikke til stede i Nipponbare. De observerte assosieringsfrekvensene ble vektet med 90 % og de resterende % ble fordelt likt til frekvenser av alle mulige assosieringer. Sammenstillingene ble rangert ved hjelp av en vektmatrisepoengsum

51 (y-aksen), tatt som en negativ logg av frekvenspoengsummen avledet fra RVDnukleotidassosieringsfrekvensene i FIG. 1B. Dermed, jo lavere poengsum, jo bedre samsvar. For PthXo1, PthXo6, PthXo7 og Tal1c var det eksperimentelt identifiserte målgenet det beste eller nesten beste samsvaret. Bedre samsvar ble ikke innledet med en T, ble ikke representert på mikromatrisen anvendt til å identifisere målet, eller manglet introner og EST-bevis. Skanning av de reverse komplementpromotorsekvensene ga ingen sammenstillinger som ga høyere poeng enn fremadsetene for de kjente målene. Dette resultatet betyr ikke at TAL-effektorer binder til den positive tråden, men indikerer at de fungerer i en fremad retning i forhold til den positive tråden. Det kjente målet for den femte effektoren, AvrXa27, er sykdomsresistensgenet Xa27 (Gu et al., ovenfor). Den dårligere rangeringen for dette samsvaret (,368) kan gjenspeile en kalibrert, eller nyere og sub-optimal vertstilpasning. Bedre scoringsseter omfatter sannsynligvis gener målrettet av AvrXa27 for patogenesen. [0138] Ved å anvende vektmatrisen igjen ble det oppnådd ti ekstra sammenstillinger ved å skanne alle rispromotorene med 40 ytterligere X. oryzae TAL-effektorer og beholde de beste sammenstillingene som nedstrømsgenet ble aktivert for under infeksjon basert på offentlige mikromatrisedata (PLEXdb.org, aksesjon OS3) (tabell 3). Som med det første settet går en T foran hvert sete, og ingen reverstrådede seter ga bedre poengsum. RVD-nukleotidassosieringsfrekvensene til de totalt 20 sammenstillingene er vist i FIG. 1C. De utgjør en ganske enkel kode. [0139] RVD-nukleotidfrekvensene i det utvidede settet med 20 TAL-effektornukleotidsammenstillinger ble anvendt til å generere en ny vektmatrise, og et beregningsskript ble skrevet i Python v2. ( Skriptet kan anvendes til å skanne enhver samling av DNA-sekvenser for samsvar med en bestemt TALeffektor, med en brukerdefinert vektfaktor for observerte vs. uobserverte RVDnukleotidassosieringer. Se Moscou and Bogdanove (ovenfor). [0140] Det er noe degenerasjon i koden. Sterke assosiasjoner kan representere ankere som står for det meste av bindingsaffiniteten, med svake assosieringer som gir en grad av fleksibilitet. Alternativt kan naboeffekter være involvert. Den sistnevnte muligheten ble undersøkt ved å bestemme nukleotidassosieringsfrekvensene for hver RVD betinget av RVD-en til en av sidene, og sammenligne dem med de totale observerte frekvensene - med andre ord, ved å sortere RVD-nukleotidsammenkoblingene i henhold til nabo- RVD-en til venstre eller høyre, og å sammenligne de relative frekvensene til hvert par dermed sortert med den generelle frekvensen for det paret. Frekvensene for RVDnukleotidassosieringene sortert av naboen avvek ikke vesentlig fra de totale observerte frekvensene, noe som tyder på at assosieringene er kontekstuavhengige. [0141] Sekvenser som flankerer de 20 målsetene viste ingen konserverte nukleotider bortsett fra T ved -1, men de pleier å være C-rike etter setet og G-fattige i sin helhet (Fig. 1D). Med få unntak begynner setene innen 60 bp oppstrøms for den anmerkede

52 1 transkripsjonelle starten og ingen er nærmere enn 87 bp til translasjonsstarten (tabell 2 og tabell 3). Andre regler for RVD/nukleotidassosiasjonene beskrives i eksempel 4 og. [0142] Gitt disse resultatene er det nå mulig å forutsi TAL-effektormål i et genom og konstruere mål fra begynnelsen av. Evnen til å forutsi seter vil fremskynde identifisering av vertsgener som er viktige i sykdom. Evnen til å konstruere mål holder løftet for å utforme holdbare resistensgener som reagerer på konserverte eller flere TAL-effektorer. Tilpasning av TAL-effektorer for vilkårlig genaktivering eller målretting av fusjonerte proteiner for DNA-modifikasjon er også mulig, som det beskrives i dette dokumentet. Tabell 2 Forutsagte målsetefunksjoner for eksperimentelt identifiserte TAL-effektormålpar TAL-effektor Kilde RVD-er Målgen TcS TATA-boks TIS AvrXa27 1 Xanthomonas oryzae pv. oryzae PXO99 A 17 Xa27 (ris) AvrBs3 2 X. campestri spv. vesicatoria 18 Bs3 (pepper) AvrBs3 3 X. campestris pv. vesicatoria 18 UPA20 (pepper) 72 1 AvrBs3Δrep16 4, Modifisert AvrBs3 14 Bs3-E (pepper) AvrBs3Δrep9 4 Modifisert AvrBs3 1 Bs3 (pepper) AvrHah1 6 X. gardneri 14 Bs3 (pepper) PthXo1 7 X. oryzae pv. oryzae PXO99 A 24 Os8N3 (ris) PthXo6 8 X. oryzae pv. oryzae PXO99 A 23 OsTFX1 (ris) PthXo7 8 X. oryzae pv. oryzae PXO99 A 22 OsTFIIAγ1 (ris) Tal1c X. oryzae pv. oryzicola BLS26 16 OsHEN1 (ris) RVD-er, repeteringsvariable direster; TcS, anmerket transkripsjonelt startsete; TIS, translasjonelt startsete. Plasseringene er relativt til '-enden av målsetet. 1 Gu et al., supra 2 Kay et al. (2007) Science 318:648 3 Römer et al. (2007) Science 318:64 4 Herbers et al. (1992) Nature 36:172 Römer et al. (2009) Plant Physiol. 6 Schornack et al. (2008) New Phytologist 179:46 7 Yang et al. (2006) Proc. Natl. Acad. Sci. USA 3:03

53 2 Forutsagte målsetefunksjoner for eksperimentelt identifiserte TAL-effektormålpar TAL-effektor Kilde RVD-er Målgen TcS TATA-boks TIS 8 Sugio et al. (2007) Proc. Natl. Acad. Sci. USA Tabell 3 Xanthomonas oryzae TAL-effektorkandidatmål i ris aktivert under infeksjon. Effektor Stamme Rislokus r TcS RVDer TATAboks TIS q Ganger endring Tal1c BLS26 16 OsHen ,01 3,3 Tal2c BLS26 27 Os03g ,01,2 Tal2d BLS26 16 Os04g n.p. 2 3,9E-07 29,7 Tal3b BLS26 18 Os0g ,4E-08 8, Tal4a BLS26 26 Os03g ,2E-04 2,6 Tal4b BLS26 14 Os09g n.p ,0E-03 3,6 Tal4c BLS26 23 Os06g n.p. 11 2,7E- 17,1 Tal6 BLS26 20 Os07g ,6E-02 21,6 PthXo1 PXO99 A 24 Os8N ,0E-08 84,2 PthXo6 PXO99 A 23 OsTFX ,E-03 2,8 PthXo7 PXO99 A 22 OsTFIIAγ ,6E-06 4, Tal9a PXO99 A 20 OsHen ,13 8,2 Tal7a/8a PXO99 A 18 Os01g ,8E-01 1,7 Tal7b/8b PXO99 A 20 Os01g ,8E-01 1,7 RVD-er, repeteringsvariable direster; r, rangering av 8,918 skannede genmodeller, basert på RVDvektmatrisepoengsummen; TcS, anmerket transkripsjonelt startsete; n.p., ikke til stede; TIS, translasjonelt startsete. Lokasjonene står i forhold til '-enden av målsetet. q-verdiene er for en sammenligning for å spotte over fem tidspunkter opptil 96 timer etter inokuleringen, replikert fire ganger; ganger endring gitt er på 96 timer (PLEXdb, aksesjon OS3). Eksempel 2 TALEN-er kan fungere i gjær [0143] Plasmidkonstruksjonen: Den proteinkodende sekvensen til TAL-effektoren, AvrBs3, ble oppnådd ved forføyning fra et plasmid med BamHI. Et DNA-fragment som koder for hovedsakelig repeteringsdomenet ble skjært bort med SphI.

54 Aminosyresekvensen til AvrBs3 finnes under GENBANK-aksesjonsnr. P14727 og SEQ ID NO:12 (FIG. 3), og nukleinsyresekvensen under aksesjonsnr. X16130 og SEQ ID NO:13 (FIG. 4). I FIG. 4 er BamHI- og SphI-setene i fet skrift og understreket. AvrBs3 BamHI- og SphI-fragmentene ble klonet inn i nukleaseuttrykkingsvektoren pdw1789_tal (FIG. ) tilstøtende sekvensene som koder for FokI-nukleasedomenet. For å klone AvrBs3-målsetet inn i målrapportørplasmidet ble to komplementære DNA-oligonukleotider, som inneholder to AvrBs3-gjenkjenningsseter anordnet i en omvendt retning med en 18 bp-avstandsstykkesekvens mellom seg, ble syntetisert med BgllI- og SpeI-overheng ved henholdsvis '- og 3'-endene. Det ble fremstilt andre rapportørplasmider som hadde gjenkjenningsseter med lengder av avstandsstykket på 6, 9, 12 og 1 bp. De hybridiserte DNA-oligonukleotidene ble klonet inn i rapportørplasmidet, pcp (FIG. 6), som ble fordøyd med BglII og SpeI. [0144] Gjæranalyse: Målrapportørplasmidene ble transformert inn i gjærstammen YPH499 (en MAT-a-stamme) og transformantene ble utvalgt på syntetisk komplett medium som manglet tryptofan (SC-W). TALEN-uttrykkingsplasmidene ble transformert til YPH00 (en MAT-α-stamme); og transformantene ble sådd ut på SCmedium som manglet histidin (SC-H). Gjærkoloniene som bærer målrapportørplasmidet og koloniene som bærer TALEN-uttrykkingsplasmidet ble dyrket over natten ved 30 C i henholdsvis flytende SC-W og SC-H-medier. Kulturene ble justert til den samme OD 600 og 200 µl av hver ble blandet inn i 200 µl YPD-medium. Blandingen ble inkubert ved 30 C i 4 timer for å tillate sammenpassing av de to gjærstammetypene. Den blandede kulturen ble spunnet ned og resuspendert i ml SC-WH-medier ved 30 C over natten eller inntil OD 600 når et område på 0,-1. Cellene ble høstet og kvantitative β-galaktosidaseanalyser ble gjennomført slik det beskrives (Townsend et al. (2009) Nature 49:442-44). [014] Resultater: TAL-FokI-fusjonen er en setespesifikk nuklease bestående av TAL DNA-gjenkjenningsdomenet og det uspesifikke FokI-DNA-spaltingsdomenet. TAL DNA-gjenkjenningsdomenet kan konstrueres for å binde forskjellige DNA-sekvenser. Som det beskrives i eksempel 1 i dette dokumentet har DNA-gjenkjenningsspesifisiteten for TAL-effektorer, en ny klasse DNA-bindende domene, blitt dekodet. Særlig inneholder det DNA-bindende domenet med TAL-effektorer et ulikt antall tandem, 34- aminosyrerepeteringer, noe som kan gjenkjenne og binde til spesifikke DNAsekvenser. Aminosyresekvensene til repeteringene er konserverte med unntak av to tilstøtende høyst variable rester i posisjonene 12 og 13 i repeteringene. Disse posisjonene spesifiserer sammen individuelle nukleotider i DNA-bindingssetet, en repetering til ett nukleotid. Arkitekturen til TALEN-ene er illustrert i FIG. 7. TALENene fungerer som dimerer, der hver monomer består av manipulerte TAL DNAgjenkjenningsrepeteringer fusert til et ikke-spesifikt spaltingsdomene fra FokIendonukleasen. DNA-gjenkjenningsrepeteringene kan konstrueres til å binde mål-

55 DNA-sekvenser innenfor et genom av interesse. TAL-nukleasemonomerer binder til ett av de to DNA-halvsetene som separeres av en avstandsstykkesekvens. Denne avstanden gjør at FokI-monomerene kan dimerisere og lage et dobbeltrådet DNAbrudd (DSB) i avstandsstykkesekvensen mellom halvsetene. [0146] For å undersøke potensialet til TAL-effektor-DNA-gjenkjenningsdomenet ble forsøkene utført for å bestemme hvorvidt naturlige TAL-effektorer kan fungere som nukleaser ved fusjon med FokI-nukleasedomenet. Den gjærbaserte analysen ble utført ved anvendelse av en TAL-nukleaseuttrykkingskonstruksjon og en målrapportørkonstruksjon. Som vist i FIG. inneholder ryggraden i nukleaseuttrykkingskonstruksjonen et FokI-nukleasedomene og et N-terminalt nukleært lokaliseringssignal (NLS) under kontroll av gjær-tef1-promotoren. Flere restriksjonsseter er lokalisert mellom FokI-nukleasedomenet og NLS-motivet for å lette kloning av forskjellige TAL-effektorer. Målrapportørkonstruksjonen har et avbrutt lacz-rapportørgen med en 12 bp duplisering av kodingssekvens som vist i FIG. 6. Dupliseringen flankerer et URA3-gen og en målsekvens (sammensatt av to halvseter og en avstandsstykkesekvens) gjenkjent av TAL DNA-bindende domener. Hvis TALEN-en binder og genererer DNA-doble trådbrudd (DSB-er) ved målsetet, repareres slike brudd, i gjær, hovedsakelig ved homolog rekombinasjon mellom de dupliserte lacz-sekvensene gjennom enkelttrådet hybridisering (Haber (199) Bioessays 17:609). Rekombinasjon resulterer i rekonstitusjon av et funksjonelt lacz-gen og tap av URA3 (som gir - fluororotinsyreresistens). Relativ spaltingsaktivitet av TALEN-ene ble målt ved å bestemme lacz-enzymaktivitet. [0147] I disse studiene ble en naturlig TAL-effektor, AvrBs3, som hadde en sentral nukleaserepeteringsregion som fremsatt i SEQ ID NO: 16 (FIG. 8) klonet inn i nukleaseuttrykkingsvektoren og AvrBs3-målsetene (to bindingsseter anordnet i en omvendt orientering) med en 18 bp avstandsstykkesekvens ble klonet inn i målrapportørvektoren. Gjæranalysen ble utført ved anvendelse av skjemaet vist i FIG. 9 og som beskrives ovenfor. Resultatene viste at lacz-aktiviteten fra gjærceller transformert med både AvrBs3-nukleaseplasmidet og målrapportørplasmidet var signifikant høyere (1,8 ganger høyere) enn kontrollgjærcellene som kun inneholdt målrapportørplasmidet (FIG. ). Ingen aktivitet ble observert med nukleasefusjoner laget med bare SphI-fragmentet som hovedsakelig koder for repeteringsdomenet. Dette indikerte at sekvensene som er forskjellige fra det DNA-bindende domenet er nødvendige for TALEN-aktivitet. Rapportørplasmider med lengder av avstandsstykket på 6 og 9 bp klarte heller ikke å vise aktivitet, noe som indikerte at avstanden mellom de to bindingssetene er kritiske for å tillate Fokl å dimerisere. Disse dataene indikerer at AvrBs3-TAL-nukleasen kan fungere som en setepesifikk nuklease som spalter dens beslektede målsekvens i gjær.

56 Eksempel 3 - Modulær sammensetting av TAL-effektorrepeteringer for tilpassede TALEN-er [0148] Komplementære oligonukleotider som tilsvarer de 2 baseparene i hver av fire individuelle TAL-effektorrepeteringene, som hver spesifiserer et annet nukleotid, syntetiseres, hybridiseres og klones inn i en bakteriekloningsvektor med mange kopier, individuelt og i kombinasjoner på 2 og 3 repeteringer i alle permutasjonene for å gi 4 enkle, 16 doble og 64 triple repeteringsmoduler ved hjelp av standard restriksjonsfordøynings- og ligeringsmetoder (f.eks. som vist i FIG. 11). Den ønskede TALeffektorkodende sekvensen settes sammen ved å innføre de passende modulene sekvensielt inn i en portklar bakteriekloningsvektor med mange kopier inneholdende en avkortet form av tal1c-genet som mangler den sentrale repeterende regionen bortsett fra den karakteristiske endelige halve repeteringen. F.eks. kan en 18 repeterings-taleffektor kodende sekvens settes sammen ved sekvensielt å innføre triple moduler og 1 dobbeltmodul inn i den avkortede tal1c-vektoren. Eksempel 4 - Et system for modulær sammensetting av TAL-effektorrepeteringer [0149] Det ble utviklet plasmider og fremgangsmåter for generering av egendefinerte TAL-effektorkodende gener. Den funksjonelle spesifisiteten til TAL-effektorene bestemmes av RVD-ene i repeteringene, slik det beskrives i dette dokumentet; andre polymorfismer i repeteringene og andre steder i proteinene er sjeldne og ubetydelige med hensyn til funksjonell spesifisitet. Dermed ble egendefinerte TAL-effektorgener generert ved å erstatte repeteringsregionen i et vilkårlig TAL-effektorgen med repeteringer inneholdende de ønskede RVD-ene. Repeteringssekvensene utenfor RVDene samsvarte med en konsensussekvens (se nedenfor). DNA-fragmenter som koder for TAL-effektorrepeteringer ble sekvensielt satt sammen til moduler som koder for én, to eller tre repeteringer, og modulene ble klonet inn i et TAL-effektorgen som de opprinnelige repeteringene ble fjernet fra. Hver kodede repetering, bortsett fra den siste (halve) repeteringen hadde sekvensen LTPDQVVAIASXXGGKQALETVQRLLPVLCQDHG (SEQ ID NO:18; FIG. 12A). Den siste (halve) repeteringen hadde sekvensen LTPDQVVAIASXXGGKQALES (SEQ ID NO:20; FIG. 12B). I begge sekvensene indikerer "XX" plasseringen av RVDen. RVD-ene anvendt i de modulære repeteringene var NI, HD, NN og NG, som spesifiserer binding til henholdsvis A, C, G og T. I forsøkene som beskrives nedenfor, ble tal1c-genet til Xanthomonas oryzae pv. oryzicola-stammen BLS26, med dens repeteringer fjernet, anvendt som "ryggraden" for bygging av egendefinerte TALeffektorgener. [0] Fremgangsmåten som beskrives i dette dokumentet inkluderte fem komponenter: (1) generering av enkle repeteringsstartplasmider; (2) generering av enkle repeteringsmodulplasmider; (3) generering av flere repeteringsmoduler;

57 (4) generering av et komplett sett av én-, to- og tre-repeteringsmodulplasmider; og () sammensetting av egendefinerte TAL-effektorkodende sekvenser. [011] For å generere enkle repeteringsstartplasmider ble tal1c-genet fordøyd med MscI og skjøtt sammen for å fjerne hele repeteringsregionen bortsett fra den første delen av den første repeteringen, og den siste delen av den siste, avkortede repeteringen, noe som resulterer i plasmidet betegnet pcs487 (FIG. 13). Det resulterende genet kodet for RVD NI, og, som de fleste TAL-effektorgenene, inneholdt det to SphI-seter som flankerte gjenkjenningsregionen. Genet inneholdt intet XhoI-sete. [012] Deretter ble en translasjonelt synonym mutasjon innført i pcs487 for å skape et unikt PspXI-sete, som omfatter et unikt Xhol-sete sentrert på kodonene 19 og 20. Mutasjonen er avbildet i FIG. 14, som viser de opprinnelige og endrede nukleotidsekvensene for kodonene (henholdsvis SEQ ID NO:21 og SEQ ID NO:23), som begge koder for aminosyresekvensen ALES (SEQ ID NO:22). Det resulterende plasmidet ble betegnet pcs489. [013] Ved ytterligere mutagenese ble tre ytterligere konstruksjoner generert med RVD-ene HD, NN og NG, for å skape plasmidene betegnet henholdsvis pcs490, pcs491 og pcs492. SphI-fragmentet som omfatter den modifiserte repeteringsregionen ble overført fra pcs489, pcs490, pcs491 og pcs492 til det kanamycinresistente plasmidet betegnet pcs488 (FIG. 1), som kun kodet for N- og C- endedelene til tal1c, uten repeteringsregionen, i portinngangsvektoren pentr-d (Invitrogen, Carlsbad, California). Denne overføringen resulterte i de enkle repeteringsstartplasmidene betegnet henholdsvis pcs493 (FIG. 16), pcs494, pcs49 og pcs496. PspXI/XhoI-setet i den avkortede repeteringen forble unik i disse plasmidene. TAL-effektorgenet i pcs488 og hvert av dets derivater ble innledet av Shine-Dalgarno- og Kozak-sekvenser for effektiv translasjon i henholdsvis prokaryoter og eukaryoter. [014] Det ble deretter konstruert enkle repeteringsmodulplasmider. Et plasmid ble generert for hver av de fire valgte RVD-ene (NI, HD, NN og NG). Hvert plasmid hadde en '-kompatibel kohesiv ende som rekonstituerte et XhoI-sete, men ikke et PspXI-sete ved ligering inn i et PspXI-sete og en 3'-kompatibel kohesiv ende som rekonstituerte både et XhoI- og et PspXI-sete. Plasmidene ble generert ved kloning av hybridiserte syntetiske, komplementære oligonukleotider med overheng (FIG. 17A) inn i PspXI/XhoI-setet for pbluescript SK-, noe som resulterer i plasmider betegnet henholdsvis pcs02 (FIG. 17B), pcs03, pcs04 og pcs0. Hvert plasmid muliggjorde innføring av ytterligere repeteringer ved 3'-enden av den enkle repeteringsmodulen ved det unike rekonstituerte PspXI-setet, eller for fjerning av repeteringsmodulen ved hjelp av de rekonstituerte Xhol-setene. [01] Flere enkle repeteringsmoduler, en hver for NI, HD, NN og NG, ble generert. Hver hadde en ' kompatibel kohesiv ende som ikke rekonstituerte et PspXI-

58 eller XhoI-sete når de ble ligert i et PspXI-sete, en 3' kompatibel kohesiv ende som rekonstituerte både XhoI- og et PspXI-sete, og en translasjonell synonym nukleotidsubstitusjon som ødela det indre MscI-setet (FIG. 18A). Disse modulene ble generert ved hybridisering av syntetiske, komplementære oligonukleotider med overheng. Ligering av hvilken som helst av disse ytterligere enkle repeterende modulene i det unike PspXI/XhoI-setet av et enkelt repeteringsmodulplasmid (pcs02, pcs03, pcs04 eller pcs0) førte ikke til noe nytt XhoI-sete ved '-krysset, men gjenopprettelse av det unike 3' PspXI/XhoI-setet, slik at de resulterende plasmidene kunne lineariseres for innføring av flere ytterligere repeteringer ved kutting med PspXI. Repetering av denne prosessen resulterte i moduler inneholdende flere repeteringer (FIG. 18B). Videre kunne hver hele multiple repeteringsmodul skjæres bort ved hjelp av XhoI. Fordi MscI-setet ble ødelagt i de ytterligere enkle repeteringsmodulene forble MscI-setet i den innledende repeteringen unik, og var nyttig for å sjekke retningen ved etterfølgende subkloning av den multiple repeteringsmodulen. [016] Flere enkle repeteringsmoduler ble klonet iterativt i de enkle repeteringsmodulplasmidene for å generere, sammen med de enkle repeteringsmodulplasmidene, et komplett sett med alle mulige en-, to- og tre-repeteringsmoduler, for totalt 84 plasmider betegnet pcs02 gjennom pcs8 (FIG. 19). Moduler inneholdende mer enn tre repeteringer (f.eks. fire, fem, seks, sju, åtte, ni, ti eller mer enn ti repeteringer) genereres på samme måte. [017] En fremgangsmåte ble deretter utviklet for å sette sammen hvilken som helst sekvens av repeteringer i tal1c-"ryggraden" for å generere et egendefinert TALeffektorgen. Fremgangsmåten inkluderte de følgende trinnene, som også er avbildet i FIG. 20: (1) velge et enkelt repeteringsstarterplasmid med den første ønskede repeteringen (pcs493, pcs494, pcs49 eller pcs49, som koder for henholdsvis RVD NI, HD, NN, eller NG); (2) linearisere plasmidet med PspXI; (3) isolere modulen for de(n) neste repeteringen(e) fra det riktige modulplasmidet (pcs02 gjennom pcs8) ved hjelp av XhoI; (4) ligere; () kontrollere orienteringen ved fordøyning med MscI og bekrefte sekvensen fra 3'-enden ved hjelp av en vektorbasert primer; og (6) repetere trinnene 2- inntil alle repeteringene er satt sammen. Eksempel - Bibliotek av plasmider for modulær sammensetting av TALEN-er [018] Sammensetting av TALEN-repeteringer som beskrives i dette dokumentet (f.eks. ved hjelp av trinnene avbildet i FIG. 20) resulterer i en rekke mellomliggende plasmider inneholdende et økende antall repeteringer. Hver av disse plasmidene lagres

59 slik at et bibliotek av plasmider for modulær sammensetting av TALEN-er (pmat-er) genereres. F.eks. avbilder FIG. 21A og 21B sammensettingen av repeteringsmoduler i konstruksjon av TAL-endonukleaser som vil målrette de viste nukleotidsekvensene. I FIG. 21A, tilsettes repeteringsmoduler fra plasmidene betegnet pcs19, pcs24, pcs37, pcs1, pcs83 og pcs29 sekvensielt til sekvensen i starterplasmidet betegnet pcs493, noe som resulterer i plasmider betegnet pmat, pmat6, pmat7, pmat8, pmat9 og pmat60. I FIG. 21B tilsettes repeteringsmoduler fra plasmider betegnet pcs30, pcs33, pcs22 og pcs41 sekvensielt til sekvensen i plasmidet betegnet pmat1, noe som resulterer i plasmider betegnet pmat61, pmat62, pmat63 og pmat64. Eksempel 6 - Generering og testing av egendefinerte TALEN-er [019] TAL DNA-gjenkjenningsdomenet ble anvendt til å lage TALEN-er som gjenkjenner og spalter bestemte DNA-mål (FIG. 22A), ved anvendelse av systemet som beskrives i eksemplene 4 og. For å vurdere TALEN-funksjon, ble en gjæranalyse tilpasset der LacZ-aktiviteten tjener som en indikator for DNA-spaltning (Townsend et al., ovenfor). I denne analysen bringes et målplasmid og et TALENuttrykkingsplasmid sammen i den samme cellen ved sammenpassing. Målplasmidet har et lacz-rapportørgen med en 12-bp-duplisering av kodende sekvens. Dupliseringen flankerer et målsete gjenkjent av en gitt TALEN. Når et dobbelttrådet DNA-brudd forekommer på målsetet repareres det gjennom enkelttrådhybridisering mellom de dupliserte sekvensene, noe som skaper et funksjonell lacz-gen hvis uttrykking kan måles ved hjelp av standard β-galaktosidaseanalyser som tilveiebringer en kvantifiserbar avlesning (FIG. 22A). Denne analysen har vist seg å være en god indikator på evnen til en ZFN for å lage kromosommutasjoner ved NHEJ eller for å stimulere homolog rekombinasjon for genredigering i høyere eukaryoter (Townsend et al., ovenfor; og Zhang et al. (20) Proc. Natl. Acad. Sci. USA 7: ). [0160] Det ble anvendt to godt karakteriserte TAL-effektorer - AvrBs3 fra pepperpatogenet Xanthomonas campestris pv. vesicatoria og PthXo1 fra rispatogenet X. oryzae pv. oryzae (Bonas et al. (1989) Mol. Gen. Genet. 218: ; og Yang et al. (2006) Proc. Natl. Acad. Sci. USA 3:03-08). Aminosyresekvensen til AvrBs3 kan finnes under GENBANK-aksesjonsnr. P og SEQ ID NO: 12 (FIG. 3), og nukleinsyresekvensen under aksesjonsnr. X16130 og SEQ ID NO:13 (FIG. 4). Aminosyresekvensen til PthXo1 kan finnes under GENBANK-aksesjonsnr. ACD8243 og SEQ ID NO:31 (FIG. 23) og nukleinsyresekvensen under aksesjonsnr. CP000967, gen ID og SEQ ID NO:32 (FIG. 24). Aminosyresekvensen til PthXo1 under GENBANK-aksesjonsnr. ACD8243 avkortes i N-enden på grunn av en mislykket annotering av startkodonet. Den komplette sekvensen presenteres i FIG. 23. [0161] Repeteringsdomenene til både AvrBs3 og PthXo1 kodes fullstendig i et

60 konservert SphI-fragment (FIG. 4 og 24). Begge de TAL-effektorkodende genene har også et BamHI-restriksjonsfragment som omfatter den kodende sekvensen for gjenkjenningsdomenet og 287 aminosyrer før og 231 aminosyrer etter (FIG. 4 og 24; se også FIG. 22A.). Det TAL-effektortranskripsjonelle aktiveringsdomenet er fraværende fra BamHI-fragmentet. Både SphI-fragmentene og BamHI-fragmentene ble fusert til et DNA-fragment som koder for FokI som er til stede i nukleaseuttrykkingsvektoren pfz8 (FIG. 2). Fusjonsproteinene mellom FokI-nuklease og BamHIfragmentene kodet av AvrBs3 og PthXo1 er gitt i FIG. 26 og 27; SEQ ID NO:33 og 34. [0162] FokI-monomerene må dimerisere for å spalte, men den egnede lengden av avstandsstykket mellom de to DNA-gjenkjenningssetene var uklar. For ZFN-er, der sinkfingermatrisen separeres fra FokI ved en 4-7-aminosyrelinker, er det typiske avstandsstykket mellom de to gjenkjenningssetene -7 bp (Handel et al. (2009) Mol. Ther. 17:4-111). Siden f.eks. 23 aminosyrer separerer repeteringsdomenet fra FokI i BamHI TALEN-konstruksjonene som anvendes i dette dokumentet, ble en rekke avstandsstykkelengder for både BamHI- og SphI-konstruksjonene (6, 9, 12, 1 og 18 bp) anvendt. Som en positiv kontroll ble det anvendt en godt karakterisert sinkfingernuklease med et DNA-bindende domene avledet fra musetranskriberingsfaktoren Zif268 (Porteus and Baltimore (2003) Science 300:763). Som negative kontroller ble TAL-effektordomenene fusert til en katalytisk aktiv FokI-variant eller testet mot ikke-beslektede DNA-mål. [0163] Haploidcelletyper inneholdende enten TALEN-uttrykking eller målplasmid i 200 µl av overnattskulturen ble parret i YPD-medium ved 30 C. Etter 4 timer ble YPD-mediet erstattet med ml selektivt medium og inkubert over natten ved 30 C. De parrede kulturene ble lysert, ONPG-substratet tilsatt og absorbansen avlest ved 41 nm ved anvendelse av en 96-brønners plateleser (Townsend et al., ovenfor). β-galaktosidasenivåene ble beregnet som en funksjon av substratspaltingshastighet. Resultatene oppnådd med målrapportørkonstruksjonene som hadde et 1 bp avstandsstykke som separerer de to gjenkjenningssetene er vist i FIG. 22B. Alle nukleaseuttrykkingskonstruksjonene avledet fra SphI-fragmentet, som i hovedsak kodet for repeteringsmatrisen, klarte ikke å vise aktivitet, noe som indikerer at aminosyresekvenser i tillegg til de i repeteringsmatrisen er nødvendig for funksjon (FIG. 22B). Imidlertid ble robust aktivitet observert for både AvrBs3- og PthXo1- TALENene avledet fra BamHI-fragmentet (FIG. 22B). Aktiviteten til PthXo1-TALEN-en nærmet seg aktiviteten til den ZFN-positive kontrollen. Aktiviteten krevde det funksjonelle FokI-domenet og var spesifikk for DNA-målet gjenkjent av et gitt TALEN. [0164] Forsøkene ble også utført for å teste ulike avstander mellom TALeffektorbindingssetene (11 lengdevarianter mellom 12 og 30 bp), for å identifisere avstandsstykkelengder som gjør det mulig for FokI å dimerisere mest effektivt

61 (FIG. 28A). Begge enzymene viste to avstandsstykkelengdeoptimum - ett på 1 bp og det andre på enten 21 bp (AvrBs3) eller 24 bp (PthXo1). For PthXo1 ble aktiviteten observert for alle testede avstandsstykkelengder på 13 bp og lengre. Noen avstandsstykkelengder for AvrBs3 viste ingen aktivitet, men dette tyder imidlertid på at avstandsstykkelengden er kritisk for visse TALEN-er. [016] De ovennevnte forsøkene testet aktiviteten til de homodimere TALEN-ene, som binder to identiske gjenkjenningssekvenser plassert i opposisjon på hver side av avstandsstykket. Siden slike palindromiske seter er lite sannsynlige å forekomme naturlig i genomiske mål, ble forsøkene utført for å teste om TALEN-ene kunne fungere som heterodimerer. AvrBs3- og PthXo1-gjenkjenningssetene ble plassert i hode- til haleorientering på hver side av et 1 bp avstandsstykke. Aktiviteten til AvrBs3- og PthXo1-TALEN-ene individuelt og Zif268 på deres respektive mål ble målt som kontroller. Som en negativ kontroll ble en gjærkultur med bare målseteplasmidet for det heterodimere setet analysert for LacZ-aktivitet. Den resulterende aktiviteten til den heterodimere TALEN-en nærmet seg et gjennomsnitt av aktivitetene som ble observert med de to homodimere enzymene (FIG. 28B). [0166] For å teste om repeteringsdomener kunne settes sammen for å målrette TALEN-er til vilkårlige kromosomsekvenser, ble det valgt to gener som tidligere var målrettet for mutagenese med ZFN-er - ADH1 fra Arabidopsis og gridlock fra sebrafisk (Foley et al. (2009) PLoS One 4:e4348; og Zhang et al., ovenfor). Det ble utført et søk for bp sekvenser i de kodende regionene som ble innledet med en ' T og med en nukleotidsammensetning lik den til TAL-effektorbindingssetene identifisert av Moscou and Bogdanove (ovenfor). I ADH1 og gridlock forekom slike seter gjennomsnittlig hvert 7-9 bp. Fire 12 bp-seter ble valgt i ADH1 (i posisjonene 360, 408, 928 og 97 i den kromosomale gensekvensen) og et 13 bp-sete i gridlock (i posisjon 236 i den kromosomale gensekvensen; FIG. 29A). TAL-effektorrepeteringsdomener ble konstruert til gjenkjenning av disse målene, ved hjelp av de mest tallrike RVD-ene fra naturlige TAL-effektorer (NI for A, HD for C, NN for G, og NG for T). For å konstruere egendefinerte TALEN-er ble repeteringer med disse RVD-ene syntetisert hver for seg og satt inn i moduler av en, to eller tre repeteringer slik det beskrives i eksemplene 4 og. Disse modulene ble ligert sekvensielt inn i et derivat av tal1c-genet (Moscou and Bogdanove, ovenfor) som de opprinnelige repeteringene hadde blitt fjernet fra, og BamHI-fragmentene fra disse konstruerte TAL-effektorene ble fusert til sekvenser som koder for det katalytiske domenet til FokI i pfz8 (FIG. 2). Fem egendefinerte TALEN-er målrettet til ADH1 fra Arabidopsis og sebrafisk-gridlockgenet ble opprettet. [0167] De resulterende egendefinerte TALEN-ene ble testet i gjæranalyse som homodimere TALEN-er (dvs. at det identiske DNA-bindingssetet ble duplisert i invers orientering på hver side av et 16 til 18 bp avstandsstykke), selv om det skal bemerkes

62 at heterodimere TALEN-er ville måtte konstrueres for å rette spaltning ved naturlige forekommende DNA-mål. Avstandsstykkelengdene ble valgt på grunnlag av avstanden til nærmeste 1 bp fra 3'-enden av det neste tilgrensende (og motstående) kandidatsetet. Seksten bp avstandsstykker ble anvendt for ADH , ADH r og 18 bp avstandsstykker for ADH , ADH r og gridlock r. Gjæranalysen ble utført slik det beskrives ovenfor. [0168] Robust nukleaseaktivitet ble observert for ADH og gridlock r TALEN (FIG. 29B). ADH TALEN-en hadde beskjeden aktivitet som likevel var vesentlig over de negative kontrollene. For hver TALEN som ga positive resultater var nukleaseaktiviteten spesifikk for det beslektede målet. Disse resultatene indikerer at nye, funksjonelle TALEN-er kan skapes ved sammensetting av egendefinerte repeteringsdomener. Eksempel 7 - Naturlig forekommende mål- og TAL-effektorpar viser samlet og posisjonelt avvik i nukleotid- og RVD-sammensetningen [0169] De 20 parrede mål- og TAL-effektorene analysert av Moscou og Bogdanove (ovenfor) ble evaluert for samlet sammensetningsavvik og for posisjonelle effekter på nukleotid- eller RVD-frekvenser. Det ble observert at seter (på den positive tråden) var generelt A- og C-rike, og G-fattig. Gjennomsnittlig prosent A var 31 ± 16 % (1 standardavvik). Gjennomsnittlig prosent C var 37 ± 13 %. Gjennomsnittlig prosent G var 9 ± 8 %, og gjennomsnittlig prosent T var 22 ± %. Ettersom sammenstillingene varierer i lengde, ble analysen av posisjonseffekter begrenset til de fem posisjonene i hver ende. Påfallende var avviket i målsekvensene tydelig for A og mot T ved posisjonene 1 og 3, og for T i posisjon N og eventuelt 2. G var spesielt sjelden ved posisjon N-1. Dette avviket ble reflektert ved å samsvare RVD-er i effektorene, med NI som er mest vanlig i posisjonene 1 og 3, ingen NG ved posisjon 1, nesten alltid NG ved posisjon N og sjeldent NN ved posisjon N-1 (FIG. 30). Eksempel 8 - Fremgangsmåte og reagenser for rask sammensetting og kloning av egendefinerte TAL-effektorrepeteringsmatriser [0170] Golden Gate-kloningsmetoden [Engler et al. (2008), ovenfor; og Engler et al. (2009), ovenfor] benytter evnen til type IIS-restriksjonsendonukleaser (f.eks. BsaI) til å kutte utenfor deres gjenkjenningsseter til å opprette egendefinerte overheng for ordnet ligering av flere DNA-fragmenter samtidig. Ved hjelp av denne fremgangsmåten kan flere DNA-fragmenter fuseres til en matrise i en bestemt rekkefølge, og klones inn i en ønsket destinasjonsvektor i en enkelt reaksjon (FIG. 31). [0171] En fremgangsmåte og reagenser for montering av egendefinerte TALeffektorrepeteringskodende matriser ble utviklet basert på Golden Gate-systemet.

63 Når Bsal-setene plasseres på hver side av en TAL-effektorrepeteringskodende sekvens frigjør spaltingen et repeteringsfragment flankert av 4-bp overheng. Siden spaltingssetet ikke er sekvensspesifikt, ved svimling, kan repeteringskloner frigjøres med ordnede, komplementære overheng (klebrige ender), som muliggjør den ordnede sammensettingen av multi-repeteringsmatriser. [0172] Et bibliotek med 8 plasmider (FIG. 32A og 32B) ble generert for å tillate den samtidige sammensettingen av opptil repeteringsenheter i "undergrupper" etterfulgt av simultan sammensetting av en, to eller tre av disse undergruppene sammen med en endelig avkortet repetering til en komplett, egendefinert matrise. Ti forskjøvne sett av fire fragmenter, hvert fragment i et sett som koder for en repeteringsmodul med en som er forskjellig fra de fire mest vanlige RVD-ene, HD, NG, NI, og NN, ble syntetisert og klonet inn i en vektor som bærer tetracyklinresistensgenet, for totalt 40 plasmider. Fire flere fragmenter som kodet for den endeavkortede TAL-effektorrepeteringen av 20 aminosyrer, der hvert fragment koder for en som er forskjellig fra de fire mest vanlige RVD-ene, ble syntetisert og klonet inn i en annen vektor som bærer spektinomycinresistensgenet for å gi fire flere plasmider, betegnet som "siste repeteringsplasmider," FIG. 32A). Alle fragmentene i de forskjøvne settene flankeres av BsaI-seter i vektoren, slik at spaltningen med BsaI frigjør fragmentene med forskjellige klebrige ender som muliggjør sammensetting i den egnede rekkefølgen; dvs. at overhenget ved 3'-enden til et fragment for repeteringsmodulen 1 bare er komplementær til overhenget ved '-enden av fragmentet for repeteringsmodulen 2, overhenget ved 3'-enden av repeteringsmodulen 2 er bare komplementær med overhenget ved '-enden av repeteringsmodulen 3, og så videre. Fragmentene i de siste repeteringsplasmidene flankeres av seter for en annen type IIS-restriksjonsendonuklease, Esp3I. Fjorten ytterligere plasmider, som beskrives nedenfor, ble konstruert som destinasjonsvektorer for å motta sammensatte undergrupper. [0173] Den første destinasjonsvektoren, plasmid pfus_a ble konstruert til å motta den første undergruppen av repeteringer som skal settes sammen til en endelig matrise av 21 eller færre repeteringer (medregnet den endelige, avkortede repeteringen). pfus_a ble konstruert slik at spalting av BsaI danner et overheng på en side som er komplementær til overhenget på '-enden av den første repeteringsmodulen og et overheng på den andre siden som er komplementær med overhenget på 3'-enden av den. repeteringsmodulen. For å motta en andre undergruppe på eller færre repeteringer som skal settes sammen til en slik endelig matrise, ble destinasjonsvektorplasmidene pfus_b1, pfus_b2, pfus_b3, pfus_b4, pfus_b, pfus_b6, pfus_b7, pfus_b8, pfus_b9 og pfus_b konstruert slik at når de spaltes av BsaI har de overheng som er komplementære med henholdsvis overhenget i '-enden av den første repeteringsmodulen og 3'-enden av repeteringsmodulen for den tilsvarende nummererte posisjonen (f.eks. samsvarer pfus_b6-overhenget for 3'-enden av

64 undergruppen med overhenget av de fire repeteringsmodulfragmentene for posisjon 6). Matriser klonet i pfus_a- og pfus_b-seriene av plasmider flankeres av Esp 3Iseter i vektoren, og når de frigjøres ved fordøyning med Esp3I, har matrisene unike komplementære overheng som gjør at de kan ligeres i rekkefølge sammen med et endelig avkortet repeteringsfragment i destinasjonsvektoren ptal, som koder for en TALEN som mangler repeteringsregionen. ptal ble konstruert slik at spalting med Esp3I tillater innføring av repeteringsmatrisen på det riktige stedet og i den riktige orienteringen i kraft av et overheng i den ene enden som er komplementær med overhenget i '-enden av den første undergruppen av ti repeteringer og et overheng ved den andre enden som er komplementær til overhenget ved 3'-enden av det endelige avkortede repeteringsfragmentet (FIG. 33). [0174] De siste to destinasjonsvektorplasmidene, pfus_a30a og pfus_a30b, ble konstruert for å motta de første og andre ti repeteringsundergruppene som skal settes sammen til en endelig matrise på repeteringer. pfus_a30a og pfus_a30b ble konstruert slik at fordøyelsen med Esp3I frigjør oppstillingene med de riktige komplementære overhengene slik at matrisene kan ligeres i rekkefølge sammen med en tredje matrise fra en pfus_b-vektor og et endelig avkortet repeteringsfragment fra et siste repeteringsplasmid, frigjort på lignende måte ved fordøyning med Esp3I, i ptal (FIG. 32). [017] Alle destinasjonsvektorene har LacZ-genet klonet i mellom restriksjonsendonukleasesetene av type IIS, noe som muliggjør blå-hvit screening for rekombinanter. Bortsett fra ptal, som bærer et gen for ampicillinresistens, bærer alle destinasjonsvektorene et gen for spektinomycinresistens. [0176] For raskt å konstruere en egendefinert TAL-effektorrepeteringsmatrise ved hjelp av disse reagensene, ble den følgende fremgangsmåten etablert. I det første trinnet blandes de hensiktsmessige individuelle RVD-modulplasmidene for de nødvendige undergruppene med ti eller færre repeteringer sammen med den hensiktsmessige destinasjonsvektoren i et rør. T4 DNA-ligase og BsaI-endonuklease tilsettes og reaksjonen inkuberes i en PCR-maskin i sykluser på minutter ved 37 C og minutter ved 16 C, de respektive optimale temperaturene for de to enzymene. Reaksjonsblandingen behandles deretter med PLASMID-SAFE nukleasen for å hydrolysere alle lineære dsdna-fragmenter for å hindre kloning av kortere, ufullstendige matriser ved in vivo-rekombinasjon, og deretter anvendes blandingen til å transformere kjemisk kompetente E. coli-celler. De resulterende rekombinante plasmidene isoleres og de riktige konstruksjonene bekreftes. Deretter, i det andre trinnet, blandes de bekreftede plasmidene fra det første trinnet sammen med det passende siste repeteringsplasmidet og ptal, og fordøyelses- og ligeringsreaksjonssyklusen utføres som i det første trinnet. Til slutt innføres reaksjonsproduktene i E. coli, og den fulle lengden, den endelige matrisekonstruksjonen isoleres

65 og bekreftes. Protokollen kan gjennomføres av en person innen en ukes tid. [0177] Uttrykkingskonstruksjonene for TALEN-ene 8, 2 og 117 i tabell 4A, samt TALEN-ene HPRT og HPRT r, som beskrives i eksempel 14 nedenfor, ble laget ved hjelp av fremgangsmåten og reagensene som beskrives i dette eksemplet. [0178] Repeteringsmatrisene klonet i ptal subklones lett inn i andre TALeffektorgensammenhenger ved hjelp av de konserverte SphI-restriksjonsendonukleasesetene som flankerer repeteringsregionen. Eksempel 9 - Egendefinerte TALEN-data viser innledende støtte for "regler" og en sammenheng mellom RVD-antall og aktivitet [0179] Eksempel 6 beskriver forsøkene som er utført for å konstruere det TALEN- DNA-bindende domenet slik at det kan gjenkjenne unike DNA-sekvenser. Slik det beskrives gjenkjente disse egendefinerte TALEN-ene seter i Arabidopsis ADH1- og sebrafisk-gridlock-genene. Ytterligere egendefinerte TAL-effektor DNA-bindende domener ble konstruert for gjenkjenning av ikke bare seter i disse genene, men også i TT4-genet fra Arabidopsis og telomerase fra sebrafisk (Foley et al., ovenfor; og Zhang et al., ovenfor). Disse egendefinerte TALEN-ene ble gjort ved hjelp av fremgangsmåtene som beskrives i eksemplene 3, 4 og 8. I konstruering av de egendefinerte TALEN-ene ble de observerte kompositoriske og posisjonelle avvikene vedtatt som utformingsprinsipper eller "regler". Det ble først gjennomført et søk for sekvenser i de kodende regionene som ble innledet med en ' T og minst 1 bp i lengde, og som hadde en nukleotidsammensetning i samsvar med gjennomsnittene som nevnt ovenfor. Nærmere bestemt ble bare setene med 0-63 % A, % C, 0-2 % G og 2-42 % T valgt. Slike seter forekom i gjennomsnitt hvert 7-9. bp. Det ble deretter valgt seter som var i overensstemmelse med de observerte posisjonelle avvikene som beskrives ovenfor. Fra dette settet ble det identifisert to par bindingsseter i hvert gen som var 1-19 bp i lengde og separert ved 1-18 bp, slik at binding av de konstruerte TALEN-ene ville muliggjøre dimerisering av FokI. De modulære sammenstillingsfremgangsmåtene (eksempler 3 og 4) genererte dellengdekonstruksjoner. [0180] I alt ble det utformet 21 TALEN-er med mellomliggende og full lengde for å målrette 16 nukleotidsekvenser, hver med en matrise av ni repeteringer eller lengre. Aminosyresekvensene til disse TALEN-ene er tilveiebrakt i FIG. 34A-34U (SEQ ID NO:3-). Disse 21 TALEN-ene ble testet for deres evne til å spalte DNA ved hjelp av gjæranalysen som beskrives i eksemplene 2 og 6. Aktivitetsdata er vist i FIG. 3 og oppsummert i tabell 4A. [0181] Noen av de mellomliggende dellengde-talen-ene tilsvarer mål som bryter reglene for nukleotidsammensetning og ende-t. Tabell 4A viser lengde, i samsvar med disse to reglene, og aktivitet i forhold til den til ZFN268 for hvert TALEN. Resultatene

66 avdekker en generell trend som viser at ved å øke lengden på RVD-matrisen øker man aktiviteten til den resulterende TALEN-en. Dette tyder på at det er et minimalt antall RVD-er som er nødvendig før et DNA-mål kan gjenkjennes in vivo. Videre ser overensstemmelse med reglene ut til å være viktig. Av de seks TALEN-ene som ikke viser noen detekterbar aktivitet, krenket to målsammensetningsregelen, to endte ikke i NG, og en annen brøt begge reglene (en adlød begge reglene). Tre av de åtte TALENene med aktivitet under 2 % av ZFN268 brøt én av reglene, og én av fire TALEN-er med aktivitet 2-0 % av ZFN268 hadde ikke en RVD-sekvens som endte med NG. Det bemerkes at TALEN-er med aktivitet 0 % eller større enn aktiviteten til ZFN268 adlød alle reglene, og for TALEN-er av samme lengde, hadde regelbrytere generelt mindre aktivitet enn adlydende matriser. I samsvar med den generelle trenden om lengde, selv for mellomprodukter som ikke brøt noen regler, hadde de tilsvarende fullengde-talen-ene høyere aktivitet (tabell 4A og FIG. 3). Variasjon i avstandsstykkelengden som følge av TALEN-lengdeforskjeller på det samme målet kan ha bidratt til denne observasjonen, men et område avstandsstykkelengder tolereres (Christian et al., ovenfor). [0182] Noen kompleksiteter i dataene var tydelige. F.eks. varierte aktiviteten mellom lydige TALEN-er av samme lengde, noen korte matriser hadde moderat høy aktivitet, og noen lange matriser som adlød hadde liten eller ingen aktivitet (tabell 4B). Ikke desto mindre tilveiebrakte resultatene støtte for konklusjonene at 1) generelt fører et større antall repeteringer til økt aktivitet, og 2) konformitet til sammensetning og posisjonssavviksregler er viktig for aktiviteten. Derfor ble de følgende utformingsprinsippene avledet TAL-effektorbindingsseter utformes til å være minimum 1 baser lange og orientert fra ' til 3' med en T umiddelbart før setet på '-enden. Et sete kan ikke ha en T i den første (') posisjonen eller en A i den andre posisjonen. Et sete må ende med T (3'), og kan ikke ha en G på den nest siste posisjonen. Basesammensetningen til setet må falle innenfor spesifiserte områder (gjennomsnitt ± to standardavvik): En 0-63 %, C %, G 0-2 % og T 2-42 %. Gen Tabell 4A Aktivitet, samsvar med reglene og lengdene til TALEN-er testet i gjæranalysene. TALEN Navn fra Christian et al. (supra) RVDer Aktivitet % GATC telomerase N Y Slutter på NG RVD-sekvens1 HD NN NN NG NG NG NN HD NG

67 66 Gen Aktivitet, samsvar med reglene og lengdene til TALEN-er testet i gjæranalysene. TALEN Navn fra Christian et al. (supra) Aktivitet % GATC gridlock + N N ADH1 8 ADH1 63 ADH1 68 ADH1 73 RVDer ADH ADH r ADH ADH r Y N 12 - Y N 12 + Y Y 12 - N N TT Y N gridlock 6 gridlock r Y Y ADH Y Y ADH Y Y ADH Y Y TT Y Y telomerase Y Y telomerase N Y gridlock Y Y Slutter på NG RVD-sekvens1 NI HD HD HD HD NG HD NG HD HD NI NG HD NI NI NN NI NG NG HD NG HD HD HD HD NI NN NI NI NN NG NI NI NI HD HD NN NN NI NG NN HD NG HD HD NG NI NN NI HD NI NI NI HD HD NI HD NI NN NN HD NI HD NG NN HD NG NI NI HD NI HD HD HD HD NG HD NG HD HD NN HD NG HD HD HD NI NN NI NI NN NG NI NI NI HD NI NG ND ND NN NN NI NG NN HD NG HD HD NG HD NG NG NI NN NI HD NI NI NI HD HD NI HD NI NI HD NG NN NN HD NI HD NG NN HD NG NI NI HD HD HD NG HD NG NG NN NG HD HD NN HD NI NG NN NI NG NG HD NN NN NG NG NG NN HD NG NI NG HD NN NG NG NI HD HD HD HD NG HD NG HD HD NN HD NG NG HD

68 67 Gen Aktivitet, samsvar med reglene og lengdene til TALEN-er testet i gjæranalysene. TALEN Navn fra Christian et al. (supra) RVDer Aktivitet % GATC gridlock Y Y telomerase Y Y telomerase N Y ADH Y Y TT Y Y gridlock Y N 1 De testede målsekvensene består av inverterte repeteringer av den tilsvarende nukleotidsekvensen, der HD, NG, NI og NN tilsvarer henholdsvis C, T, A og G, adskilt av en avstandsstykkesekvens på bp. Tabell 4B Utdrag fra tabell 4A, sortert etter aktivitetsnivå Slutter på NG RVD-sekvens1 NG RVD-er Aktivitet % GATC Slutter på NG 9 - n y 12 - y n 12 - n n 12 - y n 1 - y y 1 - n y HD HD HD NN NN NI NI NN HD HD NN NI HD NN HD NG NI NG NG HD HD HD HD NI HD NN NI NN HD NG HD NG NI NN NI HD NI NN NN NI NI NN NG NN NN NI NN HD NG NI NG HD NI NI NN NI HG NG HD NG HD NG NG HD NI HD NG NI HD NG HD HD NN HD HD NG NN NI NI NN HD NI HD NI NG NN NN HD NG HD NI HD HD NG NI HD NI NI HD NN NI HD NI

69 68 Utdrag fra tabell 4A, sortert etter aktivitetsnivå RVD-er Aktivitet % GATC Slutter på NG + n n 12 + y y 1 + y y 1 + y y 16 + y y 17 + n y 18 + y y 18 + y n y n y y 1 ++ y y y y y y y y y y 1 20 Eksempel - Heterodimere TALEN-par spalter deres tiltenkte naturlig forekommende målsekvenser i gjæranalysen [0183] Dataene i eksemplene 2, 6 og 9 viser at egendefinerte TALEN-er kan konstrueres for gjenkjenning av nye mål-dna-sekvenser. Gjæraktivitetsdataene for de egendefinerte TALEN-ene ble samlet ved hjelp av individuelle TALEN-monomerer som gjenkjente et homodimerisk målsete. Dvs. at målsekvensen til TALEN-en ble duplisert i invers orientering på hver side av et avstandsstykke på 1 til 18 bp. Spalting av endogene kromosomsekvenser ville imidlertid generelt kreve at to forskjellige egendefinerte TALEN-er gjenkjenner to forskjellige sekvenser på begge sider av et avstandsstykke. Slik det beskrives i eksempel 6 ble denne evnen demonstrert for AvrBs3- og PthXo1-TALEN-ene sammen ved hjelp av et tilsvarende kimært målsete i gjæranalysen. Vi testet om to forskjellige egendefinerte TALEN-er kunne gjenkjenne og spalte en naturlig forekommende DNA-sekvens. Ved hjelp av gjæranalysen som beskrives i eksempel 2, ble egendefinerte TALEN-er utformet til å spalte to forskjellige målsekvenser i Arabidopsis ADH1-genet analysert for aktivitet på disse målene. DNAsekvensene til målsetene og de tilsvarende TALEN-ene er vist i FIG. 36A. Aminosyresekvensene i TALEN-ene tilveiebringes i FIG. 34. Beta-galaktosidaseaktiviteten som ble oppnådd i gjæranalysen plottes i diagrammet vist i FIG. 36B. Aktiviteten til TALEN-ene på deres naturlig forekommende målsekvens var vesentlig

70 69 høyere enn de negative kontrollene, noe som indikerte at TALEN-ene kan konstrueres for gjenkjenning og spalting av endogene mål-dna-sekvenser Eksempel 11 TALEN-er spalter naturlige gener i Arabidopsis og innfører mutasjoner ved upresis ikke-homolog endesammenføyning [0184] Ett av de aktive TALEN-parene utformet for gjenkjenning av en målsekvens i Arabidopsis-ADH1-genet ble testet for å bestemme om det kan binde, spalte og mutere kromosomal DNA. Hver av de individuelle ADH1 TALEN-ene omfattende dette paret (ptalen-er 69 og 74) ble klonet inn i planteuttrykkingsvektoren pfz14, som plasserer TALEN-ene under kontroll av den konstitutive 3S-promotoren (Zhang et al., ovenfor). De resulterende konstruksjonene ble deretter innført i Arabidopsisprotoplaster ved hjelp av elektroporering. Etter 48 timer ble genomisk DNA isolert og fordøyd med Tth1111. Et Tth1111-spaltesete ligger i avstandsstykkesekvensen mellom de to TALEN-gjenkjenningssetene (FIG. 37A). Spalting av det kromosomale DNA-et av TALEN-en ville forventes å innføre mutasjoner av upresis ikke-homolog endesammenføyning (NHEJ), noe som ville føre til at man ikke kunne spalte ved Tth1111. Et 37 bp fragment som omfatter TALEN-gjenkjenningssetet ble deretter PCR-amplifisert. PCR-produktet ble fordøyd på nytt med Tth1111 for å fjerne mesteparten av det gjenværende genomiske DNA-et som ikke ble modifisert av TALEN-formidlet NHEJ. Fordøyningsproduktene ble deretter kjørt på en agarosegel. Det ble observert et uspaltet PCR-produkt og slike uspaltede PCR-produkter er diagnostiske for nukleaseaktivitet (i dette tilfellet TALEN-aktivitet) ved den endogene målsekvensen (Zhang et al., ovenfor). Det ukuttede DNA-et ble klonet og analysert ved DNA-sekvensering. Sekvenseringen av ni uavhengige kloner avdekket at seks hadde mutasjoner innført av NHEJ (FIG. 37B). Dermed spalter TALEN-er endogene kromosomale lokus og innfører DNA-dobbelttrådbrudd og mutasjoner. Eksempel 12 - Styrking av målrettingskapasiteten [018] I kjernen av TAL-effektor-DNA-koden har hver av de fire mest vanlige RVDene tilsynelatende en-til-en-spesifisitet for de fire nukleotidene, basert på assosiasjonsfrekvenser. Dette er merkbart slik for HD, NG og NI, men mindre for NN (FIG. 1 C). NN assosieres hyppigst med G, men nesten like ofte med A, og noen ganger med C eller T. For en tilfeldig sammensatt TAL-effektor med NN på fire steder i en 13 RVD-sekvens, ga det den beste aktiviteten å ha G på alle tilsvarende posisjoner i et kunstig mål (Boch et al. (2009) Science 326: 9-112). A reduserte aktiviteten, men avskaffet den ikke, mens C og T eliminerte den detekterbare aktiviteten. Et drastisk tap av aktivitet ble observert når C, T eller A ble substituert med G på bare den første posisjonen i bindingssetet til 24-RVD-effektoren PthXo1, som er en NN

71 (Romer et al. (20) New Phytol. 187:48-7). Dette var imidlertid i kontrast til observasjonen at det mye kortere AvrHah1 (14 RVD-er) begynner med en NN som er i tråd med A, og 23-RVD-effektoren PthXo6 har tre NN-er på rad i posisjonene 4-6 som hver sammenstilles med A, men begge disse proteinene er meget aktive (se Schornack et al. (2008) New Phytol. 179:46-6; og Romer et al., ovenfor). Dermed synes spesifisiteten til NN for G å være generelt svak og kan variere med konteksten. [0186] Den observerte invariansen av tymin umiddelbart før TAL-effektormålseter er et krav til flere effektorer [Boch et al., ovenfor; Romer et al., ovenfor; og Romer et al. (2009) Plant Physiol. : ]. Aminosyresekvensen rett før den repeterende regionen i TAL-effektorer, som er sterkt konserverte (FIG. 38A), deler vesentlig likhet med repeteringen, både i aminosyresekvens og i forutsagt sekundærstruktur (FIG. 38B og Bodganove et al. (20) Curr. Opin. Plant Biol. 13: ). Det ble antatt at denne sekvensen, betegnet den "0." repeteringen, er grunnlaget for kravet til T i posisjon -1 av bindingssetet, og at rester i den RVD-analoge posisjonen (FIG. 38B) spesifiserer nukleotidet. [0187] Basert på disse funnene, ble det antatt at ved å innføre repeteringer med høy spesifisitet for G, og ved å redusere kravet til T ved -1, kan man øke målrettingskapasiteten for konstruerte TAL-effektorproteiner. Forsøkene ble igangsatt for å teste nye og sjeldne RVD-er for mer robust spesifisitet for G enn NN viser, og å erstatte de RVD-analoge restene av 0.-repeteringen med vanlige RVD-er. [0188] Nye og sjeldne RVD-er for robust spesifisitet for G: Modulene offentliggjort ovenfor (se f.eks. eksempel 4) anvendte fire spesielle RVD-er (NI, HD, NN og NG) for å spesifisere binding til de fire nukleotidbasene (henholdsvis A, C, G og T). Repeteringene inneholdende andre RVD-er kan også være nyttige, og kan ha økt spesifisitet og/eller affinitet for de fire basene i forhold til NI, HD, NN og NG. Mot bedre spesifisitet for G ble flere repeteringer som koder for nye og sjeldne RVD-er konstruert. De sjeldne RVD-ene NK, HN og NA forbandt seg med G, noe som tyder på at N kan være viktig som den ene eller de andre av restene (FIG. 1C). Dermed ble det konstruert et bredt sett av derivater som koder for repeteringer som har RVD-ene vist i tabell. Den venstre kolonnen viser RVD-er som har en polar aminosyre (R, K, D, E, Q, H, S, T eller Y) ved posisjon 12 og N ved posisjon 13. De høyre kolonnene lister opp kombinasjoner av N i den første posisjonen med hvilken som helst av 17 andre aminosyrer (G, L, V, R, K, D, E, Q, H, T, M, C, P, Y, W eller F) i den andre posisjonen til RVD-et. For å ta hensyn til muligheten for større spesifisitet uten N, ble repeteringene også foretatt med en polar aminosyre (R, K, D, E, Q, H, S, T eller Y) ved posisjon 12 og et hull (*) ved posisjon 13 (midtre kolonne). [0189] Nye kunstige RVD-er testes for funksjon i en kvantitativ rapportørgenbasert analyse for transkripsjonell aktiveringsaktivitet av TAL-effektorer, så som en GUS eller dobbelt luciferaserapportørbasert, Agrobacterium-formidlet transient

72 71 uttrykkingsanalyse i Nicotiana benthamiana, eller i den lacz-rapportørbaserte TALENanalysen i Saccharomyces cerevisiae, som beskrives ovenfor (se f.eks. eksempel 2). Repeteringsmoduler inneholdende RVD-ene som skal testes innlemmes i en TALeffektor eller TALEN med målbare og undermetningsaktivitetsnivå, og de resulterende proteinene testes for forskjeller i aktivitet på et sett av DNA-mål med integrerte permutasjoner av alle fire nukleotider ved tilsvarende posisjoner. Nærmere bestemt, ved å starte med PthXo1-varianten(e) minimalt aktive i in planta- og gjæranalysene og responsive på uoverensstemmelser ved tre tilsatte repeteringer, testes TALEN-er inneholdende hver av de nye og sjeldne repeteringene (i homomere grupper på tre) in vivo mot mål med G ved hver av de tilsvarende posisjonene. For hver som viser økt aktivitet repeteres analysene med mål permutert til de andre nukleotidene ved disse posisjonene, for å fastslå spesifisiteten. Tabell. RVD-er som skal testes a 1 Polar+N Polar* N+alle RN R* NG NH KN K* NA NT DN D* NL NM EN E* NV NC QN Q* NR NP HN H* NK NY SN S* ND NW TN T* NE NF YN Y* NQ an*-, NG- og NS-ntassosieringsfrekvensene er kjent. En stjerne representerer et mellomrom som tilsvarer den 2. posisjonen i RVD-en (dvs. den 13. posisjonen i konsensusrepeteringssekvensen). [0190] Felles RVD-substitusjoner for den RVD-analoge posisjonen til 0.-repeteringen for å redusere spesifisiteten til T i posisjon -1: Sekundære strukturforutsigelser og sammenstillingen av 0.-repeteringen og repeteringskonsensussekvenser antydet at

73 posisjonene okkupert av KR* (stjerne betegner et mellomrom) i 0- te -repeteringen var analog med RVD-en og var dermed restene som spesifiserer T ved -1. Varianter av PthXo1 med substitusjoner av HD, NG, NI og NN for KR og separat for R* ble konstruert i Tal1c-"ryggrad"-konstruksjonen som beskrives ovenfor. Aktivitetene til disse variantene sammenlignes med villtypeeffektoren i in planta. og gjæranalysene ved hjelp av mål med tilsvarende nukleotider i posisjon -1, nemlig henholdsvis C, T, A og G. Det konstrueres andre varianter av PthXo1 som har S, resten ved posisjon 11 i konsensusrepeteringssekvensen, substituert for K i posisjon 11 i den 0. repeteringen. Og det konstrueres andre varianter som har denne substitusjonen kombinert med en substitusjon for K, resten i posisjon 16 til konsensusrepeteringssekvensen, for V i posisjon 1 i den 0.-repeteringen (tabell 6). Det kan inkluderes en proksimal TATAboks for TAL-effektoraktivitet. I tillegg er PthXo1 nyttig for dette forsøket fordi, i motsetning til AvrBs3, for hvilken T ved -1 ser ut til å være en del av en TATA-boks, er TATA-boksen nærmest PthXo1-bindingssetet 46 bp nedstrøms, og vil ikke bli forstyrret av modifikasjoner ved -1. [0191] Hvis de ovennevnte modifikasjonene ikke resulterer i forbedret målretting for G eller økt evne til å målrette sekvenser innledet av andre enn T-nukleotider, testes et mer omfattende sett av kunstige RVD-er for G-spesifisitet, og andre substitusjoner enn felles RVD-ene testes for den 0.-repeteringen. Tabell repeteringskonstruksjoner som skal foretas og testes for spesifisitet for mål med A, C, G eller T ved -1 posisjonen Naturlig 0.-repeterings- Substitusjon som Substitusjon som Substitusjon som Substitusjon som sekvens (spesifiserer T spesifiserer T spesifiserer A spesifiserer C spesifiserer C ved -1)...KIA*KRGGV...(74)...KIA*NGGGV...(7)...KIA*NIGGV...(76)...KIA*HDGGV...(77)...KIA*NNGGV...(78)...KIA*KRGGV...(79)...KIASNGGGV...(80)...KIASNIGGV...(81)...KIASHDGGV...(82)...KIASNNGGV...(83)...KIAKR*GGV...(84)...KIAKNGGGV...(8)...KIAKNIGGV...(86)...KIAKHDGGV...(87)...KIAKNNGGV...(88)...KIA*KRGGV...(89)...KIASNGGGK...(90)...KIASNIGGK...(91)...KIASHDGGK...(92)...KIASNNGGK...(93) Kandidat- og substituerte RVD-er er i fet skrift. Andre substitusjoner eller modifikasjoner er understreket. Stjernene betegner et mellomrom i forhold til konsensusrepeteringssekvensen. SEQ ID NO: 2 Eksempel 13 - Nye spådde nukleotidspesifikke RVD-er [0192] Det ble observert at når RVD-ene oppført i tabellene 1A og 1B ble gruppert etter den andre aminosyreresten i RVD-en (dvs. den 13. i den totale repeteringen), var

74 det en nær perfekt korrelasjon mellom denne aminosyren og nukleotidet/nukleotidene som er spesifisert av RVD-en, uavhengig av aminosyren i den første posisjonen til RVD-en (tabell 7). Dermed spesifiserer RVD-er som ender i et mellomrom (merket med en stjerne) C eller T, eller T; RVD-er som ender på D spesifiserer C; RVD-er som ender på G spesifiserer T; og RVD-er som ender på N spesifiserer G eller A eller G. Det ble også observert at aminosyrene i posisjon 1 til RVD-en var enten H, I, N, S eller Y. Disse observasjonene antydet at RVD-spesifisiteten bestemmes av resten i den andre posisjonen, uavhengig av om resten ved den første posisjonen er H, I, N, S eller Y. Derfor ble spesifisitetene forutsagt for flere nye (dvs. ennå uobserverte) RVD-er som kombinerer rester observert ved den andre posisjonen med restene H, I, S, N eller Y ved den første posisjonen. Dermed ble I*, S* og Y* spådd å spesifisere C eller T, eller T; ID, SD og YD ble spådd å spesifisere C; SG ble spådd å spesifisere T: og IN og YN ble spådd å spesifisere G eller A, eller G. Også, selv om det bare var én forekomst av K i den andre posisjonen, basert på den observerte spesifisiteten for NK, ble det spådd at HK, IK, SK, og YK spesifiserer G. [0193] Disse nye RVD-ene testes og sammenlignes med eksisterende RVD-er for funksjon og spesifisitet i kvantitative TAL-effektor- og TALEN-aktivitetsanalyser som det som beskrives i eksemplene 2 og 11. Tabell 7 1 RVD-er gruppert og avgrenset av deres andre rest 1.-rest 2.-rest Nukleotid N * C eller T H * T H A C N A G H D C N D C H G T I G T N G T Y G T N I A H I C

75 74 RVD-er gruppert og avgrenset av deres andre rest 1.-rest 2.-rest Nukleotid N K G H N G S N G eller A N N G eller A 1 N S A eller C eller G 1 1 En stjerne angir et mellomrom. RVD-grupper med like spesifisiteter er innrammet i tykke linjer Eksempel 14 - Egendefinerte TALEN-er spalter endogene mål i dyreceller og innfører mutasjoner med upresis ikke-homolog endesammenføyning [0194] For å teste hvorvidt TALEN-er kunne anvendes for målrettet mutagenese i dyreceller ble først uttrykking av TAL-effektorene AvrBs3, PthXo1 og Tal1c testet i humane embryoniske nyre-293t-celler (HEK-293T-celler). Stoppkodonet ble fjernet fra de AvrBs3-, PthXo1- og Tal1c-kodende genene og genene ble subklonet inn i pattedyruttrykkingsvektoren pcdna3.2/v-dest (Invitrogen, Carlsbad, CA) i ramme med nedstrømssekvensen i den vektoren som koder for V-epitopen for proteinimmunodeteksjon. pcdna3.2/v-dest plasserer TAL-effektorgenet under kontroll av den konstitutive humane cytomegaloviruspromotoren (CMV-promotoren). HEK- 293T-cellene ble transfektert ved anvendelse av Lipofectamine 2000 (Invitrogen) med de resulterende plasmidene individuelt, og etter 24 timer ble totalproteinene isolert fra hver transfekterte sats av celler og underkastet polyakrylamidgelelektroforese, Western blotting og immunmerking ved hjelp av et muse-anti-v-antistoff. De merkede proteinene ble detektert med et geite-anti-muse-antistoff-pepperrotperoksidasekonjugat ved anvendelse av det SuperSignal Weat Pico-kjemiluminescerende settet (ThermoScientific, Inc.). Tilsvarende lasting ble bekreftet ved immunomerking og detektering av aktin. Hvert TAL-effektorprotein ble detekterbart uttrykt uten noen åpenbar nedbrytning (FIG. 39). [019] Deretter ble det utformet et par TALEN-er som det som beskrives i eksempel 9 for å målrette en sekvens i det endogene humane HPRT-genet, og navngitt HPRT og HPRT r (FIG. 40A og FIG. 40B). Plasmidene ptalen141 som koder for HPRT og plasmidet ptalen142 som koder for HPRT r ble konstruert ved hjelp av den Golden Gate-kloningsbaserte fremgangsmåten og reagensene som beskrives i eksempel 8. TALEN-genene ble deretter subklonet inn i pattedyruttrykkingsvektoren pcdna3.1(-) (Invitrogen, Inc.), som plasserer dem under

76 7 1 kontroll av den konstitutive CMV-promotoren, som ga plasmidene ptalen141m og ptalen 142m. HEK 293T-celler ble så transfektert med både ptalen141m og ptalen142m sammen og hver for seg med pcdna3.1(-) som en negativ kontroll. Etter 72 timer ble genomisk DNA isolert og fordøyet med restriksjonsendonuklease BpuI. Et BpuI-sete eksisterer inne i avstandsstykket som separerer HPRT og HPRT r-bindingssetene i HPRT (FIG. 41A). Etter BpuI-fordøyelsen ble PCR anvendt til å forsterke et 244 bp fragment som spenner over det TALENmålrettede setet fra både de TALEN-behandlede prøvene og kontrollprøvene. Det forventede fragmentet ble amplifisert fra begge prøvene, noe som indikerer at BpuIfordøyelsen av det genomiske DNA-er har vært ufullstendig. Etterfølgende fordøyning av PCR-produktene med BpuI resulterte imidlertid i fullstendig fordøyning av produktet amplifisert fra kontrollprøven, men ufullstendig spalting av produktet fra den TALEN-behandlede prøven (FIG. 41B). Nærværet av spaltningsresistent PCR-produkt i den TALEN-behandlede prøven tilveiebringer bevis for at det endogene BpuI-setet ble mutert in vivo som et resultat av mangelfull reparasjon av ikke-homolog endesammenføyning av et TALEN-formidlet dobbelttrådet brudd på det tiltenkte målet i HPRT. Dermed kan TALEN-er anvendes for målrettet mutagenese i pattedyrceller.

77 76 P a t e n t k r a v Fremgangsmåte for modifisering av det genetiske materialet i en celle, omfattende: (a) å tilveiebringe en celle inneholdende en mål-dna-sekvens; og (b) å innføre en vektor i cellen som koder for en transkriberingsaktivatorlignende (TAL) effektorendonuklease, idet TAL-effektorendonukleasen er omfattende: (i) et endonukleasedomene som kan spalte dobbelttrådet DNA, der endonukleasedomenene er fra en restriksjonsendonuklease av type II, og (ii) et TAL-effektordomene omfattende flere TAL-effektorrepeterte sekvenser som, i kombinasjon, binder til en spesifikk nukleotidsekvens i mål-dna-sekvensen, slik at TAL-effektorendonukleasen spalter mål-dna-sekvensen inne i eller tilstøtende den spesifikke nukleotidsekvensen i cellen eller avkommet derav. 2. Fremgangsmåten ifølge krav 1, videre omfattende tilveiebringelse til cellen av en nukleinsyre omfattende en sekvens som er homolog med minst en del av mål-dnasekvensen, slik at homolog rekombinasjon forekommer mellom mål-dna-sekvensen og nukleinsyren. 3. Fremgangsmåten ifølge krav 1 eller krav 2, der cellen er en pattedyrcelle. 4. Fremgangsmåten ifølge krav 1 eller krav 2, der cellen er en plantecelle. 2. Fremgangsmåten ifølge hvilket som helst av kravene 1 til 4, der innføringen omfatter transfektering av cellen med en vektor som koder for TAL-effektorendonukleasen. 6. Fremgangsmåten ifølge hvilket som helst av kravene 1 til, der restriksjonsendonukleasen av type II er FokI Fremgangsmåten ifølge hvilket som helst av kravene 1 til 6, der TALeffektordomenet som binder til en spesifikk nukleotidsekvens i mål-dna-sekvensen omfatter eller flere TAL-effektorrepeterte sekvenser, mer foretrukket 1 eller flere TAL-effektorrepeterte sekvenser. 8. Fremgangsmåten ifølge krav 7, der hver TAL-effektorrepeteringssekvens omfatter en repeteringsvariabel-direst (RVD) som bestemmer gjenkjenning av et basepar i mål-dna-sekvensen, der hver TAL-effektorrepeteringssekvens er ansvarlig

78 77 for gjenkjenning av et basepar i mål-dna-sekvensen, og der RVD-en omfatter én eller flere av: HD for gjenkjenning av C; NG for gjenkjenning av T; NI for gjenkjenning av A; NN for gjenkjenning av G; NS for gjenkjenning av A; HG for gjenkjenning av T; IG for gjenkjenning av T; NK for gjenkjenning av G; HA for gjenkjenning av C; ND for gjenkjenning av C; HI for gjenkjenning av C; HN for gjenkjenning av G; og NA for gjenkjenning av G. 9. Fremgangsmåte for generering av en nukleinsyre som koder for en TALeffektorendonuklease, der fremgangsmåten er omfattende: (a) identifisering av en første unik nukleotidsekvens i genomet til en celle; og (b) syntetisering av en nukleinsyre som koder for en TAL-effektorendonuklease som omfatter (i) flere TAL-effektorrepeteringssekvenser som, i kombinasjon, binder til den første unike nukleotidsekvensen, og (ii) en endonuklease som genererer et dobbelttrådet brudd inne i eller tilstøtende den første nukleotidsekvensen, der hver TAL-effektorrepeteringssekvens omfatter en RVD som bestemmer gjenkjenning av et basepar i mål-dna-et, der hver TAL-effektorrepeteringssekvens er ansvarlig for gjenkjenning av ett basepar i mål-dna-et, og der TAL-effektorendonukleasen omfatter én eller flere av følgende RVD-er: HD for gjenkjenning av C; NG for gjenkjenning av T; NI for gjenkjenning av A; NN for gjenkjenning av G; NS for gjenkjenning av A; HG for gjenkjenning av T; IG for gjenkjenning av T; NK for gjenkjenning av G; HA for gjenkjenning av C; ND for gjenkjenning av C; HI for gjenkjenning av C;

79 78 HN for gjenkjenning av G; og NA for gjenkjenning av G. 1. Fremgangsmåten ifølge krav 9, der den første nukleotidsekvensen oppfyller minst ett av følgende kriterier: i) er minimum 1 baser lang og orienteres fra ' til 3' med en T rett foran setet ved '-enden; ii) ikke har en T i den første (') posisjonen eller en A i den andre posisjonen; iii) ender på T i den siste (3') posisjonen, og ikke har en G på den nest siste posisjonen; og iv) har en basissammensetning på 0-63 % A, % C, 0-2 % G, og 2-42 % T. 11. Fremgangsmåten ifølge krav 9 eller krav, videre omfattende identifisering av en andre nukleotidsekvens i genomet av cellen, der de første og andre nukleotidsekvensene separeres ved 1-18 bp. 12. Fremgangsmåten ifølge hvilket som helst av kravene 9 til 11, der endonukleasen genererer et dobbelttrådet brudd mellom de første og andre nukleotidsekvensene En TAL-effektorendonukleasemonomer omfattende et endonukleasedomene og et TAL-effektor-DNA-bindende domene som er spesifikt for et mål-dna, der endonukleasedomenet er fra en restriksjonsendonuklease av type II, der det DNAbindende domenet omfatter flere TAL-effektorrepeteringssekvenser, idet hver TALeffektorrepeteringssekvens er omfattende en RVD som bestemmer gjenkjenning av et basepar i mål-dna-et, og der hver TAL-effektorrepeteringssekvens er ansvarlig for gjenkjenning av ett basepar i mål-dna-et TAL-effektorendonukleasemonomeren ifølge krav 13, der restriksjonsendonukleasen av type II er FokI TAL-effektorendonukleasemonomeren ifølge krav 14, der monomeren fungerer som en dimer med en annen monomer over et todelt gjenkjenningssete med et avstandsstykke, slik at FokI kan dimerisere og lage et dobbelttrådet brudd i mål-dnaet i avstandsstykket. 16. TAL-effektorendonukleasemonomeren ifølge krav 13, der TALeffektorendonukleasemonomeren omfatter én eller flere av de følgende RVD-ene: HD for gjenkjenning av C;

80 NG for gjenkjenning av T; NI for gjenkjenning av A; NN for gjenkjenning av G; NS for gjenkjenning av A; HG for gjenkjenning av T; IG for gjenkjenning av T; NK for gjenkjenning av G; HA for gjenkjenning av C; ND for gjenkjenning av C; HI for gjenkjenning av C; HN for gjenkjenning av G; og NA for gjenkjenning av G. 17. TAL-effektorendonukleasemonomeren ifølge krav 13, der aminosyresekvensen til TAL-effektorendonukleasen har minst 9 % identitet med en sekvens valgt fra SEQ ID NO:33 til SEQ ID NO:, SEQ ID NO:72 og SEQ ID NO: Fremgangsmåte for generering av ikke-humane dyr, omfattende: i) tilveiebringelse av en eukaryot celle omfattende en mål-dna-sekvens som det er ønskelig å føre en genetisk modifikasjon inn i, der cellen omfatter en nukleinsyre som koder for en TAL-effektorendonuklease ifølge hvilket som helst av kravene 13 til 17; ii) generering av et dobbelttrådet brudd i mål-dna-sekvensen med TAL-effektorendonukleasen; og iii) generering av ikke-humant dyr fra cellen eller avkommet derav, der et dobbeltrådet brudd har funnet sted. 19. Fremgangsmåten ifølge krav 18, videre omfattende: innføring i cellen av en eksogen nukleinsyre omfattende en sekvens som er homolog med minst en del av mål-dna-et, der innføringen er under forhold som muliggjør forekommelse av homolog rekombinasjon mellom den eksogene nukleinsyren og mål- DNA-sekvensen i cellen eller avkommet derav; og generering av ikke-humant dyr fra cellen eller avkommet derav der den homologe rekombinasjonen har funnet sted. 20. Fremgangsmåte for generering av en plante, omfattende: i) tilveiebringelse av en plantecelle omfattende en mål-dna-sekvens inn i hvilken det er ønskelig å innføre en forhåndsvalgt genetisk modifikasjon, der plantecellen omfatter en nukleinsyre som koder for en TAL-effektorendonuklease ifølge hvilket som helst av kravene 13 og 17;

81 80 ii) generering av et dobbelttrådet brudd i mål-dna-sekvensen med TALeffektorendonukleasen; og iii) generering av en plante fra cellen eller avkommet derav, der et dobbeltrådet brudd har funnet sted. 21. Fremgangsmåten ifølge krav 20, videre omfattende: innføring i plantecellen av en eksogen nukleinsyre omfattende en sekvens som er homolog med minst en del av mål-dna-sekvensen, der innføringen er under forhold som muliggjør forekommelse av homolog rekombinasjon mellom den eksogene nukleinsyren og mål-dna-sekvensen i cellen eller avkommet derav; og generering av en plante fra cellen eller avkommet derav, der homolog rekombinasjon har funnet sted Fremgangsmåte for målrettet genetisk rekombinasjon i en celle, omfattende: i) innføring i cellen av en nukleinsyre som koder for en TAL-effektorendonuklease ifølge hvilket som helst av kravene 13 til 17, der TAL-effektorendonukleasen målrettes mot en valgt DNA-målsekvens; ii) indusering av uttrykking av TAL-effektorendonukleasen i cellen; og iii) identifisering av en celle der den valgte DNA-målsekvensen oppviser en mutasjon. 23. Fremgangsmåten ifølge krav 22, der mutasjonen velges fra gruppen bestående av sletting av genetisk materiale, innføring av genetisk materiale, og både sletting og innføring av genetisk materiale Fremgangsmåten ifølge krav 22, videre omfattende innføring av donor-dna inn i cellen. 2. Fremgangsmåten ifølge hvilket som helst av kravene 22 til 24, der cellen er en insektcelle, en plantecelle, en fiskecelle eller en pattedyrcelle Nukleinsyre som koder for en TAL-effektorendonuklease omfattende (i) et endonukleasedomene som kan spalte dobbelttrådet DNA, der endonukleasedomenet er fra en restriksjonsendonuklease av type II og (ii) et TAL-effektordomene omfattende flere TAL-effektorrepeteringssekvenser som, i kombinasjon, binder til en valgt mål- DNA-sekvens. 27. Nukleinsyren ifølge krav 26, der endonukleasedomenet er fra FokI.

82 Uttrykkingskassett omfattende en promotor operativt koblet til nukleinsyren ifølge krav 26 eller krav Vertscelle omfattende uttrykkingskassetten ifølge krav 28.

83 82

84 83

85 84

86 8

87 86

88 87

89 88

90 89

91 90

92 91

93 92

94 93

95 94

96 9

97 96

98 97

99 98

100 99

101 0

102 1

103 2

104 3

105 4

106

107 6

108 7

109 8

110 9

111 1

112 111

113 112

114 113

115 114

116 11

117 116

118 117

119 118

120 119

121 120

122 121

123 122

124 123

125 124

126 12

127 126

128 127

129 128

130 129

131 130

132 131

133 132

134 133

135 134

136 13

137 136

138 137

139 138

140 139

141 140

142 141

143 142

144 143

145 144

(12) Oversettelse av europeisk patentskrift

(12) Oversettelse av europeisk patentskrift (12) Oversettelse av europeisk patentskrift (11) NO/EP 2096 B1 (19) NO NORGE (1) Int Cl. C12N 1/ (2006.01) Patentstyret (21) Oversettelse publisert 201.04.13 (80) Dato for Den Europeiske Patentmyndighets

Detaljer

Fremgangsmåte for å produsere en gnager med evne til å produsere et repertoar av kimære antistoffer eller tunge antistoffkjeder, idet fremgangsmåten

Fremgangsmåte for å produsere en gnager med evne til å produsere et repertoar av kimære antistoffer eller tunge antistoffkjeder, idet fremgangsmåten 1 Patentkrav 1. Fremgangsmåte for å produsere en gnager med evne til å produsere et repertoar av kimære antistoffer eller tunge antistoffkjeder, idet fremgangsmåten omfatter: innsetting inn i et gnagercellegenom;

Detaljer

2. Fremgangsmåten ifølge krav 1, hvori dsrna-duplekset har en lengde fra 8 basepar (bp) ti 30 bp.

2. Fremgangsmåten ifølge krav 1, hvori dsrna-duplekset har en lengde fra 8 basepar (bp) ti 30 bp. 1 Patentkrav 1. Fremgangsmåte for å endre et mål-dna, der fremgangsmåten omfatter å bringe mål-dna-et i kontakt med et kompleks omfattende: (a) et Cas9-polypeptid og (b) et enkeltmolekyl-rna som er målrettet

Detaljer

1. En ikke-naturlig forekommende eller konstruert sammensetning omfattende:

1. En ikke-naturlig forekommende eller konstruert sammensetning omfattende: 1 Patentkrav EP2931898 1. En ikke-naturlig forekommende eller konstruert sammensetning omfattende: et leveringssystem som er operativt konfigurert for å levere CRISPR-Caskomplekskomponenter eller polynukleotidsekvenser

Detaljer

(12) Oversettelse av europeisk patentskrift

(12) Oversettelse av europeisk patentskrift (12) Oversettelse av europeisk patentskrift (11) NO/EP 2150617 B1 (19) NO NORGE (51) Int Cl. C12N 15/85 (2006.01) C12N 15/86 (2006.01) Patentstyret (21) Oversettelse publisert 2015.03.02 (80) Dato for

Detaljer

Oversikt over kap. 11. Kap. 11 Den direkte påvisning av genotype skiller individuelle genomer. Fire klasser av DNA polymorfismer.

Oversikt over kap. 11. Kap. 11 Den direkte påvisning av genotype skiller individuelle genomer. Fire klasser av DNA polymorfismer. Kap. 11 Den direkte påvisning av genotype skiller individuelle genomer Oversikt over kap. 11 Fire klasser av DNA variasjon til direkte påvisning av genotype. Metoder som bruker hybridisering, elektroforese,

Detaljer

Oppgave 2b V1979 Hvor i cellen foregår proteinsyntesen, og hvordan virker DNA og RNA i cellen under proteinsyntesen?

Oppgave 2b V1979 Hvor i cellen foregår proteinsyntesen, og hvordan virker DNA og RNA i cellen under proteinsyntesen? Bi2 «Genetikk» [3B] Målet for opplæringa er at elevane skal kunne gjere greie for transkripsjon og translasjon av gen og forklare korleis regulering av gen kan styre biologiske prosessar. Oppgave 2b V1979

Detaljer

Bioteknologi i dag muligheter for fremtiden

Bioteknologi i dag muligheter for fremtiden Bioteknologi i dag muligheter for fremtiden Arvestoff Genetisk materiale, DNA. Baser En del av et nukleotid som betegnes med bokstavene A, C, G og T. Med disse fire bokstavene skriver DNAtrådene sine beskjeder

Detaljer

FYS3710 Molekylærbiologi

FYS3710 Molekylærbiologi 1 2 I en eukaryot celle er kromosomene festet i en indre membran som omgir en kjerne. Proteinene produseres i cellens cytoplasma. 3 I en prokaryot celle (for eksempel en bakteriecelle) er det ett kromosom.

Detaljer

Figurer kapittel 8: Bioteknologi Figur s

Figurer kapittel 8: Bioteknologi Figur s 2 Figurer kapittel 8: Bioteknologi Figur s. 236 237 5' 3' 5' 3' DNA-primer 5' 3' DNA bit som skal kopieres Oppvarming 3' 5' 5' DNAprimer tilsettes 3' 3' 5' DNApolymerase Nytt DNA dannes Kopieringen gjentas

Detaljer

idet, en eller flere innskuddshendelser anvender den setespesifikke rekombinasjonen,

idet, en eller flere innskuddshendelser anvender den setespesifikke rekombinasjonen, 1 Patentkrav 1. Fremgangsmåte for å produsere en gnager med evne til å produsere et repertoar av kimære antistoffer eller tunge antistoffkjeder, idet fremgangsmåten omfatter: innsetting inn i et gnagercellegenom;

Detaljer

Kapittel 14: Det eukaryote genom og dets uttrykksregulering

Kapittel 14: Det eukaryote genom og dets uttrykksregulering Kapittel 14: Det eukaryote genom og dets uttrykksregulering Innhold: 1. Det humane genom 2. Struktur av protein-kodende gener 3. RNA processering 4. Transkripsjonell kontroll 5. Posttranskripsjonell kontroll

Detaljer

LEKSJON 4: BIOTEKNOLOGI HVORDAN VI BRUKER NATURENS EGNE MEKANISMER TIL VÅR FORDEL, OG UTFORDRINGENE SOM FØLGER MED

LEKSJON 4: BIOTEKNOLOGI HVORDAN VI BRUKER NATURENS EGNE MEKANISMER TIL VÅR FORDEL, OG UTFORDRINGENE SOM FØLGER MED LEKSJON 4: BIOTEKNOLOGI HVORDAN VI BRUKER NATURENS EGNE MEKANISMER TIL VÅR FORDEL, OG UTFORDRINGENE SOM FØLGER MED KOMPETANSEMÅL Forklarebegrepene krysning og genmodifisering, og hvordan bioteknologi brukes

Detaljer

PATENTKRAV. og en første lett kjede og en andre lett kjede, hvor første og andre lette kjeder er forskjellige.

PATENTKRAV. og en første lett kjede og en andre lett kjede, hvor første og andre lette kjeder er forskjellige. 1 PATENTKRAV 1. Isolert monoklonalt antistoff som bærer en forskjellig spesifisitet i hvert kombinasjonssete og som består av to kopier av et enkelt tung kjede polypeptid og en første lett kjede og en

Detaljer

ML-208, generell informasjon

ML-208, generell informasjon ML-208, generell informasjon Emnekode: ML-208 Emnenavn: Molekylærbiologi Dato:20.12.2017 Varighet:4 timer Tillatte hjelpemidler: Ingen Merknader:Lag gjerne tegninger og figurer for å illustrere og forklare

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i : INF2300 Grunnkurs i bioinformatikk Eksamensdag : Tirsdag 15. juni 2004 Tid for eksamen : 09.00 12.00 Oppgavesettet er på : 13

Detaljer

Polynukleotid som omfatter en nukleinsyre valgt fra gruppen som består av: a) en nukleinsyre med en nukleinsyresekvens som vist i SEKV. ID nr.

Polynukleotid som omfatter en nukleinsyre valgt fra gruppen som består av: a) en nukleinsyre med en nukleinsyresekvens som vist i SEKV. ID nr. 168 PATENTKRAV 1. Polynukleotid som omfatter en nukleinsyre valgt fra gruppen som består av: a) en nukleinsyre med en nukleinsyresekvens som vist i SEKV. ID nr. 1; 5 b) en nukleinsyre som koder for et

Detaljer

Flervalgsoppgaver: proteinsyntese

Flervalgsoppgaver: proteinsyntese Flervalgsoppgaver - proteinsyntese Hver oppgave har ett riktig svaralternativ. Proteinsyntese 1 Hva blir transkribert fra denne DNA sekvensen: 3'-C-C-G-A-A-T-G-T-C-5'? A) 3'-G-G-C-U-U-A-C-A-G-5' B) 3'-G-G-C-T-T-A-C-A-G-5'

Detaljer

GENETISKE MEKANISMER INVOLVERT I SPREDING AV RESISTENS

GENETISKE MEKANISMER INVOLVERT I SPREDING AV RESISTENS GENETISKE MEKANISMER INVOLVERT I SPREDING AV RESISTENS KRISTIN HEGSTAD OUTLINE Hvordan erverves nye egenskaper? Mekanismer for horisontal genoverføring (HGT) Genetiske elementer involvert i spredning Definisjoner

Detaljer

Kapittel 12: FRA DNA TIL PROTEIN:

Kapittel 12: FRA DNA TIL PROTEIN: Kapittel 12: FRA DNA TIL PROTEIN: fra genotype til fenotype 1. Gener og polypeptider 2. DNA, RNA og informasjonsflow 3. Transkripsjon: DNA-dirigert RNA-syntese 4. Den genetiske kode 5. Aktører i Translasjon

Detaljer

Klipp og lim: Genredigering med CRISPR teknologi

Klipp og lim: Genredigering med CRISPR teknologi Klipp og lim: Genredigering med CRISPR teknologi Realfagskonferanse 4. mai 2017 Magnar Bjørås Institutt for kreftforskning og molekylærmedisin, NTNU Klinikk for laboratoriemedisin, Oslo Universitetssykehus

Detaljer

1. Isolert protein omfattende et stabilisert aktivin IIB reseptor polypeptid, hvori polypeptidet er valgt fra gruppen bestående av:

1. Isolert protein omfattende et stabilisert aktivin IIB reseptor polypeptid, hvori polypeptidet er valgt fra gruppen bestående av: 1 Patentkrav. 1. Isolert protein omfattende et stabilisert aktivin IIB reseptor polypeptid, hvori polypeptidet er valgt fra gruppen bestående av: (a) et polypeptid bestående av sekvensen representert ved

Detaljer

GENTEKNOLOGISK ARBEID MED NAKENT DNA

GENTEKNOLOGISK ARBEID MED NAKENT DNA Sosial- og helsedepartementet Pb 8011 Dep. 0030 OSLO Oslo, 2. mai 1996. Ref. 96/00015-003RKA/401 GENTEKNOLOGISK ARBEID MED NAKENT DNA Det vises til brev fra Sosial- og helsedepartementet datert 6. februar

Detaljer

Naturfag for ungdomstrinnet

Naturfag for ungdomstrinnet Naturfag for ungdomstrinnet Arv Illustrasjoner: Ingrid Brennhagen 1 Vi skal lære om arvestoffet, DNA celledeling genetisk variasjon arv 2 DNA Arvestoffet kalles DNA. DNA er kjempestore molekyler som inneholder

Detaljer

ML-208, generell informasjon

ML-208, generell informasjon ML-208, generell informasjon Emnekode: ML-208 Emnenavn: Molekylærbiologi Dato:20.12.2017 Varighet:4 timer Tillatte hjelpemidler: Ingen Merknader:Lag gjerne tegninger og figurer for å illustrere og forklare

Detaljer

Kap.14 Det prokaryote kromosom: Genetisk analyse i bakterier

Kap.14 Det prokaryote kromosom: Genetisk analyse i bakterier Kap.14 Det prokaryote kromosom: Genetisk analyse i bakterier Oversikt over kapittel 14 Generell oversikt over bakterier Variasjon i størrelser Metabolsk aktivitet Hvordan dyrke dem for å studere dem Det

Detaljer

BIOKJEMI MED BIOTEKNOLOGI

BIOKJEMI MED BIOTEKNOLOGI EKSAMEN BIOKJEMI MED BIOTEKNOLOGI Dato: 22.05.06 Tid: Kl. 09.00-13.00 Antall timer: 4 Antall studiepoeng: 6 Antall sider: 5 (herav 2 vedlegg) Fagansvarlig: Sven Olav Aastad Tillatte hjelpemidler: Kalkulator

Detaljer

Anordning og fremgangsmåte for kanalkoding og -dekoding i et kommunikasjonssystem som anvender low-density parity-check-koder

Anordning og fremgangsmåte for kanalkoding og -dekoding i et kommunikasjonssystem som anvender low-density parity-check-koder 1 Anordning og fremgangsmåte for kanalkoding og -dekoding i et kommunikasjonssystem som anvender low-density parity-check-koder BAKGRUNN FOR OPPFINNELSEN 5 1. Oppfinnelsens område 10 Den foreliggende oppfinnelsen

Detaljer

Genkartlegging. Hva er egentlig et genkart? Genetisk og fysisk kartlegging

Genkartlegging. Hva er egentlig et genkart? Genetisk og fysisk kartlegging NTNU Genkartlegging 1 Termin IC Frank Skorpen Institutt for laboratoriemedisin, barne- og kvinnesykdommer Hva er egentlig et genkart? Kartet over det humane genom gir oss posisjonen av de ca 25,000 genene

Detaljer

FLERVALGSOPPGAVER BIOTEKNOLOGI

FLERVALGSOPPGAVER BIOTEKNOLOGI FLERVALGSOPPGAVER BIOTEKNOLOGI FLERVALGSOPPGAVER FRA EKSAMEN I BIOLOGI 2 Disse flervalgsoppgavene er hentet fra eksamen i Biologi 2 del 1. Det er fire (eller fem) svaralternativer i hver oppgave, og bare

Detaljer

Klinisk molekylærmedisin (5): Eksempler på funksjonelle analyser

Klinisk molekylærmedisin (5): Eksempler på funksjonelle analyser Pediatrisk Endokrinologi 2003;17: 64-69 Klinisk molekylærmedisin (5): Eksempler på funksjonelle analyser Pål Rasmus Njølstad 1,2,3, Lise Bjørkhaug 1 1 Seksjon for pediatri, Institutt for klinisk medisin

Detaljer

Sammenligningen mellom Arabidopsis thaliana genomet og de kjente genomene fra cyanobakterier, gjær, bananflue og nematode, viser bl. a.

Sammenligningen mellom Arabidopsis thaliana genomet og de kjente genomene fra cyanobakterier, gjær, bananflue og nematode, viser bl. a. Sammenligningen mellom Arabidopsis thaliana genomet og de kjente genomene fra cyanobakterier, gjær, bananflue og nematode, viser bl. a. Antall gener som er involvert i cellulær kommunikasjon og signaloverføring

Detaljer

Vekst av planteplankton - Skeletonema Costatum

Vekst av planteplankton - Skeletonema Costatum Vekst av planteplankton - Skeletonema Costatum Nivå: 9. klasse Formål: Arbeid med store tall. Bruke matematikk til å beskrive naturfenomen. Program: Regneark Referanse til plan: Tall og algebra Arbeide

Detaljer

Forelesninger i BI Cellebiologi Proteinrensing - Væskekromatografi. Figure 3-43 b

Forelesninger i BI Cellebiologi Proteinrensing - Væskekromatografi. Figure 3-43 b Proteinrensing - Væskekromatografi Figure 3-43 b Proteinrensing - Væskekromatografi Ved affinitets-kromatografi brukes en søyle med kuler som er dekket med ligander (f.eks. et enzym-substrat eller et annet

Detaljer

4260 Mikrobiologi. Midtprøveoppgaver. 02. oktober 2013

4260 Mikrobiologi. Midtprøveoppgaver. 02. oktober 2013 1 Høgskolen i Telemark Fakultet for allmennvitenskapelige fag 4260 Mikrobiologi Midtprøveoppgaver 02. oktober 2013 Tid: 2 timer Sidetall: 7 (40 spørsmål) Hjelpemidler: Ingen Velg kun ett svaralternativ

Detaljer

Beskrivelse BAKGRUNN [0001] [0002]

Beskrivelse BAKGRUNN [0001] [0002] Beskrivelse BAKGRUNN 2 [0001] Blekkskrivere opererer ved å støte ut små dråper med blekk fra et skrivehode på et utskriftsmedium, slik som papir. Skrivehodet innbefatter generelt en dyseplate med en flerhet

Detaljer

FLERVALGSOPPGAVER BIOTEKNOLOGI

FLERVALGSOPPGAVER BIOTEKNOLOGI FLERVALGSOPPGAVER BIOTEKNOLOGI FLERVALGSOPPGAVER FRA EKSAMEN I BIOLOGI 2 V2008 - V2011 Disse flervalgsoppgavene er hentet fra eksamen i Biologi 2 del 1. Det er fire (eller fem) svaralternativer i hver

Detaljer

Hvor er genene? Gensøk-algoritmer. Gener i prokaryoter. Genenes anatomi (prokaryoter) Forelesning INF3350/4350 5. sept 2007

Hvor er genene? Gensøk-algoritmer. Gener i prokaryoter. Genenes anatomi (prokaryoter) Forelesning INF3350/4350 5. sept 2007 Gensøk-algoritmer Hvor er genene? Forelesning INF330/430. sept 2007 Ole Christian Lingjærde Gruppen for bioinformatikk Institutt for Informatikk, UiO En viktig del av kartleggingen av et genom er å finne

Detaljer

NASJONALE PRØVER 2015. En presentasjon av resultatene til 5.trinn ved Jåtten skole, skoleåret 2015-16

NASJONALE PRØVER 2015. En presentasjon av resultatene til 5.trinn ved Jåtten skole, skoleåret 2015-16 NASJONALE PRØVER 2015 En presentasjon av resultatene til 5.trinn ved Jåtten skole, skoleåret 2015-16 Gjennomføring av nasjonale prøver 2015 Nasjonale prøver for 5.trinn ble gjennomført i oktober 2015.

Detaljer

Kosmos SF. Figurer kapittel 8 Den biologiske tidsalderen Figur s. 214 BIOTEKNOLOGI. Næringsmiddelindustri. Landbruk. Akvakultur

Kosmos SF. Figurer kapittel 8 Den biologiske tidsalderen Figur s. 214 BIOTEKNOLOGI. Næringsmiddelindustri. Landbruk. Akvakultur Figurer kapittel 8 Den biologiske tidsalderen Figur s. 214 Proteiner fra olje og gass Bryggerier Meierivirksomhet Næringsmiddelindustri Fiskeavl Akvakultur Genmodifiserte organismer Planteavl Landbruk

Detaljer

Hvordan standardisere en metode for isolering av plasmid til syntese av diabetes antigener?

Hvordan standardisere en metode for isolering av plasmid til syntese av diabetes antigener? Hvordan standardisere en metode for isolering av plasmid til syntese av diabetes antigener? Ranveig Østrem, Bioingeniør Hormonlaboratoriet, Aker Oslo Universitetssykehus Bakgrunn for analysen Pasienter

Detaljer

Foreleser: Eivind Coward, kontor 5. etg. Datablokken. coward@ii.uib.no Gruppeleder: Harald Barsnes

Foreleser: Eivind Coward, kontor 5. etg. Datablokken. coward@ii.uib.no Gruppeleder: Harald Barsnes Foreleser: Eivind Coward, kontor 5. etg. Datablokken. coward@ii.uib.no Gruppeleder: Harald Barsnes Forelesninger: tirsdag og fredag 12 14 rom 2104 Øvinger: fredag 10 12 rom 2143 Gi en innføring i noen

Detaljer

Kap. 30 INDUSTRIELL MIKROBIOLOGI

Kap. 30 INDUSTRIELL MIKROBIOLOGI Kap. 30 INDUSTRIELL MIKROBIOLOGI Mikroorganismer kan brukes kommersielt til å produsere/omdanne et bredt utvalg av stoffer i stor skala: alkoholholdige varer (øl, vin mm.) organiske kjemikalier (f.eks.

Detaljer

Kosmos SF. Figurer kapittel 8: Den bioteknologiske tidsalderen Figur s. 234 BIOTEKNOLOGI. Næringsmiddelindustri. Landbruk.

Kosmos SF. Figurer kapittel 8: Den bioteknologiske tidsalderen Figur s. 234 BIOTEKNOLOGI. Næringsmiddelindustri. Landbruk. Figurer kapittel 8: Den bioteknologiske tidsalderen Figur s. 234 Proteiner fra olje og gass Bryggerier Meierivirksomhet Næringsmiddelindustri Fiskeavl Akvakultur Genmodifiserte organismer Planteavl Landbruk

Detaljer

Hfr-stammer Kartlegging ved avbrutt konjugasjon (time of entry)

Hfr-stammer Kartlegging ved avbrutt konjugasjon (time of entry) BAKTERIE OG FAG GENETIKK Man studerer ofte E. coli fordi den inneholder få gener (4700 kb)sammenlihgnet med menneskets ca 6 mill kb, har kort generasjonstid (20 min) og er hele livssyklusen i haploid tilstand.

Detaljer

Medarbeidersamtale. Veiledningshefte. Medarbeidersamtale. Mars 2004 Avdeling for økonomi og personal

Medarbeidersamtale. Veiledningshefte. Medarbeidersamtale. Mars 2004 Avdeling for økonomi og personal Medarbeidersamtale Veiledningshefte Mars 2004 Avdeling for økonomi og personal Steinkjer kommune Avdeling for økonomi og personal 1 Steinkjer kommune Avdeling for økonomi og personal 2 Medarbeidersamtale

Detaljer

EP Patentkrav

EP Patentkrav 1 EP26727 Patentkrav 1. Monoklonalt antistoff, eller et funksjonelt fragment derav som spesifikt gjenkjenner ett eller flere Siglec- polypeptider bestående av en aminosyresekvens som beskrevet i hvilket

Detaljer

(12) Translation of european patent specification

(12) Translation of european patent specification (12) Translation of european patent specification (11) NO/EP 2771468 B1 (19) NO NORWAY (51) Int Cl. C12N 15/63 (2006.01) Norwegian Industrial Property Office (21) Translation Published 2015.07.06 (80)

Detaljer

4. Plasmid DNA er A. sirkulært, enkelttrådet B. lineært, dobbelttrådet C. sirkulært, dobbelttrådet og supercoiled

4. Plasmid DNA er A. sirkulært, enkelttrådet B. lineært, dobbelttrådet C. sirkulært, dobbelttrådet og supercoiled Side 1 av 7 Norges teknisknaturvitenskapelige universitet Fakultet for naturvitenskap og teknologi Institutt for biologi Faglig kontaktperson(er) under eksamen: Anna Kusnierczyk EKSAMEN I: BI2015 BOKMÅL

Detaljer

NORGES TEKNISK NATURVITENSKAPELIGE UNIVERSITETET

NORGES TEKNISK NATURVITENSKAPELIGE UNIVERSITETET NORGES TEKNISK NATURVITENSKAPELIGE UNIVERSITETET Side 1 av 7 FAKULTET FOR NATURVITENSKAP OG TEKNOLOGI Institutt for biologi Faglig kontaktperson under eksamen: Anna Kusnierczyk EKSAMEN I: BI2015 DATO:

Detaljer

Fremgangsmåte for analyse av et ad hoc-nettverk, og elektronisk apparat

Fremgangsmåte for analyse av et ad hoc-nettverk, og elektronisk apparat 1 Fremgangsmåte for analyse av et ad hoc-nettverk, og elektronisk apparat Oppfinnelsen vedrører en fremgangsmåte for analyse av et ad hoc-nettverk samt et tilsvarende elektronisk apparat for et slikt ad

Detaljer

Mal for vurderingsbidrag

Mal for vurderingsbidrag Mal for vurderingsbidrag Fag: Norsk/naturfag temabasert undervisning. Tema: Fremføring av sammensatt tekst (plakat). (Teknologi og design med fokus på plast som materiale) Trinn: 8.trinn Tidsramme: To

Detaljer

Forelesning 9 mandag den 15. september

Forelesning 9 mandag den 15. september Forelesning 9 mandag den 15. september 2.6 Største felles divisor Definisjon 2.6.1. La l og n være heltall. Et naturlig tall d er den største felles divisoren til l og n dersom følgende er sanne. (1) Vi

Detaljer

(12) Translation of european patent specification

(12) Translation of european patent specification (12) Translation of european patent specification (11) NO/EP 2462237 B1 (19) NO NORWAY (1) Int Cl. C12P 21/06 (2006.01) C07H 21/04 (2006.01) Norwegian Industrial Property Office (21) Translation Published

Detaljer

Metode for å kartlegge DNA-et og båndmønsteret det har. Brukes for å kartlegge slektskap eller identifisere individer innenfor rettsmedisin.

Metode for å kartlegge DNA-et og båndmønsteret det har. Brukes for å kartlegge slektskap eller identifisere individer innenfor rettsmedisin. 8: Den bioteknologiske tidsalderen Figur side 238 Proteiner fra olje og gass Bryggerier Meierivirksomhet Næringsmiddelindustri Fiskeavl Akvakultur Genmodifiserte organismer Planteavl Landbruk Husdyravl

Detaljer

Arabidopsis thaliana, vårskrinneblom

Arabidopsis thaliana, vårskrinneblom Arabidopsis thaliana, vårskrinneblom Tilhører Brassicaceae familien og ligger under ordenen Capparales. Nært beslektede planter er f. eks. raps og kål. Arabidopsis thaliana har i flere år vært en av modell

Detaljer

Beskrivelse Oppfinnelsen angår en fremgangsmåte for å fjerne lukt fra eddik.

Beskrivelse Oppfinnelsen angår en fremgangsmåte for å fjerne lukt fra eddik. 1 Beskrivelse Oppfinnelsen angår en fremgangsmåte for å fjerne lukt fra eddik. Eddik er en blanding av syre som omfatter eddiksyre. Et tilbakevendende problem med eddik er dens lim/løsningsmiddel-liknende

Detaljer

Veileder for utarbeidelse av nasjonale retningslinjer. - for god hygienepraksis og anvendelse av HACCP prinsippene

Veileder for utarbeidelse av nasjonale retningslinjer. - for god hygienepraksis og anvendelse av HACCP prinsippene Veileder for utarbeidelse av nasjonale retningslinjer - for god hygienepraksis og anvendelse av HACCP prinsippene 1. Innledning Denne informasjonen retter seg til bransjeorganisasjoner innen produksjon,

Detaljer

(12) Oversettelse av europeisk patentskrift

(12) Oversettelse av europeisk patentskrift (12) Oversettelse av europeisk patentskrift (11) NO/EP 2131860 B1 (19) NO NORGE (51) Int Cl. A61K 39/395 (2006.01) Patentstyret (21) Oversettelse publisert 2014.03.24 (80) Dato for Den Europeiske Patentmyndighets

Detaljer

2. Polypeptid ifølge krav 1, hvor polypeptidet utløser en beskyttende immunrespons hos en pattedyrvert mot stammer av C.difficile.

2. Polypeptid ifølge krav 1, hvor polypeptidet utløser en beskyttende immunrespons hos en pattedyrvert mot stammer av C.difficile. 1 Patentkrav 1 1. Polypeptid som omfatter et første fragment og et andre fragment, hvor (i) det første fragmentet er et toksin A repeterende domenefragment; (ii) det andre fragmentet er et toksin B repeterende

Detaljer

Oncogenic Mutations Affecting Cell Proliferation

Oncogenic Mutations Affecting Cell Proliferation Oncogenic Mutations Affecting Cell Proliferation Fra RTK til Nucleus (Boka s.1070-74) Normalt kreves et vekst stimulerende signal ( growth factor eks. PDGF, EGF, NGF) for at celler skal gå inn i celledeling,

Detaljer

UNIVERSITETET I OSLO. Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO. Det matematisk-naturvitenskapelige fakultet UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i MBV 1030 Generell biokjemi Eksamensdag: 6. /7. januar 2005 Tid for eksamen: Oppgavesettet er på 6 sider Vedlegg: 1 Tillatte hjelpemidler:

Detaljer

Matematisk morfologi III

Matematisk morfologi III Matematisk morfologi III Lars Aurdal Norsk regnesentral Lars.Aurdal@nr.no 4. desember 2003 Copyright Lars Aurdal, NTNU/NR Oversikt, kursdag 3 Sammensatte operasjoner: Hit-or-miss-transformen. Skjeletter.

Detaljer

(12) Translation of european patent specification

(12) Translation of european patent specification (12) Translation of european patent specification (11) NO/EP 26098 B1 (19) NO NORWAY (1) Int Cl. C07K 14/08 (06.01) C12Q 1/70 (06.01) Norwegian Industrial Property Office (21) Translation Published 16..24

Detaljer

Repeterbarhetskrav vs antall Trails

Repeterbarhetskrav vs antall Trails Repeterbarhetskrav vs antall Trails v/ Rune Øverland, Trainor Automation AS Artikkelserie Dette er første artikkel i en serie av fire som tar for seg repeterbarhetskrav og antall trials. Formålet med artikkelserien

Detaljer

(12) Oversettelse av europeisk patentskrift

(12) Oversettelse av europeisk patentskrift (12) Oversettelse av europeisk patentskrift (11) NO/EP 242166 B1 (19) NO NORGE (1) Int Cl. G06K 19/077 (06.01) G06K 19/06 (06.01) Patentstyret (21) Oversettelse publisert 14.02.24 (80) Dato for Den Europeiske

Detaljer

Flervalgsoppgaver: Immunsystemet

Flervalgsoppgaver: Immunsystemet Flervalgsoppgaver - immunsystemet Hver oppgave har ett riktig svaralternativ. Immunsystemet 1 Vaksinasjon der det tilføres drepte, sykdomsfremkallende virus gir A) passiv, kunstig immunitet B) aktiv kunstig,

Detaljer

NORGE. Patentstyret (12) SØKNAD (19) NO (21) (13) A1. (51) Int Cl.

NORGE. Patentstyret (12) SØKNAD (19) NO (21) (13) A1. (51) Int Cl. (12) SØKNAD (19) NO (21) 171288 (13) A1 NORGE (1) Int Cl. C07K 16/18 (06.01) C07K 16/28 (06.01) A61K 39/39 (06.01) Patentstyret (21) Søknadsnr 171288 (86) Int.inng.dag og søknadsnr 0.09.02 PCT/US0/031401

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i : INF2300 Grunnkurs i bioinformatikk Eksamensdag : Mandag 6. juni 2005 Tid for eksamen : 09.00 12.00 Oppgavesettet er på : xx

Detaljer

(12) Oversettelse av europeisk patentskrift

(12) Oversettelse av europeisk patentskrift (12) Oversettelse av europeisk patentskrift (11) NO/EP 237066 B1 (19) NO NORGE (1) Int Cl. E06C 1/12 (06.01) Patentstyret (21) Oversettelse publisert 14.02.24 (80) Dato for Den Europeiske Patentmyndighets

Detaljer

FLERVALGSOPPGAVER - CELLEMEMBRANEN

FLERVALGSOPPGAVER - CELLEMEMBRANEN FLERVALGSOPPGAVER - CELLEMEMBRANEN Hvert spørsmål har ett riktig svaralternativ. Transport cellemembranen 1 På hvilken måte er ulike membraner i en celle forskjellige? A) Fosfolipider finnes bare i enkelte

Detaljer

Oversikt over kap.10. Kap 10. Rekonstruksjon av Genomet. Splitt og overvinn strategien imøtekommer de fleste utfordringer

Oversikt over kap.10. Kap 10. Rekonstruksjon av Genomet. Splitt og overvinn strategien imøtekommer de fleste utfordringer Kap 10. Rekonstruksjon av Genomet Gjennom genetisk og molekylær analyse Oversikt over kap.10 Utfordringer og strategier ved genomanalyse Genomstørrelse Egenskaper må også analyseres Problemer med DNA polymorfismer

Detaljer

Kodestil i C++ Introduksjon. Navnekonvensjoner. Globale variabler. Simen Hagen 26.9.2003

Kodestil i C++ Introduksjon. Navnekonvensjoner. Globale variabler. Simen Hagen 26.9.2003 Kodestil i C++ Simen Hagen 26.9.2003 Introduksjon I store programmeringsprosjekter er det viktig at koden har et konsistent utseende og at alle bruker en felles stil på koden. Alle som skriver kode har

Detaljer

(12) Oversettelse av europeisk patentskrift

(12) Oversettelse av europeisk patentskrift (12) Oversettelse av europeisk patentskrift (11) NO/EP 2137304 B1 (19) NO NORGE (51) Int Cl. C12N 9/10 (2006.01) C12N 15/54 (2006.01) C12P 7/64 (2006.01) Patentstyret (21) Oversettelse publisert 2013.12.23

Detaljer

Utarbeidelse av forskningsprotokoll

Utarbeidelse av forskningsprotokoll Utarbeidelse av forskningsprotokoll Rubrikker :Utarbeidelsen av forskningsprotokollen skjer gjerne i flere trinn. Det er vanlig at man tar utgangspunkt i en problemstilling eller et spesifikt forskningsspørsmål

Detaljer

Kap. 20 Mikrobiell vekstkontroll

Kap. 20 Mikrobiell vekstkontroll Kap. 20 Mikrobiell vekstkontroll Fokuset er her rettet mot reagenser og metoder som anvendes for vekstkontroll av mikrober utenfor kroppen Et utvalg av stoffert benyttes i det daglige liv: såper/vaskemidler

Detaljer

Kap 12. Det eukaryote kromosom. En organelle for pakking og styring av DNA

Kap 12. Det eukaryote kromosom. En organelle for pakking og styring av DNA Kap 12. Det eukaryote kromosom En organelle for pakking og styring av DNA Oversikt over kapittel 12 Komponentene i et kromosom: DNA, histoner, og nonhiston proteiner Ett langt DNA molekyl og mange typer

Detaljer

Læringsmiljø Hadeland. Felles skoleutviklingsprosjekt for Gran, Lunner og Jevnaker. Vurderingsbidrag

Læringsmiljø Hadeland. Felles skoleutviklingsprosjekt for Gran, Lunner og Jevnaker. Vurderingsbidrag Vurderingsbidrag Fag: Norsk Tema: Lesing, skriftlige tekster Trinn: 1.trinn Tidsramme: 1 måned ----------------------------------------------------------------------------- Undervisningsplanlegging Konkretisering

Detaljer

Fortsettelses kurs i Word

Fortsettelses kurs i Word Fortsettelses kurs i Word Lynkurs fra Kristiansand folkebibliotek Innholdsfortegnelse Formål med dagens kurs... 2 Sette inn forsider... 2 Sette inn tabeller... 2 Topptekst Bunntekst Sidetall... 2 Sett

Detaljer

Trinnvise anvisninger Bygge et gjerde

Trinnvise anvisninger Bygge et gjerde Trinnvise anvisninger Bygge et gjerde Typer gjerder Nettinggjerde Et nettinggjerde kan settes opp ganske raskt og er en av de gjerdetypene som koster minst, og som er lettest å vedlikeholde. Kurver med

Detaljer

(12) Translation of european patent specification

(12) Translation of european patent specification (12) Translation of european patent specification (11) NO/EP 2176 B1 (19) NO NORWAY (1) Int Cl. A01K 67/027 (06.01) C07K 16/00 (06.01) C07K 16/46 (06.01) C12N 1/8 (06.01) Norwegian Industrial Property

Detaljer

GENER, genregulering, og genfamilier

GENER, genregulering, og genfamilier GENER, genregulering, og genfamilier 1-A, H-11 Forelesning 21.11.11 Frank Skorpen, Institutt for Laboratoriemedisin, Barne- og Kvinnesykdommer, DMF, NTNU Gener Kromosom, kromatin og DNA Hva er et gen?

Detaljer

1. Medfødt og ervervet immunitet. Karl Schenck, V2015

1. Medfødt og ervervet immunitet. Karl Schenck, V2015 1. Medfødt og ervervet immunitet Karl Schenck, V2015 Medfødt og ervervet immunforsvar Antimicrobial peptides «Alltid beredt!» Relativt uspesifikt Må aktiveres Spesifikt Komponenter av medfødt immunitet

Detaljer

Repeterbarhetskrav vs antall Trails

Repeterbarhetskrav vs antall Trails Repeterbarhetskrav vs antall Trails v/ Rune Øverland, Trainor Automation AS Artikkelserie Dette er andre artikkel i en serie av fire om tar for seg repeterbarhetskrav og antall trials. Formålet med artikkelserien

Detaljer

MAT1030 Forelesning 30

MAT1030 Forelesning 30 MAT1030 Forelesning 30 Kompleksitetsteori Roger Antonsen - 19. mai 2009 (Sist oppdatert: 2009-05-19 15:04) Forelesning 30: Kompleksitetsteori Oppsummering I dag er siste forelesning med nytt stoff! I morgen

Detaljer

Reproduksjon av dyrevirus. Adsorpsjon Penetrasjon og avkledning Replikasjon og transkripsjon Syntese og samling (assembly) av viruskapsid Frigjøring

Reproduksjon av dyrevirus. Adsorpsjon Penetrasjon og avkledning Replikasjon og transkripsjon Syntese og samling (assembly) av viruskapsid Frigjøring Reproduksjon av dyrevirus Adsorpsjon Penetrasjon og avkledning Replikasjon og transkripsjon Syntese og samling (assembly) av viruskapsid Frigjøring ATTACHMENT Click after each step to view process PENETRATION

Detaljer

NOR/306R1678.00T OJ L 314/06, p. 4-6

NOR/306R1678.00T OJ L 314/06, p. 4-6 NOR/306R1678.00T OJ L 314/06, p. 4-6 Commission Regulation (EC) No 1678/2006 of 14 November 2006 amending Regulation (EC) No 92/2005 as regards alternative means of disposal of and use of animal by-products

Detaljer

Hovedområde: Bioteknologi Eksamensoppgaver fra skriftlig eksamen Naturfag (NAT1002).

Hovedområde: Bioteknologi Eksamensoppgaver fra skriftlig eksamen Naturfag (NAT1002). Hovedområde: Bioteknologi Eksamensoppgaver fra skriftlig eksamen Naturfag (NAT1002). Oppgave 26 V2008 Et eksempel på godkjent bruk av bioteknologi i Norge er A) gentesting for arvelige sykdommer B) genterapi

Detaljer

Klinisk molekylærmedisin (3): DNA-sekvensering

Klinisk molekylærmedisin (3): DNA-sekvensering Pediatrisk Endokrinologi 2002;16:51 56 Klinisk molekylærmedisin (3): DNA-sekvensering elge Ræder 1, Maria Ræder 2, Pål Rasmus Njølstad 1,3,4 1 Pediatrisk institutt, Universitetet i Bergen; 2 Anestesiavdelingen

Detaljer

PBM 233 Mikrobiologi for farmasøyter

PBM 233 Mikrobiologi for farmasøyter PBM 233 Mikrobiologi for farmasøyter Faglærer 2004: Per Arne Risøen Biologisk seksjon, ZEB Kap. 11 Mikrobiell evolusjon og systematikk Dateringer av fossiler viser at bakterier oppstod for ca. 3,6 milliarder

Detaljer

Oppfinnelsens område. Bakgrunn for oppfinnelsen

Oppfinnelsens område. Bakgrunn for oppfinnelsen 1 Oppfinnelsens område Oppfinnelsen vedrører smelting av metall i en metallsmelteovn for støping. Oppfinnelsen er nyttig ved smelting av flere metaller og er særlig nyttig ved smelting av aluminium. Bakgrunn

Detaljer

IA-funksjonsvurdering Revidert februar 2012. En samtale om arbeidsmuligheter

IA-funksjonsvurdering Revidert februar 2012. En samtale om arbeidsmuligheter IA-funksjonsvurdering Revidert februar 2012 En samtale om arbeidsmuligheter // IA - Funksjonsvurdering En samtale om arbeidsmuligheter Målet med et inkluderende arbeidsliv (IA) er å gi plass til alle som

Detaljer

Introduksjon Bakgrunn

Introduksjon Bakgrunn 1 Introduksjon Den foreliggende oppfinnelsen beskriver en metode for å presentere visuell informasjon relatert til et objekt eller struktur. Mer spesifikt er oppfinnelsen beskrevet ved en metode for å

Detaljer

Startveiledning for det nye AdWords-grensesnittet En veiledning til endringene i kampanjeadministrasjonen

Startveiledning for det nye AdWords-grensesnittet En veiledning til endringene i kampanjeadministrasjonen Startveiledning for det nye AdWords-grensesnittet En veiledning til endringene i kampanjeadministrasjonen Introduksjon og oversikt AdWords har vokst, takket være deg. Siden 2005 har vi lagt til over tjue

Detaljer

Patent i Norge nr. 333597 FMC Kongsberg Subsea AS

Patent i Norge nr. 333597 FMC Kongsberg Subsea AS P602.doc Patentstyret Sandakerveien 64 Postboks 8160 Dep. 0033 OSLO Oslo, 6. oktober 2014 Vår ref.: P22021NO00 / GLA Håvard Larsen Deres ref.:op2014/00168 Patent i Norge nr. 333597 FMC Kongsberg Subsea

Detaljer

Den grunnleggende ferdigheten å kunne regne. Introduksjon

Den grunnleggende ferdigheten å kunne regne. Introduksjon Den grunnleggende ferdigheten å kunne regne Introduksjon Hvorfor regning som grunnleggende ferdighet? For å utvikle elevenes kompetanse slik at de kan: - ta stilling til samfunnsspørsmål på en reflektert

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: INF2810 Eksamensdag: Fredag 5. juni 2015 Tid for eksamen: 14:30 (4 timer) Oppgavesettet er på 4 sider (ikke medregnet denne siden)

Detaljer

Konklusjon for 4 grupper

Konklusjon for 4 grupper Konklusjon for 4 grupper Hvordan kåre en vinner? Hvilket valg som er det beste er avhengig av hva de andre gruppene har valgt. Hvem som blir vinnere og tapere bestemmes ut ifra kombinasjonen av valgene

Detaljer