Arabidopsis thaliana, vårskrinneblom Tilhører Brassicaceae familien og ligger under ordenen Capparales. Nært beslektede planter er f. eks. raps og kål. Arabidopsis thaliana har i flere år vært en av modell organismene innen plante biologi. Dette er på grunn av flere faktorer. Arabidopsis thaliana har en kort livssyklus, ca. 6 uker i fra spiring til den utvikler modne frø. Den er enkel å dyrke, er liten av vekst (ca. 30 cm høy), og trenger lite dyrkningsplass. Arabidopsis thaliana er en selv-pollinator, dvs. en trenger ikke manuelt å pollinere blomstene (ev. være avhengig av insekt pollinatorer). Kryss-pollinering er også relativt sjelden. Det er derfor lett å få rene linjer. Den lar seg lett transformere med Agrobacterium tumefaciens som kan overføre ulike gen-konstruksjoner.
Den er diploid og har et genom på ca. 125 mega baser. Inneholder lite repetert DNA og i over 10 år har det eksistert relativt gode genetiske kart. Det finnes et stort utvalg av Arabidopsis mutanter som kan fås i fra frøbanker / Stock center i USA og England.
Arabidopsis ble i Desember 2000 den første planten hvor hele genomet (minus enkelte centromer regioner) ble oppklart / sekvensert. Arabidopsis genomet består av 5 kromosom som varierer i fra 17.5 til 29.1 mega baser. Sekvenseringen av Arabidopsis ble foretatt av et internasjonalt konsortium The Arabidopsis Genome Initiative i tidsrommet 1996-2000. Mesteparten ble sekvensert de siste 2 årene.
På grunn av at gode genetiske kart eksisterte for Arabidopsis og at genomet var relativt lite ble en mapping basert sekvenseringsstrategi benyttet. Dvs. det ble laget et genomisk BAC bibliotek, hvor overlappende kloner ble identifisert ved hjelp av RFLP analyser og hybridisering eller ved PCR av sequencetagged sites (STS) og Southern blotting. BAC kloner ble deretter shotgun sekvensert. Dvs. BAC klonene (ca. 50-100 kb.) ble enkeltvis kuttet opp i småbiter og klonet over i plasmid vektorer (1-3 Kb) og deretter sekvensert. Overlappende sekvenser ble deretter satt sammen til sekvens av hele BAC klon var komplett.
Resultatet fra sekvenseringen viste at Arabidopsis thaliana genomet var rundt 125 mega baser og inneholdt rundt 25,000 gener. Dvs. flere gener enn man fant i de to invertebrate organismene; nematoden Caenorhabditis elegans (ca. 19,000 gener) og i bananflua Drosophila melanogaster (ca. 13,500 gener). Selv om sekvensen til genomet er kjent er det fremdeles mye arbeid som gjenstår. Å sette sammen alle exon i et gen korrekt, samt å finne start / stopp og beskrivelse av protein er ikke trivielt. Denne prosessen, som kalles for annotering, er i mange tilfeller gjort av dataprogram og er ofte unøyaktig. Etter at dataprogrammet har funnet et mulig gen og korresponderende protein blir disse sjekket mot gen / protein databasene: GenBank, Pfam osv. Protein sekvens. >gi 2352084 gb AAB68776.1 MDHNSPKSRRSRKPEPKPDIYSTFVVHSDSDSDQGRDRDKRKAKPEEDENVDLYATMVYKGDSDGEGEED DDDDSMLPPLLKRLPKDFGGGASLDYDDDDGDESGDFGTMIVKTDRSSHSKKNSPYSSKPRMGVSPRRRA RGGDEESSDEEDEEEDDDDDDGDYGTFVVKSKDKKGKKKDKEIDMTTMGRAVASMQKSNFGGKTRKLDPS SSSSKLHGEDNRKMQQQNSKMSTTSLPDSITREDPTTKYEFLNELGKGSYGSVYKARDLKTSEIVAVKVI SLTEGEEGYEEIRGEIEMLQQCNHPNVVRYLGSYQGEDYLWIVMEYCGGGSVADLMNVTEEALEEYQIAY ICREALKGLAYLHSIYKVHRDIKGGNILLTEQGEVKLGDFGVAAQLTRTMSKRNTFIGTPHWMAPEVIQE NRYDGKVDVWALGVSAIEMAEGLPPRSSVHPMRVLFMISIEPAPMLEDKEKWSLVFHDFVAKCLTKEPRL RPTAAEMLKHKFVERCKTGASAMSPKIEKSRQIRATMALQAQSVVAPSLEDTSTLGPKSSEELGITVPSK PPQNSTEAPLTSTLNRQHITGNTVLAGEGGDFGTMIVHGEDETEESDSRSQLVREKESSSSQFEGVPREF PGEELPDSWIHDKKKPPAIDLPVEASISQSMQASSSHEHRTKLHNIAGTQMEGGSDASGSTLKNETVGRK AFALQDKLWSIYAAGNTVPIPFLRATDISPIALLSENMIGGMQQDGNGTVAVEALQELFTSSDPQSKKGR RGQNEMPLPPSVYQRLTTSSSLMNLAQVLAYHRACYEEMPLQELQATQEQQTIQNLCDTLRTILRL BlastP analyse. Sequences producing significant alignments: Score E Value gi 2352084 gb AAB68776.1 (U96613) serine/threonine kinase... 1324 0.0 gi 12061243 gb AAG45491.1 (AY013245) 36I5.3 [Oryza sativa] 659 0.0 gi 3114674 gb AAC15972.1 kinase [Dictyostelium discoideum]... 282 1e-74 gi 7302511 gb AAF57595.1 CG7097 [Drosophila melanogaster]... 272 2e-71 gi 12643529 sp O00506 ST25_HUMAN SERINE/THREONINE PROTEIN K... 271 2e-71
Kun 9% av genene i Arabidopsis thaliana er annotert og karakterisert eksperimentelt (ikke maskinelt). Nesten 40% av genene er uklassifiserte, hypotetiske, ukjente.