BLAST. Blast. Noen mulige sammenstilling av CHAEFAP og CAETP. Evolusjonær basis for sekvenssammenstilling. Sekvenssammenstilling og statistikken brukt

Størrelse: px
Begynne med side:

Download "BLAST. Blast. Noen mulige sammenstilling av CHAEFAP og CAETP. Evolusjonær basis for sekvenssammenstilling. Sekvenssammenstilling og statistikken brukt"

Transkript

1 Blast BLAST Sekvenssammenstilling og statistikken brukt Finner best mulig sammenstilling(er), evt. finner veldig gode sammenstillinger. Kan teoretisk unngå å finne beste sammenstilling. Avgjør om sammenstillingen er god nok for å konkludere med at sekvensene er homologe. Anja Bråthen Kristoffersen 1 Anja Bråthen Kristoffersen 2 Evolusjonær basis for sekvenssammenstilling evolusjon CAEFTP Felles forfar CAEFTP Deles Substitusjon T A (pos. 5) Innsetting H (mellom pos. 1 og 2) evolusjon CAEFTP Delesjon F (pos. 4) Noen mulige sammenstilling av CHAEFAP og CAETP C H A E F A - P C - A - - E T P C H A - E F A P C - A E T - - P C H A E F A P C - A E T P - CHAEFAP Evolusjonær korrekt sammenstilling: CAETP CHAEFAP C-AE-TP Anja Bråthen Kristoffersen 3 Målet er å finne en god sammenstilling som reflekterer hvordan sekvensene hører sammen evolusjonært. Anja Bråthen Kristoffersen 4

2 Grunnspørsmål Gitt en skåringsmatrise (f.eks. BLOSUM 62) og et straffesystem for å innføre gap (f.eks. -11 for å starte gap og -1 for å fortsette et allerede startet gap), hvilken sammenstilling har den høyeste skåren? Enormt mange mulige sammenstillinger mellom to sekvenser. F. eks. hvis vi har to sekvenser som hver er 1000 lang vil det være mer en mulige sammenstillinger. Vi trenger dynamisk programmering eller en heuristisk søkermetode! Dynamisk programmering Needleman-Wunsch algoritmen (global sammenstilling) Smith-Waterman (lokal sammenstilling) Begge disse algoritmene er av orden m*n og finner den høyeste skåren for sammenstilling av to sekvenser som hver er m og n lang. Dermed ville disse algoritmene kunne brukes til å sammenstille to sekvenser som hver er 1000 lang. Men dynamisk programmeringsalgoritmer går alt for sakte for å søke med en søkesekvens mot alle mulige sekvenser i en database for å finne den beste sammenstillingen ParAlign er en implementasjon av Smith-Waterman slik at sammenstillingssøk i store databaser går 8 ganger forterre enn med vanlig Smith-Waterman. Vi vil nå se BLAST, en heuristiske algoritme hvor mye statistikk blir brukt! Anja Bråthen Kristoffersen 5 Anja Bråthen Kristoffersen 6 Heuristiske søkealgoritmer Begrenser søket til en brøkdel av de mulige sammenstillingene på en slik måte at den høyeste skår sammenstillingen forhåpentligvis ikke blir utelatt. Eksempler på slike søkeprogram er: FASTA algoritmen (Lipman og Pearson; 1985) BLAST algoritmen (Altschul, Gish, Miller, Myers og Lipman; 1990) Tar vanligvis bare noen sekunder å sammenlikne en sekvens med en hel database Lokal sammenstilling Vi begrenser oss til lokal sammenstilling. Statistikken er her bedre forstått en for global sammenstilling. Det er også mer fornuftig å bruke lokal sammenstilling for å bestemme homologi mellom to proteiner, mange proteiner er gjennom evolusjon kun homologe over deler av proteinsekvensen. Anja Bråthen Kristoffersen 7 Anja Bråthen Kristoffersen 8

3 BLAST algoritmen 1. Finn alle par av lengde W med skårer over en terskel verdi T, disse kalles hits (W = 3 og T = 11 er oftest brukt). 2. Søk etter to hits innen en predefinert avstand (f. eks. 40 aminosyrer) på samme diagonal og kombiner dem i en høy skårings segment par (HSP). 3. Se kun på de beste HSPene. Utvid disse sekvensene (hvor gap er tillatt) ved hjelp av en dynamisk programmeringsalgoritme inntil skåren kommer under en bestemt terskelverdi (høyeste skår oppnådd så langt minus en bestemt distanse). BLASTs utskrift De sammenstillingene som har fått høyest skår (ikke nødvendigvis den beste sammenstillingen som eksisterer ) Statistisk informasjon om likheten mellom søkersekvensen og sekvensen som blir funnet (hvorvidt likheten er statistisk signifikant, angis med p-verdi og E-verdi) Anja Bråthen Kristoffersen 9 Anja Bråthen Kristoffersen 10 Søkesekvens GCTTGCTTAACGACACC Score E Sequences producing significant alignments: (Bits) Value gi gb AF Grapevine leafroll-associated virus Alignments >gi gb AF Grapevine leafroll-associated virus 3, complete genome Length=17919 Score = 34.2 bits (17), Expect = 1.6 Identities = 17/17 (100%), Gaps = 0/17 (0%) Strand=Plus/Plus Query 1 GCTTGCTTAACGACACC 17 Sbjct 3877 GCTTGCTTAACGACACC 3893 Database: All GenBank+EMBL+DDBJ+PDB sequences (but no EST, STS, GSS,environmental samples or phase 0, 1 or 2 HTGS sequences) Posted date: Oct 28, :46 PM Number of letters in database: -1,366,463,430 Number of sequences in database: 3,542,881 Anja Bråthen Kristoffersen 11 Lambda K H Gapped Lambda K H Matrix: blastn matrix: 1-3 Gap Penalties: Existence: 5, Extension: 2 Number of Sequences: Number of Hits to DB: Number of extensions: 3472 Number of successful extensions: 3472 Number of sequences better than 10: 0 Number of HSP's better than 10 without gapping: 0 Number of HSP's gapped: 3472 Number of HSP's successfully gapped: 0 Number of extra gapped extensions for HSPs above 10: 3472 Length of query: 17 Length of database: Length adjustment: 15 Effective length of query: 2 Effective length of database: Effective search space: Effective search space used: A: 0 X1: 11 (21.8 bits) X2: 15 (29.7 bits) X3: 25 (49.6 bits) S1: 11 (22.3 bits) S2: 16 (32.2 bits) Anja Bråthen Kristoffersen 12

4 Statistisk signifikans Er den oppnådde skåren høy nok for å anta at sekvensen er homologe? (NB! enhver søkersekvens vil oppnå en høyest skår med en sekvens i databasen derfor er det ikke nok å kun lete etter høyeste skår). For å besvare spørsmålet må vi ha en følelse for hvor høy skåren kan bli kun ved tilfeldighet. Statistisk teori bak BLAST Vi ser kun på parvise sammenstillinger uten gap (dvs. enklere versjon av BLAST) Her er teorien enklere og i større grad forstått enn for BLAST med gap. Når gap tillates i BLAST bruker man gjerne en høy straff for å innføre gap (f.eks. -11) derfor er muligens ikke statistikken så forskjellig for BLAST med gap og BLAST uten gap. Anja Bråthen Kristoffersen 13 Anja Bråthen Kristoffersen 14 Hva kan forventes ved ren tilfeldighet? Vi trenger litt forståelse for hva som kan skje ved ren tilfeldighet. Anta at vi har to sekvenser med lengder m og n. Anta videre at hver posisjon i sekvensene er uavhengig og identisk fordelt (iid) med gitte sannsynligheter for hver aminosyre avhengig av erfaring (f.eks. relativ frekvens q 1,q 2,,q 20 ). Gitt en global sammenstilling av de to sekvensene. La skåren mellom to aminosyrer i posisjon j være X j (hvor første posisjon i sammenstillingen har indeks 1 og siste har indeks N) Det er n+m-1 slike globale sammenstillinger som må ses på Anja Bråthen Kristoffersen 15 Anja Bråthen Kristoffersen 16

5 X j ene er, gitt at sekvensene er iid, tilfeldige variable som også er iid. Skåren til den lokale ikke gappede sammenstillingen fra posisjon 0 til k er: For hver av sammenstillingene vil den kumulative skåren være en tilfeldig gange Den tilfeldige prosessen S 0, S 1, S 2,, S N blir da tilfeldig gange prosess. Anja Bråthen Kristoffersen 17 Anja Bråthen Kristoffersen 18 E[S(a,b)] < 0 Når forventningen til skåren mellom to aminosyrer er negativ vil den tilfeldig gangen få en negativ drift. Hvis forventningsverdien var positiv ville den tilfeldige gangen hatt en positiv drift noe som ville ha ført til høyere og høyere kumulativ skår. Da ville vi forventet jo lengre sammenstillinger jo bedre skår for to tilfeldige sekvenser. To lange urelaterte sekvenser ville da forventes å få bedre skår enn to korte relaterte sekvenser! Betingelser for substitusjonsmatrisen Minst et element i substitusjonsmatrisen må være positivt < 0 (dette sikrer at den tilfeldige gangen vil over tid ha drift nedover og vi vil forvente å finne nye stigepunkt (ladder points) med jevne mellomrom) Betingelsene oppnås når skåren er definert som en log-likelihood ratio! Dermed vil både BLOSUM matrisene og PAM matrisene være OK! Anja Bråthen Kristoffersen 19 Anja Bråthen Kristoffersen 20

6 Ekskursjon Stige start ladder Laveste nivå oppnådd hittil Den delen av den tilfeldige gangen som er fra et stigepunkt og til høyeste punkt før neste stigepunkt. La Y i være høyden oppnådd ved i-te ekskursjon. Hvis stigepunktene X i og X i+1 ligger rett etter hverandre vil høyden til Y i være 0. Y i -ene blir da uavhengige tilfeldige variable. Anja Bråthen Kristoffersen 21 Anja Bråthen Kristoffersen 22 Høyeste skår Y max Y max = max(y 1, Y ξ ) hvor ξ er (det tilfeldige) antall ekskursjoner, blir i BLAST brukt som testobservator. Vi må for å bestemme om den høyeste skåren er signifikant eller ikke finne fordelingen til Y max under nullhypotesen: de to sammenstilte sekvensene er tilfeldige. Anja Bråthen Kristoffersen 23 Anja Bråthen Kristoffersen 24

7 Hvordan oppfører en typisk ekskursjon seg? Antall steg før en negativ verdi oppnås Fra teorien til tilfeldig gange har vi at: Fordelingen til Y max? Denne har vi sett på før, allikevel vil jeg vise et lite eksempel som viser at Y max ikke kan ha lik fordeling som Y i tiltross for at Y max vil være en av verdiene Y i. Eksempel: Anta at Z i er en uavhengig tilfeldig variabel slik at for alle k hvor konstanten C, 0 < C < 1, kan beregnes. Forventet antall steg A før en negativ verdi oppnås kan også beregnes Anja Bråthen Kristoffersen 25 La Da vil P(alle Z i er lik 0) = Anja Bråthen Kristoffersen 26 Anta at Z 1, Z 2,, Z n er uavhengige og identisk fordelte tilfeldige variable med P(Z i x) = F(x). La Z max = max{z 1, Z 2,, Z 100 } Da vil P(Y max k) Det kan vises at: og dermed hvor N = antall posisjoner i sammenstillingen og λ (= θ*) er den unike positive løsningen til m(θ*) = 1: og K = (C/A)e λ. Anja Bråthen Kristoffersen 27 Anja Bråthen Kristoffersen 28

8 n+m-1mulige globale sammenstillinger Dermed har vi n + m 1 forskjellige Y max verdier. La S max være maksimum av disse. Dvs. S max er skåren til den høyeste skåren av alle de lokale sammenstillingene E-verdi Vi ser igjen på ekskursjonene Y 1, Y 2,, Y N/A, hvor P(Y i k) C e λk. Antall ekskursjoner som oppnår en høyde på minst k vil cirka være: Dermed kan vi finne en sannsynlighet for at S max er større eller lik k: S max er testobservatoren som blir brukt i BLAST for å beregne p-verdien og E-verdien. hvor I i =1 hvis Y i k og 0 ellers. Da er: Anja Bråthen Kristoffersen 29 Anja Bråthen Kristoffersen 30 E-verdien til Y max = y Anta at du observerer Y max = y, da vil E-verdien til observasjonen være: som vil være lik antall ganger vi forventer at en ekskursjon skal oppnå en verdi som er større eller lik y. BLAST E-verdien i BLAST likner på E-verdien på forrige slide, bare at den bruker S max og fordelingen til S max. BLAST tar også hensyn til størrelsen på datasettet. Vi tok kun hensyn til størrelsen på de to sekvensene som skulle sammenstilles. E-verdien sier altså noe om hvor mange ganger vi forventer å finne en sammenstilling med skår bedre eller lik den skåren vi har funnet i et datasett av den størrelsen vi søker i. Anja Bråthen Kristoffersen 31 Anja Bråthen Kristoffersen 32

Gensøk. Oppsummering. Typer av sammenstillinger. Sammenstilling av sekvenser. To prinsipper for søking etter gener i DNA:

Gensøk. Oppsummering. Typer av sammenstillinger. Sammenstilling av sekvenser. To prinsipper for søking etter gener i DNA: Oppsummering Gensøk Oppsummeringen som gis her omfatter bare de temaer som er forelest av Ole Christian, og er ikke ment å være komplett. I korte trekk gjelder for denne delen av pensum som for de øvrige:

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i : INF2300 Grunnkurs i bioinformatikk Eksamensdag : Tirsdag 15. juni 2004 Tid for eksamen : 09.00 12.00 Oppgavesettet er på : 13

Detaljer

Mer om Markov modeller

Mer om Markov modeller Høyere ordens Markov modeller Mer om Markov modeller p h mnr = Pr( Y j+ 3 = ah Y j+ 2 = am, Y j+ 1 = an, Y j = a : r For en k-te ordens Markov modell som modellerer en DNA prosess vil det være 3*4 k mulige

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamensdag / Day of exam: 3. juni 2006/June 3 th 2006 Tid for eksamen / Exam hours: 900-200 Eksamen i / Exam in: MBV3070 Oppgavesettet

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Kandidatnummer: BOKMÅL UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i : INF3350/INF4350 Grunnkurs i bioinformatikk Eksamensdag : Tirsdag 5. desember 2006 Tid for eksamen : 15.30

Detaljer

MOL204 Anvendt bioinformatikk I

MOL204 Anvendt bioinformatikk I Universitetet i Bergen Molekylærbiologisk institutt Matematisk-naturvitenskapelig Embetseksamen MOL204 Anvendt bioinformatikk I bokmål / nynorsk / english Mandag 15. desember 2008, 4 timer, kl 9:00-13:00

Detaljer

MOL204 Anvendt bioinformatikk I

MOL204 Anvendt bioinformatikk I Universitetet i Bergen Molekylærbiologisk institutt Matematisk-naturvitenskapelig embetseksamen MOL204 Anvendt bioinformatikk I bokmål / nynorsk / english Mandag 17. desember 2007, 4 timer, kl 9:00-13:00

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK2120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 6. juni 2011. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

MOL204 Anvendt bioinformatikk I

MOL204 Anvendt bioinformatikk I Universitetet i Bergen Molekylærbiologisk institutt Matematisk-naturvitenskapelig Embetseksamen MOL204 Anvendt bioinformatikk I bokmål / nynorsk / english Tirsdag 15. februar 2005, 4 timer, kl 9:00-13:00

Detaljer

Mer om søking i sekvenser

Mer om søking i sekvenser Mer om søking i sekvenser agens forelesning orelesning IN335/435 26 sept 27 Ole Christian Lingjærde Gruppen for bioinformatikk Institutt for Informatikk, UiO Kort oppsummering fra sist Globale sammenstillinger

Detaljer

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Eksamen desember 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet

Detaljer

UNIVERSITETET I BERGEN Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I BERGEN Det matematisk-naturvitenskapelige fakultet Skriftlig eksamen/written Examination Emne/Course: MOL204 Anvendt bioinformatikk I / Applied bioinformatics I Dato/Date: 12. februar/12 February Tillatte hjelpemidler (i samsvar med emnebeskrivelsen)/permitted

Detaljer

6.2 Signifikanstester

6.2 Signifikanstester 6.2 Signifikanstester Konfidensintervaller er nyttige når vi ønsker å estimere en populasjonsparameter Signifikanstester er nyttige dersom vi ønsker å teste en hypotese om en parameter i en populasjon

Detaljer

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Eksamen desember 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlege stokastiske variabelen X ha fordelingsfunksjon (sannsynstettleik

Detaljer

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0

Oppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0 Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir

Detaljer

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet BIOKJEMISK INSTITUTT

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet BIOKJEMISK INSTITUTT UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet BIOKJEMISK INSTITUTT Eksamen i: KJB492 - Bioinformatikk, 3 vekttall Eksamensdag: Onsdag 13.november 2000 Tid for eksamen: kl. 09.00-13.00

Detaljer

MOL204 Anvendt bioinformatikk I

MOL204 Anvendt bioinformatikk I Universitetet i Bergen Molekylærbiologisk institutt Matematisk naturvitenskapelig embetseksamen MOL204 Anvendt bioinformatikk I bokmål / nynorsk / english Mandag 20. desember 2010, 4 timer, kl 9:00 13:00

Detaljer

UNIVERSITETET I BERGEN Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I BERGEN Det matematisk-naturvitenskapelige fakultet Skriftlig eksamen/written Examination Emne/Course: MOL204 Anvendt bioinformatikk I / Applied bioinformatics I Dato/Date: 16. desember/16 December Tillatte hjelpemidler (i samsvar med emnebeskrivelsen)/permitted

Detaljer

MOL204 Anvendt bioinformatikk I

MOL204 Anvendt bioinformatikk I Universitetet i Bergen Molekylærbiologisk institutt Matematisk-naturvitenskapelig embetseksamen MOL204 Anvendt bioinformatikk I bokmål / nynorsk / english Mandag 15. februar 2011, 4 timer, kl 9:00-13:00

Detaljer

STK juni 2016

STK juni 2016 Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6

Detaljer

Oppfriskning av blokk 1 i TMA4240

Oppfriskning av blokk 1 i TMA4240 Oppfriskning av blokk 1 i TMA4240 Geir-Arne Fuglstad November 21, 2016 2 Hva har vi gjort i dette kurset? Vi har studert to sterkt relaterte grener av matematikk Sannsynlighetsteori: matematisk teori for

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i : INF2300 Grunnkurs i bioinformatikk Eksamensdag : Mandag 6. juni 2005 Tid for eksamen : 09.00 12.00 Oppgavesettet er på : xx

Detaljer

Bioberegninger - notat 4: Mer om sannsynlighetsmaksimering

Bioberegninger - notat 4: Mer om sannsynlighetsmaksimering Bioberegninger - notat 4: Mer om sannsynlighetsmaksimering 8. mars 2004 1 Kort om Newton s metode i flere dimensjoner Newton s metode kan generaliseres til å løse sett av n ligninger med n ukjente. Skal

Detaljer

Forelesning 9 Kjikvadrattesten. Kjikvadrattest for bivariate tabeller (klassisk variant) Når kan vi forkaste H 0?

Forelesning 9 Kjikvadrattesten. Kjikvadrattest for bivariate tabeller (klassisk variant) Når kan vi forkaste H 0? Forelesning 9 Kjikvadrattesten Kjikvadrattesten er den mest benyttede metoden for å utføre statistiske generaliseringer fra bivariate tabeller. Kjikvadrattesten brukes til å teste nullhypotesen om at det

Detaljer

7 Egenverdier og egenvektorer TMA4110 høsten 2018

7 Egenverdier og egenvektorer TMA4110 høsten 2018 7 Egenverdier og egenvektorer TMA4 høsten 8 Det er ofte hensiktsmessig å tenke på en matrise ikke bare som en tabell med tall, men som en transformasjon av vektorer. Hvis A er en m n-matrise, så gir A

Detaljer

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån. http://unstats.un.org/unsd/wsd/

Verdens statistikk-dag. Signifikanstester. Eksempel studentlån. http://unstats.un.org/unsd/wsd/ Verdens statistikk-dag http://unstats.un.org/unsd/wsd/ Signifikanstester Ønsker å teste hypotese om populasjon Bruker data til å teste hypotese Typisk prosedyre Beregn sannsynlighet for utfall av observator

Detaljer

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20). Econ 130 HG mars 017 Supplement til forelesningen 7. februar Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.0). Regel 5.19 sier at summer, Y X1 X X

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

TMA4240 Statistikk H2010 (20)

TMA4240 Statistikk H2010 (20) TMA4240 Statistikk H2010 (20) 10.5: Ett normalfordelt utvalg, kjent varians (repetisjon) 10.4: P-verdi 10.6: Konfidensintervall vs. hypotesetest 10.7: Ett normalfordelt utvalg, ukjent varians Mette Langaas

Detaljer

Egenverdier og egenvektorer

Egenverdier og egenvektorer Kapittel 9 Egenverdier og egenvektorer Det er ofte hensiktsmessig å tenke på en matrise ikke bare som en tabell med tall, men som en transformasjon av vektorer Hvis A er en m n-matrise, så gir A en transformasjon

Detaljer

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2. Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Sara Martino a, Torstein Fjeldstad b Tlf: a 994 03 330, b 962 09 710 Eksamensdato: 28. november 2018 Eksamenstid

Detaljer

Hypotesetesting. mot. mot. mot. ˆ x

Hypotesetesting. mot. mot. mot. ˆ x Kapittel 6.4-6.5: ypotesetesting ypotesetesting er en standard vitenskapelig fremgangsmåte for å sjekke påstander. Generell problemstilling: Basert på informasjonen i data fra et tilfeldig utvalg ønsker

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

Verdens statistikk-dag.

Verdens statistikk-dag. Verdens statistikk-dag http://unstats.un.org/unsd/wsd/ Signifikanstester Ønsker å teste hypotese om populasjon Bruker data til å teste hypotese Typisk prosedyre Beregn sannsynlighet for utfall av observator

Detaljer

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.

Kontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt. Eksamen i: MET00 Statistikk for økonomer Eksamensdag: 8. november 2007 Tid for eksamen: 09.00-13.00 Oppgavesettet er på 5 sider. Tillatte hjelpemidler: Alle trykte eller egenskrevne hjelpemidler og kalkulator.

Detaljer

Notat 3 - ST februar 2005

Notat 3 - ST februar 2005 Notat 3 - ST1301 1. februar 2005 1 Simulering fra modell Når vi skal analysere et gitt konkret innsamlet datasett vil vi gjøre dette med utgangspunkt i en statistisk modell. Vi kan si at en slik statistisk

Detaljer

Kapittel 3: Studieopplegg

Kapittel 3: Studieopplegg Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere

Detaljer

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 10 LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011 Oppgave 1 Oljeleting a) Siden P(A

Detaljer

+ S2 Y ) 2. = 6.737 6 (avrundet nedover til nærmeste heltall) n Y 1

+ S2 Y ) 2. = 6.737 6 (avrundet nedover til nærmeste heltall) n Y 1 Løsningsforslag for: MOT10 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 6. november 007 TILLATTE HJELPEMIDLER: Kalkulator: HP0S, Casio FX8 eller TI-0 Tabeller og formler i statistikk (Tapir forlag) MERKNADER:

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1110 FASIT. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider. Vedlegg: Tillatte

Detaljer

MOL204 Anvendt bioinformatikk I

MOL204 Anvendt bioinformatikk I Universitetet i Bergen Molekylærbiologisk institutt Matematisk-naturvitenskapelig Embetseksamen MOL204 Anvendt bioinformatikk I bokmål / nynorsk / english Torsdag 4. Mai 2006, 4 timer, kl 9:00-13:00 Alle

Detaljer

LP. Leksjon 6: Kap. 6: simpleksmetoden i matriseform, og Seksjon 7.1: følsomhetsanalyse

LP. Leksjon 6: Kap. 6: simpleksmetoden i matriseform, og Seksjon 7.1: følsomhetsanalyse LP. Leksjon 6: Kap. 6: simpleksmetoden i matriseform, og Seksjon 7.1: følsomhetsanalyse matrisenotasjon simpleksalgoritmen i matrisenotasjon eksempel negativ transponert egenskap: bevis følsomhetsanalyse

Detaljer

MOL204 Anvendt bioinformatikk I

MOL204 Anvendt bioinformatikk I Universitetet i Bergen Molekylærbiologisk institutt Matematisk-naturvitenskapelig Embetseksamen MOL204 Anvendt bioinformatikk I bokmål / nynorsk / english Onsdag 21. desember 2005, 4 timer, kl 9:00-13:00

Detaljer

TMA4240 Statistikk H2015

TMA4240 Statistikk H2015 TMA4240 Statistikk H2015 Funksjoner av stokastiske variabler (kapittel 7+notat) Fokus på start med kumulativ fordeling 7.2 Funksjon av en SV (inkludert en-entydighet). Fordeling til max/min (fra notat).

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig

Detaljer

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

Eksamensoppgave i ST1201/ST6201 Statistiske metoder Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: 20. desember 2016 Eksamenstid (fra til): 09:00

Detaljer

Ridge regresjon og lasso notat til STK2120

Ridge regresjon og lasso notat til STK2120 Ridge regresjon og lasso notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på noen alternativer til minste kvadraters metode ved lineær regresjon. Metodene er særlig aktuelle

Detaljer

Eksamen INF3350/INF4350 H2006 Løsningsforslag

Eksamen INF3350/INF4350 H2006 Løsningsforslag Eksame INF3350/INF4350 H2006 Løsigsforslag Oppgave. Score (eller bit score) S' er e statistisk idikator på hvor sigifikat e match er. Høyere bit score svarer til høyere sigifikas. Idikatore er uavhegig

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig

Detaljer

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00

EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER Torsdag 14. desember 2006 Tid: 09:0013:00 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist, tlf. 975 89 418 EKSAMEN I FAG TMA4315 GENERALISERTE LINEÆRE MODELLER

Detaljer

Skanning del I. Kapittel 2 INF 3110/ INF

Skanning del I. Kapittel 2 INF 3110/ INF Skanning del I Kapittel 2 18.01.2013 1 Skanning: innhold (begge forelesningene) Hva gjør en skanner? Input: programteksten. Output: Ett og ett token fra programteksten (sekvensielt). Regulære uttrykk/definisjoner.

Detaljer

Kapittel 3: degenerasjon.

Kapittel 3: degenerasjon. LP. Leksjon 3 Kapittel 3: degenerasjon. degenerasjon eksempel på sirkling den leksikografiske metoden andre pivoteringsregler fundamentaleoremet i LP LP. Leksjon 3: #1 of 15 Repetisjon simpleksalgoritmen:

Detaljer

Logistisk regresjon 1

Logistisk regresjon 1 Logistisk regresjon Hovedideen: Binær logistisk regresjon håndterer avhengige, dikotome variable Et hovedmål er å predikere sannsynligheter for å ha verdien på avhengig variabel for bestemte (sosiale)

Detaljer

MOL204 Anvendt bioinformatikk I

MOL204 Anvendt bioinformatikk I Universitetet i Bergen Molekylærbiologisk institutt Matematisk-naturvitenskapelig embetseksamen MOL204 Anvendt bioinformatikk I bokmål / nynorsk / english Tirsdag 16. februar 2010, 4 timer, kl 9:00-13:00

Detaljer

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår Løsningsforslag ECON 130 Obligatorisk semesteroppgave 017 vår Andreas Myhre Oppgave 1 1. (i) Siden X og Z er uavhengige, vil den simultane fordelingen mellom X og Z kunne skrives som: f(x, z) = P(X = x

Detaljer

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl. 10.00-12.

MASTER I IDRETTSVITENSKAP 2014/2016. Utsatt individuell skriftlig eksamen. STA 400- Statistikk. Mandag 24. august 2015 kl. 10.00-12. MASTR I IDRTTSVITNSKAP 2014/2016 Utsatt individuell skriftlig eksamen i STA 400- Statistikk Mandag 24. august 2015 kl. 10.00-12.00 Hjelpemidler: kalkulator ksamensoppgaven består av 10 sider inkludert

Detaljer

MOL204 Anvendt bioinformatikk I. MOL204 Applied Bioinformatics I

MOL204 Anvendt bioinformatikk I. MOL204 Applied Bioinformatics I Universitetet i Bergen Molekylærbiologisk institutt Matematisk naturvitenskapelig embetseksamen MOL204 Anvendt bioinformatikk I bokmål / nynorsk / english Onsdag 21. mai 2008, 4 timer, kl 9:00 13:00 Alle

Detaljer

Kan vi stole på resultater fra «liten N»?

Kan vi stole på resultater fra «liten N»? Kan vi stole på resultater fra «liten N»? Olav M. Kvalheim Universitetet i Bergen Plan for dette foredraget Hypotesetesting og p-verdier for å undersøke en variabel p-verdier når det er mange variabler

Detaljer

Søkeproblemet. Gitt en datastruktur med n elementer: Finnes et bestemt element (eller en bestemt verdi) x lagret i datastrukturen eller ikke?

Søkeproblemet. Gitt en datastruktur med n elementer: Finnes et bestemt element (eller en bestemt verdi) x lagret i datastrukturen eller ikke? Søking Søkeproblemet Gitt en datastruktur med n elementer: Finnes et bestemt element (eller en bestemt verdi) x lagret i datastrukturen eller ikke? Effektiviteten til søkealgoritmer avhenger av: Om datastrukturen

Detaljer

Arabidopsis thaliana, vårskrinneblom

Arabidopsis thaliana, vårskrinneblom Arabidopsis thaliana, vårskrinneblom Tilhører Brassicaceae familien og ligger under ordenen Capparales. Nært beslektede planter er f. eks. raps og kål. Arabidopsis thaliana har i flere år vært en av modell

Detaljer

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 27. februar 2017 (4 timer)

SKOLEEKSAMEN I SOS KVANTITATIV METODE. 27. februar 2017 (4 timer) Institutt for sosiologi og samfunnsgeografi BOKMÅL SKOLEEKSAMEN I SOS4020 - KVANTITATIV METODE 27. februar 2017 (4 timer) Tillatte hjelpemidler: Alle skriftlige hjelpemidler og kalkulator. Sensur for eksamen

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2. Eksamensdag: Tirsdag 2. juni 2009. Tid for eksamen: 14.30 17.30. Oppgavesettet

Detaljer

Profil Lavpris Supermarked Hypermarked Totalt. Coop Prix 4 4. Coop Extra 13 5. Coop Mega 7 7. Coop Obs 5 13. Rimi 24 24. Ica Supermarked 7 7

Profil Lavpris Supermarked Hypermarked Totalt. Coop Prix 4 4. Coop Extra 13 5. Coop Mega 7 7. Coop Obs 5 13. Rimi 24 24. Ica Supermarked 7 7 Vedlegg 1 - Regresjonsanalyser 1 Innledning og formål (1) Konkurransetilsynet har i forbindelse med Vedtak 2015-24, (heretter "Vedtaket") utført kvantitative analyser på data fra kundeundersøkelsen. I

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 7. oktober 2009. Tid for eksamen: 15:00 17:00. Oppgavesettet er på

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Analysere en observator for å finne ut noe om korresponderende

Detaljer

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: 30.mai 2016. Klokkeslett: 09 13. Sted: Tillatte hjelpemidler: Teorifagbygget, «Tabeller og formler i statistikk» av Kvaløy

Detaljer

MOL204 Anvendt bioinformatikk I

MOL204 Anvendt bioinformatikk I Universitetet i Bergen Molekylærbiologisk institutt Matematisk naturvitenskapelig embetseksamen MOL204 Anvendt bioinformatikk I bokmål / nynorsk / english Mandag 14. desember 2009, 4 timer, kl 9:00 13:00

Detaljer

Innlevering 2a i INF2810, vår 2017

Innlevering 2a i INF2810, vår 2017 Innlevering 2a i INF2810, vår 2017 Hovedtematikken denne gang er Huffman-koding, som ble dekket i 6. forelesning (23. februar) og i seksjon 2.3.4 i SICP. Det er viktig å ha lest denne seksjonen før dere

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Å analysere en utvalgsobservator for å trekke slutninger

Detaljer

Hypotesetesting: Prinsipper. Frode Svartdal UiTø Januar 2014 Frode Svartdal

Hypotesetesting: Prinsipper. Frode Svartdal UiTø Januar 2014 Frode Svartdal Hypotesetesting: Prinsipper Frode Svartdal UiTø Januar 2014 Frode Svartdal Alt dette er mat for hypotesetesting! Utgangspunkt En antakelse begrunnet i teori Dissonansteori: Hvis, så. En vanlig oppfatning

Detaljer

Casio. Et oppdatert Casio Manual som tar av seg litt av faget MA-155. En basis guide for bruk av Casio. Denne manualen er skrevet av «EFN»

Casio. Et oppdatert Casio Manual som tar av seg litt av faget MA-155. En basis guide for bruk av Casio. Denne manualen er skrevet av «EFN» Casio Et oppdatert Casio Manual som tar av seg litt av faget MA-155. En basis guide for bruk av Casio. Denne manualen er skrevet av «EFN» Denne manualen bruker eksempler fra utgaven 2017: Statistikk En

Detaljer

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl. 10.00-12.00

MASTER I IDRETTSVITENSKAP 2014/2016. Individuell skriftlig eksamen. STA 400- Statistikk. Fredag 13. mars 2015 kl. 10.00-12.00 MASTER I IDRETTSVITENSKAP 2014/2016 Individuell skriftlig eksamen i STA 400- Statistikk Fredag 13. mars 2015 kl. 10.00-12.00 Hjelpemidler: kalkulator Eksamensoppgaven består av 10 sider inkludert forsiden

Detaljer

LP. Leksjon 3. Kapittel 3: degenerasjon.

LP. Leksjon 3. Kapittel 3: degenerasjon. LP. Leksjon 3. Kapittel 3: degenerasjon. degenerasjon eksempel på sirkling den leksikografiske metoden andre pivoteringsregler fundamentaleoremet i LP 1 / 23 Repetisjon simpleksalgoritmen: sekvens av pivoteringer

Detaljer

Statistikk. Forkurs 2017

Statistikk. Forkurs 2017 Statistikk Forkurs 2017 Hva er statistikk? Undersøke Registrere Lage oversikt Presentasjon av informasjon Formidle Arbeidet med statistikk kan vi dele inn i to hovedområder: Samle inn og ordne opplysninger

Detaljer

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK

EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 12 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK Onsdag

Detaljer

Søk i sekvenser. Sekvenssøk. Sammenstillinger av sekvenser. Global og lokal sammenstilling. Global sammenstilling: Lokal sammenstilling:

Søk i sekvenser. Sekvenssøk. Sammenstillinger av sekvenser. Global og lokal sammenstilling. Global sammenstilling: Lokal sammenstilling: øk i sekvenser ekvenssøk Forelesning NF3350/4350 9. sept 2007 Ole Christian ingjærde Gruppen for bioinformatikk nstitutt for nformatikk, UiO Mål:identifisere hvilke sekvenser i en sekvensdatabase som er

Detaljer

4 Matriser TMA4110 høsten 2018

4 Matriser TMA4110 høsten 2018 Matriser TMA høsten 8 Nå har vi fått erfaring med å bruke matriser i et par forskjellige sammenhenger Vi har lært å løse et lineært likningssystem ved å sette opp totalmatrisen til systemet og gausseliminere

Detaljer

Obligatorisk oppgavesett 1 MAT1120 H16

Obligatorisk oppgavesett 1 MAT1120 H16 Obligatorisk oppgavesett MAT0 H6 Innleveringsfrist: torsdag /09 06, innen kl 4.30. Besvarelsen leveres på Matematisk institutt, 7. etasje i N.H. Abels hus. Husk å bruke forsiden som du finner via hjemmesiden.

Detaljer

Formelsamling i medisinsk statistikk

Formelsamling i medisinsk statistikk Formelsamling i medisinsk statistikk Versjon av 6. mai 208 Dette er en formelsamling til O. O. Aalen (red.): Statistiske metoder i medisin og helsefag, Gyldendal, 208. Gjennomsnitt x = n (x + x 2 + x 3

Detaljer

Datastrukturer for rask søking

Datastrukturer for rask søking Søking Søkeproblemet Gitt en datastruktur med n elementer: Finnes et bestemt element (eller en bestemt verdi) x lagret i datastrukturen eller ikke? Effektiviteten til søkealgoritmer avhenger av: Om datastrukturen

Detaljer

Logistisk regresjon 2

Logistisk regresjon 2 Logistisk regresjon 2 SPSS Utskrift: Trivariat regresjon a KJONN UTDAAR Constant Variables in the Equation B S.E. Wald df Sig. Exp(B) -,536,3 84,56,000,25,84,08 09,956,000,202 -,469,083 35,7,000,230 a.

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Det er to populasjoner som vi ønsker å sammenligne. Vi trekker da et utvalg

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 11 Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale begreper

Detaljer

Tilleggsoppgaver for STK1110 Høst 2015

Tilleggsoppgaver for STK1110 Høst 2015 Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0

Detaljer

i x i

i x i TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 11, blokk II Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale

Detaljer

UNIVERSITETET I BERGEN Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I BERGEN Det matematisk-naturvitenskapelige fakultet Skriftlig eksamen/written Examination Emne/Course: MOL204 Anvendt bioinformatikk I / Applied bioinformatics I Dato/Date: 17. desember/17 December Tillatte hjelpemidler (i samsvar med emnebeskrivelsen)/permitted

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Mandag 1. desember 2014. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

Skanning del I INF /01/15 1

Skanning del I INF /01/15 1 Skanning del I INF 5110-2015 21/01/15 1 Skanning: innhold (begge forelesningene) Hva gjør en skanner? Input: Programteksten. Output: Ett og ett token fra programteksten (sekvensielt). Regulære uttrykk/definisjoner.

Detaljer

Statistikk. Forkurs 2018

Statistikk. Forkurs 2018 Statistikk Forkurs 2018 Hva er statistikk? Undersøke Registrere Lage oversikt Presentasjon av informasjon Formidle Arbeidet med statistikk kan vi dele inn i to hovedområder: Samle inn og ordne opplysninger

Detaljer

MOL204 Anvendt bioinformatikk I og KB207 Anvendt bioinformatikk

MOL204 Anvendt bioinformatikk I og KB207 Anvendt bioinformatikk Universitetet i Bergen Molekylærbiologisk institutt Matematisk-naturvitenskapelig Embetseksamen MOL204 Anvendt bioinformatikk I og KB207 Anvendt bioinformatikk bokmål / nynorsk / english Onsdag 17. desember

Detaljer

PQ: HEAP. Heap. Er disse heap er? Hvordan implementere heap:

PQ: HEAP. Heap. Er disse heap er? Hvordan implementere heap: PQ: HEAP Ingen sammenheng med memory heap Definisjon og data-invarianter for heap InsertKey og RemoveMin for heap Kompleksitet for operasjoner: O(log n) Prioritetskø impl vha Heap Heap En heap er et binært

Detaljer

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.

EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller. KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. BtG27 EKSAMENSDATO: 27. mai 211. KLASSE: HIS 8 11. TID: kl. 8. 13.. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 3 innkl. forside) TILLATTE

Detaljer

Scanning - I Kap. 2. Hva scanneren gjør

Scanning - I Kap. 2. Hva scanneren gjør Scanning - I Kap. 2!! Hovedmål! Gå ut fra en beskrivelse av de enkelte tokens, og hvordan de skal deles opp i klasser! Lage et program (funksjon, prosedyre, metode) som leverer ett og ett token, med all

Detaljer

UNIVERSITETET I OSLO Matematisk Institutt

UNIVERSITETET I OSLO Matematisk Institutt UNIVERSITETET I OSLO Matematisk Institutt Midtveiseksamen i: STK 1000: Innføring i anvendt statistikk Tid for eksamen: Onsdag 9. oktober 2013, 11:00 13:00 Hjelpemidler: Lærebok, ordliste for STK1000, godkjent

Detaljer

Introduksjon til inferens

Introduksjon til inferens Introduksjon til inferens Hittil: Populasjon der verdien til et individ/enhet beskrives med en fordeling. Her inngår vanligvis ukjente parametre, μ, p,... Enkelt tilfeldig utvalg (SRS), observator p =

Detaljer

Eksamen iin115 og IN110, 15. mai 1997 Side 2 Oppgave 1 Trær 55 % Vi skal i denne oppgaven se på en form for søkestrukturer som er spesielt godt egnet

Eksamen iin115 og IN110, 15. mai 1997 Side 2 Oppgave 1 Trær 55 % Vi skal i denne oppgaven se på en form for søkestrukturer som er spesielt godt egnet UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i IN 115 og IN110 Algoritmer og datastrukturer Eksamensdag: 15. mai 1997 Tid for eksamen: 9.00 15.00 Oppgavesettet er på 8 sider.

Detaljer

Notat 6 - ST februar 2005

Notat 6 - ST februar 2005 Notat 6 - ST1301 22. februar 2005 1 Instruksjoner som data I begynnelsen av kurset definerte vi data som informasjon uttrykkt i et programmeringsspråk. Slike data kan være av ulik type, f.eks. enkle skalarer

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK2520 Problemer og metoder i aktuarfag. Eksamensdag: Onsdag 4. desember 2013 Tid for eksamen: 09.00 13.00 Oppgavesettet er på

Detaljer