Algoritmer for klustering av mikromatriser. Kompleks prosess. Forelesning # 9. Sammenlikning av flere populasjoner. Mange gener og få prøver

Størrelse: px
Begynne med side:

Download "Algoritmer for klustering av mikromatriser. Kompleks prosess. Forelesning # 9. Sammenlikning av flere populasjoner. Mange gener og få prøver"

Transkript

1 , most ing ingle tip sists of nally xtract mages, it tely of each of ming this lify and ess. nalyze n each, most ing ingle tip sists of onally xtract mages, it tely of each of ming this lify and ess. analyze n each, most ing ingle tip sists of nally xtract mages, it tely of each of ming this lify and ess. nalyze n each Algoritmer for klustering av mikromatriser Kompleks prosess Forelesning # 9 Biological question Differentially expressed genes Sample class prediction etc. Experimental design Lars O. Baumbusch Radiumhospitalet Rikshospitalet HF Senter for Bioinformatikk, IFI, UiO Forelesning er en modifiserte versjon av forlesninger utarbeidet av Ole Christian Lingjærde og andre Estimation Microarray experiment -bit TIFF files Image analysis (Rfg, Rbg), (Gfg, Gbg) Normalization R, G Testing Clustering Discrimination Biological verification and interpretation Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Sammenlikning av flere populasjoner Mange og få Det er ofte interessant å sammenlikne gen-ekspresjonen i mange forskjellige populasjoner: prøve + referanse prøve + referanse prøve + referanse... Identifikasjon av vevsspesifikke Søke etter endringer i genekspresjon når normale celler endrer seg til kreftceller mikroarray mikroarray mikroarray... Skille mellom ulike ekspresjonsmønstre i samme krefttyper Studere cellulære responser til endringer i omgivelsene (f.eks. virusinfeksjon, giftstoffer, legemiddler) Antall variable () er normalt er langt større enn antall observasjoner () rød : høy ekspresjon grønn : lav ekspresjon Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Betydelige variasjon Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00

2 Tabeller over genekspresjoner Log(R/G) har mer symmetrisk fordeling x x x x x x x x x sampler Ratio Histogram Log(ratio) Histogram x = genekspresjon for i'te gen i j'te prøve ij rød intensitet = log grønn intensitet Frequency Ratio Frequency Log(ratio) Tabellen med genekspresjonsdata (eller kopitall) er ofte startpunktet for statistiske analyser av mikromatrisedata log () = 0 log () = log (/) = - Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00. Normalisering Forsøk på å fjerne systematiske feil i målingene Mål: fjerne effekten av alle ikke-biologiske (matrise-spesifikke og målespesifikke) faktorer som måtte påvirke målt intensitet For normaliserte data skal enhver forskjell i måleverdi ideelt sett skyldes forskjell i genekspresjon Normalisering er ofte nødvendig for å kunne sammenlikne data fra en mikromatrise med data fra en annen. Reduksjon av antall Vanligvis er vi mest interessert i de som ikke har samme ekspresjon i alle prøvene Gener som varierer lite i ekspresjon kan isåfall utelukkes fra datasettet. Det er mange måter å gjøre dette på; en av de metodene som ofte benyttes er følgende: For rad (gen) i=,,...,n: finn radmedianen μ i tell antall j=,,...,m som oppfyller Xij < μi eller Xij > μi + Fjern raden (genet) fra datasettet hvis antallet er mindre enn k (med f.eks. k=) Xi Xi Xi beholder kun med k eller flere interessante verdier Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 8

3 Eksempler på objekter og egenskaper Eksempel på problemstilling I Objekter: Stjerner Egenskaper: Lysstyrke og overflatetemperatur Objekter: Gener Egenskaper: Ekspresjon i 0 ulike vevs Objekter: Vevs Egenskaper: Ekspresjon av Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 9 Vil klustre 00 personer med hensyn på inntekt og formue Utgangspunkt: Data om personene INNTEKT Individ nr Inntekt Formue Individ og bør åpenbart havne i samme kluster, men hva med individ 00, som er temmelig lik individ og? Skal (forskjeller i) inntekt og formue vektes likt? Er det rimelig å fastlegge antall klustre på forhånd, eller skal dataene tale for seg selv? FORMUE Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 0 Eksempel på problemstilling II Eksempel på problemstilling III Anta at dataene så slik ut: Hvor mange klustere har vi her: Individ nr... Inntekt Formue INNTEKT FORMUE Kan vi snakke om klustere her? Hvor mange? Ulike klustringsmetoder kan her gi svært forskjellige svar Og her: Slike situasjoner er mest problematiske i høyere dimensjon (f.eks. punktene på et fler-dimensjonalt rom, da kan vi ikke så lett visualisere den romlige strukturen) Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00

4 Hvordan klustre? Anta at vi ønsker å finne klustere av. Tenk på hvert gen (hver rad) som en vektor: Y = ( Y, Y,, Y ), i =,,, n i i i im Hvordan klustre? Formelt ønsker vi å finne en funksjon c(i) som tilordner den i'te vektoren Y i til en av k klasser: c : {,,...,n} {,,...,k} Klusteranalyse søker å arrangere vektorene i grupper (klustere) av vektorer slik at medlemmene innen en gruppe er mer like enn medlemmer fra ulike grupper. Eksempel (m=): Dvs c(i) er klassen (klusteret) til vektoren Y i. i c(i) Y i Her er det naturlig å arrangere punktene (vektorene) i tre klustere Yi Y i Y i Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Resultatet av klustring Eksempel Resultatet av en klustring kan være: navngitte klustre For hvert objekt angis hvilket kluster (f.eks. kluster, kluster,...) objektet tilhører anonyme klustre For hvert objekt angis hvilke andre objekter som tilhører samme kluster Navngitte klustre: Anonyme klustre: Objekt x x x x x x x x x Kluster x x x x x x x x x x x x x x x x Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00

5 , most ing ingle tip sists of onally xtract mages, it tely of each of ming this lify and ess. analyze n each, most ing ingle tip sists of nally xtract mages, it tely of each of ming this lify and ess. nalyze n each Konklusjon Hvorfor klustre ekspresjonsdata? Hvorfor klustre : Ikke alltid opplagt hva som bør utgjøre et kluster! Ulike klustermetoder kan gi veldig ulike grupperinger Hva som definerer interessante klustre er problemavhengig Resultatene av å kjøre en klustermetode på høydimensjonale data må alltid tolkes med varsomhet vi kan ikke validere resultatet med et enkelt plot av dataene Redusere kompleksitet: identifisere typiske ekspresjonsmønstre Generere hypoteser: liknende ekspresjonsmønster kan være indikasjon på liknende funksjon eller koregulering Hvorfor klustre : Identifisere kjente kategoriseringer (f.eks. i friske og syke ) basert på ekspresjon Finne nye (eller mer detaljerte) kategoriseringer (f.eks. subtyper av en sykdom) basert på ekspresjon Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 8 Klustring av genekspresjonsdata Objektene som skal klustres er da en av følgende: Genekspresjonsdata Anta at vi har genekspresjonsdata på G og A arrayer:, hvor hvert gen er beskrevet av et sett av genekspresjonsverdier (en verdi for hver array) arrayer/, hvor hver array/prøve er beskrevet av et sett av genekspresjonsverdier (en verdi for hvert gen) prøve referanse mikroarray prøve A referanse + mikroarray Ofte ønsker en klustre både og arrayer: klustre (som over) klustre arrayer (som over) felles presentasjon av begge klustringer A A sampler xg xg xga Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 9 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 0

6 x ij = Genekspresjonsdata A A G G GA genekspresjon for i'te gen i j'te prøve Antar at preprosessering (filtrering, normalisering) og eventuell transformasjon (f.eks. til log-skala) er utført Klustring av Hvert gen beskrives som en A-dimensjonal vektor: A A G G GA x x To i og j ligger nær hverandre dersom avstanden mellom de tilhørende vektorene x i og x j er liten x G Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Klustring av Hver array/prøve beskrives som en G-dimensjonal vektor: A A G G GA x x x A To i og j ligger nær hverandre dersom avstanden mellom de tilhørende vektorene x i og x j er liten. Ting vi må ta stilling til Objektets egenskaper Hvilke egenskaper ved objektene ønsker vi å se på? Avstandsmål Hvordan skal vi måle avstand/likhet mellom objekter? Klustringsmetode Hvordan ønsker vi at grupperingen skal foregå? Presentasjon av resultatet Hvordan ønsker vi resultatet presentert? Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00

7 Eksempel: Klustring av rader i et bilde tilfeldig permutasjon av radene Ordning av radene basert på hierarkisk klustring av radvektorene (mer om hierarkisk klustring senere i forelesningen) (Eksempel fra Gavin Sherlock, MGED V, 00) (Eksempel fra Gavin Sherlock, MGED V, 00) Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 pause Klustering metoder K-means klustering Hierarkisk klustring Self-organizing maps (SOM) Prinsipalkomponent klustring Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 8

8 Distance measure Define distance or dissimilarity measure between genes: Convert gene expression matrix in a distance matrix Two different types of similarity for two sets of gene expression levels and the correlation of gene expression between two arrays can be observed:. Has gene in array A approximately the same level of expression compared to gene in array B = mean distance. Coordinated changes from gene to gene across two arrays = correlation measure Distance measure Euclidean distance: Is the square root of the sum of squared distances between expression data points When comparing x gene expression with y gene expression at time point i (assuming there are n time points in total), the distance score (d) can be calculated by: n d = ( x y ) i= i i Distance can be expressed as Euclidean distance or Pearson correlation coefficient Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 9 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 0 Distance measure Example of Euclidian and Manhattan distance Variable (,) Euclidean distance: d( xy, ) = ( x y ) k k Manhattan- distance: d( xy, ) = xk yk (,) Variable Euclidian distance Manhattan distance (+=8) Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 8

9 Distance measure Pearson correlation coefficient: Measures the overall similarity between the trends or shapes of two sets of data Perfect positive correlation = Perfect negative correlation = - Distance score (d) can be calcluated as: n xi x yi y d = n i= sdi sdi (Were n is the total number of time points, x and y are average values for the x gene and y gene data, and sd are the standard deviation values Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Avstandsmål Pearsons korrelasjonskoeffisient: cov( xy, ) ( xk x)( yk y) r( xy, ) = = sd( x) sd( y) ( x x) ( y y) (cov = co-varians, sd standard deviation) Dette er et similaritetsmål, ikke et avstandsmål Geometrisk tolking: anta at vi har sentrert vektorene x og y: x x x y y y Da er xy k k x y cosθ r( xy, ) = = = cosθ x y x y k hvor θ er vinkelen mellom vektorene x og y k k k Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Pearsons korrelasjonskoeffisient k-means klustring To vektorer x og y (sentrerte): x Samme vektorer, nå skalert: ax Basisalgoritmen: θ y Euklidsk avstand (svarer til stiplede linjer) avhenger av skaleringen Pearsons korrelasjonskoeffisient (svarer til vinkler) avhenger ikke av skaleringen Med Pearson korrelasjon er ikke skaleringen av dataene viktig; med Euklidsk avstand er den det θ by. Antall klustre k bestemmes av bruker. Foreta en initiell tilordning av objekter til klustre. Beregn senteret i hvert kluster. Tilordne hvert objekt til nærmeste kluster (= nærmeste senter). Repeter steg - inntil klusterne har stabilisert seg Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 9

10 Initiell tilordning av punkter til klustre Beregning av klustersentre Tre metoder for initiell tilordning av objekter til klustre: Plasser k punkter i tilfeldige posisjoner i det rommet dataene ligger, og tilordne hvert objekt til det nærmeste av disse punktene Velg tilfeldig ut k av punktene som skal klustres, og tilordne hvert objekt til det nærmeste av disse punktene Fordel tilfeldig punktene som skal klustres i k grupper av tilnærmet samme størrelse. Dette kan f.eks. gjøres ved å starte med følgende klustertilordning: La x x være punktene som tilhører et bestemt kluster., r Klustersenteret blir da: r r i= z = xi (,,,,,,,,,,,,...) (de tre første datapunktene tilordnes kluster, osv) og foreta en tilfeldig permutasjon Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 8 Tilordne hvert punkt til nærmeste senter Eksempel med k= klustre: Hierarkiske klustringsmetoder Konstruerer et hierarki av klustere (en trestruktur) 9 Resulterer i et dendrogram hvor man kan få ut en partisjonering av dataene i så mange klustere man ønsker (fra ett kluster til n klustere, hvor n er antall objekter som klustres) 0 8 To hovedgrupper av beregningsalgoritmer: agglomerative: start med hvert objekt som et eget kluster, og slå sammen klustere iterativt helt til bare ett kluster gjenstår divisive: start med alle objekter i ett kluster, og del opp på beste måte iterativt helt til hvert kluster bare består av ett objekt Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 9 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst

11 8 9 Hierarkisk klustring Resultatet er en nestet sekvens av partisjoner av dataene (partisjoner inni partisjoner) som normalt vises i form av et dendrogram Ordningen av objektene (genene, prøvene) er ikke entydig i et dendrogram: ved hver forgrening kan vi velge å bytte om plasseringen av høyre og venstre gren Tre sentrale varianter: single-link, complete-link, averagelink Mange varianter Avstanden mellom to klustre kan defineres på flere måter: Single linkage : bruk minste punktavstand Complete linkage: bruk største punktavstand Average linkage : bruk gjennomsnittlig punktavstand Complete linkage Single linkage Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Eksempel SOM (self-organizing maps) Single-linkage: SOM er opprinnelig inspirerert av biologiske forbilder Y i Y i I de sensoriske delene av nervesystemet tilpasses nerveforbindelsene i henhold til de mønstre som systemet presenteres for Algoritmene som benyttes i SOM har en meget grov analogi til de prinsippene som opererer i de biologiske forbildene Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00

12 Prinsipalkomponent klustring Anta at punktene x,...,x n som skal klustres ligger i R p. Gitt en vektor z i R p av lengde kan vi finne projeksjonen av x,...,x n ned på z: proj(x i, z) = x it z = x i z + x i z x ip z p (i =,,..., n) A B G C D F E z A G B C F ED Dermed er vektorene x,...,x n redusert til skalarer (reelle tall i R). La Prinsipalkomponent klustring p = proj( x, z ), i =,, n i i Vi kan regne ut variansen (spredningen) til projeksjonen: n n n k n i k= i= v ( z) = ( p -p), p = p Variansen avhenger typisk av retningen til vektoren z: z z z Liten varians Middels varians Stor varians Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Prinsipalkomponent klustring Vektoren z som maksimerer variansen v(z) kalles første prinsipalkomponent til dataene. Prinsipalkomponent klustring: Finn første prinsipalkomponent til dataene identifiser klustre ved å se på prosjeksjonene Prinsipalkomponent klustring Vi kan også finne andre, tredje,..., prinsipalkomponent. Da reduseres datapunktene til lavere dimensjon, men ikke nødvendigvis til skalarer Eksempel: Vi kan da identifisere klustere med andre teknikker: A D F E z A G F ED klustring Finn første, andre,... prinsipalkomponent til dataene klustre projeksjonene med f.eks. hierarkisk klustring G Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 8

13 Prinsipalkomponent klustring Validering av klustre If there is correlation between the objects, then the first few principal components can account for a lot of the variation in the data A plot of the first two principal components can therefore be useful for looking for differences between objects Problem: The first principal components many not minimize the within-cluster variance while maximizing the between-cluster variance Homogenitet innen klustre kan f.eks. måles som gjennomsnittlig avstand fra et klustermedlem til senteret av klusteret Separasjon mellom klustre kan f.eks. måles som gjennomsnittlig avstand mellom klustersentre, eller minste avstand mellom to klustersentre Robusthet av klustre kan f.eks. måles ved å se hvor stor endring man får i klusterne når punktene perturberes (dvs hvert punkt forflyttes litt i en tilfeldig retning) Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 9 Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00 0 Eksempler på programverktøy For bildebehandling: TIGR Spotfinder ( ArraySuite software package ( GenePix Pro ( ImaGene ( ScanAlyze (rana.lbl.gov) For visualisering & dataanalyse: TIGR MultiExperiment Viewer ( XCluster (genome- Gene Expression Omnibus (NCBI) Expression Profiler (ep.ebi.ac.uk) Stanford Microarray Database (SMD) J-Express ( Cluster & TreeView (rana.lbl.gov) Lars O. Baumbusch (DNR/IFI) INF0/INF0 Høst 00

Hva er bioinformatikk? Introduksjon til bioinformatikk. Summary. Menneskets genom. Prokaryoter og eukaryoter. Lars O. Baumbusch

Hva er bioinformatikk? Introduksjon til bioinformatikk. Summary. Menneskets genom. Prokaryoter og eukaryoter. Lars O. Baumbusch Introduksjon til bioinformatikk Summary Hva er bioinformatikk? Bruk av informatikk og statistikk til å trekke biologisk forståelse ut av molekylære data fra levende organismer Lars O. Baumbusch Senter

Detaljer

Oblig3 - obligatorisk oppgave nr. 3 (av 3) i INF3350/4350

Oblig3 - obligatorisk oppgave nr. 3 (av 3) i INF3350/4350 Oblig3 - obligatorisk oppgave nr. 3 (av 3) i INF3350/4350 Levering av besvarelsen Besvarelse må leveres senest mandag 12. november kl 16.00. Send besvarelsen på epost til Lars Baumbusch (lars.o.baumbusch@rr-research.no).

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Kandidatnummer: BOKMÅL UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i : INF3350/INF4350 Grunnkurs i bioinformatikk Eksamensdag : Tirsdag 5. desember 2006 Tid for eksamen : 15.30

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i : INF2300 Grunnkurs i bioinformatikk Eksamensdag : Tirsdag 15. juni 2004 Tid for eksamen : 09.00 12.00 Oppgavesettet er på : 13

Detaljer

TFY4170 Fysikk 2 Justin Wells

TFY4170 Fysikk 2 Justin Wells TFY4170 Fysikk 2 Justin Wells Forelesning 5: Wave Physics Interference, Diffraction, Young s double slit, many slits. Mansfield & O Sullivan: 12.6, 12.7, 19.4,19.5 Waves! Wave phenomena! Wave equation

Detaljer

UNIVERSITY OF OSLO. Faculty of Mathematics and Natural Sciences

UNIVERSITY OF OSLO. Faculty of Mathematics and Natural Sciences Page 1 UNIVERSITY OF OSLO Faculty of Mathematics and Natural Sciences Exam in BIO4210/9210 Classification and Phylogeny Day of exam: 13. December 2011 Exam hours: 9.00-12.00 (3 hours) This examination

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: KJB 492 Bioinformatikk Eksamensdag: Fredag 14. desember 2001 Tid for eksamen: Kl.: 9.00 13.00 Oppgavesettet er på 7 sider. Vedlegg:

Detaljer

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger

Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger Intro til hypotesetesting Analyse av kontinuerlige data 21. april 2005 Tron Anders Moger Seksjon for medisinsk statistikk, UIO 1 Repetisjon fra i går: Normalfordelingen Variasjon i målinger kan ofte beskrives

Detaljer

Mette Langaas. Norsk Regnesentral Mette Langaas 1. Plan

Mette Langaas. Norsk Regnesentral Mette Langaas 1. Plan Bioinformatikk - en innføring fra en statistikers ståsted Mette Langaas Figur fra The Human Genome Project http://www.ornl.gov/hgmis / 08.05.2001 Mette Langaas 1 Plan Hva er bioinformatikk? Hva er gen

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

Ma Flerdimensjonal Analyse Øving 1

Ma Flerdimensjonal Analyse Øving 1 Ma1203 - Flerdimensjonal Analyse Øving 1 Øistein Søvik Brukernavn: Oistes 23.01.2012 Oppgaver 10.1 6. Show that the triangle with verticies (1, 2, 3), (4, 0, 5) and (3, 6, 4) has a right angle. z y x Utifra

Detaljer

Lineære modeller i praksis

Lineære modeller i praksis Lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y én eller flere uavhengige variabler:

Detaljer

Generelle lineære modeller i praksis

Generelle lineære modeller i praksis Generelle lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y en eller flere uavhengige

Detaljer

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Eksamensoppgave i TMA4267 Lineære statistiske modeller Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Tlf: Eksamensdato: August 2014 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler:

Detaljer

Klustring av mikromatrisedata: Estimering av antall klustre og identifikasjon av subtyper.

Klustring av mikromatrisedata: Estimering av antall klustre og identifikasjon av subtyper. Universitetet i Oslo Institutt for informatikk Klustring av mikromatrisedata: Estimering av antall klustre og identifikasjon av subtyper. Masteroppgave Espen Solberg 30. oktober 2007 Sammendrag Et sentralt

Detaljer

Plan. Pensum i bioinformatikk. Hva er bioinformatikk?

Plan. Pensum i bioinformatikk. Hva er bioinformatikk? Bioinformatikk - en innføring fra en statistikers ståsted Mette Langaas Plan Hva er bioinformatikk? Hva er gen og genom? Forskningsområder innen bioinformatikk. Funksjonell genomikk: genekspresjon og DNA

Detaljer

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger Fordelinger, mer om sentralmål og variasjonsmål Tron Anders Moger 20. april 2005 1 Forrige gang: Så på et eksempel med data over medisinerstudenter Lærte hvordan man skulle få oversikt over dataene ved

Detaljer

MOT310 Statistiske metoder 1, høsten 2011

MOT310 Statistiske metoder 1, høsten 2011 MOT310 Statistiske metoder 1, høsten 2011 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 30. oktober, 2011 Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 1 / 15 -tabell

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk. Eksamensdag: Torsdag 9. oktober 2008. Tid for eksamen: 15:00 17:00. Oppgavesettet er på

Detaljer

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk Snøtetthet Notat for TMA424/TMA4245 Statistikk Institutt for matematiske fag, NTNU 5. august 22 I forbindelse med varsling av om, klimaforskning og særlig kraftproduksjon er det viktig å kunne anslå hvor

Detaljer

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) TMA440 Statistikk H010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,

Detaljer

Utfordringer knyttet til statistisk analyse av komposittdata

Utfordringer knyttet til statistisk analyse av komposittdata ISSN 1893-1170 (online utgave) ISSN 1893-1057 (trykt utgave) www.norskbergforening.no/mineralproduksjon Notat Utfordringer knyttet til statistisk analyse av komposittdata Steinar Løve Ellefmo 1,* 1 Institutt

Detaljer

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen:

Kræsjkurs i STAT101. Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen: Kræsjkurs i STAT101 Noen anbefalinger Regn mange(5-10) oppgavesett til eksamen: Legg vekt på å forstå hva formlene brukes til, det vil si når, og hvordan? Lær sammenhengen mellom fordelingene og tema i

Detaljer

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ Psykologisk institutt Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ Faglig kontakt under eksamen: Mehmet Mehmetoglu Tlf.: 91838665 Eksamensdato: Eksamenstid (fra-til): Hjelpemiddelkode/Tillatte

Detaljer

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio) Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio) Beskrive fordelinger (sentraltendens, variasjon og form): Observasjon y i Sentraltendens

Detaljer

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling Kapittel 8 Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling TMA4240 H2006: Eirik Mo 2 Til nå... Definert sannsynlighet og stokastiske variabler (kap. 2 & 3).

Detaljer

Faglig kontaktperson under eksamen: 1.aman. Hans K. Stenøien ( )

Faglig kontaktperson under eksamen: 1.aman. Hans K. Stenøien ( ) Side 1 av 11 Norges teknisknaturvitenskapelige universitet Fakultet for naturvitenskap og teknologi Institutt for biologi Faglig kontaktperson under eksamen: 1.aman. Hans K. Stenøien (91897592) EKSAMEN

Detaljer

Er det mulig at flertallet av førere er sikrere enn gjennomsnittsføreren?

Er det mulig at flertallet av førere er sikrere enn gjennomsnittsføreren? Er det mulig at flertallet av førere er sikrere enn gjennomsnittsføreren? Trafikdage 2013 Rune Elvik, Transportøkonomisk institutt og Aalborg Universitet (re@toi.no) En forskningstradisjon Tror du at du

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,

Detaljer

TDT4117 Information Retrieval - Autumn 2014

TDT4117 Information Retrieval - Autumn 2014 TDT4117 Information Retrieval - Autumn 2014 Assignment 1 Task 1 : Basic Definitions Explain the main differences between: Information Retrieval vs Data Retrieval En samling av data er en godt strukturert

Detaljer

Deskriptiv statistikk., Introduksjon til dataanalyse

Deskriptiv statistikk., Introduksjon til dataanalyse Introduksjon til dataanalyse Deskriptiv statistikk 2 Kapittel 1 Denne timen og delvis forrige time er inspirert av Kapittel 1, men vi kommer ikke til å gå igjennom alt fra dette kapittelet i forelesning.

Detaljer

Kort overblikk over kurset sålangt

Kort overblikk over kurset sålangt Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente

Detaljer

Medisinsk statistikk, KLH3004 Dmf, NTNU 2009. Styrke- og utvalgsberegning

Medisinsk statistikk, KLH3004 Dmf, NTNU 2009. Styrke- og utvalgsberegning Styrke- og utvalgsberegning Geir Jacobsen, ISM Sample size and Power calculations The essential question in any trial/analysis: How many patients/persons/observations do I need? Sample size (an example)

Detaljer

Deskriptiv statistikk., Introduksjon til dataanalyse

Deskriptiv statistikk., Introduksjon til dataanalyse Introduksjon til dataanalyse Deskriptiv statistikk 2 Kapittel 1 Denne timen og delvis forrige time er inspirert av Kapittel 1, men vi kommer ikke til å gå igjennom alt fra dette kapittelet i forelesning.

Detaljer

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen gir testobservatoren t mer spredning enn testobservatoren

Detaljer

Accuracy of Alternative Baseline Methods

Accuracy of Alternative Baseline Methods Accuracy of Alternative Baseline Methods Dr. Steven Braithwait Christensen Associates Energy Consulting IEPEC - Paris June 2010 Outline Demand response & role of baseline loads Measures of baseline performance

Detaljer

Universitetet i Bergen Det matematisk-naturvitenskapelige fakultet Eksamen i emnet Mat131 - Differensiallikningar I Onsdag 25. mai 2016, kl.

Universitetet i Bergen Det matematisk-naturvitenskapelige fakultet Eksamen i emnet Mat131 - Differensiallikningar I Onsdag 25. mai 2016, kl. 1 MAT131 Bokmål Universitetet i Bergen Det matematisk-naturvitenskapelige fakultet Eksamen i emnet Mat131 - Differensiallikningar I Onsdag 25. mai 2016, kl. 09-14 Oppgavesettet er 4 oppgaver fordelt på

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet

Detaljer

GeWare: A data warehouse for gene expression analysis

GeWare: A data warehouse for gene expression analysis GeWare: A data warehouse for gene expression analysis T. Kirsten, H.-H. Do, E. Rahm WG 1, IZBI, University of Leipzig www.izbi.de, dbs.uni-leipzig.de Outline Motivation GeWare Architecture Annotation Integration

Detaljer

Mikromatriser introduksjon. Strategi for mikromatrise eksperimenter. Forelesning # 8. Bruksområder. Mikromatriser trinn for trinn. Lars O.

Mikromatriser introduksjon. Strategi for mikromatrise eksperimenter. Forelesning # 8. Bruksområder. Mikromatriser trinn for trinn. Lars O. Mikromatriser introduksjon Strategi for mikromatrise eksperimenter Forelesning # 8 probe Lars O. Baumbusch Radiumhospitalet Rikshospitalet HF Senter for Bioinformatikk, IFI, UiO Biological Question Lars

Detaljer

Speed Racer Theme. Theme Music: Cartoon: Charles Schultz / Jef Mallett Peanuts / Frazz. September 9, 2011 Physics 131 Prof. E. F.

Speed Racer Theme. Theme Music: Cartoon: Charles Schultz / Jef Mallett Peanuts / Frazz. September 9, 2011 Physics 131 Prof. E. F. September 9, 2011 Physics 131 Prof. E. F. Redish Theme Music: Speed Racer Theme Cartoon: Charles Schultz / Jef Mallett Peanuts / Frazz 1 Reading questions Are the lines on the spatial graphs representing

Detaljer

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene 1 Sec 3-2: Hvordan beskrive senteret i dataene 2 Sec 3-3: Hvordan beskrive spredningen i dataene Todeling av statistikk Deskriptiv statistikk Oppsummering og beskrivelse av den stikkprøven du har. Statistisk

Detaljer

Slope-Intercept Formula

Slope-Intercept Formula LESSON 7 Slope Intercept Formula LESSON 7 Slope-Intercept Formula Here are two new words that describe lines slope and intercept. The slope is given by m (a mountain has slope and starts with m), and intercept

Detaljer

Examination paper for (BI 2015) (Molekylærbiologi, laboratoriekurs)

Examination paper for (BI 2015) (Molekylærbiologi, laboratoriekurs) Department of (Biology) Examination paper for (BI 2015) (Molekylærbiologi, laboratoriekurs) Academic contact during examination: Thorsten Hamann Phone: 91825937 Examination date: 19.12.2016 Examination

Detaljer

5.8 Iterative estimater på egenverdier

5.8 Iterative estimater på egenverdier 5.8 Iterative estimater på egenverdier Det finnes ingen eksplisitt formel for beregning av egenverdiene til en kvadratisk matrise. Iterative metoder som finner (ofte) en (meget god) approksimasjon til

Detaljer

Kapittel 1: Data og fordelinger

Kapittel 1: Data og fordelinger STK Innføring i anvendt statistikk Mandag 8. august 8 Ingrid K. lad I løpet av dette kurset skal dere bli fortrolig med statistisk tenkemåte forstå teori og metoder som ligger bak knappene/menyene i vanlige

Detaljer

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt

Sammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt SOS1120 Kvantitativ metode Forelesningsnotater 10. forelesning høsten 2005 Per Arne Tufte Sammenlikninger av gjennomsnitt Sammenlikner gjennomsnittet på avhengig variabel for ulike grupper av enheter Kan

Detaljer

EKSAMENSOPPGAVER STAT100 Vår 2011

EKSAMENSOPPGAVER STAT100 Vår 2011 EKSAMENSOPPGAVER STAT100 Vår 2011 Løsningsforslag Oppgave 1 (Med referanse til Tabell 1) a) De 3 fiskene på 2 år hadde lengder på henholdsvis 48, 46 og 35 cm. Finn de manglende tallene i Tabell 1. Test

Detaljer

Forelesning 4 torsdag den 28. august

Forelesning 4 torsdag den 28. august Forelesning 4 torsdag den 28. august 1.10 Rekursjon Merknad 1.10.1. Hvert tall i sekvensen 1, 2, 4, 8, 16,... er to ganger det foregående. Hvordan kan vi beskrive sekvensen formelt? Vi kan ikke skrive

Detaljer

Multiblokkseminaret: LS-PLS. Bjørn-Helge Mevik

Multiblokkseminaret: LS-PLS. Bjørn-Helge Mevik Multiblokkseminaret: LS-PLS Bjørn-Helge Mevik Oversikt Introduksjonseksempel Motivasjon og prinsipp Algoritmer og implementasjon Et levende eksempel Egenskaper Varianter og generaliseringer Credits og

Detaljer

Mer om Histogramprosessering og Convolution/Correlation

Mer om Histogramprosessering og Convolution/Correlation Mer om Histogramprosessering og Convolution/Correlation Lars Vidar Magnusson January 30, 2017 Delkapittel 3.3 Histogram Processing Delkapittel 3.4 Fundementals of Spatial Filtering Lokal Histogramprosessering

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i : INF2310 Digital bildebehandling Eksamensdag : Fredag 29. mars 2019 Tid for eksamen : 14:30 18:30 (4 timer) Oppgavesettet er

Detaljer

Akkurat den samme begrunnelsen som vi brukte med variabelen X 2. "Jeg bruker internett mye mer på i-phone nå enn det jeg gjorde før på mobilen.

Akkurat den samme begrunnelsen som vi brukte med variabelen X 2. Jeg bruker internett mye mer på i-phone nå enn det jeg gjorde før på mobilen. 1 Øving 1 Oppgave 1.5 (Leie av studentbolig) Et datasett gir oversikt over ledige studentboliger til leie. Opplysninger om boligene er angitt. Hensikten med denne oppgave er å bestemme hva slags type variablene

Detaljer

Datahandling and presentation. Themes. Respekt og redelighet Masterseminar, Frode Volden

Datahandling and presentation. Themes. Respekt og redelighet Masterseminar, Frode Volden 7.04.008 Datahandling and presentation Masterseminar, 8.04.08 Frode Volden Themes Ethics Data loss and security Software Data presentation and analyses Respekt og redelighet Forskeren har et ansvar for

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 7. oktober 2009. Tid for eksamen: 15:00 17:00. Oppgavesettet er på

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 9.4: Konfidensintervall for µ 8.7: Student-t fordeling 8.6: Fordeling til S 2 Mette Langaas Foreleses onsdag 13.oktober, 2010 2 Estimering Mål: finne sannheten

Detaljer

Øving 1 TMA4240 - Grunnleggende dataanalyse i Matlab

Øving 1 TMA4240 - Grunnleggende dataanalyse i Matlab Øving 1 TMA4240 - Grunnleggende dataanalyse i Matlab For grunnleggende introduksjon til Matlab, se kursets hjemmeside https://wiki.math.ntnu.no/tma4240/2015h/matlab. I denne øvingen skal vi analysere to

Detaljer

Kp. 13. Enveis ANOVA

Kp. 13. Enveis ANOVA -tabell Bjørn H. Auestad Kp. 13: Én-faktor eksperiment 1 / 13 Kp. 13: Én-faktor -tabell 13.1 Analysis-of-Variance Technique 13.2 The Strategy of Experimental Design 13.3 One-Way Analysis of Variance: Completely

Detaljer

Kvinne Antall Tabell 1a. Antall migreneanfall i året før kvinnene fikk medisin.

Kvinne Antall Tabell 1a. Antall migreneanfall i året før kvinnene fikk medisin. Eksamen STAT100, Høst 2011 (lettere revidert). Tillatte hjelpemidler: C3: alle typer kalkulator, alle andre hjelpemidler Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Detaljer

Til bruk i metodeundervisningen ved Høyskolen i Oslo

Til bruk i metodeundervisningen ved Høyskolen i Oslo MINIMANUAL FOR SPSS Til bruk i metodeundervisningen ved Høyskolen i Oslo Denne minimanualen viser hvordan analyser i metodeundervisningen på masternivå (master i sosialt arbeid, master i familiebehandling

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK2120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 6. juni 2011. Tid for eksamen: 14.30 18.30. Oppgavesettet er

Detaljer

Foreleses onsdag 13.oktober, 2010

Foreleses onsdag 13.oktober, 2010 TMA440 Statistikk H010 Statistisk inferens: 9.4: Konfidensintervall for µ 8.7: Student-t fordeling 8.6: Fordeling til S Mette Langaas Foreleses onsdag 13.oktober, 010 Estimering Mål: finne sannheten om

Detaljer

Regresjon med GeoGebra

Regresjon med GeoGebra Praksis og Teori Askim videregående skole 14.08.14 1 Lærplanmål 2 Punkter og Lister 3 Regresjon 4 Teori 5 Nytt verktøy Læreplanmål i 2P Modellering gjere målingar i praktiske forsøk og formulere matematiske

Detaljer

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005 SOS110 Kvantitativ metode Forelesningsnotater 6 forelesning høsten 005 Statistisk beskrivelse av enkeltvariabler (Univariat analyse) Per Arne Tufte Disposisjon Datamatrisen Variabler Datamatrisen Frekvensfordelinger

Detaljer

Kapittel 3: Studieopplegg

Kapittel 3: Studieopplegg Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere

Detaljer

Eksamensoppgave i PSY3100 Forskningsmetode kvantitativ

Eksamensoppgave i PSY3100 Forskningsmetode kvantitativ Psykologisk institutt Eksamensoppgave i PSY3100 Forskningsmetode kvantitativ Faglig kontakt under eksamen: Christian Klöckner Tlf.: 73 59 19 60 Eksamensdato: 8. desember 2016 Eksamenstid: 09:00 13:00 Hjelpemiddelkode/Tillatte

Detaljer

Repeated Measures Anova.

Repeated Measures Anova. Repeated Measures Anova. Vi bruker oppgave-5 som eksempel. I en evalueringsstudie av en terapeutisk intervensjon valgte man et pre-post med kontrollgruppe design. Alle personer ble undersøkt tre ganger

Detaljer

Neural Network. Sensors Sorter

Neural Network. Sensors Sorter CSC 302 1.5 Neural Networks Simple Neural Nets for Pattern Recognition 1 Apple-Banana Sorter Neural Network Sensors Sorter Apples Bananas 2 Prototype Vectors Measurement vector p = [shape, texture, weight]

Detaljer

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ Psykologisk institutt Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ Faglig kontakt under eksamen: Mehmet Mehmetoglu Tlf.: 91838665 Eksamensdato: 7. desember 2015 Eksamenstid (fra-til): 9.00-13.00

Detaljer

Tilleggsoppgaver for STK1110 Høst 2015

Tilleggsoppgaver for STK1110 Høst 2015 Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0

Detaljer

INF februar 2017 Ukens temaer (Kap 3.3 i DIP)

INF februar 2017 Ukens temaer (Kap 3.3 i DIP) 15. februar 2017 Ukens temaer (Kap 3.3 i DIP) Kjapp repetisjon av gråtonetransformasjon Histogramtransformasjoner Histogramutjevning Histogramtilpasning/histogramspesifikasjon Standardisering av histogram

Detaljer

Plan. Pensum i bioinformatikk. Hva er bioinformatikk?

Plan. Pensum i bioinformatikk. Hva er bioinformatikk? Bioinformatikk - et interessant forskningsfelt for statistikere? Mette Langaas Hva er bioinformatikk? Plan Bakgrunn i biologi (gen, genom). Forskningsområder innen bioinformatikk. Funksjonell genomikk:

Detaljer

Oppgave 1a Definer følgende begreper: Nøkkel, supernøkkel og funksjonell avhengighet.

Oppgave 1a Definer følgende begreper: Nøkkel, supernøkkel og funksjonell avhengighet. TDT445 Øving 4 Oppgave a Definer følgende begreper: Nøkkel, supernøkkel og funksjonell avhengighet. Nøkkel: Supernøkkel: Funksjonell avhengighet: Data i en database som kan unikt identifisere (et sett

Detaljer

PSY 1002 Statistikk og metode. Frode Svartdal April 2016

PSY 1002 Statistikk og metode. Frode Svartdal April 2016 PSY 1002 Statistikk og metode Frode Svartdal April 2016 GANGEN I HYPOTESETESTING 1. Formuler en hypotese «Man får bedre karakterer hvis man leser pensum» 2. Formuler motstykket, nullhypotesen H 0 «Man

Detaljer

Notat 3 - ST februar 2005

Notat 3 - ST februar 2005 Notat 3 - ST1301 1. februar 2005 1 Simulering fra modell Når vi skal analysere et gitt konkret innsamlet datasett vil vi gjøre dette med utgangspunkt i en statistisk modell. Vi kan si at en slik statistisk

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i Eksamensdag: 14 juni 2004 Tid for eksamen: 9.00 12.00 Oppgavesettet er på 5 sider. Vedlegg: Tillatte hjelpemidler: INF-MAT2350

Detaljer

Notat 2, ST januar 2005

Notat 2, ST januar 2005 Notat 2, ST1301 25. januar 2005 1 Sammensatte uttrykk Vi har sett at funksjoner ikke trenger å bestå av annet enn ett enkeltuttrykk som angir hva funksjonen skal returnere uttrykkt ved de variable funksjonen

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

Physical origin of the Gouy phase shift by Simin Feng, Herbert G. Winful Opt. Lett. 26, (2001)

Physical origin of the Gouy phase shift by Simin Feng, Herbert G. Winful Opt. Lett. 26, (2001) by Simin Feng, Herbert G. Winful Opt. Lett. 26, 485-487 (2001) http://smos.sogang.ac.r April 18, 2014 Introduction What is the Gouy phase shift? For Gaussian beam or TEM 00 mode, ( w 0 r 2 E(r, z) = E

Detaljer

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik?

Forelesning 13 Analyser av gjennomsnittsverdier. Er inntektsfordelingen for kvinner og menn i EU-undersøkelsen lik? 2 verdier Forelesning 13 Analyser av gjennomsnittsverdier Valg av type statistisk generalisering i bivariat analyse er avhengig av hvilke variabler vi har Avhengig variabel kategorivariabel kontinuerlig

Detaljer

EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012

EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012 NTNU Fakultet for samfunnsvitenskap og teknologiledelse Psykologisk institutt EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012 DATO: 12.12.12 Studiepoeng: 7,5 Sidetall bokmål 4 Tillatte hjelpemidler:

Detaljer

7) Radix-sortering sekvensielt kode og effekten av cache

7) Radix-sortering sekvensielt kode og effekten av cache ) Radix-sortering sekvensielt kode og effekten av cache Dels er denne gjennomgangen av vanlig Radix-sortering viktig for å forstå en senere parallell versjon. Dels viser den effekten vi akkurat så tilfeldig

Detaljer

On Capacity Planning for Minimum Vulnerability

On Capacity Planning for Minimum Vulnerability On Capacity Planning for Minimum Vulnerability Alireza Bigdeli Ali Tizghadam Alberto Leon-Garcia University of Toronto DRCN - October 2011 Kakow - Poland 1 Outline Introduction Network Criticality and

Detaljer

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamen i: ECON20/420 Matematikk 2: Matematisk analyse og lineær algebra Exam: ECON20/420 Mathematics 2: Calculus and Linear Algebra Eksamensdag: Fredag 2. mai

Detaljer

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 4. juni 2007. Tid for eksamen: 14.30 17.30. Oppgavesettet er

Detaljer

Kap. 6 Ortogonalitet og minste kvadrater

Kap. 6 Ortogonalitet og minste kvadrater Kap. 6 Ortogonalitet og minste kvadrater IR n er mer enn bare et vektorrom: den har et naturlig indreprodukt, nemlig prikkproduktet av vektorer. Dette indreproduktet gjør det mulig å tenke geometrisk og

Detaljer

Øving 1 TMA4245 - Grunnleggende dataanalyse i Matlab

Øving 1 TMA4245 - Grunnleggende dataanalyse i Matlab Øving 1 TMA4245 - Grunnleggende dataanalyse i Matlab For grunnleggende bruk av Matlab vises til slides fra basisintroduksjon til Matlab som finnes på kursets hjemmeside. I denne øvingen skal vi analysere

Detaljer

Statistisk analyse av data fra planlagte forsøk

Statistisk analyse av data fra planlagte forsøk Statistisk analyse av data fra planlagte forsøk 19. mars 2019 9.00 10.30 Skypemøte 2 i NLR s kurs i forsøksarbeid 2019 Torfinn Torp Temaer Noen sentrale begreper, framgangsmåte etc., via et eksempel. Noen

Detaljer

Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ

Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ Institutt for psykologi Eksamensoppgave i PSY3100 forskningsmetoder kvantitativ Faglig kontakt under eksamen: Odin Hjemdal Tlf.: 73 59 19 60 Eksamensdato: 15. mai 2017 Eksamenstid: 09:00-13:00 Hjelpemiddelkode/Tillatte

Detaljer

0:7 0:2 0:1 0:3 0:5 0:2 0:1 0:4 0:5 P = 0:56 0:28 0:16 0:38 0:39 0:23

0:7 0:2 0:1 0:3 0:5 0:2 0:1 0:4 0:5 P = 0:56 0:28 0:16 0:38 0:39 0:23 UTKAST ENGLISH VERSION EKSAMEN I: MOT100A STOKASTISKE PROSESSER VARIGHET: 4 TIMER DATO: 16. februar 2006 TILLATTE HJELPEMIDLER: Kalkulator; Tabeller og formler i statistikk (Tapir forlag): Rottman: Matematisk

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk Eksamensdag: Torsdag 2. desember 2010. Tid for eksamen: 09.00 13.00. Oppgavesettet er på

Detaljer

Lasermåling - Homogenitet

Lasermåling - Homogenitet Lasermåling - Homogenitet 07.10.2014 Erik Espe, erik@viatech.no Lasermåling - Homogenitet Varige Veger 03.11.2014 Erik Espe, erik@viatech.no Viatech har laget lasermåleutstyr for veg siden 2005 Statens

Detaljer

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk

Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk Gruvedrift Notat for TMA/TMA Statistikk Institutt for matematiske fag, NTNU I forbindelse med planlegging av gruvedrift i et område er det mange hensyn som må tas når en skal vurdere om prosjektet er lønnsomt.

Detaljer

Bootstrapping og simulering Tilleggslitteratur for STK1100

Bootstrapping og simulering Tilleggslitteratur for STK1100 Bootstrapping og simulering Tilleggslitteratur for STK1100 Geir Storvik April 2014 (oppdatert April 2016) 1 Introduksjon Simulering av tilfeldige variable (stokastisk simulering) er et nyttig verktøy innenfor

Detaljer

L12-Dataanalyse. Introduksjon. Nelson Aalen plott. Page 76 of Introduksjon til dataanalyse. Levetider og sensurerte tider

L12-Dataanalyse. Introduksjon. Nelson Aalen plott. Page 76 of Introduksjon til dataanalyse. Levetider og sensurerte tider Page 76 of 80 L12-Dataanalyse Introduksjon Introduksjon til dataanalyse Presentasjonen her fokuserer på dataanalyseteknikker med formål å estimere parametere (MTTF,, osv) i modeller vi benytter for vedlikeholdsoptimering

Detaljer

ME Metode og statistikk Candidate 2511

ME Metode og statistikk Candidate 2511 ME-400, forside Emnekode: ME-400 Emnenavn: Metode og statistikk Dato: 31. mai Varighet: 5 timer Tillatte hjelpemidler: Kalkulator (enkel type) Merknader: Besvar 3 av 4 oppgaver (Oppgavene teller likt)

Detaljer

Vektorligninger. Kapittel 3. Vektorregning

Vektorligninger. Kapittel 3. Vektorregning Kapittel Vektorligninger I denne uken skal vi bruke enkel vektorregning til å analysere lineære ligningssystemer. Vi skal ha et spesielt fokus på R, for det går an å visualisere; klarer man det, går det

Detaljer

1. Opprette Workspace: Velg File, New Workspace. Angi Workspace name og location (hvor filene skal lagres). Trykk OK

1. Opprette Workspace: Velg File, New Workspace. Angi Workspace name og location (hvor filene skal lagres). Trykk OK Hvordan kjøre analyse av Aker H3 semi submersible, med offbody points Dette er en guide til hvordan gjøre en Wadam analyse i HydroD. Vi har tatt utgangspunkt i en modell av en Aker H3 semisub, og du vil

Detaljer

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind Forelesning 6: Punktestimering, usikkerhet i estimering Jo Thori Lind j.t.lind@econ.uio.no Oversikt 1. Trekke utvalg 2. Estimatorer og observatorer som stokastiske variable 3. Egenskapene til en estimator

Detaljer

Eksamen PSY1010 PSYC1100 Forskningsmetode I vår 2013

Eksamen PSY1010 PSYC1100 Forskningsmetode I vår 2013 Eksamen PSY1010 PSYC1100 Forskningsmetode I vår 2013 Bokmål Skriftlig skoleeksamen, 16. mai. (3 timer) Ingen hjelpemidler tillatt. Besvar tre 3 av følgende fire 4 oppgaver. Oppgave 1. Tenk deg at du skal

Detaljer