ST1301 Bioberegninger. Jarle Tufto
|
|
- Grethe Gulbrandsen
- 6 år siden
- Visninger:
Transkript
1 ST1301 Bioberegninger Jarle Tufto 30. november 2003
2 2
3 Forord Jarle Tufto Trondheim, 30. november
4 4
5 Innhold 1 Introduksjon Om kurset Hvorfor R? Eksempel på en enkel R-sesjon Mer om brukergrensesnittet til R under unix Brukergrensesnittet til R under windows Mere om R Operasjoner på matriser og vektorer Andre datatyper Funksjoner Løkker Kontrollflyt Grafiske muligheter Generering av stokastiske variable Introduksjon Transformasjoner Inversjonsmetoden Forkastningsmetoden Innebygde funksjoner i R for generering av stokastiske variable 17 4 Noen standard statistiske metoder t-test Regresjon Variansanalyse χ 2 -test Bruk av sannsynlighetsmaksimering Generellt om statistiske modeller Numeriske metoder for sannsynlighetsmaksimering
6 6 INNHOLD 6 Bootstrapping 23 7 Leslie matriser og stabil alderstruktur 25 8 Simulering av biologiske stokastiske prosesser Genetisk drift Miljø og demografisk stokastisitet Stabilitet og kaos
7 Kapittel 1 Introduksjon 1.1 Om kurset Innenfor en del retninger av statistikkfaget er behovet for programmeringsferdigheter relativt store. I forbindelse med analyse av data, vil man som biomatematiker og statistiker særlig ha behov for å utføre ulike typer numeriske beregninger og å implementere ulike typer algoritmer for å simulere fra til dels kompliserte sannsynlighetsfordelinger. Da bachelorprogrammet i biomatematikk ble satt sammen sto valget mellom å legge inn et av Institutt for informatikks standard grunnkurs i programmering i første studieår eller å lage vårt eget kurs. Vi har valgt det siste fordi dette i langt større grad gir oss muligheten til å fokusere på programmeringsteknikker som vi som statiskere rent faktisk vil ha behov for. Det gir oss også muligheten til å velge et høynivå programmeringsspråk som er mer tilpasset den type beregninger vi som statiskere møter. Samtidig er tanken at vi samtidig vil kunne styrke forståelsen av viktige deler av brukerkursene i sannsynlighetsregning, statistiske metoder og matematikk ved å gjøre deler av stoffet i disse kursenen mer konkret og håndgripelig. Et standard grunnkurs i programmering vil være nyttig særlig i et senere masterstudiet når en skal jobbe med mer avanserte statistiske teknikker, men slik vi ser det kan et slikt kurs tas først når behovet melder seg i forbindelse med mastergrad. Dette kurset vil også kunne være interessant for masterstudenter i biologi og andre interesserte som ønsker å lære seg programmeringsferdigheter tilpasset den type problem en som masterstudent vil kunne møte i forbindelse med analyse av innsamlede data. Øvingene vil i praksis være den viktigste delen av kurset. ******************* 7
8 8 KAPITTEL 1. INTRODUKSJON 1.2 Hvorfor R? Når vi som statistikere skal trekke slutninger fra data, f.eks. fra en klinisk undersøkelse eller tidseriedata fra en populasjon ute i naturen, bygger vi slutningene på en statistisk modell. En slik modell representerer generellt et sett antakelser om de prosessene som har generert dataene. Hvilke antakelser vi finner rimelige varierer selvsagt fra situasjon til situasjon. I mange tilfeller vi modellantakelsene svare til standard statistiske modeller som variansanalyse, lineær regresjon, logistisk regresjon eller levetidsanalyse. I slike tilfeller kan vi benytte standard metoder for estimering og hypotesetesting under slike modeller. Slike standardmetoder finnes innebyggd i en rekke forskjellige statistiske programpakker som SPSS, SAS, Minitab, S-plus og i R som vi skal benytte i dette kurset. I andre tilfeller vil ikke de antakelsene vi finner rimelige svare til noen standard statistisk modell og metode. I slike tilfeller vil vi måtte analysere dataene ved hjelp av egenutviklede statistiske modeller som vi forsøker å skreddersy for den aktuelle situasjonen vi studerer. Programpakken R er velegnet til å utføre den type beregninger vi trenger å utføre i slike situasjoner. I biologi og medisin blir mye av teorien stadig mer matematisert og stokastiske, ikke-deterministiske modeller spiller en stadig viktigere rolle. For å oppnå innsikt i de dynamiske egenskapene til en modell vil vi ofte trenge å undersøke modellen ved hjelp av stokastisk simulering og numeriske beregninger på datamaskin fordi matematisk analyse av alle sider ved modellen blir for vanskelig. Også på dette området er R relativt egnet og vi har valgt å bruke R for begrense antall programpakker som studentene vil måtte sette seg inn i. R er også en fritt tilgjengelig programpakke med fritt modifiserbar kildekode som kan kjøres under alle vanlige operativsystemer som Unix, Linux, og ulike versjon av Microsoft Windows. Dette har gjort R til et attraktivt alternativ til tilsvarende kommersielle programpakker. Mye av nyere avanserte statistiske metoder utvikles og implementeres av ledende statistikere som tilleggspakker ( packages ) som kan kjøres under R. I bruk er R svært likt den kommersielle programpakken S-plus. R, ulike tilleggspakker, og mer informasjon om systemet er tilgjengelig fra Som student må du gjerne installere R på din hjemmemaskin. 1.3 Eksempel på en enkel R-sesjon Skriver vi R i unix-shellet blir vi møtt av av følgende: R : Copyright 2003, The R Development Core Team
9 1.3. EKSEMPEL PÅ EN ENKEL R-SESJON 9 Version ( ) R is free software and comes with ABSOLUTELY NO WARRANTY. You are welcome to redistribute it under certain conditions. Type license() or licence() for distribution details. R is a collaborative project with many contributors. Type contributors() for more information. Type demo() for some demos, help() for on-line help, or help.start() for a HTML browser interface to help. Type q() to quit R. [Previously saved workspace restored] > Tegnet > (Rs kommandoprompt) vises når R venter på at vi skal gi en ny kommando. Det enkleste vi kan gjøre i R er å bruke programmet som en avansert kalkulator. Skriver vi > returner R følgende: [1] 20 R kjenner alle grunnleggende regnearter som addisjon, subtraksjon, multiplikasjon, divisjon, potenser, o.s.v. Merk også at R bruker punktum og ikke komma som desimalskilletegn. > 10-5 [1] 5 > 6*5.1 [1] 30.6 > 100/3 [1] > 5^2 [1] 25 > sqrt(2) [1]
10 10 KAPITTEL 1. INTRODUKSJON Objekter For å ta vare på resultatet av en beregning er det hensiktsmessig å lagre resultatet av beregningen på et eget navngitt sted i datamaskinens minne. Dette gjør vi ved å tilordne resultatet av uttrykket til et såkalt objekt. Hvis vi skriver > a <- 5+3 opprettes et objekt (en plass i datamaskinens minne) hvor verdien av uttrykket 5+3 lagres. Objektet får navn a. Operatoren <- kalles en tilordningsoperator. Vi kan så senere bruke resultatet av beregningen ved å inkludere a i nye uttrykk. F.eks. > a [1] 8 > a^2 [1] 64 Objekter av type vektor Uttrykk og objekter trenger ikke å være av typen enkle tall (skalarer) men kan også være av type vektor, matrise, o.l. For å opprette søylevektoren (5, 2, 1, 5, 6, 1) skriver vi: > x<-c(5,2,1,5,6,-1) Her tilordnes verdien av uttrykket c(5,2,1,5,6,-1) (en vektor) til objektet x. Ønsker vi å beregne summen av alle elementene i vektoren skriver vi: > sum(x) [1] 18 De fleste regneoperasjoner utføres elementvis for vektorer. Om vi oppretter en ny vektor y og legger denne til x får vi > y<-c(1,2,3,4,5,6) > z<-x+y > z [1]
11 1.3. EKSEMPEL PÅ EN ENKEL R-SESJON 11 Vi ser at resultat er en ny like lang vektor hvor elementene i vektoren z er gitt ved z i = x i + y i. Hvis vektorene er av forskjellig lengde vil den korteste resirkuleres. F.eks. vil vektoren c(2,3) i uttrykket nedenfor resirkuleres slik at annenhvert element opphøyes i henholdsvis 2 og 3: > x [1] > x^c(2,3) [1] Å beregne er 6 i=1 x 2 i er dermed enkelt: > sum(x^2) [1] 92 Her vil uttrykket xˆ 2 altså være en ny vektor med elementer lik kvadratet av elementene i vektoren x. Denne vektoren blir så argument til funksjonen sum. Beregning av enkle deskriptive observatorer som utvalgsgjennomsnitt og utvalgsvarians kan gjøres ved hjelp funskjonene sum og length: >sum(x)/length(x) [1] 3 > sum((x-sum(x)/length(x))^2)/(length(x)-1) [1] 7.6 Men R har selvsagt også innebyggde funksjoner for å utføre nettopp disse beregningene: > mean(x) [1] 3 > var(x) [1] 7.6 Mer informasjon om innebyggde funksjoner finnes ved først å starte hjelpesystemet med kommandoen > help.start() Hjelpesystemet vil da vises i nettleseren netscape eller mozilla. Hjelp om en bestemt funskjon finner en via oversikten i nettleser eller ved å skrive f.eks. > help(mean) i R-vinduet. Hjelpesiden for kommandoen mean vil da vises i nettleser (see fig. 1.1). Dersom R kjøres i ESS-mode under emacs, kan den være nødvendig å gi det ekstra argumentet html.help=t (h=t er tilstrekkelig).
12 12 KAPITTEL 1. INTRODUKSJON Figur 1.1: Hjelpesiden for kommandoen mean
13 1.4. MER OM BRUKERGRENSESNITTET TIL R UNDER UNIX Mer om brukergrensesnittet til R under unix 1.5 Brukergrensesnittet til R under windows
14 14 KAPITTEL 1. INTRODUKSJON
15 Kapittel 2 Mere om R 2.1 Operasjoner på matriser og vektorer 2.2 Andre datatyper 2.3 Funksjoner 2.4 Løkker 2.5 Kontrollflyt 2.6 Grafiske muligheter 15
16 16 KAPITTEL 2. MERE OM R
17 Kapittel 3 Generering av stokastiske variable 3.1 Introduksjon Har vi en modell innebærer det at vi har gjort visse antakelser om hvordan dataene er fordelt. I en lineær regresjonsmodeller er f.eks. responsvariabelen Y i for den i te observasjonen normalfordelt med forventning a + bx i og varians σ 2. I denne modellen har estimatorene for de ulike parameterne kjente fordelinger. F.eks. er estimatoren for stigningstallet b, ˆb, student t-fordelt. I mer kompliserte modeller vil ulike estimatorer og observatorer ikke nødvendigvis ha fordelinger vi kjenner analytisk. 3.2 Transformasjoner 3.3 Inversjonsmetoden 3.4 Forkastningsmetoden 3.5 Innebygde funksjoner i R for generering av stokastiske variable 17
18 18 KAPITTEL 3. GENERERING AV STOKASTISKE VARIABLE
19 Kapittel 4 Noen standard statistiske metoder 4.1 t-test 4.2 Regresjon 4.3 Variansanalyse 4.4 χ 2 -test 19
20 20 KAPITTEL 4. NOEN STANDARD STATISTISKE METODER
21 Kapittel 5 Bruk av sannsynlighetsmaksimering 5.1 Generellt om statistiske modeller 5.2 Numeriske metoder for sannsynlighetsmaksimering 21
22 22 KAPITTEL 5. BRUK AV SANNSYNLIGHETSMAKSIMERING
23 Kapittel 6 Bootstrapping 23
24 24 KAPITTEL 6. BOOTSTRAPPING
25 Kapittel 7 Leslie matriser og stabil alderstruktur 25
26 26 KAPITTEL 7. LESLIE MATRISER OG STABIL ALDERSTRUKTUR
27 Kapittel 8 Simulering av biologiske stokastiske prosesser 8.1 Genetisk drift 8.2 Miljø og demografisk stokastisitet 8.3 Stabilitet og kaos 27
ST1301 Bioberegninger - Introduksjon
ST1301 Bioberegninger - Introduksjon Jarle Tufto 11. januar 2005 1 Om kurset Innenfor en del retninger av statistikk og biologifaget er behovet for programmeringsferdigheter relativt store. I forbindelse
DetaljerST Bioberegninger, introduksjon Om kurset
ST1301 - Bioberegninger, introduksjon Om kurset Stokastisk modellering: Biologiske prosesser er stokastiske (genetisk drift, mutasjoner, overlevelse, død, populasjonsdynamikk). Vi trenger stokastiske modeller
DetaljerNotat 3 - ST februar 2005
Notat 3 - ST1301 1. februar 2005 1 Simulering fra modell Når vi skal analysere et gitt konkret innsamlet datasett vil vi gjøre dette med utgangspunkt i en statistisk modell. Vi kan si at en slik statistisk
DetaljerProgrammering i R - del 2
Programmering i R - del 2 14. februar 2004 1 Simulering fra modell Når vi skal analysere et gitt konkret innsamlet datasett vil vi gjøre dette med utgangspunkt i en statistisk modell. Vi kan si at en slik
DetaljerLæringsmål og pensum. https://www.youtube.com/watch? v=nkiu9yen5nc
1 TDT4110 Informasjonsteknologi grunnkurs: Kapittel 1 Introduksjon til Programmering og Python Professor Alf Inge Wang 2 https://www.youtube.com/watch? v=nkiu9yen5nc 3 Læringsmål og pensum Mål Lære om
DetaljerTMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer
DetaljerØving 12, ST1301 A: B:
Øving 12, ST1301 Oppgave 1 En to-utvalgs t-test forutsetter at observasjonene i hvert utvalg X 1 ; X 2 ; : : : ; X n og Y 1 ; Y 2 ; : : : ; Y m er uavhengige normalfordelte variable. Hvis testen oppfører
DetaljerTDT4110 Informasjonsteknologi grunnkurs: Kapittel 1 Introduksjon til Programmering og Python. Professor Alf Inge Wang
2 TDT4110 Informasjonsteknologi grunnkurs: Kapittel 1 Introduksjon til Programmering og Python Professor Alf Inge Wang 3 https://www.youtube.com/watch? v=nkiu9yen5nc 4 Læringsmål og pensum Mål Lære om
DetaljerEn innføring i MATLAB for STK1100
En innføring i MATLAB for STK1100 Matematisk institutt Universitetet i Oslo Februar 2017 1 Innledning Formålet med dette notatet er å gi en introduksjon til bruk av MATLAB. Notatet er først og fremst beregnet
DetaljerNotat 6 - ST februar 2005
Notat 6 - ST1301 22. februar 2005 1 Instruksjoner som data I begynnelsen av kurset definerte vi data som informasjon uttrykkt i et programmeringsspråk. Slike data kan være av ulik type, f.eks. enkle skalarer
DetaljerST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper
ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper Bo Lindqvist Institutt for matematiske fag 2 Kapittel 8: Sammenligning av grupper Situasjon: Vi ønsker
DetaljerSTK Oppsummering
STK1100 - Oppsummering Geir Storvik 6. Mai 2014 STK1100 Tre temaer Deskriptiv/beskrivende statistikk Sannsynlighetsteori Statistisk inferens Sannsynlighetsregning Hva Matematisk verktøy for å studere tilfeldigheter
DetaljerEksamensoppgave i ST1201/ST6201 Statistiske metoder
Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: 04. desember 2015 Eksamenstid (fra til): 09:00
DetaljerEksamensoppgave i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806
DetaljerTMA4240 Statistikk H2010
TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må
DetaljerUtfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010
TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må
DetaljerKort overblikk over kurset sålangt
Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente
DetaljerTDT4105 Informasjonsteknologi, grunnkurs (ITGK)
1 TDT4105 Informasjonsteknologi, grunnkurs (ITGK) Introduksjon til programmering i Matlab Rune Sætre satre@idi.ntnu.no 3 Læringsmål og pensum Mål Lære om programmering og hva et program er Lære om hvordan
DetaljerTMA4240 Statistikk Høst 2016
TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 12 Denne øvingen består av oppgaver om enkel lineær regresjon. De handler blant
DetaljerProgrammering i R. 6. mars 2004
Programmering i R 6. mars 2004 1 Funksjoner 1.1 Hensikt Vi har allerede sette på hvordan vi i et uttrykk kan inkludere kall til funksjoner som er innebygd i R slik som funksjonene sum, plot o.s.v. Generelt
Detaljer2.8 BACHELORGRADSPROGRAM I BIOMATEMATIKK
2.8 BACHELORGRADSPROGRAM I BIOMATEMATIKK SIDE 111 2.8 BACHELORGRADSPROGRAM I BIOMATEMATIKK 2.8.1 INNLEDNING Dette er et treårig studieprogram med emner fra matematikk,, biologi og medisin. Programmet er
Detaljern n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2
TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 12, blokk II Denne øvingen består av oppgaver om enkel lineær regresjon. De handler
DetaljerForelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind
Forelesning 6: Punktestimering, usikkerhet i estimering Jo Thori Lind j.t.lind@econ.uio.no Oversikt 1. Trekke utvalg 2. Estimatorer og observatorer som stokastiske variable 3. Egenskapene til en estimator
Detaljer2.8 BACHELORGRADSPROGRAM I BIOMATEMATIKK
2.8 BACHELORGRADSPROGRAM I BIOMATEMATIKK SIDE 111 2.8 BACHELORGRADSPROGRAM I BIOMATEMATIKK 2.8.1 INNLEDNING Dette er et treårig studieprogram med emner fra matematikk, statistikk, biologi og medisin. Programmet
DetaljerBioberegninger - notat 4: Mer om sannsynlighetsmaksimering
Bioberegninger - notat 4: Mer om sannsynlighetsmaksimering 8. mars 2004 1 Kort om Newton s metode i flere dimensjoner Newton s metode kan generaliseres til å løse sett av n ligninger med n ukjente. Skal
DetaljerStatistikk og dataanalyse
Njål Foldnes, Steffen Grønneberg og Gudmund Horn Hermansen Statistikk og dataanalyse En moderne innføring Kapitteloversikt del 1 INTRODUKSJON TIL STATISTIKK Kapittel 1 Populasjon og utvalg 19 Kapittel
Detaljer4.8 EMNEBESKRIVELSER I STATISTIKK
SIDE 317 ST0101 Brukerkurs i sannsynlighetsregning Anbefalte forkunnskaper: 2MX fra videregående skole. Læringsmål: Kurset skal gi studentene grunnleggende kunnskaper i sannsynlighetsregning. Det legges
DetaljerTDT4105 Informasjonsteknologi, grunnkurs. Introduksjon til programmering i Matlab. Rune Sætre / Anders Christensen {satre,
1 TDT4105 Informasjonsteknologi, grunnkurs Introduksjon til programmering i Matlab Rune Sætre / Anders Christensen {satre, anders}@idi.ntnu.no 2 Frist for øving 1: Fredag 16. Sept. Noen oppstartsproblemer
DetaljerEksamensoppgåve i ST1201/ST6201 Statistiske metoder
Institutt for matematiske fag Eksamensoppgåve i ST1201/ST6201 Statistiske metoder Fagleg kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: 04. desember 2015 Eksamenstid (frå til): 09:00
DetaljerSTK1100 våren Generell introduksjon. Omhandler delvis stoffet i avsnitt 1.1 i læreboka (resten av kapittel 1 blir gjennomgått ved behov)
STK1100 våren 2017 Generell introduksjon Omhandler delvis stoffet i avsnitt 1.1 i læreboka (resten av kapittel 1 blir gjennomgått ved behov) Ørnulf Borgan Matematisk institutt Universitetet i Oslo 1 «Overalt»
DetaljerTDT4105 Informasjonsteknologi, grunnkurs. Introduksjon til programmering i Matlab. Rune Sætre / Anders Christensen {satre, anders}@idi.ntnu.
1 TDT4105 Informasjonsteknologi, grunnkurs Introduksjon til programmering i Matlab Rune Sætre / Anders Christensen {satre, anders}@idi.ntnu.no 2 Frist for øving 1: Fredag 11. Sept. Noen oppstartsproblemer
DetaljerTDT4110 Informasjonsteknologi, grunnkurs Uke 35 Introduksjon til programmering i Python
TDT4110 Informasjonsteknologi, grunnkurs Uke 35 Introduksjon til programmering i Python Professor Guttorm Sindre Institutt for datateknikk og informasjonsvitenskap Læringsmål og pensum Mål Vite hva et
DetaljerMatematikk Øvingeoppgaver i numerikk leksjon 1 Å komme i gang
Matematikk 1000 Øvingeoppgaver i numerikk leksjon 1 Å komme i gang I denne øvinga skal vi bli litt kjent med MATLAB. Vi skal ikkje gjøre noen avanserte ting i dette oppgavesettet bare få et visst innblikk
DetaljerEksamensoppgave i ST0103 Brukerkurs i statistikk
Institutt for matematiske fag Eksamensoppgave i ST0103 Brukerkurs i statistikk Faglig kontakt under eksamen: Jarle Tufto Tlf: 99 70 55 19 Eksamensdato: 3. desember 2016 Eksamenstid (fra til): 09:00-13:00
DetaljerTDT4105 Informasjonsteknologi, grunnkurs (ITGK)
1 TDT4105 Informasjonsteknologi, grunnkurs (ITGK) Introduksjon til programmering i Matlab Rune Sætre satre@idi.ntnu.no 2 Læringsmål og pensum Mål Lære om programmering og hva et program er Lære å designe
DetaljerPunktestimator. STK Bootstrapping og simulering - Kap 7 og eget notat. Bootstrapping - eksempel Hovedide: Siden λ er ukjent, bruk ˆλ:
Punktestimator STK00 - Bootstrapping og simulering - Kap 7 og eget notat Geir Storvik 8. april 206 Trekke ut informasjon om parametre fra data x,..., x n Parameter av interesse: θ Punktestimator: Observator,
DetaljerInformasjon om studieprogrammet Beregningsorientert informatikk
Informasjon om studieprogrammet Beregningsorientert informatikk Beregningsorientert informatikk kombinerer kunnskaper og ferdigheter i matematikk og informatikk, og legger spesielt vekt på utvikling av
DetaljerBootstrapping og simulering Tilleggslitteratur for STK1100
Bootstrapping og simulering Tilleggslitteratur for STK1100 Geir Storvik April 2014 (oppdatert April 2016) 1 Introduksjon Simulering av tilfeldige variable (stokastisk simulering) er et nyttig verktøy innenfor
DetaljerBred profil på statistikk?
Bred profil på statistikk? Geir Storvik Juleseminar CSE 30. November 2012 Statistikk Statistikk involverer innsamling, organisering, analysering, tolkning og presentasjon av data Sentralt: Ta hensyn til
DetaljerForkurs i informatikk Python. Andreas Færøvig Olsen
Andreas Færøvig Olsen andrefol@ifi.uio.no Mål Hvorfor Python? Gi en mykere start på INF1100 Komme i gang med programmering 2 3 Hva er Python? Hva er programmering? 4 Hva er Python? Hva er programmering?
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerTMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 Ei bedrift produserer elektriske komponentar. Komponentane kan ha to typar
DetaljerTMA 4255 Forsøksplanlegging og anvendte statistiske metoder
TMA 4255 Forsøksplanlegging og anvendte statistiske metoder Våren 2007 1 Om kurset Foreleser Øvingslærer Kurset er beregnet for studenter som ønsker en videreføring av grunnkurset i statistikk. Sentralt
DetaljerTMA4240 Statistikk Høst 2015
TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II I denne øvingen skal vi fokusere på hypotesetesting. Vi ønsker å gi dere
DetaljerLæreplan i Programmering og modellering - programfag i studiespesialiserende utdanningsprogram
2.12.2016 Læreplan i - programfag i studiespesialiserende utdanningsprogram Formål Programmering er et emne som stadig blir viktigere i vår moderne tid. Det er en stor fordel å kunne forstå og bruke programmering
DetaljerAlternativ dag for teoriforelesning. Intro. Torsdag 12:15-14:00 R1
1 2 Alternativ dag for teoriforelesning Torsdag 12:15-14:00 R1 TDT4105 Informasjonsteknologi grunnkurs: Uke 35b Introduksjon til Matlab 09:15 10:00 R7 Jørn Amundsen Asbjørn Thomassen Roger Midtstraum 3
Detaljer4.8 EMNEBESKRIVELSER I STATISTIKK
SIDE 355 ST0101 Brukerkurs i sannsynlighetsregning Probability with Applications Faglærer: Professor Steinar Engen Studiepoengreduksjoner: ST0202: 3.50 SP ST1101: 7.50 SP MNFSIB1: 3.50 SP MNFST001: 7.50
DetaljerAndre sett med obligatoriske oppgaver i STK1110 høsten 2010
Andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Dette er det andre settet med obligatoriske oppgaver i STK1110 høsten 2010. Oppgavesettet består av fire oppgaver. Det er valgfritt om du vil
DetaljerSTK Oppsummering
STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer
Detaljer10.1 Enkel lineær regresjon Multippel regresjon
Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel
DetaljerBioberegninger, ST november 2006 Kl. 913 Hjelpemidler: Alle trykte og skrevne hjelpemidler, lommeregner.
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Bokmål Faglig kontakt under eksamen: Førsteamanuensis Jarle Tufto Telefon: 99 70 55 19 Bioberegninger, ST1301 30.
DetaljerTMA4240 Statistikk H2017 [15]
TMA4240 Statistikk H207 [5] Del 2: Statistisk inferens Populasjon og utvalg [8.] Observatorer og utvalgsfordelinger [8.2-8.3] Fordeling til gjennomsnittet og sentralgrenseteoremet [8.4] Normalplott [8.8]
DetaljerUNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1120 Statistiske metoder og dataanalyse 2 Eksamensdag: Mandag 4. juni 2007. Tid for eksamen: 14.30 17.30. Oppgavesettet er
DetaljerNotat 2, ST januar 2005
Notat 2, ST1301 25. januar 2005 1 Sammensatte uttrykk Vi har sett at funksjoner ikke trenger å bestå av annet enn ett enkeltuttrykk som angir hva funksjonen skal returnere uttrykkt ved de variable funksjonen
DetaljerKap. 6.1: Fordelingen til en observator og stok. simulering
Kap. 6.1: Fordelingen til en observator og stok. simulering Data, observatorer og relaterte fordelinger. Stokastisk simulering. Illustrasjon: - Sammenligning av jury bedømmelser i idrett. Fra data til
DetaljerMatematikk 1000. Øvingeoppgaver i numerikk leksjon 1 Å komme i gang
Matematikk 1000 Øvingeoppgaver i numerikk leksjon 1 Å komme i gang I denne øvinga skal vi bli litt kjent med MATLAB. Vi skal ikkje gjøre noen avanserte ting i dette oppgavesettet bare få et visst innblikk
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet
Detaljerår i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 i=1 (x i x) 2 = 60, 9
TMA424 Statistikk Vår 214 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II Oppgave 1 Matlabkoden linearreg.m, tilgjengelig fra emnets hjemmeside, utfører
DetaljerEksamensoppgåve i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgåve i TMA4240 Statistikk Fagleg kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk Eksamensdag: Mandag 3. desember 2018. Tid for eksamen: 14.30 18.30. Oppgavesettet er på
DetaljerLøsningsforslag øving 8, ST1301
Løsningsforslag øving 8, ST3 Oppgave Hva gjør følgende funksjon? Hvilken fordeling har variabelen n som returneres som funksjonsverdi? Forklar hvorfor. Forutsett at to enkle positive tall blir oppgitt
DetaljerUtvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling
Kapittel 8 Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling TMA4240 H2006: Eirik Mo 2 Til nå... Definert sannsynlighet og stokastiske variabler (kap. 2 & 3).
DetaljerEksamensoppgave i Løsningsskisse TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i Løsningsskisse TMA440 Statistikk Faglig kontakt under eksamen: Håkon Tjelmeland a, Sara Martino b Tlf: a 48 18 96, b 99 40 33 30 Eksamensdato: 30. november
DetaljerTDT4105 Informasjonsteknologi, grunnkurs. Introduksjon til programmering i Matlab
1 Kunnskap for en bedre verden TDT4105 Informasjonsteknologi, grunnkurs Introduksjon til programmering i Matlab Amanuensis Terje Rydland Kontor: ITV-021 i IT-bygget vest (Gløshaugen) Epost: terjery@idi.ntnu.no
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM)
Literatur / program Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-20. august 2007 Sven Ove Samuelsen Plan for første forelesning: 1. Introduksjon, Literatur, Program 2. ksempler 3. Uformell
DetaljerST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag ST1101/ST6101 Sannsynlighetsregning og statistikk Vår 2019 Løsningsforslag Øving 8 Oppgaver fra boka.12.1 X har pdf p X (k)
DetaljerEKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 12 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK Onsdag
DetaljerLøsningsforslag øving 9, ST1301
Løsningsforslag øving 9, ST1301 Oppgave 1 Regresjon. Estimering av arvbarhet. a) Legg inn din egen høyde, din mors høyde, din fars høyde, og ditt kjønn via linken på fagets hjemmeside 1. Last så ned dataene
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1100 Statistiske metoder og dataanalyse 1 - Løsningsforslag Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30
DetaljerMinste kvadraters metode i MATLAB og LabVIEW
Minste kvadraters metode i MATLAB og LabVIEW Av Finn Haugen (finn@techteach.no) TechTeach (http://techteach.no) 22.12 2002 1 2 TechTeach Innhold 1 Minste kvadraters metode i MATLAB 7 2 Minste kvadraters
DetaljerUtvalgsfordelinger (Kapittel 5)
Utvalgsfordelinger (Kapittel 5) Oversikt pensum, fortid og fremtid Eksplorativ data-analyse (Kap 1, 2) Hvordan produsere data (Kap 3) Sannsynlighetsteori (Kap 4) Utvalgsfordelinger til observatorer (Kap
DetaljerNotat 2, ST Sammensatte uttrykk. 27. januar 2006
Notat 2, ST1301 27. januar 2006 1 Sammensatte uttrykk Vi har sett at funksjoner ikke trenger å bestå av annet enn ett enkeltuttrykk som angir hva funksjonen skal returnere uttrykkt ved de variable funksjonen
DetaljerST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave 3 Pensumoversikt Kap. 2 Beskrivende statistikk,
Detaljerfor x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter
TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 3, blokk II Dette er den første av to innleveringer i blokk 2. Denne øvingen skal oppsummere
DetaljerUNIVERSITETET I OSLO ØKONOMISK INSTITUTT
Eksamen: ECON2130 Statistikk 1 UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamensdag: 29.05.2019 Sensur kunngjøres: 19.06.2019 Tid for eksamen: kl. 09:00 12:00 Oppgavesettet er på 5 sider Tillatte hjelpemidler:
DetaljerBachelor i matematiske fag
Bachelor i matematiske fag Bachelorprogrammet i matematiske fag er en 3-årig utdanning med 180 studiepoeng. Målgruppen for programmet er studenter med allmenn interesse for matematikk, statistikk, fysikk
DetaljerMatematikk 1000. Øvingsoppgaver i numerikk leksjon 5 Løsningsforslag
Matematikk 1000 Øvingsoppgaver i numerikk leksjon 5 Løsningsforslag Oppgave 1 Hva gjør disse skriptene? a) Skriptet lager plottet vi ser i gur 1. Figur 1: Plott fra oppgave 1 a). b) Om vi endrer skriptet
DetaljerKapittel 4.4: Forventning og varians til stokastiske variable
Kapittel 4.4: Forventning og varians til stokastiske variable Forventning og varians til stokastiske variable Histogrammer for observerte data: Sannsynlighets-histogrammer og tetthetskurver for stokastiske
DetaljerFormelsamling i medisinsk statistikk
Formelsamling i medisinsk statistikk Versjon av 6. mai 208 Dette er en formelsamling til O. O. Aalen (red.): Statistiske metoder i medisin og helsefag, Gyldendal, 208. Gjennomsnitt x = n (x + x 2 + x 3
DetaljerEksamensoppgave i ST1201/ST6201 Statistiske metoder
Institutt for matematiske fag Eksamensoppgave i ST1201/ST6201 Statistiske metoder Faglig kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: 20. desember 2016 Eksamenstid (fra til): 09:00
DetaljerMatematikk Øvingsoppgaver i numerikk leksjon 4 m-ler
Matematikk 1000 Øvingsoppgaver i numerikk leksjon 4 m-ler I denne øvinga skal vi lære oss å lage m-ler små tekstler som vi bruker i MATLAB-sammenheng. Der nst to typer m-ler: Funksjonsler og skript. Funksjonsler
DetaljerI enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x
Multiple regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable.det er fortsatt en responsvariabel. Måten dette gjøre på er nokså naturlig. Prediktoren
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Det er to populasjoner som vi ønsker å sammenligne. Vi trekker da et utvalg
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 301 Statistiske metoder og anvendelser. Eksamensdag: Torsdag, 2. juni, 1994. Tid for eksamen: 09.00 14.00. Oppgavesettet er
DetaljerEKSAMENSOPPGAVE STA «Tabeller og formler i statistikk» av Kvaløy og Tjelmeland. To A4-ark/ 4 sider med egne notater. Godkjent kalkulator. Rute.
Fakultet for naturvitenskap og teknologi EKSAMENSOPPGAVE Eksamen i: STA-1001. Dato: Tirsdag 26. september 2017. Klokkeslett: 09 13. Sted: Åsgårdvegen 9. Tillatte hjelpemidler: «Tabeller og formler i statistikk»
DetaljerInstitutt for datavitenskap og informasjonsvitenskap Institutt for matematiske fag
2.8 ÅRSSTUDIER Fakultet for informasjonsteknologi, matematikk og elektronikk Institutt for datavitenskap og informasjonsvitenskap Institutt for matematiske fag Fakultet for naturvitenskap og teknologi
Detaljer11. september Institutt for geofag Universitetet i Oslo. GEO En Introduksjon til MatLab. Kapittel 5 (del 2) Ada Gjermundsen
, Institutt for geofag Universitetet i Oslo 11. september 2012 Litt repetisjon: Array, En array er en variabel som inneholder flere objekter (verdier) En endimensjonal array er en vektor En array med to
DetaljerRidge regresjon og lasso notat til STK2120
Ridge regresjon og lasso notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på noen alternativer til minste kvadraters metode ved lineær regresjon. Metodene er særlig aktuelle
DetaljerBootstrapping og simulering
Bootstrapping og simulering Tilleggslitteratur for STK1100 Geir Storvik April 2014 1 Introduksjon Simulering av tilfeldige variable (stokastisk simulering) er et nyttig verktøy innenfor statistikk, men
DetaljerFørste sett med obligatoriske oppgaver i STK1110 høsten 2015
Første sett med obligatoriske oppgaver i STK1110 høsten 2015 Dette er det første obligatoriske oppgavesettet i STK1110 høsten 2015. Oppgavesettet består av fire oppgaver. Du må bruke Matematisk institutts
DetaljerTMA4100 Matematikk 1, høst 2013
TMA4100 Matematikk 1, høst 2013 Teknostart forelesning 4 www.ntnu.no TMA4100 Matematikk 1, høst 2013, Teknostart forelesning 4 Hva er Maple? www.ntnu.no TMA4100 Matematikk 1, høst 2013, Teknostart forelesning
DetaljerRAMMER FOR MUNTLIG EKSAMEN I MATEMATIKK ELEVER 2015
RAMMER FOR MUNIG EKSAMEN I MAEMAIKK EEVER 2015 Fagkoder: MA1012, MA1014, MA1016, MA1018, MA1101,MA1105, MA1106, MA1110, REA3021, REA3023, REA3025, REA3027, REA3029 Årstrinn: Vg1, Vg2 og Vg3 Gjelder for
DetaljerPilkast og kjikvadrat fordelingen
Pilkast og kjikvadrat fordelingen Halvor Aarnes, IBV, 014 Innhold Pilkast... 1 Simulering av pilkast... Kjikvadratfordelingen og gammafordelingen... 3 Rayleigh-fordelingen... 5 Pilkast brukt til å estimere
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis
DetaljerTMA4240 Statistikk Høst 2009
TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Oppgave 1 Oppgave 11.5 fra læreboka. Oppgave 2 Oppgave 11.21 fra læreboka. Oppgave
DetaljerProgrammering i Java med eksempler
Simulering av differenslikninger Programmering i Java med eksempler Forelesning uke 39, 2006 MAT-INF1100 Differenslikn. p. 1 Løsning av differenslikninger i formel Mulig for lineære likninger med konst.
DetaljerObservatorar og utvalsfordeling. Torstein Fjeldstad Institutt for matematiske fag, NTNU
Observatorar og utvalsfordeling Torstein Fjeldstad Institutt for matematiske fag, NTNU 08.10.2018 I dag Til no i emnet Observatorar Utvalsfordelingar Sentralgrenseteoremet 2 Til no i emnet definisjon av
DetaljerTMA4100 Matematikk 1, høst 2013
TMA4100 Matematikk 1, høst 2013 Teknostart forelesning 4 www.ntnu.no TMA4100 Matematikk 1, høst 2013, Teknostart forelesning 4 Hva er Maple? Maple er et kraftig matematikkverktøy. Symbolsk matematikk er
DetaljerInferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"
Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.
DetaljerNTNU KOMPiS Studieplan for MATEMATIKK 2 (8.-13. trinn) med hovedvekt på 8.-10. trinn Studieåret 2015/2016
NTNU KOMPiS Studieplan for MATEMATIKK 2 (8.-13. trinn) med hovedvekt på 8.-10. trinn Studieåret 2015/2016 Profesjons- og yrkesmål Dette studiet er beregnet for lærere på ungdomstrinnet som ønsker videreutdanning
Detaljer