Seksjon 1.3 Tetthetskurver og normalfordelingen

Størrelse: px
Begynne med side:

Download "Seksjon 1.3 Tetthetskurver og normalfordelingen"

Transkript

1 Seksjon 1.3 Tetthetskurver og normalfordelingen Har sett på ulike metoder for å plotte eller oppsummere data Vil nå starte på hvordan beskrive data ved modeller Hovedmetode er tetthetskurver

2

3

4 Tetthetskurver Alternativ til histogram Glatt tilnærming av de irregulære boksene i histogram Mer robuste

5 Andel mindre enn 6 er 0.303

6 Andel mindre enn 6 er 0.293, tett på 0.303

7 Tetthetskurver En tetthetskurve er en kurve som Alltid er ovenfor den horisontale aksen Har areal eksakt lik 1 En tetthetskurve beskriver det overordnede mønstret i en fordeling. Arealet nedenfor en verdi beskriver andelen av observasjoner som faller innenfor dette området. Modell for beskrivelse av data

8 Senter og spredning for tetthetskurver Har tidligere sett på mål for senter og spredning for data Ønsker tilsvarende mål for tetthetskurver

9 Median i en tetthetskurve Punktet der halvparten av arealet under kurven er nedenfor og halvparten er ovenfor Mål på senter i fordeling Kaller denne noen ganger for teoretisk median for å skille den fra median av data som kalles empirisk median

10

11 Forventning i tetthetskurve Forventning av en tetthetskurve er balansepunktet der kurven ville balansere hvis den var laget av solid materiale På engelsk, mean svarer både til gjennomsnitt og forventning På norsk skiller vi mellom disse

12

13 Matematisk formel forventning Kan matematisk regne ut forventing ved = x xf x dx Et slags gjennomsnitt av funksjonsverdiene

14 Idealisering Tetthetskurve: Idealisert beskrivelse av fordeling til data Teoretisk median: Idealisert beskrivelse av empirisk median Forventning: Idealisert beskrivelse av gjennomsnitt Vi vil også skille mellom empirisk og teoretisk standardavvik

15 Symmetriske fordelinger Ofte brukt i statistikk Matematisk bekveme Realistiske i mange sammenhenger Positive og negative målefeil har samme fordeling For symmetriske fordelinger er forventning og median like

16

17 Normalfordeling Ofte bekvemt å anta kurven har en bestemt form Normalfordeling: Viktig klasse av tetthetskurver Unimodal, klokkeformet, symmetrisk Spesifisert av senterpunkt μ og spredningsmål σ Senterpunkt μ svarer til forventning (og median) Spredningsmål σ svarer til standardavvik Matematisk beskrivelse 1 exp 0.5 x 2 / 2 2 Bruker ofte N(μ,σ)

18

19 Normalfordeling Viktigste fordeling innen statistikk God beskrivelse av fordeling for reelle data x μ svarer til σ svarer til s God tilnærming til fordeling av mange oppsummerende mål (gjennomsnitt etc) Statistiske metoder basert på normalfordeling fungerer godt for data som er tilnærmet symmetrisk fordelte.

20 regelen Tilnærmet 68% av fordelingen faller innenfor intervallet [μ-σ,μ+σ] Tilnærmet 95% av fordelingen faller innenfor intervallet [μ-2σ,μ+2σ] Tilnærmet 99.7% av fordelingen faller innenfor intervallet [μ-3σ,μ+3σ]

21

22 Eksempel høyde kvinner Kvinner mellom 18 og 24 er tilnærmet normal fordelte med forventning μ=64.5 tommer og standard avvik σ=2.5 tommer. 95% innenfor [64.5-2*2.5,64.5+2*2.5] eller [59.5,69.5] (tilnærmet) 2.5% under enn % over 69.5

23

24 Standardisering og z-skår Hvis x er en observasjon fra en fordeling som har forventing μ og standard avvik σ, så er den standardiserte verdien av x lik z = (x-μ)/σ En standardisert verdi kalles ofte z-skår Forteller hvor mange standard avvik den opprinnelige observasjon er forskjellig fra forventningen

25 Eksempel, høyde kvinner Standardisert høyde: z=(høyde-64.5)/2.5 Høyde=68 gir z=( )/2.5=1.4 Høyde=60 gir z=( )/2.5 = -1.8 Store eller små z-verdier svarer til ekstreme observasjoner

26 Standardisering lineær transformasjon x har forventning μ og standard avvik σ z = (x-μ)/σ = x/σ - μ/σ x/σ har forventning μ/σ og standard avvik 1 z har forventning 0 og standard avvik 1

27

28 Beregninger for normalfordeling Ønsker ofte å gjøre ulike beregninger for normalfordelingen Vanskelig for generelle normalfordelinger Enkelt å slå opp i tabell for standard normalfordeling

29 Eksempel Ønsker å beregne Sanns for høyde x < 60 x < 60 ekvivalent med x-64.5 < =-4.5 x-64.5 < -4.5 ekvivalent med z = (x-64.5)/2.5 < -4.5/2.5 = -1.8 z < -1.8 har sannsynlighet eller 3.59%

30

31

32 Sjekking av normalfordeling Normalfordeling ofte brukt Bør sjekke om data er tilnærmet normalfordelt Histogram/tetthetsplot nyttige men litt vanskelige å evaluere Bedre metode: Kvantil-plot Detaljer i boka Hovedpoeng: Data bør ligge på rett linje

33

34

35

36

Seksjon 1.3 Tetthetskurver og normalfordelingen

Seksjon 1.3 Tetthetskurver og normalfordelingen Seksjon 1.3 Tetthetskurver og normalfordelingen Har sett på ulike metoder for å plotte eller oppsummere data ved tall Vil nå starte på hvordan beskrive data ved modeller Hovedmetode er tetthetskurver Tetthetskurver

Detaljer

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Boka (Ch 1.4) motiverer dette ved å gå fra histogrammer til tetthetskurver.

Detaljer

Eksempel på data: Karakterer i «Stat class» Introduksjon

Eksempel på data: Karakterer i «Stat class» Introduksjon Eksempel på data: Karakterer i «Stat class» Introduksjon Viktige begreper for å beskrive data: Enheter som er objektene i datasettet «label» som av og til brukes for å skille enhetene En variabel er en

Detaljer

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte

Detaljer

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler STK1000 Uke 36, 2016. Studentene forventes å lese Ch 1.4 (+ 3.1-3.3 + 3.5) i læreboka (MMC). Tetthetskurver Eksempel: Drivstofforbruk hos 32 biler Fra histogram til tetthetskurver Anta at vi har kontinuerlige

Detaljer

Et lite notat om og rundt normalfordelingen.

Et lite notat om og rundt normalfordelingen. Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte

Detaljer

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag Situasjonen er som i quiz-eksempelet: n = 4, p = 1/3 ( suksess betyr å gjette riktig alternativ), q = 2/3. Oppgave: Finn

Detaljer

Kapittel 4.4: Forventning og varians til stokastiske variable

Kapittel 4.4: Forventning og varians til stokastiske variable Kapittel 4.4: Forventning og varians til stokastiske variable Forventning og varians til stokastiske variable Histogrammer for observerte data: Sannsynlighets-histogrammer og tetthetskurver for stokastiske

Detaljer

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B

Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B Situasjonen er som i quiz-eksempelet: n = 4, p = 1/3 ( suksess betyr å gjette riktig alternativ), q = 2/3. Oppgave: Finn P(x), x=0,1,2,3,4 fra den generelle formelen for binomisk sannsynlighetsfordeling

Detaljer

Binomisk sannsynlighetsfunksjon

Binomisk sannsynlighetsfunksjon ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Binomisk sannsynlighetsfunksjon La det være n forsøk, sannsynlighet p for suksess og sannsynlighet q for fiasko. Den tilfeldige

Detaljer

Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner

Detaljer

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling

Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling Econ 2130 Forelesning uke 10 (HG) Geometrisk og normal fordeling 1 Geometrisk fordeling Binomisk forsøks-serie En serie likeartete forsøk med to mulige utfall, S og F, i hvert. (Modell) forutsetninger

Detaljer

Utvalgsfordelinger (Kapittel 5)

Utvalgsfordelinger (Kapittel 5) Utvalgsfordelinger (Kapittel 5) Oversikt pensum, fortid og fremtid Eksplorativ data-analyse (Kap 1, 2) Hvordan produsere data (Kap 3) Sannsynlighetsteori (Kap 4) Utvalgsfordelinger til observatorer (Kap

Detaljer

Statistikk og dataanalyse

Statistikk og dataanalyse Njål Foldnes, Steffen Grønneberg og Gudmund Horn Hermansen Statistikk og dataanalyse En moderne innføring Kapitteloversikt del 1 INTRODUKSJON TIL STATISTIKK Kapittel 1 Populasjon og utvalg 19 Kapittel

Detaljer

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner

Detaljer

Formelsamling i medisinsk statistikk

Formelsamling i medisinsk statistikk Formelsamling i medisinsk statistikk Versjon av 6. mai 208 Dette er en formelsamling til O. O. Aalen (red.): Statistiske metoder i medisin og helsefag, Gyldendal, 208. Gjennomsnitt x = n (x + x 2 + x 3

Detaljer

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1

(Det tas forbehold om feil i løsningsforslaget.) Oppgave 1 ÅMA1 Sannsylighetsregning og statistikk Løsningsforslag til eksamen vår 2011, s. 1 (Det tas forbehold om feil i løsningsforslaget.) Oppgave 1 a) Data: x 1, x 2, x 3, x 4, x 5 Gjennomsnitt: x = 1 5 (x 1

Detaljer

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen Bo Lindqvist Institutt for matematiske fag 2 Kap. 6: Normalfordelingen Normalfordelingen regnes som den viktigste statistiske fordelingen!

Detaljer

Forelesning 3. april, 2017

Forelesning 3. april, 2017 Forelesning 3. april, 2017 APPENDIX TIL KAP. 6 Sentralgrenseteoremet AVSNITT 6.3 Anvendelser av sentralgrenseteoremet Histogrammer S-kurver Q-Q-plot Diverse eksempler MGF for følger av uavhengige identisk

Detaljer

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling

Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling Kapittel 8 Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling TMA4240 H2006: Eirik Mo 2 Til nå... Definert sannsynlighet og stokastiske variabler (kap. 2 & 3).

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Deleksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 13. oktober 2010. Tid for eksamen: 15:00 17:00. Oppgavesettet

Detaljer

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind

Forelesning 5: Kontinuerlige fordelinger, normalfordelingen. Jo Thori Lind Forelesning 5: Kontinuerlige fordelinger, normalfordelingen Jo Thori Lind j.t.lind@econ.uio.no Oversikt 1. Kontinuerlige fordelinger 2. Uniform fordeling 3. Normal-fordelingen 1. Kontinuerlige fordelinger

Detaljer

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger Fordelinger, mer om sentralmål og variasjonsmål Tron Anders Moger 20. april 2005 1 Forrige gang: Så på et eksempel med data over medisinerstudenter Lærte hvordan man skulle få oversikt over dataene ved

Detaljer

Ekstreme bølger. Geir Storvik Matematisk institutt, Universitetet i Oslo. 5. mars 2014

Ekstreme bølger. Geir Storvik Matematisk institutt, Universitetet i Oslo. 5. mars 2014 Ekstreme bølger Geir Storvik Matematisk institutt, Universitetet i Oslo 5. mars 2014 Bølger Timesvise max-bølger ved bøye utenfor østkyst av USA (17/12/1991-23/2-1992) Størrelse på bølger varierer sterkt

Detaljer

Medisinsk statistikk Del I høsten 2009:

Medisinsk statistikk Del I høsten 2009: Medisinsk statistikk Del I høsten 2009: Kontinuerlige sannsynlighetsfordelinger Pål Romundstad Beregning av sannsynlighet i en binomisk forsøksrekke generelt Sannsynligheten for at suksess intreffer X

Detaljer

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen gir testobservatoren t mer spredning enn testobservatoren

Detaljer

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013

Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013 Introduksjon til statistikk og dataanalyse Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013 Introduksjon til statistikk og dataanalyse Hollywood-filmer fra 2011 135 filmer Samla budsjett: $ 7 166

Detaljer

Deskriptiv statistikk., Introduksjon til dataanalyse

Deskriptiv statistikk., Introduksjon til dataanalyse Introduksjon til dataanalyse Deskriptiv statistikk 2 Kapittel 1 Denne timen og delvis forrige time er inspirert av Kapittel 1, men vi kommer ikke til å gå igjennom alt fra dette kapittelet i forelesning.

Detaljer

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår Løsningsforslag ECON 130 Obligatorisk semesteroppgave 017 vår Andreas Myhre Oppgave 1 1. (i) Siden X og Z er uavhengige, vil den simultane fordelingen mellom X og Z kunne skrives som: f(x, z) = P(X = x

Detaljer

Inferens i fordelinger

Inferens i fordelinger Inferens i fordelinger Modifiserer antagelsen om at standardavviket i populasjonen σ er kjent Mer kompleks systematisk del ( her forventningen i populasjonen). Skal se på en situasjon der populasjonsfordelingen

Detaljer

Deskriptiv statistikk., Introduksjon til dataanalyse

Deskriptiv statistikk., Introduksjon til dataanalyse Introduksjon til dataanalyse Deskriptiv statistikk 2 Kapittel 1 Denne timen og delvis forrige time er inspirert av Kapittel 1, men vi kommer ikke til å gå igjennom alt fra dette kapittelet i forelesning.

Detaljer

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer. Utvalgsfordelinger Vi har sett at utvalgsfordelinger til en observator er fordelingen av verdiene observatoren tar ved mange gjenttatte utvalg av samme størrelse fra samme populasjon. Utvalg er en tilfeldig

Detaljer

Tabell 1: Beskrivende statistikker for dataene

Tabell 1: Beskrivende statistikker for dataene Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 7, blokk II Løsningsskisse Oppgave 1 a) Utfør en beskrivende analyse av datasettet % Data for Trondheim: TRD_mean=mean(TRD);

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk. Eksamensdag: Torsdag 9. oktober 2008. Tid for eksamen: 15:00 17:00. Oppgavesettet er på

Detaljer

Kapittel 3: Studieopplegg

Kapittel 3: Studieopplegg Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere

Detaljer

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Underveiseksamen i: STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 22/3, 2006. Tid for eksamen: Kl. 09.00 11.00. Tillatte hjelpemidler:

Detaljer

Introduksjon. Viktige begreper for å beskrive data: Enheter som er objektene i datasettet. «label» som av og til brukes for å skille enhetene

Introduksjon. Viktige begreper for å beskrive data: Enheter som er objektene i datasettet. «label» som av og til brukes for å skille enhetene Introduksjon Viktige begreper for å beskrive data: Enheter som er objektene i datasettet «label» som av og til brukes for å skille enhetene En variabel er en karakteristikk av hver enhet Variablene angis

Detaljer

Forslag til endringar

Forslag til endringar Forslag til endringar Bakgrunn: Vi har ingen forelesningar veka etter påske. Eg skal bort 18. og 19. april. Eksamen er 30.mai Forslag til endringar: Ekstra forelesningar onsdag 16.mars og onsdag 30 mars

Detaljer

I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen

I dag. Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen I dag Konfidensintervall og hypotesetes4ng ukjent standardavvik (kap. 7.1) t-fordelingen Inferens for forventningen 4l en populasjon (7.1) Kapi@el 6: En antagelse om kjent standardavvik s i populasjonen

Detaljer

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer. Utvalgsfordelinger Vi har sett at utvalgsfordelinger til en statistikk (observator) er fordelingen av verdiene statistikken tar ved mange gjenttatte utvalg av samme størrelse fra samme populasjon. Utvalg

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Kapittel 7: Utvalgsfordeling Bo Lindqvist Institutt for matematiske fag 2 Fra kapittel 1: Populasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,

Detaljer

Løsningsforslag til obligatorisk oppgave i ECON 2130

Løsningsforslag til obligatorisk oppgave i ECON 2130 Andreas Mhre April 15 Løsningsforslag til obligatorisk oppgave i ECON 13 Oppgave 1: E(XY) = E(X(Z X)) Setter inn Y = Z - X E(XY) = E(XZ X ) E(XY) = E(XZ) E(X ) E(XY) = - E(X ) X og Z er uavhengige, så

Detaljer

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering TMA4245 Statistikk Kapittel 8.1-8.5. Kapittel 9.1-9.3+9.15 Turid.Follestad@math.ntnu.no p.1/21 Har sett

Detaljer

Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel.

Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel. Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel. Det er i flere av oppgavene flere fremgangsmåter. Om din måte var riktig burde komme frem i rettingen. A Både X og Y tilfredsstiller

Detaljer

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) TMA440 Statistikk H010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Fra første forelesning: Populasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg En delmengde av

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1000 Innføring i anvendt statistikk Eksamensdag: Onsdag 12. oktober 2016 Tid for eksamen: 10.00 12.00 Oppgavesettet er på

Detaljer

Fra første forelesning:

Fra første forelesning: 2 Fra første forelesning: ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag opulasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg En delmengde av populasjonen

Detaljer

Utvalgsfordelinger (Kapittel 5)

Utvalgsfordelinger (Kapittel 5) Utvalgsfordelinger (Kapittel 5) Observator En observator er en funksjon av data for mange individer, for eksempel Gjennomsnitt Andel Stigningstall i regresjonslinje En observator er en tilfeldig variabel

Detaljer

TMA4240 Statistikk H2017 [15]

TMA4240 Statistikk H2017 [15] TMA4240 Statistikk H207 [5] Del 2: Statistisk inferens Populasjon og utvalg [8.] Observatorer og utvalgsfordelinger [8.2-8.3] Fordeling til gjennomsnittet og sentralgrenseteoremet [8.4] Normalplott [8.8]

Detaljer

Oppfriskning av blokk 1 i TMA4240

Oppfriskning av blokk 1 i TMA4240 Oppfriskning av blokk 1 i TMA4240 Geir-Arne Fuglstad November 21, 2016 2 Hva har vi gjort i dette kurset? Vi har studert to sterkt relaterte grener av matematikk Sannsynlighetsteori: matematisk teori for

Detaljer

ECON2130 Kommentarer til oblig

ECON2130 Kommentarer til oblig ECON2130 Kommentarer til oblig Her har jeg skrevet ganske utfyllende kommentarer til en del oppgaver som mange slet med. Har noen steder gått en del utover det som det strengt tatt ble spurt om i oppgaven,

Detaljer

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser. ÅMA1 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 0, s. 1 (Det tas forbehold om feil i løsningsforslaget.) a) Gjennomsnitt: x = 1 Emp. standardavvik: Median: 1 (1.33 + 1.) = 1.35

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1000 Innføring i anvendt statistikk Eksamensdag: Fredag 28. oktober 2016 Tid for eksamen: 14.00 16.00 Oppgavesettet er på

Detaljer

Kapittel 1: Data og fordelinger

Kapittel 1: Data og fordelinger STK Innføring i anvendt statistikk Mandag 8. august 8 Ingrid K. lad I løpet av dette kurset skal dere bli fortrolig med statistisk tenkemåte forstå teori og metoder som ligger bak knappene/menyene i vanlige

Detaljer

Statistikk for språk- og musikkvitere 1

Statistikk for språk- og musikkvitere 1 Statistikk for språk- og musikkvitere 1 Mitt navn: Åsne Haaland, Vitenskapelig databehandling USIT Ikke nøl, avbryt med spørsmål! Hva oppnår en med statistikk? Få oversikt over data: typisk verdi, spredning,

Detaljer

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene 1 Sec 3-2: Hvordan beskrive senteret i dataene 2 Sec 3-3: Hvordan beskrive spredningen i dataene Todeling av statistikk Deskriptiv statistikk Oppsummering og beskrivelse av den stikkprøven du har. Statistisk

Detaljer

TMA4240 Statistikk 2014

TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Løsningsskisse Oppgave Scriptet run confds.m simulerer n data x,..., x n fra en normalfordeling med

Detaljer

TMA4240 Statistikk Høst 2016

TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 9 Løsningsskisse Oppgave 1 a) Vi lar her Y være antall fugler som kolliderer med vindmølla i løpet av den gitte

Detaljer

Gammafordelingen og χ 2 -fordelingen

Gammafordelingen og χ 2 -fordelingen Gammafordelingen og χ 2 -fordelingen Gammafunksjonen Gammafunksjonen er en funksjon som brukes ofte i sannsynlighetsregning. I mange fordelinger dukker den opp i konstantleddet. Hvis man plotter n-fakultet

Detaljer

Kap. 8: Utvalsfordelingar og databeskrivelse

Kap. 8: Utvalsfordelingar og databeskrivelse Kap. 8: Utvalsfordelingar og databeskrivelse Utvalsfordelingar Utvalsfordeling for gjennomsnitt (med kjent varians) ( X ) Sentralgrenseteoremet (SGT) Utvalsfordeling for varians (normalfordeling) Utvalfordeling

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Deleksamen i: STK1000 Innføring i avvendt statistikk Eksamensdag: Onsdag 7. oktober 2015 Tid for eksamen: 11.00 13.00 Oppgavesettet er på

Detaljer

Denne uken: Kapittel 4.3 og 4.4

Denne uken: Kapittel 4.3 og 4.4 Sist: Kapittel 4.1, 4.2, 4.5 Tilfeldighet Sannsynlighetsmodeller Regler for sannsynlighet Denne uken: Kapittel 4.3 og 4.4 Tilfeldige variable Forventning og varians til tilfeldige variable Litt repetisjon:

Detaljer

LØSNING: Oppgavesett nr. 1

LØSNING: Oppgavesett nr. 1 LØSNING: Oppgavesett nr. MAT0 Statistikk, 208 (Versjon 0) Oppgave : ( fordeling, gjennomsnitt, varians og standardavvik ) a) Plotter fordelingen til x i : antall personer 5 4 5 3 2 2 2 2 40 50 60 70 80

Detaljer

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).

Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20). Econ 130 HG mars 017 Supplement til forelesningen 7. februar Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.0). Regel 5.19 sier at summer, Y X1 X X

Detaljer

UNIVERSITETET I OSLO Matematisk Institutt

UNIVERSITETET I OSLO Matematisk Institutt UNIVERSITETET I OSLO Matematisk Institutt Midtveiseksamen i: STK 1000: Innføring i anvendt statistikk Tid for eksamen: Onsdag 9. oktober 2013, 11:00 13:00 Hjelpemidler: Lærebok, ordliste for STK1000, godkjent

Detaljer

Kort overblikk over kurset sålangt

Kort overblikk over kurset sålangt Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente

Detaljer

Forkurs i kvantitative metoder ILP 2019

Forkurs i kvantitative metoder ILP 2019 Forkurs i kvantitative metoder ILP 2019 Dag 2. Forkurs som arbeidskrav for kvantitativ deler av PED-3055 Gregor Maxwell og Bent-Cato Hustad Førsteamanuensis i spesialpedagogikk Hva lærte vi i går? Hva

Detaljer

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger STK00 våren 206 Normalfordelingen Svarer til avsnitt 4.3 i læreboka Geir Storvik Matematisk institutt Universitetet i Oslo Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger Normalfordelingen

Detaljer

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger 2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 3 4 Pensumoversikt Forelesninger og øvinger

Detaljer

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave 3 Pensumoversikt Kap. 2 Beskrivende statistikk,

Detaljer

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper Bo Lindqvist Institutt for matematiske fag 2 Kapittel 8: Sammenligning av grupper Situasjon: Vi ønsker

Detaljer

Sted Gj.snitt Median St.avvik Varians Trondheim 6.86 7.50 6.52 42.49 Værnes 7.07 7.20 6.79 46.05 Oppdal 4.98 5.80 7.00 48.96

Sted Gj.snitt Median St.avvik Varians Trondheim 6.86 7.50 6.52 42.49 Værnes 7.07 7.20 6.79 46.05 Oppdal 4.98 5.80 7.00 48.96 Vår 213 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 8, blokk II Matlabøving Løsningsskisse Oppgave 1 a) Ingen løsningsskisse. b) Finn, for hvert datasett,

Detaljer

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Øvelsesoppgave i: ECON2130 Statistikk 1 Dato for utlevering: Mandag 22. mars 2010 Dato for innlevering: Fredag 9. april 2010 UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Innleveringssted: Ved siden av SV-info-senter

Detaljer

Normalfordelingen. Univariat normalfordeling (Gaussfordelingen): der µ er forventningsverdien og σ 2 variansen. Multivariat normalfordeling:

Normalfordelingen. Univariat normalfordeling (Gaussfordelingen): der µ er forventningsverdien og σ 2 variansen. Multivariat normalfordeling: Normalfordelingen Univariat normalfordeling (Gaussfordelingen): p(x µ,σ 2 ) = 1 µ)2 (x e 2σ 2 = N(µ,σ 2 ) 2πσ der µ er forventningsverdien og σ 2 variansen. Multivariat normalfordeling: [ 1 p(x µ,σ) =

Detaljer

Kapittel 4.3: Tilfeldige/stokastiske variable

Kapittel 4.3: Tilfeldige/stokastiske variable Kapittel 4.3: Tilfeldige/stokastiske variable Litt repetisjon: Sannsynlighetsteori Stokastisk forsøk og sannsynlighet Tilfeldig fenomen Individuelle utfall er usikre, men likevel et regulært mønster for

Detaljer

Inferens i regresjon

Inferens i regresjon Strategi som er fulgt hittil: Inferens i regresjon Deskriptiv analyse og dataanalyse først. Analyse av en variabel før studie av samvariasjon. Emne for dette kapittel er inferens når det er en respons

Detaljer

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005 SOS110 Kvantitativ metode Forelesningsnotater 6 forelesning høsten 005 Statistisk beskrivelse av enkeltvariabler (Univariat analyse) Per Arne Tufte Disposisjon Datamatrisen Variabler Datamatrisen Frekvensfordelinger

Detaljer

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter

Observatorer. STK Observatorer - Kap 6. Utgangspunkt. Eksempel høyde Oxford studenter Observatorer STK00 - Observatorer - Kap 6 Geir Storvik 4. april 206 Så langt: Sannsynlighetsteori Stokastiske modeller Nå: Data Knytte data til stokastiske modeller Utgangspunkt Eksempel høyde Oxford studenter

Detaljer

Akkurat den samme begrunnelsen som vi brukte med variabelen X 2. "Jeg bruker internett mye mer på i-phone nå enn det jeg gjorde før på mobilen.

Akkurat den samme begrunnelsen som vi brukte med variabelen X 2. Jeg bruker internett mye mer på i-phone nå enn det jeg gjorde før på mobilen. 1 Øving 1 Oppgave 1.5 (Leie av studentbolig) Et datasett gir oversikt over ledige studentboliger til leie. Opplysninger om boligene er angitt. Hensikten med denne oppgave er å bestemme hva slags type variablene

Detaljer

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast)

Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Forventning (gjennomsnitt) (X=antall mynt i tre kast) Diskret sannsynlighetsfordeling (kap 1.1-1.6) Oversikt Utfallsrom (sample space) Sannsynlighetsfordeling Forventning (expectation), E(X), populasjonsgjennomsnitt Bruk av figurer og histogram Binomialfordelingen

Detaljer

STK Oppsummering

STK Oppsummering STK1100 - Oppsummering Geir Storvik 6. Mai 2014 STK1100 Tre temaer Deskriptiv/beskrivende statistikk Sannsynlighetsteori Statistisk inferens Sannsynlighetsregning Hva Matematisk verktøy for å studere tilfeldigheter

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer

Detaljer

Transformasjoner av stokastiske variabler

Transformasjoner av stokastiske variabler Transformasjoner av stokastiske variabler Notasjon merkelapper på fordelingene Sannsynlighetstettheten og den kumulative fordelingen til en stokastisk variabel X betegnes hhv. f X og F X. Indeksen er altså

Detaljer

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling

Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling Wilcoxon Signed-Rank Test I uke, bruker vi Z test eller t-test for hypotesen H:, og begge tester er basert på forutsetningen om normalfordeling

Detaljer

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave 3 Pensumoversikt Kap. 2 Beskrivende statistikk,

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Kapittel 2: Beskrivende analyse og presentasjon av data for én variabel Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Grafisk

Detaljer

Introduksjon til statistikk og dataanalyse

Introduksjon til statistikk og dataanalyse Introduksjon til statistikk og dataanalyse Hollywood-filmer fra 2011 135 filmer Samla budsjett: $ 7 166 500 000 Samla billettsalg: $ 20 199 000 000 2 Datasettet vårt Filmene er delt i 8 sjangere: Action

Detaljer

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må

OPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må OPPGAVEHEFTE I STK000 TIL KAPITTEL 7 Regneoppgaver til kapittel 7 Oppgave Anta at man har resultatet av et randomisert forsøk med to grupper, og observerer fra gruppe, mens man observerer X,, X,2,, X,n

Detaljer

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Øvelsesoppgave i: ECON30- Statistikk Dato for utlevering: 5.03.06 Dato for innlevering: 05.04.06 innen kl. 5:00 Innleveringssted: Ekspedisjonen i. etasje ES hus

Detaljer

ECON Statistikk 1 Forelesning 2: Innledning

ECON Statistikk 1 Forelesning 2: Innledning ECON2130 - Statistikk 1 Forelesning 2: Innledning Data, beskrivende statistikk, visualisering Jo Thori Lind j.t.lind@econ.uio.no 1. Beskrivende statistikk Typer variable Nominelle: Gjensidig utelukkende

Detaljer

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.

Tid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned. EKSAMENSOPPGAVE, bokmål Institutt: IKBM Eksamen i: STAT100 STATISTIKK Tid: 29. mai 2012 09.00-12.30 (3.5 timer) Emneansvarlig: Trygve Almøy (Tlf: 95141344) Tillatte hjelpemidler: C3: alle typer kalkulator,

Detaljer

TMA4240 Statistikk Høst 2012

TMA4240 Statistikk Høst 2012 TMA424 Statistikk Høst 212 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 7 Løsningsskisse Matlabøving Beskrivende analyse Oppgave 1 a) Finn, for hvert datasett,

Detaljer

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind Forelesning 6: Punktestimering, usikkerhet i estimering Jo Thori Lind j.t.lind@econ.uio.no Oversikt 1. Trekke utvalg 2. Estimatorer og observatorer som stokastiske variable 3. Egenskapene til en estimator

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 8, blokk II Løsningsskisse Oppgave 1 Da komponentene danner et parallellsystem, vil systemet fungere dersom minst

Detaljer

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk Snøtetthet Notat for TMA424/TMA4245 Statistikk Institutt for matematiske fag, NTNU 5. august 22 I forbindelse med varsling av om, klimaforskning og særlig kraftproduksjon er det viktig å kunne anslå hvor

Detaljer

Dataens tidsalder. Hvorfor data? Data, data, data. STK1000 Innføring i anvendt statistikk. Tirsdag 24. august 2010

Dataens tidsalder. Hvorfor data? Data, data, data. STK1000 Innføring i anvendt statistikk. Tirsdag 24. august 2010 STK1000 Innføring i anvendt statistikk Tirsdag 24. august 2010 Geir Storvik (modifisert etter I. Glad s tidligere presentasjon) 1 Data, data, data Genetiske data World Wide Web Overvåkning Medisinske bilder

Detaljer

Kapittel 7: Inferens for forventningerukjent standardavvik

Kapittel 7: Inferens for forventningerukjent standardavvik Kapittel 7: Inferens for forventningerukjent standardavvik 7.1: Inferens for forventningen i en populasjon 7.2: Inferens for å sammenligne to forventninger 7.1 Inferens for forventningen i en populasjon

Detaljer