Et lite notat om og rundt normalfordelingen.
|
|
- Inger Iversen
- 10 måneder siden
- Visninger:
Transkript
1 Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte verdier som søyler i intervaller Kan være symmetrisk, skjev, ha en eller flere topper, lette eller tunge haler (outliere/ekstremverdier) Gjennomsnitt: x Tyngdepunktet for histogrammet Median: Verdien som har like mange observasjoner på hver side Kvartiler: Deler inn observasjonene i fire grupper med like mange observasjoner i hver gruppe (Empirisk) standardavvik: sd, SD Varians Teoretisk/tenkt Fordelingskurve Viser den idealiserte fordelingen av verdier som en kontinuerlig kurve Kan være symmetrisk, skjev, ha en eller flere topper, lette eller tunge haler Forventningsverdi: Tyngdepunktet for kurven Median: Verdien som har like mye areal under kurven på hver side Kvartiler: Deler inn x-aksen i fire intervaller, så det er like stort areal under kurven i hvert intervall. Standardavvik: σ Varians: σ 2 Toppunkt = Mode Histogrammer kan enten vise antall på y-aksen, eller skaleres slik at arealet av hver søyle reflekterer andelen av observasjonene som er i det gitte intervallet. Fordelingskurver har totalt areal lik 1. Velger vi et intervall på x- aksen, vil arealet under kurven i dette intervallet tilsvare andelen verdier som havner i intervallet.
2
3
4 Hei på deg, normalfordeling! (Finn μ og σ)
5 Normalfordeling Hvordan ser en normalfordeling ut? OBS: Teoretisk sannsynlighetstetthet Entoppet, symmetrisk, lette haler. «Bell-shaped» Formelen for normalfordeling: Normalfordelingen og dens far: Johann Carl Friedrich Gauß ( )
6 Hva bruker vi den til, og hvorfor er den viktig? Normalfordelingen brukes (blant annet) som modell for observerte data, når fordelingen til observasjonene er entoppet, symmetrisk og har lette haler:
7 En praktisk anvendelse: Oppsummeringstall for det vanlige/typiske/senteret i en fordeling av kontinuerlige data (av og til diskrete data): Standardavviket er et utmerket oppsummeringstall for spredningen når datasettet ligner på en normalfordeling, altså når fordelingen er symmetrisk, entoppet, og har lette haler, fordi: Da vil intervallet x ± 2sd inneholde omtrent 95% av observasjonene, og så godt som ingen observasjoner befinner seg utenfor x ± 3sd. Hvis man oppgir x og sd som oppsummeringstall, har man altså implisitt sagt at fordelingen ligner på en normalfordeling, og at de fleste observasjonene ligger mellom 2 til 3 standardavvik fra midten. Hvorfor? Normalfordelingen er formulert som en formel (!), og kan regnes på:
8
9
10 Standardisering: Fra originalobservasjoner til z-scorer. Normalfordelingen er gitt ved der y viser høyden på y-aksen, og x er verdiene til variabelen som er normalfordelt. Siden μ kan være et hvilket som helst tall på tallinja, og σ kan være et hvilket som helst tall større eller lik null, finnes det uendelig mange normalfordelinger. Men alle normalfordelte verdier kan regnes om til en såkalt standard normalfordeling, som har forventning 0 og standardavvik 1. Hvis vi vet hva μ og σ er, finner vi z-scoren, altså den standardiserte verdien av x, slik: z = x μ σ
11 Vi bruker notasjonen N(μ, σ) for en generell normalfordeling, og N(0, 1) for en standard normalfordeling. Ofte skriver vi også X~N(μ, σ), og Z~N(0, 1). Slik ser fordelingene ut: X~N(μ, σ) Z~N(0, 1)
12 Eksempel: IQ (Ukas oppgave) IQ-tester er konstruert for å ha et populasjonsgjennomsnitt (μ) på 100, og standardavvik (σ) på 15: Jeg tok en IQ-test på og endte med et resultat på 115. Den tilsvarende z-scoren blir da z = x μ σ = 15 = 1 Ser på figuren at siden z-scoren er nøyaktig 1, kan det leses rett ut av figuren at 15.8% av befolkningen (13.6%+2.1%+0.1%) er smartere enn meg. Oppgave: Ta samme IQ-test som jeg har tatt, og regn om til z-score.
13 Hvis vi ikke vet hva μ og σ er, kan vi erstatte dem med x og sd, og allikevel lage z-scorer. Eksempel: Høyde: I en fil med høyde for 1016 kvinner som har født barn i perioden , er gjennomsnittshøyden cm, og sd 5.8 cm Med en høyde på cm har KFF en z-score på z = x μ σ = 5. 8 = Nå kan det ikke leses rett ut av figuren hvor stor andel som er høyere eller lavere enn meg. Da trenger vi en normalfordelingstabell!
14 Table A, side i boka: Med andre ord: 55.6% av norske kvinner er lavere enn meg. R: > pnorm(0.14) [1]
15 Hvordan sjekker vi om noe «er normalfordelt»? Lag histogram, boksplott: Sjekk symmetri og haler Fortsatt usikker? Lag normalfordelingsplott (QQ-plott): Hvis normalfordelt: Rett linje Hvis ikke rett linje: Ikke normalfordelt QQ-plott/Normal quantile plot lages ikke for hånd, vi bruker alltid programvare. Da gjøres dette i bakgrunnen: Sortér alle observasjonene dine fra lavest til høyest, og gjør dem om til percentiler, altså verdier som sier hvor stor andel av de observerte verdiene som er mindre eller lik den verdien du kikker på. Finn hvilken z-score de ulike percentilene ville hatt hvis de var i en N(0,1)-fordeling (Bruk tabellen motsatt vei) Plott observasjonene mot de tilsvarende z-scorene
16 Hvis normalfordelt: QQ-plottet viser en rett linje QQ-plottet viser ikke en rett linje: Ikke normalfordelt
17 (Fortsatt:) Hva bruker vi den til, og hvorfor er den viktig? Mange matematiske resultater (kall det gjerne formler) er basert på at enten dataene selv, eller en avledning av dataene, er normalfordelt. For eksempel er formelen for 95% konfidensintervall for populasjonsgjennomsnittet (forventningen) μ: x ± 1. 96SE(x ), Denne formelen stammer fra sentralgrenseteoremet, der normalfordelingen også dukker opp. Dette skal vi se på senere i kurset. Dessuten: Normalfordelingen er en god approksimasjon til binomisk fordeling med stor n, og poissonfordeling med høy frekvens, og det gjør utregningene av tester og konfidensintervaller mye enklere. Vi får da også at 95% konfidensintervall for en andel p i populasjonen: p ± 1. 96SE(p ) Dette kommer vi også til senere. Så: Mange statistiske analyser forutsetter at normalfordelingen er til stede, enten at observasjonene er normalfordelte, eller at noe avledet av data er normalfordelt.
Et lite notat om og rundt normalfordelingen.
Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte
STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler
STK1000 Uke 36, 2016. Studentene forventes å lese Ch 1.4 (+ 3.1-3.3 + 3.5) i læreboka (MMC). Tetthetskurver Eksempel: Drivstofforbruk hos 32 biler Fra histogram til tetthetskurver Anta at vi har kontinuerlige
Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?
Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Boka (Ch 1.4) motiverer dette ved å gå fra histogrammer til tetthetskurver.
Seksjon 1.3 Tetthetskurver og normalfordelingen
Seksjon 1.3 Tetthetskurver og normalfordelingen Har sett på ulike metoder for å plotte eller oppsummere data Vil nå starte på hvordan beskrive data ved modeller Hovedmetode er tetthetskurver Tetthetskurver
Binomisk sannsynlighetsfunksjon
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Binomisk sannsynlighetsfunksjon La det være n forsøk, sannsynlighet p for suksess og sannsynlighet q for fiasko. Den tilfeldige
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1000 Innføring i anvendt statistikk Eksamensdag: Onsdag 12. oktober 2016 Tid for eksamen: 10.00 12.00 Oppgavesettet er på
Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling
Kapittel 8 Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling TMA4240 H2006: Eirik Mo 2 Til nå... Definert sannsynlighet og stokastiske variabler (kap. 2 & 3).
Løsning på Dårlige egg med bruk av Tabell 2 i Appendix B
Situasjonen er som i quiz-eksempelet: n = 4, p = 1/3 ( suksess betyr å gjette riktig alternativ), q = 2/3. Oppgave: Finn P(x), x=0,1,2,3,4 fra den generelle formelen for binomisk sannsynlighetsfordeling
Seksjon 1.3 Tetthetskurver og normalfordelingen
Seksjon 1.3 Tetthetskurver og normalfordelingen Har sett på ulike metoder for å plotte eller oppsummere data ved tall Vil nå starte på hvordan beskrive data ved modeller Hovedmetode er tetthetskurver Tetthetskurver
Medisinsk statistikk Del I høsten 2009:
Medisinsk statistikk Del I høsten 2009: Kontinuerlige sannsynlighetsfordelinger Pål Romundstad Beregning av sannsynlighet i en binomisk forsøksrekke generelt Sannsynligheten for at suksess intreffer X
ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen
ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen Bo Lindqvist Institutt for matematiske fag 2 Kap. 6: Normalfordelingen Normalfordelingen regnes som den viktigste statistiske fordelingen!
Forslag til endringar
Forslag til endringar Bakgrunn: Vi har ingen forelesningar veka etter påske. Eg skal bort 18. og 19. april. Eksamen er 30.mai Forslag til endringar: Ekstra forelesningar onsdag 16.mars og onsdag 30 mars
Tabell 1: Beskrivende statistikker for dataene
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 7, blokk II Løsningsskisse Oppgave 1 a) Utfør en beskrivende analyse av datasettet % Data for Trondheim: TRD_mean=mean(TRD);
Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår
Løsningsforslag ECON 130 Obligatorisk semesteroppgave 017 vår Andreas Myhre Oppgave 1 1. (i) Siden X og Z er uavhengige, vil den simultane fordelingen mellom X og Z kunne skrives som: f(x, z) = P(X = x
Analyseoversikt, Uke 35
Analyseoversikt, Uke 35 STK1000 Uke 35, 2016. Studentene forventes å lese Ch 1.1-1.3 i læreboka (MMC). Avsnittet om Stem-and-leaf-plot er ikke pensum. Ulike typer data Kategoriske data MMC: «Kvalitative
Tema: Deskriptiv statistikk for kontinuerlige data. Av Kathrine Frey Frøslie,
Tema: Deskriptiv statistikk for kontinuerlige data. Av Kathrine Frey Frøslie, www.statistrikk.no Kontinuerlige data er målinger som gjøres langs en skala, for eksempel tid, lengde og vekt. Noen ganger
Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005
SOS110 Kvantitativ metode Forelesningsnotater 6 forelesning høsten 005 Statistisk beskrivelse av enkeltvariabler (Univariat analyse) Per Arne Tufte Disposisjon Datamatrisen Variabler Datamatrisen Frekvensfordelinger
Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger
Fordelinger, mer om sentralmål og variasjonsmål Tron Anders Moger 20. april 2005 1 Forrige gang: Så på et eksempel med data over medisinerstudenter Lærte hvordan man skulle få oversikt over dataene ved
Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering
Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering TMA4245 Statistikk Kapittel 8.1-8.5. Kapittel 9.1-9.3+9.15 Turid.Follestad@math.ntnu.no p.1/21 Har sett
Eksempel på data: Karakterer i «Stat class» Introduksjon
Eksempel på data: Karakterer i «Stat class» Introduksjon Viktige begreper for å beskrive data: Enheter som er objektene i datasettet «label» som av og til brukes for å skille enhetene En variabel er en
Diskrete sannsynlighetsfordelinger som histogram. Varians. Histogram og kumulativ sannsynlighet. Binomial-fordelingen
Diskret sannsynlighetsfordeling (kap 1.1-1.6) Oversikt Utfallsrom (sample space) Sannsynlighetsfordeling Forventning (expectation), E(, populasjonsgjennomsnitt Bruk av figurer og histogram Binomialfordelingen
ECON2130 Kommentarer til oblig
ECON2130 Kommentarer til oblig Her har jeg skrevet ganske utfyllende kommentarer til en del oppgaver som mange slet med. Har noen steder gått en del utover det som det strengt tatt ble spurt om i oppgaven,
Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013
Introduksjon til statistikk og dataanalyse Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013 Introduksjon til statistikk og dataanalyse Hollywood-filmer fra 2011 135 filmer Samla budsjett: $ 7 166
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk. Eksamensdag: Torsdag 9. oktober 2008. Tid for eksamen: 15:00 17:00. Oppgavesettet er på
Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel.
Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel. Det er i flere av oppgavene flere fremgangsmåter. Om din måte var riktig burde komme frem i rettingen. A Både X og Y tilfredsstiller
1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene
1 Sec 3-2: Hvordan beskrive senteret i dataene 2 Sec 3-3: Hvordan beskrive spredningen i dataene Todeling av statistikk Deskriptiv statistikk Oppsummering og beskrivelse av den stikkprøven du har. Statistisk
Kapittel 4.4: Forventning og varians til stokastiske variable
Kapittel 4.4: Forventning og varians til stokastiske variable Forventning og varians til stokastiske variable Histogrammer for observerte data: Sannsynlighets-histogrammer og tetthetskurver for stokastiske
Medisinsk statistikk Del I høsten 2008:
Medisinsk statistikk Del I høsten 2008: Kontinuerlige sannsynlighetsfordelinger Pål Romundstad Noen tips Boka Summary etter hvert kapittel forteller hvor dere har vært og hva som er sentralt Øvingene Overdriv
Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk
Snøtetthet Notat for TMA424/TMA4245 Statistikk Institutt for matematiske fag, NTNU 5. august 22 I forbindelse med varsling av om, klimaforskning og særlig kraftproduksjon er det viktig å kunne anslå hvor
Øving 1 TMA4240 - Grunnleggende dataanalyse i Matlab
Øving 1 TMA4240 - Grunnleggende dataanalyse i Matlab For grunnleggende introduksjon til Matlab, se kursets hjemmeside https://wiki.math.ntnu.no/tma4240/2015h/matlab. I denne øvingen skal vi analysere to
Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1
ECON 0 EKSAMEN 004 VÅR SENSORVEILEDNING Oppgaven består av 0 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom
Kapittel 3: Studieopplegg
Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere
Sted Gj.snitt Median St.avvik Varians Trondheim 6.86 7.50 6.52 42.49 Værnes 7.07 7.20 6.79 46.05 Oppdal 4.98 5.80 7.00 48.96
Vår 213 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 8, blokk II Matlabøving Løsningsskisse Oppgave 1 a) Ingen løsningsskisse. b) Finn, for hvert datasett,
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Kapittel 2: Beskrivende analyse og presentasjon av data for én variabel Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Grafisk
TMA4240 Statistikk Høst 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 9 Løsningsskisse Oppgave 1 a) Vi lar her Y være antall fugler som kolliderer med vindmølla i løpet av den gitte
STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner
STK1100 våren 2017 Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner Svarer til avsnittene 4.1 og 4.2 i læreboka Ørnulf Borgan Matematisk institutt Universitetet i
ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave 3 Pensumoversikt Kap. 2 Beskrivende statistikk,
Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger
2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 3 4 Pensumoversikt Forelesninger og øvinger
Kapittel 1: Data og fordelinger
STK Innføring i anvendt statistikk Mandag 8. august 8 Ingrid K. lad I løpet av dette kurset skal dere bli fortrolig med statistisk tenkemåte forstå teori og metoder som ligger bak knappene/menyene i vanlige
Øving 1 TMA4245 - Grunnleggende dataanalyse i Matlab
Øving 1 TMA4245 - Grunnleggende dataanalyse i Matlab For grunnleggende bruk av Matlab vises til slides fra basisintroduksjon til Matlab som finnes på kursets hjemmeside. I denne øvingen skal vi analysere
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis
Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans
Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner
TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger
TMA4240/TMA4245 Statistikk: Oppsummering kontinuerlige sannsynlighetsfordelinger Kontinuerlig uniform fordeling f() = B A, A B. En kontinuerlig størrelse (vekt, lengde, tid), som aldri kan bli mindre enn
1 Section 6-2: Standard normalfordelingen. 2 Section 6-3: Anvendelser av normalfordelingen. 3 Section 6-4: Observator fordeling
1 Section 6-2: Standard normalfordelingen 2 Section 6-3: Anvendelser av normalfordelingen 3 Section 6-4: Observator fordeling 4 Section 6-5: Sentralgrenseteoremet Oversikt Kapittel 6 Kontinuerlige tilfeldige
UNIVERSITETET I OSLO Matematisk Institutt
UNIVERSITETET I OSLO Matematisk Institutt Midtveiseksamen i: STK 1000: Innføring i anvendt statistikk Tid for eksamen: Onsdag 9. oktober 2013, 11:00 13:00 Hjelpemidler: Lærebok, ordliste for STK1000, godkjent
ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon
ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon Bo Lindqvist Institutt for matematiske fag 2 Kap. 9: Inferens om én populasjon Statistisk inferens har som mål å tolke/analysere
TMA4240 Statistikk Høst 2007
TMA4240 Statistikk Høst 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b4 Løsningsskisse Oppgave 1 Eksamen juni 1999, oppgave 3 av 3 a) µ populasjonsgjennomsnitt,
Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)
TMA440 Statistikk H010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,
Forelening 1, kapittel 4 Stokastiske variable
Forelening 1, kapittel 4 Stokastiske variable Eksempel X = "antall kron på kast med to mynter (før de er kastet)" Uniformt utfallsrom {MM, MK, KM, KK}. X = x beskriver hendelsen "antall kron på kast med
Estimat og konfidensintervall for andel pasientopphold med minst én pasientskade
Estimat og konfidensintervall for andel pasient Gjennomsnitt, standardavvik, minimum og maksimum for andel med minst én er beregnet på samme måte som i Tabell 1 på side 20 i «Rapport for Nasjonal Journalundersøkelse
Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.20).
Econ 130 HG mars 017 Supplement til forelesningen 7. februar Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.0). Regel 5.19 sier at summer, Y X1 X X
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Underveiseksamen i: STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 22/3, 2006. Tid for eksamen: Kl. 09.00 11.00. Tillatte hjelpemidler:
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Kapittel 7: Utvalgsfordeling Bo Lindqvist Institutt for matematiske fag 2 Fra kapittel 1: Populasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg
Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002
Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002 Oppgave 1 a) En god estimator er forventningsrett og har liten varians. Vi tester forventningsretthet: E[ˆµ] E[Y ] µ E[ µ] E[ 1 2 X + 1 2 Y ] 1 2 E[X]
Løsningsforslag til obligatorisk oppgave i ECON 2130
Andreas Mhre April 15 Løsningsforslag til obligatorisk oppgave i ECON 13 Oppgave 1: E(XY) = E(X(Z X)) Setter inn Y = Z - X E(XY) = E(XZ X ) E(XY) = E(XZ) E(X ) E(XY) = - E(X ) X og Z er uavhengige, så
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Fra første forelesning: Populasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg En delmengde av
Emnekode: LGU Emnenavn: Matematikk 2 (5 10), emne 2. Semester: VÅR År: 2016 Eksamenstype: Skriftlig
Sensurveiledning Emnekode: LGU 52003 Emnenavn: Matematikk 2 (5 10), emne 2 Semester: VÅR År: 2016 Eksamenstype: Skriftlig Oppgave 1 Grafen i Vedlegg 1 viser farten som en deltaker i et ultramaraton holder
Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere
Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis μ 1 og μ. Vi trekker da ett utvalg fra hver populasjon. ST00 Statistikk for
Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1
ECON 130 EKSAMEN 005 VÅR SENSORVEILEDNING Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom , Oppgave 1 I denne oppgaven kan du anta at
Introduksjon. Viktige begreper for å beskrive data: Enheter som er objektene i datasettet. «label» som av og til brukes for å skille enhetene
Introduksjon Viktige begreper for å beskrive data: Enheter som er objektene i datasettet «label» som av og til brukes for å skille enhetene En variabel er en karakteristikk av hver enhet Variablene angis
Inferens i regresjon
Strategi som er fulgt hittil: Inferens i regresjon Deskriptiv analyse og dataanalyse først. Analyse av en variabel før studie av samvariasjon. Emne for dette kapittel er inferens når det er en respons
i x i
TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 11, blokk II Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale
Gammafordelingen og χ 2 -fordelingen
Gammafordelingen og χ 2 -fordelingen Gammafunksjonen Gammafunksjonen er en funksjon som brukes ofte i sannsynlighetsregning. I mange fordelinger dukker den opp i konstantleddet. Hvis man plotter n-fakultet
Fra første forelesning:
2 Fra første forelesning: ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag opulasjon Den mengden av individer/objekter som vi ønsker å analysere. Utvalg En delmengde av populasjonen
EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.
KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. BtG207 EKSAMENSDATO: 16. juni 2009. KLASSE: HIS 07 10. TID: kl. 8.00 13.00. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 3 innkl. forside)
Eksamensoppgave i TMA4245 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4245 Statistikk Faglig kontakt under eksamen: Ingelin Steinsland a, Øyvind Bakke b Tlf: a 73 59 02 39, 926 63 096, b 73 59 81 26, 990 41 673 Eksamensdato:
Sannsynlighetsregning og Statistikk.
Sannsynlighetsregning og Statistikk. Leksjon Velkommen til dette kurset i sannsynlighetsregning og statistikk! Vi vil som lærebok benytte Gunnar G. Løvås:Statistikk for universiteter og høyskoler. I den
Utvalgsfordelinger (Kapittel 5)
Utvalgsfordelinger (Kapittel 5) Oversikt pensum, fortid og fremtid Eksplorativ data-analyse (Kap 1, 2) Hvordan produsere data (Kap 3) Sannsynlighetsteori (Kap 4) Utvalgsfordelinger til observatorer (Kap
Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk
MAT0100V Sannsynlighetsregning og kombinatorikk Forventning, varians og standardavvik Tilnærming av binomiske sannsynligheter Konfidensintervall Ørnulf Borgan Matematisk institutt Universitetet i Oslo
Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.
Utvalgsfordelinger Vi har sett at utvalgsfordelinger til en statistikk (observator) er fordelingen av verdiene statistikken tar ved mange gjenttatte utvalg av samme størrelse fra samme populasjon. Utvalg
Oppgaver fra 8.3, 8.4, , 8.51, 8.52, 8.231, 8.232, 8.250, 8.252
Oppgaver fra 8.3, 8.4, 8.5 8.41, 8.51, 8.52, 8.231, 8.232, 8.250, 8.252 8.41 Populasjon: Tilfeldig variabel X : Trekke en tilfeldig flaske og måle volumet Ukjent sannsynlighetsfordeling, men forventning
ST0103 Brukerkurs i statistikk Høst 2014
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag ST0103 Brukerkurs i statistikk Høst 2014 Løsningsforslag Øving 1 2.1 Frekvenstabell For å lage en frekvenstabell må vi telle
Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir
TMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 Ei bedrift produserer elektriske komponentar. Komponentane kan ha to typar
Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans
Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner
TMA4240 Statistikk Høst 2016
TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 11 Oppgavene i denne øvingen dreier seg om hypotesetesting og sentrale begreper
Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere
2 Inferens om varians og standardavvik for ett normalfordelt utvalg (9.4) Inferens om variansen til en normalfordelt populasjon bruker kjikvadrat-fordelingen ( chi-square distribution ) (der kji er den
1 Section 7-2: Estimere populasjonsandelen. 2 Section 7-4: Estimere µ når σ er ukjent
1 Section 7-2: Estimere populasjonsandelen 2 Section 7-4: Estimere µ når σ er ukjent Kapittel 7 Nå begynner vi med statistisk inferens! Bruke stikkprøven til å 1 Estimere verdien til en parameter i populasjonen.
Eksamensoppgave i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Jo Eidsvik og Arild Brandrud Næss Tlf: 90 12 74 72 og 99 53 82 94 Eksamensdato: 9. desember 2013 Eksamenstid
Konfidensintervall for µ med ukjent σ (t intervall)
Forelesning 3, kapittel 6 Konfidensintervall for µ med ukjent σ (t intervall) Konfidensintervall for µ basert på n observasjoner fra uavhengige N( µ, σ) fordelinger når σ er kjent : Hvis σ er ukjent har
Løsningsforslag Eksamen S2, høsten 2016 Laget av Tommy Odland Dato: 27. januar 2017
Løsningsforslag Eksamen S, høsten 016 Laget av Tommy Odland Dato: 7. januar 017 Del 1 - uten hjelpemidler Oppgave 1 a) Vi skal derivere f(x) = x 3 5x, og vi kommer til å få bruk for reglene (ax n ) = anx
Utvalgsfordelinger (Kapittel 5)
Utvalgsfordelinger (Kapittel 5) Observator En observator er en funksjon av data for mange individer, for eksempel Gjennomsnitt Andel Stigningstall i regresjonslinje En observator er en tilfeldig variabel
Dataens tidsalder. Hvorfor data? Data, data, data. STK1000 Innføring i anvendt statistikk. Tirsdag 24. august 2010
STK1000 Innføring i anvendt statistikk Tirsdag 24. august 2010 Geir Storvik (modifisert etter I. Glad s tidligere presentasjon) 1 Data, data, data Genetiske data World Wide Web Overvåkning Medisinske bilder
Hypotesetesting av λ og p. p verdi.
Forelesning 7, kapittel 6 Hypotesetesting av λ og p. p verdi. Det som gjøres i denne forelesningen er nær opptil det vi gjorde da vi konstruerte z test for µ, og styrkefunksjon for denne. I tillegg til
Oppgaver til Studentveiledning 3 MET 3431 Statistikk
Oppgaver til Studentveiledning 3 MET 3431 Statistikk 24. april 2012 kl 17.15-20.15 i B2 Handelshøyskolen BI 2 Oppgaver 1. Eksamensoppgaver: Eksamen 01/06/2011: Oppgave 1-7. Eksamensoppgaven fra 06/2011
TMA4240 Statistikk Høst 2012
TMA424 Statistikk Høst 212 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 7 Løsningsskisse Matlabøving Beskrivende analyse Oppgave 1 a) Finn, for hvert datasett,
Statistisk behandling av kalibreringsresultatene Del 1. v/ Rune Øverland, Trainor Elsikkerhet AS
Statistisk behandling av kalibreringsresultatene Del 1. v/ Rune Øverland, Trainor Elsikkerhet AS Denne artikkelserien handler om statistisk behandling av kalibreringsresultatene. I de fleste tilfeller
Oppgaver til Studentveiledning 4 MET 3431 Statistikk
Oppgaver til Studentveiledning 4 MET 3431 Statistikk 8. mai 2012 kl 17.15-20.15 i B2 Handelshøyskolen BI 2 Oppgaver 1. Eksamensoppgaver: Eksamen 22/11/2011: Oppgave 1-7. Eksamensoppgaven fra 11/2011 er
ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4
ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4 Bjørn H. Auestad Institutt for matematikk og naturvitenskap Universitetet i Stavanger 27. mars Bjørn H. Auestad Kp. 6: Hypotesetesting
Statistikk for språk- og musikkvitere 1
Statistikk for språk- og musikkvitere 1 Mitt navn: Åsne Haaland, Vitenskapelig databehandling USIT Ikke nøl, avbryt med spørsmål! Hva oppnår en med statistikk? Få oversikt over data: typisk verdi, spredning,
MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem
MAT400 PROSJEKTOPPGAVE: Statistikk i S2 Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem 20. mai 205 Innhold. Stokastisk Variabel.. Stokastiske variable som funksjoner 3 2. Forventningsverdi
Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans
Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner
Statistikk 1. Nico Keilman. ECON 2130 Vår 2014
Statistikk 1 Nico Keilman ECON 2130 Vår 2014 Pensum Kap 1-7.3.6 fra Løvås «Statistikk for universiteter og høgskoler» 3. utgave 2013 (eventuelt 2. utgave) Se overspringelsesliste på emnesiden Supplerende
Kontinuerlige sannsynlighetsfordelinger.
Kontinuerlige sannsynlighetsfordelinger. Dekkes av kap. 6 og deler av kap. 8.5 i boka. Husk: f(x) er sannsynlighetstettheten til en kontinuerlig X dersom: 1. f(x) 0 for alle x R 2. f(x)dx =1 3. P (a
Analyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger
Intro til hypotesetesting Analyse av kontinuerlige data 21. april 2005 Tron Anders Moger Seksjon for medisinsk statistikk, UIO 1 Repetisjon fra i går: Normalfordelingen Variasjon i målinger kan ofte beskrives
Kort overblikk over kurset sålangt
Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente
Løsningsforslag Eksamen S2, våren 2016 Laget av Tommy Odland Dato: 29. januar 2017
Løsningsforslag Eksamen S, våren 016 Laget av Tommy Odland Dato: 9. januar 017 Del 1 - uten hjelpemidler Oppgave 1 a) Vi skal derivere f(x) = e x. Den generelle regelen er at (e ax ) = ae ax, i vårt tilfelle
EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.
KANDIDATNUMMER: EKSAMEN FAGNAVN: Statistikk. FAGNUMMER: Rea 1082 EKSAMENSDATO: 14. mai 2009. KLASSE: Ing. TID: kl. 9.00 13.00. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 3 (innkl. forside) TILLATTE
TMA4240 Statistikk H2015
TMA4240 Statistikk H2015 Funksjoner av stokastiske variabler (kapittel 7+notat) Fokus på start med kumulativ fordeling 7.2 Funksjon av en SV (inkludert en-entydighet). Fordeling til max/min (fra notat).
Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.
Utvalgsfordelinger Vi har sett at utvalgsfordelinger til en observator er fordelingen av verdiene observatoren tar ved mange gjenttatte utvalg av samme størrelse fra samme populasjon. Utvalg er en tilfeldig