STK1100 våren Generell introduksjon. Omhandler delvis stoffet i avsnitt 1.1 i læreboka (resten av kapittel 1 blir gjennomgått ved behov)

Like dokumenter
Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

STK1100 våren 2019 Mere om konfidensintevaller

STK1100 våren Normalfordelingen. Normalfordelingen er den viktigste av alle sannsynlighetsfordelinger

STK1100 våren Kontinuerlige stokastiske variabler Forventning og varians Momentgenererende funksjoner

TMA4240 Statistikk H2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Hypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:

ÅMA110 Sannsynlighetsregning med statistikk, våren

Kapittel 4.4: Forventning og varians til stokastiske variable

ÅMA110 Sannsynlighetsregning med statistikk, våren 2011

TMA 4255 Forsøksplanlegging og anvendte statistiske metoder

Statistikk og dataanalyse

TMA4240 Statistikk H2010

Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent)

MAT4010 PROSJEKTOPPGAVE: Statistikk i S2. Olai Sveine Johannessen, Vegar Klem Hafnor & Torstein Mellem

Oppgaver fra 8.3, 8.4, , 8.51, 8.52, 8.231, 8.232, 8.250, 8.252

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

STK1100 våren Introduksjon til sannsynlighetsbegrepet. Svarer til avsnittene 2.1 og 2.2 i læreboka

STK1100 våren Introduksjon til sannsynlighetsbegrepet. Deterministiske fenomener. Stokastiske forsøk. Litt historikk

STK Oppsummering

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Sannsynlighetsregning og Statistikk.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2010 Oppsummering

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Innhold. Innledning. Del I

Bred profil på statistikk?

STK1100 våren Introduksjon til sannsynlighetsbegrepet. Deterministiske fenomener. Stokastiske forsøk. Litt historikk

Informasjon om studieprogrammet Beregningsorientert informatikk

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Hypotesetesting (kp. 6) ÅMA110 Sannsynlighetsregning med statistikk, våren Tre deler av faget/kurset: 1. Beskrivende statistikk

ÅMA110 Sannsynlighetsregning med statistikk, våren Noen viktige sannsynlighetsmodeller. Binomisk modell. Kp. 3 Diskrete tilfeldige variable

Binomisk sannsynlighetsfunksjon

Binomisk fordeling. Hypergeometrisk fordeling. MAT0100V Sannsynlighetsregning og kombinatorikk. Vi har følgende situasjon: = = 2

Studieplan 2009/2010. Matematikk 2. Studiepoeng: Arbeidsmengde i studiepoeng er: 30. Studiets varighet, omfang og nivå. Innledning.

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting, innledning. Kp.

Studieplan 2011/2012. Matematikk 2. Studiepoeng: 30. Studiets varighet, omfang og nivå. Innledning. Læringsutbytte

ÅMA110 Sannsynlighetsregning med statistikk, våren Kp. 3 Diskrete tilfeldige variable. Diskrete tilfeldige variable, varians (kp. 3.

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 4

UNIVERSITETET I OSLO

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

Eksamensoppgave i ST1201/ST6201 Statistiske metoder

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

ÅMA110 Sannsynlighetsregning med statistikk, våren

TMA4240 Statistikk Høst 2008

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Regneøvelse 29/5, 2017

Betinget sannsynlighet

TMA4240 Statistikk H2017 [15]

Fordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

ÅMA110 Sannsynlighetsregning med statistikk, våren 2008

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

STK1100 våren Forventningsverdi. Forventning, varians og standardavvik

Last ned Statistikk - Tor Martin Kvikstad. Last ned. Last ned e-bok ny norsk Statistikk Gratis boken Pdf, ibook, Kindle, Txt, Doc, Mobi

1 Section 4-1: Introduksjon til sannsynlighet. 2 Section 4-2: Enkel sannsynlighetsregning. 3 Section 5-1: Introduksjon til sannsynlighetsfordelinger

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Emnenavn: Eksamenstid: 4 timer. Faglærer: Hans Kristian Bekkevard

Innledning kapittel 4

Denne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans

Utvalgsfordelinger (Kapittel 5)

Læreplan i matematikk X - programfag i utdanningsprogram for studiespesialisering

Test, 3 Sannsynlighet og statistikk

NTNU KOMPiS Studieplan for MATEMATIKK 1 ( trinn) med hovedvekt på trinn Studieåret 2015/2016

EKSAMEN ST0202 STATISTIKK FOR SAMFUNNSVITERE

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

Innhold. Innledning. Del I

ST0202 Statistikk for samfunnsvitere

Oppgaver til Studentveiledning 4 MET 3431 Statistikk

Tilfeldige variable (5.2)

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Kapittel 8: Tilfeldige utvalg, databeskrivelse og fordeling til observatorar, Kapittel 9: Estimering

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO Matematisk Institutt

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

Læreplan i matematikk for samfunnsfag - programfag i studiespesialiserende program

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

STK1100 våren 2017 Kombinatorikk

TMA4240 Statistikk Høst 2018

MATEMATIKK 1 (for trinn) Emnebeskrivelser for studieåret 2014/2015

STK1100 våren Betinget sannsynlighet og uavhengighet. Svarer til avsnittene 2.4 og 2.5 i læreboka

ÅMA110 Sannsynlighetsregning med statistikk, våren ÅMA110 Sannsynlighetsregning med statistikk, våren 2010

ÅMA110 Sannsynlighetsregning med statistikk, våren Hypotesetesting (kp. 6) Hypotesetesting. Kp. 6 Hypotesetesting ...

ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper

UNIVERSITETET I OSLO

ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon

Kapittel 3: Studieopplegg

MAT0100V Sannsynlighetsregning og kombinatorikk

TMA4240 Statistikk H2010

Department of Mathematics University of Oslo

Fasit for tilleggsoppgaver

NTNU KOMPiS Studieplan for MATEMATIKK 1 ( trinn) Studieåret 2014/2015

statistikk, våren 2011

Norske hoppdommere og Janne Ahonen

ÅMA110 Sannsynlighetsregning med statistikk, våren 2006 Kp. 6, del 3

Et lite notat om og rundt normalfordelingen.

Høgskoleni Øs fold EKSAMEN. Om noe er uklart eller mangelfullt i oppgaven inngår det som en del av oppgaven å ta de nødvendige forutsetninger.

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Transkript:

STK1100 våren 2017 Generell introduksjon Omhandler delvis stoffet i avsnitt 1.1 i læreboka (resten av kapittel 1 blir gjennomgått ved behov) Ørnulf Borgan Matematisk institutt Universitetet i Oslo 1

«Overalt» samles det inn data Internett (Google, Facebook, mm) Mengden av data bare øker og øker «Big Data» 2

Data må behandles og fortolkes for å gi nyttig informasjon og grunnlag for beslutninger. Da må vi ta hensyn til at data oftest er påvirket av måleusikkerhet, individuelle variasjoner, og andre faktorer av tilfeldig natur. Vi må ta hensyn til disse tilfeldige variasjonene når dataene skal behandles og fortolkes. Vi beskriver da dataene med en statistisk modell som tar hensyn til de tilfeldige variasjonene og bruker en statistisk metode for å få informasjon ut av dataene. Sannsynlighetsregningen danner grunnlaget for statistiske modeller og metoder. Vi vil se kort på noen eksempler.

Av et utvalg på 792 som ville ha stemt hvis det var valg, ville 270 ha stemt Arbeiderpartiet (Ap). Hva er Ap's oppslutningen i populasjonen av alle stemmeberettigede? 4

Vi får en (noe forenklet) statistisk modell for meningsmålingen ved å se på den som et binomisk forsøk (jf. Matematikk R1): Hver av de n = 792 personene i utvalget vil enten ha stemt Ap, eller så ville de ikke det Sannsynligheten for at en person ville ha stemt Ap er p = «andelen i populasjonen som ville ha stemt Ap» Personene i utvalget ville ha stemt Ap eller ikke uavhengig av hverandre 270 Et estimat på Ap's oppslutning er pˆ = = 0.341 792 Ved å bruke kunnskap om den tilfeldige variasjonen i et binomisk forsøk, kan vi regne ut at en feilmargin for dette estimatet er ± 3.3prosentpoeng 5

Histogrammet viser vektøkning under graviditet for et utvalg på 68 kvinner. Gjennomsnittlig vektøkning: x = 13.5 kg Hva kan vi ut fra disse dataene si om gjennomsnittlig vektøkning under graviditet for alle gravide (i den populasjonen utvalget kommer fra)? Må da ha en statistisk modell som beskriver variasjonen i vektøkning blant gravide kvinner. En mulig modell er at vektøkningen er normalfordelt. Ved å bruke denne modellen, kan en finne en at gjennomsnittlig vektøkning blant alle gravide er 13.5 ± 1.4kg

Et forsikringsselskap registrerer skader (f. eks. på biler) og størrelsen på skadene for alle som er forsikret i selskapet. På grunnlag av data for tidligere år, må de bestemme hvor mye hver kunde skal betale for forsikringen neste år. Da bruker de en statistisk modell som beskriver sannsynligheten for at en kunde får en skade og hvor stor sannsynligheten er for skader av ulik størrelse. 7

I forskning, forvaltning og næringsliv samles det inn stadig større datamengder. «Big Data» gir nye utfordringer både innen statistikk og informatikk. I tillegg til mer tradisjonelle statistiske metoder (som tar utgangspunkt i en sannsynlighetsmodell), er det også nødvendig å videreutvikle metoder innen maskinlæring (som tar utgangspunkt i en algoritme). Data science er en fellesbetegnelse på informatiske og statistiske metoder for «Big Data» 8

Det nye kurset STK2100 tar for seg en del sentrale metoder i data science (kan tas i fjerde semester). STK1100 er et mer basalt kurs som legger hovedvekten på grunnleggende sannsynlighetsregning og statistisk modellering. Men vi vil også se litt på hvordan sannsynlighetsregningen danner grunnlaget for statistiske metoder: Populasjon Utvalg 9

Hovedtrekk av pensum i STK1100 (fra læreboka til Devore og Berk): Kapittel 1: Beskrivende statistikk (tas ved behov) Kapittel 2: Grunnleggende sannsynlighetsregning (mye repetisjon fra Matematikk R1) Kapitlene 3-6: Diskrete og kontinuerlige stokastiske variabler. Sannsynlighetsfordelinger, forventning, varians, store talls lov, sentralgrensesetningen, m.m. Kapitlene 7 og 8: Litt om statistiske metoder (estimering og konfidensintervall) 10