ØVINGER 2017 Løsninger til oppgaver. Øving 1

Like dokumenter
ST0103 Brukerkurs i statistikk Høst 2014

Statistikk. Forkurs 2017

Statistikk. Forkurs 2018

ting å gjøre å prøve å oppsummere informasjonen i Hva som er hensiktsmessig måter å beskrive dataene på en hensiktsmessig måte.

Kapittel 1: Data og fordelinger

Deskriptiv statistikk., Introduksjon til dataanalyse

Et lite notat om og rundt normalfordelingen.

Sannsynlighetsregning og Statistikk.

Når du har arbeidet deg gjennom dette kapittelet, er målet at du skal kunne

Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?

1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene

Beskrivende statistikk.

Sentralmål og spredningsmål

Et lite notat om og rundt normalfordelingen.

Deskriptiv statistikk., Introduksjon til dataanalyse

INNHOLD. Matematikk for ungdomstrinnet

STK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler

Statistikk Løsninger. Innhold. Statistikk Vg2P

Statistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005

ECON Statistikk 1 Forelesning 2: Innledning

Dataens tidsalder. Hvorfor data? Data, data, data. STK1000 Innføring i anvendt statistikk. Tirsdag 24. august 2010

MATEMATIKK (MAT1005) Sentralmål / Spredningsmål

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

Tema. Beskrivelse. Husk!

Øving 1 TMA Grunnleggende dataanalyse i Matlab

Øving 1 TMA Grunnleggende dataanalyse i Matlab

Løsningskisse for oppgaver til undervisningsfri uke 8 ( februar 2012)

Eksamen våren 2016 Løsninger

2P kapittel 3 Statistikk Utvalgte løsninger oppgavesamlingen

Bruk SUMMER-funksjonen i formelen i G9. Oppgave 14. H. Aschehoug & Co Side 1

ECON2130 Kommentarer til oblig

2P 2012 vår ny LØSNING

Statistikk. Mål. for opplæringen er at eleven skal kunne. planlegge, gjennomføre og vurdere statistiske undersøkelser

Løsning eksamen 2P våren 2008

Øgrim Bakken Pettersen Skrindo Dypbukt Mustaparta Thorstensen Thorstensen. Digitalt verktøy for Sigma 2P. Microsoft Excel

ÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.

Eksempel på data: Karakterer i «Stat class» Introduksjon

Løsningsforslag til obligatorisk oppgave i ECON2130 våren 2014 av Jonas Schenkel.

Øgrim Bakken Pettersen Skrindo Dypbukt Mustaparta Thorstensen Thorstensen. Digitalt verktøy for Sigma 2P. Microsoft Excel

Seksjon 1.3 Tetthetskurver og normalfordelingen

UNIVERSITETET I OSLO

MATEMATIKK (MAT1005) Sentralmål / Spredningsmål

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger

( ) 3. DEL 1 Uten hjelpemidler. Oppgave 1. Oppgave 2. Oppgave I gjennomsnitt har hver elev 1,25 søsken.

ST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag

2P, Statistikk Quiz. Test, 2 Statistikk

ST0202 Statistikk for samfunnsvitere

Forkurs i kvantitative metoder ILP 2019

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Statistikk 2. Tabellen nedenfor viser oljeproduksjonen i et OPEC-land i perioden 1990 til Produksjonen er i 1000 tonn.

Grunnleggende kurs i Excel. Langnes skole

Akkurat den samme begrunnelsen som vi brukte med variabelen X 2. "Jeg bruker internett mye mer på i-phone nå enn det jeg gjorde før på mobilen.

Bruk av digitale verktøy som graftegner og regneark skal dokumenteres med utskrift eller gjennom en IKT-basert eksamen.

Øving 7: Statistikk for trafikkingeniører

Manual til Excel. For ungdomstrinnet ELEKTRONISK UNDERVISNINGSFORLAG AS

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Statistikk for språk- og musikkvitere 1

Formelsamling i medisinsk statistikk

Matriser En matrise er en rektangulær oppstilling av tall og betegnes med en stor bokstav, f.eks. A, B, C,.. Eksempler:

Eksamen våren 2015 Løsninger

Oppgaven består av 10 delspørsmål som anbefales å veie like mye, Kommentarer og tallsvar er skrevet inn mellom <<, >>, Oppgave 1

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 24. november 2017

ST0202 Statistikk for samfunnsvitere Kapittel 6: Normalfordelingen

1 Grafisk framstilling av datamateriale

2P kapittel 3 Statistikk Løsninger til innlæringsoppgavene

Eksamen 2P MAT1015 Høsten 2012 Løsning

Bruk av Google Regneark

Kapittel 1: Introduksjon til statistikk og dataanalyse Foreleses tirsdag 9. januar 2007.

Løsningsforslag til obligatorisk oppgave i ECON 2130

Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk

Basisoppgaver til 2P kap. 3 Statistikk

GeoGebra-opplæring i 2P-Y

Forelening 1, kapittel 4 Stokastiske variable

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Eksamen høsten 2017 Løsninger

( ) 3. DEL 1 Uten hjelpemidler. Oppgave 1 Antall søsken i klassen er: = = 20

ECON240 Vår 2018 Oppgaveseminar 1 (uke 6)

Forelesningsnotat i Diskret matematikk 27. september 2018

Statistikk Oppgaver. Innhold. Statistikk Vg2P

2P-Y eksamen våren 2018 løsningsforslag

Eksamen MAT1015 Matematikk 2P Va ren 2015

Oppgave 1: Feil på mobiltelefoner

Løsningsforslag for 2P våren 2015

2P kapittel 3 Statistikk Løsninger til innlæringsoppgavene

Eksamen høsten 2016 Løsninger

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Forelesning 3. april, 2017

2P eksamen våren 2018 løsningsforslag

Kapittel 1 ser på. Statistikk i hverdagen

Loven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere

ØVINGER 2017 Løsninger til oppgaver. Lineærkombinasjonen Z = 5X + 8Y har forventningsverdi

BEGYNNERKURS I SPSS. Anne Schad Bergsaker 3. mai 2018

2P kapittel 4 Statistikk Løsninger til oppgavene i læreboka

Hjelpemidler på Del 2 Alle hjelpemidler er tillatt, med unntak av Internett og andre verktøy som tillater kommunikasjon.

Høgskolen i Sør-Trøndelag Avdeling Trondheim Økonomisk Høgskole EKSAMENSOPPGAVE

ST0202 Statistikk for samfunnsvitere

Estimat og konfidensintervall for andel pasientopphold med minst én pasientskade

Transkript:

ØVINGER 017 Løsninger til oppgaver Øving 1.1. Frekvenstabell For å lage en frekvenstabell må vi telle antall observasjoner av hvert antall henvendelser. Siden antall henvendelser på en gitt dag alltid ligger mellom 0 og 7 trenger vi en tabell med åtte rader. Videre lar vi tabellen ha tre kolonner. I den venstre kolonnen lister vi variabelen vi ønsker å tabulere frekvensen av, altså antall henvendelser. I den midterste kolonnen skriver vi frekvensen vi har observert hvert antall henvendelser med, altså hvor mange ganger hvert av tallene opptrer i tabellen i oppgaveteksten. I den høyre kolonnen skriver vi relativ frekvens, altså hvor stor andel av observasjonene hver observerte verdi utgjør. Vi finner de relative frekvensene ved å normalisere frekvensene i den midterste kolonnen. Siden det totalt er 100 observasjoner, normaliserer vi frekvensene ved å dele på 100. Antall henvendelser Frekvens Relativ frekvens 0 9 0.09 1 0 0.0 0. 3 18 0.18 4 11 0.11 8 0.08 0.0 7 3 0.03 For å kontrollere utregningene kan vi sjekke at summen av frekvensene blir lik antall observasjoner, alstå 100, og at summen av de relative frekvensene blir 1. Merk at en frekvenstabell ikke nødvendigvis trenger å ha med både frekvenser og relative frekvenser. Histogram Histogrammet skal være et søylediagram som visualiserer innholdet i frekvenstabellen. Søylene bør være brede nok til at de er helt inntil hverandre. I tillegg ønsker vi at det totale arealet av søylene skal være lik 1. Hvis hver rad i frekvenstabellen representeres av en rektangulær søyle med bredde 1 og høyde lik den relative frekvensen, da vil arealet av søylen være lik relativ frekvens, og sammenlagt vil arealet av alle søylene være lik summen av de relative frekvensene, som er 1. Det kan være praktisk å sentrere hver søyle horisontalt på verdien den representerer, slik at søylen for null henvendelser strekker seg fra 0. til 0. på x-aksen, 1

søylen for en henvendelse strekker seg fra 0. til 1., og så videre. 0.3 0.3 0. Relativ frekvens 0. 0.1 0.1 0.0 0 0 1 3 4 7 Antall henvendelser Histogrammet har en skjev form. De høyeste søylene finner vi rundt to henvendelser. Høyden avtar gradvis når man beveger seg til høyre, dvs. mot flere henvendelser. Histogrammet har ikke noen tilsvarende hale på venstre side, siden antall henvendelser alltid er større enn eller lik null. En slik skjev form er typisk for histogrammer av ikke-negative variable... Vi bør unngå å bruke gjennomsnitt som sentralmål når vi studerer inntektsforhold. Dette fordi fordelingen av inntekt ofte er svært skjev. sinntekten er gjerne mange ganger større enn inntekten til en typisk arbeidstaker. inntekten er derimot et informativt sentralmål for inntekt, og er bedre skikket til å fortelle oss hvor inntektsnivået faktisk ligger. Sammenlignet med gjennomsnittet påvirkes medianen lite av den store skjevheten i utvalget, altså det at noen få arbeidstakere har svært høy inntekt. Modus kan også brukes som sentralmål for inntekt, men fungerer best dersom observasjonene er gruppert i intervaller, slik at det blir mange nok observasjoner av hvert intervall. Modus forteller da hvilket intervall en typisk inntekt ligger innenfor..7. For å finne medianen begynner vi med å sortere tallene i stigende rekkefølge: 3 4 7 8 1. De to midterste tallene er 4 og 7, så medianen er (4 + 7/ =..

et av tallene er + 3 + 4 + 7 + 8 + 1 = 3 =. For å finne standardavviket regner vi først ut variansen, s = 1 [ ( + (3 + (4 + (7 + (8 + (1 ] = 1 = 1 et er da s = 14 = 3.74. [ 4 + 3 + + 1 + + ] = = 1 70 = 14..8. en er gjennomsnittet av de to midterste tallene, 1 000 004 + 1 000 007 = 1 000 00.. Summen av tallene er 000 03, og gjennomsnittet er summen delt på, 000 03 = 1 000 00. Vi skal regne ut standardavviket, og ser først på de individuelle kvadratavvikene (1 000 00 1 000 00 = ( (1 000 003 1 000 00 = (3 (1 000 004 1 000 00 = (4 (1 000 007 1 000 00 = (7 (1 000 008 1 000 00 = (8 (1 000 01 1 000 00 = (1. Dette er de samme kvadratavvikene som i oppgave.7, slik at variansen også i dette tilfellet blir 3

s = 1 [ 4 + 3 + + 1 + + ] 1 = 1 70 = 14, og standardavviket blir 14 = 3.74. Tallene i denne oppgaven er forskjøvet oppover med 1 000 000 i forhold til tallene i oppgave.7. Dermed er medianen og gjennomsnittet forskjøvet tilsvarende i forhold til sentralmålene i oppgave.7. Spredningen til tallene er imidlertid uendret, slik at standardavviket er det samme som før..9 Her er de to midterste tallene 400 og 700, så medianen er et blir 400 + 700 = 0. 00 + 300 + 400 + 700 + 800 + 100 Variansen er = 300 = 00. s = 1 [ (00 00 + (300 00 + (400 00 + 1 +(700 00 + (800 00 + (100 00 ] = = 1 [ 400 + 300 + 00 + 100 + 00 + 400 ] = = 1 700 000 = 140 000, slik at standardavviket blir 140 000 = 374.17. Tallene som er gitt i denne oppgaven er de samme som i oppgave.7, men multiplisert med 100. en og gjennomsnittet blir her 100 ganger tilsvarende sentralmål i oppgave.7. Til forskjell fra translasjon, som i oppgave.8, vil multiplikasjon endre spredningen til utvalget, så her finner vi også at standardavviket er 100 ganger større enn standardavviket i oppgave.7.. (19. Definisjon.3 gir oss følgende formel for varians: 4

s = 1 (x i x, og vi skal vise at dette er det samme som ( 1 x i n x. Vi følger anbefalingen i oppgaveteksten, og bruker nederste linje i regel. til å utvide summen, ( s = 1 (x i x = 1 x i x x i + n x. Videre merker vi oss at siden x = 1/n n x i, så kan vi bytte ut n x i med n x. Dermed er ( s = 1 x i x(n x + n x = = 1 ( x i n x + n x = = 1 ( x i n x.