Statistikk for språk- og musikkvitere 1
|
|
- Helene Eriksen
- 7 år siden
- Visninger:
Transkript
1 Statistikk for språk- og musikkvitere 1
2 Mitt navn: Åsne Haaland, Vitenskapelig databehandling USIT Ikke nøl, avbryt med spørsmål!
3 Hva oppnår en med statistikk?
4 Få oversikt over data: typisk verdi, spredning, grad av symmetrisk fordeling etc. Generalisering, fra utvalg til hele populasjoner (hypotesetesting)
5 Flere bruksområder Til å forklare (Multippel regresjon: posisjonen til tungeroten forklares med punkter på tungebladet, side 83 i Johnson-bok. Bidraget til enkeltpunkt)
6 Anvendelser i datalingvistikk Prediksjon: Klassifiseringsoppgaver i språkteknologi: Prediksjon av korrekt kategori (Hver faktors bidrag er ikke transparent) Data Mining: Å oppdage mønstre i store datamengder, som korpora.
7 Dagens program Diskusjon av de første to anvendelsene Gitt et datasett, hvordan går vi frem, hva er det første vi gjør?
8 1 : Se på data En Cherokeetalende (mann) med 30 års mellomrom, 1971 og 2001 (side 2, Keith Johnson: Quantitative Methods in Linguistics,). Varighet av aspirasjon, (VOT, Voice Onset Time), i ustemte plosiver (/k/ and/t/):
9 Gjennomsnitt 2001 = 84.7, gjennomsnittet er størst. Beskrivende statistikk: Representativ verdi og spredningsmål Representativ verdi: Gjennomsnitt (vanlig), X = 1 N N 1 xi Summer alle observasjonene, og divider med antallet Gjennomsnitt 1971 = 113.5
10 Median og modus Median er midterste observasjon Modus den mest frekvente Hvis data er symmetrisk fordelt, er de sammenfallende. Gjennomsnittet påvirkes sterkt av utliggere.
11 Spredningsmål: Standard avvik, s ( x i X )( x ( n 1) i X ) = s Kvadratet av s er lik summen av hver observasjon minus gjennomsnittet kvadrert, dividert med antallet-1 Gjennomsnittlig avstand til gjennomsnittet: Hvorfor er definisjonen av s så vanskelig? Kvadrering gir positivt tall St avvik 1971 =35.9, st avvik 2001=36.09
12 Sorterer etter voksende størrelse: Kan gjøres automatisk av en statistikkpakke, Excel etc, eller manuelt. 1971: Min-verdi: 53 Max-verdi: 181 Modus, (mest frekvente): 109 (to observasjonen, alle andre verdier opptrer bare en gang)
13 Kvartiler Kvartiler = 25 prosent av observasjonene(første) and 75 prosent (tredje) Medianen er andre kvartil 1971 (tilsammen 18 observasjoner): Median=114 (snittet av 9. og 10. observasjon) Første kvartil=79 (5. minste) Tredje kvartil=129 (15. minste)
14 2 : Grafer Visualisering hjelper forståelsen for alle parter! Histogram (søylediagram) Vise en mye brukt graf Box plot (kvartiler, median og utliggere)
15 Histogram (1971) Density var1
16 Box Plot (1971 venstre, 2001 høyre) var1 var2
17 Box Plot : Box plots viser resultatene for to eller mer måleserier. (Vi har to.) For hver sample: 3 vannrette linjer: første kvartil, median og tredje kvartil. Gi boksen vegger ved å legge til loddrette linjer. Da har vi en boks med halvparten av observasjonene.
18 Loddrette Linjer, fra boksen Avstanden mellom tredje og første kvartil kalles Inter Quartile Range (IQR). Loddrette linjer tegnes fra første og henholdsvis tredje kvartil og til ytterste punkt som er opptil 1.5 IQR. Utliggere er observasjoner som ligger mer enn 1.5 IQR fra selve boksen. IQR-1971: =50, 1.5 IQR=75 Nedre strek: 53 er ytterste verdi innenfor 1.kvartil-1.5IQR 1971 har ingen utliggere, (men 2001 har tre)
19 Hva viser boksplottene for 1971 og 2001?
20 3 : Generalisering: Sammenligning av to gjennomsnitt 1971-gj.snitt = gj.snitt = 84.7 Vi tester statistisk om 1971-snittet er lik snittet for denne Cherokee taleren, eller om de er signifikant forskjellige.
21 Enveis vs toveis tester En kan også velge å teste om 1971-snittet er signifikant større enn 2001-snittet (eller omvent). Dette er en enveis test. Å teste for likhet representerer en toveis test. Vi skal gjøre en toveis test
22 Hva er en normalfordeling (Gausskurve)?
23 Sannsynlighetsfordelinger Sannsynligheten er definert for intervaller Totalt areal under kurven er 1 (den totale sannsynligheten) Det finnes familier av fordelinger
24 t-sannsynlighetsfordelinger er en slik familie I en toveis test beregnes den totale sannsynligheten for venstre og høyre hale intervaller
25 Klare for testing Er 1971-snittet vesentlig forskjellig fra snittet, eller skyldes forskjellen mest sannsynlig tilfeldigheter? Fordi vi sammenligner to gjennomsnitt: T-test (Det er noen tilleggskrav for å bruke t-test)
26 T-testen Nullhypothesen er at gj. snittene er like, H0: μ 1971 = μ 2001 Nullhypotesen skal eventuelt forkastes som følge av testen (Det er ikke mulig å bruke den motsatte satsen som null hypotese, ettersom vi da ikke kommer videre)
27 Av en familie: hvilken t- fordeling? Valget av t-sannsynlighetsfordeling bestemmes entydig av antall frihetsgrader. For t-testen er antall frihetsgrader totalt antall observasjoner i de to måleseriene - 2. Her: 18 (år1971)+26(år2001)-2=42.
28 Som et tall Måleseriene (1971 and 2001) representeres som et tal,l test observatoren, (formelen er ikke vist) t=2.6116, (antall frihetsgrader er 42)
29 P-verdien P-verdien er sannsynligheten for test observatoren, eller noe mer ekstremt, gitt nullhypotesen I eksemplet vårt er p-verdien (to sidig) P-verdien på betyr at gitt at nullhypotesen er sann, så kan vi forvente at vi i 1.24 prosent av alle trials får det vi fikk, eller noe mer sjeldent.
30 Signifikansnivå, α Signifikansnivå α, er grensen for forkastning. Tre vanlige signifikansnivåer: 0.10, 0.05 and P-verdien < signifikansnivået betyr FORKASTNING En kan ikke jukse gjennom valg av signifikansnivå. Vi: P-verdien= Da får jeg forkastning for signifikansnivåene 0.10
31 Type I og Type II feil Nullhypotesen er faktisk sann, men vi forkastet den Nullhypotesen er i virkeligheten gal, men vi forkastet ikke og beholdt den
32 Hva skriver vi? Test observatoren, Antall frihetsgrader P-verdi Signifikansnivå Forkastning eller ikke-forkastning
33 Neste gang, 17. november, samme sted, men kortere ( ) Hva slags statistikkhjelp finnes ved UiO? Demo av statistikkprogramvare (STATA).
Kapittel 3: Studieopplegg
Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere
DetaljerIntroduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013
Introduksjon til statistikk og dataanalyse Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013 Introduksjon til statistikk og dataanalyse Hollywood-filmer fra 2011 135 filmer Samla budsjett: $ 7 166
DetaljerST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave 3 Pensumoversikt Kap. 2 Beskrivende statistikk,
DetaljerLærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Forelesninger og øvinger
2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 3 4 Pensumoversikt Forelesninger og øvinger
DetaljerForelesning 7 Statistiske beskrivelser av enkeltvariabler. Mål for sentraltendens
Forelesning 7 Statistiske beskrivelser av enkeltvariabler Statistiske mål for univariate fordelinger: Sentraltendens Verdien for fordelingens tyngdepunkt Spredning Hvor nært opp til tyngdepunktet ligger
DetaljerTMA4240 Statistikk H2010 (20)
TMA4240 Statistikk H2010 (20) 10.5: Ett normalfordelt utvalg, kjent varians (repetisjon) 10.4: P-verdi 10.6: Konfidensintervall vs. hypotesetest 10.7: Ett normalfordelt utvalg, ukjent varians Mette Langaas
DetaljerTMA4240 Statistikk H2010 (19)
TMA4240 Statistikk H2010 (19) Hypotesetesting 10.1-10.3: Generelt om statistiske hypoteser 10.5: Ett normalfordelt utvalg Mette Langaas Foreleses mandag 25.oktober, 2010 2 Estimering og hypotesetesting
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig
DetaljerÅMA110 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 2010, s. 1. Oppgave 1. Histogram over frekvenser.
ÅMA1 Sannsylighetsregning og statistikk Løsningsforslag til eksamen høst 0, s. 1 (Det tas forbehold om feil i løsningsforslaget.) a) Gjennomsnitt: x = 1 Emp. standardavvik: Median: 1 (1.33 + 1.) = 1.35
DetaljerKapittel 1: Data og fordelinger
STK Innføring i anvendt statistikk Mandag 8. august 8 Ingrid K. lad I løpet av dette kurset skal dere bli fortrolig med statistisk tenkemåte forstå teori og metoder som ligger bak knappene/menyene i vanlige
DetaljerKrysstabellanalyse (forts.) SOS1120 Kvantitativ metode. 4. Statistisk generalisering. Forelesningsnotater 9. forelesning høsten 2005.
SOS112 Kvantitativ metode Krysstabellanalyse (forts.) Forelesningsnotater 9. forelesning høsten 25 4. Statistisk generalisering Per Arne Tufte Eksempel: Hypoteser Eksempel: observerte frekvenser (O) Hvordan
DetaljerAnalyse av kontinuerlige data. Intro til hypotesetesting. 21. april 2005. Seksjon for medisinsk statistikk, UIO. Tron Anders Moger
Intro til hypotesetesting Analyse av kontinuerlige data 21. april 2005 Tron Anders Moger Seksjon for medisinsk statistikk, UIO 1 Repetisjon fra i går: Normalfordelingen Variasjon i målinger kan ofte beskrives
DetaljerKort overblikk over kurset sålangt
Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente
DetaljerStatistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere
2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Å analysere en utvalgsobservator for å trekke slutninger
DetaljerST0202 Statistikk for samfunnsvitere. Bo Lindqvist Institutt for matematiske fag
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave 3 Pensumoversikt Kap. 2 Beskrivende statistikk,
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Inferens om varians og standardavvik for ett normalfordelt utvalg (9.4) Inferens om variansen til en normalfordelt populasjon
DetaljerIntroduksjon til statistikk og dataanalyse
Introduksjon til statistikk og dataanalyse Hollywood-filmer fra 2011 135 filmer Samla budsjett: $ 7 166 500 000 Samla billettsalg: $ 20 199 000 000 2 Datasettet vårt Filmene er delt i 8 sjangere: Action
DetaljerStatistikk og dataanalyse
Njål Foldnes, Steffen Grønneberg og Gudmund Horn Hermansen Statistikk og dataanalyse En moderne innføring Kapitteloversikt del 1 INTRODUKSJON TIL STATISTIKK Kapittel 1 Populasjon og utvalg 19 Kapittel
DetaljerSeksjon 1.3 Tetthetskurver og normalfordelingen
Seksjon 1.3 Tetthetskurver og normalfordelingen Har sett på ulike metoder for å plotte eller oppsummere data Vil nå starte på hvordan beskrive data ved modeller Hovedmetode er tetthetskurver Tetthetskurver
DetaljerHypotesetesting. Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan. H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf:
Hypotesetesting Hvorfor og hvordan? Gardermoen 21. april 2016 Ørnulf Borgan H. Aschehoug & Co Sehesteds gate 3, 0102 Oslo Tlf: 22 400 400 www.aschehoug.no 1 Oversikt Sannsynlighetsregning og statistikk
DetaljerNotasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere
2 Inferens om varians og standardavvik for ett normalfordelt utvalg (9.4) Inferens om variansen til en normalfordelt populasjon bruker kjikvadrat-fordelingen ( chi-square distribution ) (der kji er den
DetaljerKan vi stole på resultater fra «liten N»?
Kan vi stole på resultater fra «liten N»? Olav M. Kvalheim Universitetet i Bergen Plan for dette foredraget Hypotesetesting og p-verdier for å undersøke en variabel p-verdier når det er mange variabler
DetaljerSnøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk
Snøtetthet Notat for TMA424/TMA4245 Statistikk Institutt for matematiske fag, NTNU 5. august 22 I forbindelse med varsling av om, klimaforskning og særlig kraftproduksjon er det viktig å kunne anslå hvor
DetaljerVerdens statistikk-dag.
Verdens statistikk-dag http://unstats.un.org/unsd/wsd/ Signifikanstester Ønsker å teste hypotese om populasjon Bruker data til å teste hypotese Typisk prosedyre Beregn sannsynlighet for utfall av observator
DetaljerStatistikk 1. Nico Keilman. ECON 2130 Vår 2014
Statistikk 1 Nico Keilman ECON 2130 Vår 2014 Pensum Kap 1-7.3.6 fra Løvås «Statistikk for universiteter og høgskoler» 3. utgave 2013 (eventuelt 2. utgave) Se overspringelsesliste på emnesiden Supplerende
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis
DetaljerEt lite notat om og rundt normalfordelingen.
Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte
DetaljerIntroduksjon til inferens
Introduksjon til inferens Hittil: Populasjon der verdien til et individ/enhet beskrives med en fordeling. Her inngår vanligvis ukjente parametre, μ, p,... Enkelt tilfeldig utvalg (SRS), observator p =
DetaljerST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper
ST0103 Brukerkurs i statistikk Forelesning 26, 18. november 2016 Kapittel 8: Sammenligning av grupper Bo Lindqvist Institutt for matematiske fag 2 Kapittel 8: Sammenligning av grupper Situasjon: Vi ønsker
DetaljerDataens tidsalder. Hvorfor data? Data, data, data. STK1000 Innføring i anvendt statistikk. Tirsdag 24. august 2010
STK1000 Innføring i anvendt statistikk Tirsdag 24. august 2010 Geir Storvik (modifisert etter I. Glad s tidligere presentasjon) 1 Data, data, data Genetiske data World Wide Web Overvåkning Medisinske bilder
DetaljerUtvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling
Kapittel 8 Utvalgsfordelinger; utvalg, populasjon, grafiske metoder, X, S 2, t-fordeling, χ 2 -fordeling TMA4240 H2006: Eirik Mo 2 Til nå... Definert sannsynlighet og stokastiske variabler (kap. 2 & 3).
DetaljerØVINGER 2017 Løsninger til oppgaver. Øving 1
ØVINGER 017 Løsninger til oppgaver Øving 1.1. Frekvenstabell For å lage en frekvenstabell må vi telle antall observasjoner av hvert antall henvendelser. Siden antall henvendelser på en gitt dag alltid
DetaljerStatistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere
2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Analysere en observator for å finne ut noe om korresponderende
DetaljerEt lite notat om og rundt normalfordelingen.
Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Observasjoner Histogram Viser fordelingen av faktiske observerte
DetaljerStatistisk beskrivelse av enkeltvariabler. SOS1120 Kvantitativ metode. Disposisjon. Datamatrisen. Forelesningsnotater 6. forelesning høsten 2005
SOS110 Kvantitativ metode Forelesningsnotater 6 forelesning høsten 005 Statistisk beskrivelse av enkeltvariabler (Univariat analyse) Per Arne Tufte Disposisjon Datamatrisen Variabler Datamatrisen Frekvensfordelinger
DetaljerEt lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver?
Et lite notat om og rundt normalfordelingen. Anta at vi har kontinuerlige data. Hva er likt og ulikt for histogrammer og fordelingskurver? Boka (Ch 1.4) motiverer dette ved å gå fra histogrammer til tetthetskurver.
Detaljer1 8-1: Oversikt. 2 8-2: Grunnleggende hypotesetesting. 3 Section 8-3: Å teste påstander om andeler. 4 Section 8-5: Teste en påstand om gjennomsnittet
1 8-1: Oversikt 2 8-2: Grunnleggende hypotesetesting 3 Section 8-3: Å teste påstander om andeler 4 Section 8-5: Teste en påstand om gjennomsnittet Definisjoner Hypotese En hypotese er en påstand om noe
DetaljerTestobservator for kjikvadrattester
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 11: Anvendelser av kjikvadratfordelingen: Kjikvadrattester Situasjon: Et tilfeldig utvalg av n individer er trukket
DetaljerSTK1000 Uke 36, Studentene forventes å lese Ch 1.4 ( ) i læreboka (MMC). Tetthetskurver. Eksempel: Drivstofforbruk hos 32 biler
STK1000 Uke 36, 2016. Studentene forventes å lese Ch 1.4 (+ 3.1-3.3 + 3.5) i læreboka (MMC). Tetthetskurver Eksempel: Drivstofforbruk hos 32 biler Fra histogram til tetthetskurver Anta at vi har kontinuerlige
DetaljerST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon
ST0202 Statistikk for samfunnsvitere Kapittel 9: Inferens om én populasjon Bo Lindqvist Institutt for matematiske fag 2 Kap. 9: Inferens om én populasjon Statistisk inferens har som mål å tolke/analysere
DetaljerForkurs i kvantitative metoder ILP 2019
Forkurs i kvantitative metoder ILP 2019 Dag 2. Forkurs som arbeidskrav for kvantitativ deler av PED-3055 Gregor Maxwell og Bent-Cato Hustad Førsteamanuensis i spesialpedagogikk Hva lærte vi i går? Hva
DetaljerKap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere
Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis μ 1 og μ. Vi trekker da ett utvalg fra hver populasjon. ST00 Statistikk for
DetaljerHypotesetest: generell fremgangsmåte
TMA4240 Statistikk H2010 (21) 10.8, 10.10: To normalfordelte utvalg 10.9: Teststyrke og antall observasjoner Mette Langaas Foreleses mandag 1.november, 2010 2 Hypotesetest: generell fremgangsmåte Generell
DetaljerDenne uken: kap : Introduksjon til statistisk inferens. - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans
Denne uken: kap. 6.1-6.2-6.3: Introduksjon til statistisk inferens - Konfidensintervall - Hypotesetesting - P-verdier - Statistisk signifikans VG 25/9 2011 Statistisk inferens Mål: Trekke konklusjoner
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk. Eksamensdag: Torsdag 9. oktober 2008. Tid for eksamen: 15:00 17:00. Oppgavesettet er på
DetaljerOppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir
Detaljer2. Hva er en sampelfordeling? Nevn tre eksempler på sampelfordelinger.
H12 - Semesteroppgave i statistikk - sensurveiledning Del 1 - teori 1. Gjør rede for resonnementet bak ANOVA. Enveis ANOVA tester om det er forskjeller mellom gjennomsnittene i tre eller flere populasjoner.
DetaljerOppgaver til Studentveiledning 4 MET 3431 Statistikk
Oppgaver til Studentveiledning 4 MET 3431 Statistikk 8. mai 2012 kl 17.15-20.15 i B2 Handelshøyskolen BI 2 Oppgaver 1. Eksamensoppgaver: Eksamen 22/11/2011: Oppgave 1-7. Eksamensoppgaven fra 11/2011 er
Detaljer1 Sec 3-2: Hvordan beskrive senteret i dataene. 2 Sec 3-3: Hvordan beskrive spredningen i dataene
1 Sec 3-2: Hvordan beskrive senteret i dataene 2 Sec 3-3: Hvordan beskrive spredningen i dataene Todeling av statistikk Deskriptiv statistikk Oppsummering og beskrivelse av den stikkprøven du har. Statistisk
DetaljerST0202 Statistikk for samfunnsvitere [1]
ST0202 Statistikk for samfunnsvitere [1] Introduksjon til ST0202 Kapittel 1: Statistikk Kapittel 2: Deskriptiv analyse og presentasjon av en variabel Mette Langaas Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2011h/start
DetaljerØving 7: Statistikk for trafikkingeniører
NTNU Veg og samferdsel EVU kurs Trafikkteknikk Oslo / høsten 2007 Øving 7: Statistikk for trafikkingeniører Det anbefales generelt å arbeide i grupper med 2-3 studenter i hver gruppe. Bruk gjerne Excel
DetaljerLærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave. Pensumoversikt. Oversikt. ST0202 Statistikk for samfunnsvitere
2 Lærebok Robert Johnson og Patricia Kuby: Elementary Statistics, 10. utgave ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 3 4 Pensumoversikt Oversikt Kap. 2 Beskrivende
DetaljerSannsynlighetsregning og Statistikk.
Sannsynlighetsregning og Statistikk. Leksjon Velkommen til dette kurset i sannsynlighetsregning og statistikk! Vi vil som lærebok benytte Gunnar G. Løvås:Statistikk for universiteter og høyskoler. I den
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Det er to populasjoner som vi ønsker å sammenligne. Vi trekker da et utvalg
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Introduksjon til ST0202 Kapittel 1: Statistikk Kapittel 2: Beskrivende analyse og presentasjon av data for én variabel Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start
DetaljerEksamensoppgave i TMA4255 Anvendt statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4255 Anvendt statistikk Faglig kontakt under eksamen: Anna Marie Holand Tlf: 951 38 038 Eksamensdato: August 2016 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte
DetaljerInnhold. Innledning. Del I
Del I Innledning 1 Hva er statistikk?... 19 1.1 Bokas innhold 20 1.1.1 Noen eksempler 20 1.1.2 Historie 23 1.1.3 Bokas oppbygning 25 1.2 Noen viktige begreper 26 1.2.1 Populasjon og utvalg 26 1.2.2 Variasjon
DetaljerSupplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar 2013. Skrevet av Stian Lydersen 16 januar 2013
1 Supplement til power-point presentasjonen i medisinsk statistikk, forelesning 7 januar 013. Skrevet av Stian Lydersen 16 januar 013 Vi antar at vårt utvalg er et tilfeldig og representativt utvalg for
DetaljerEcon 2130 uke 16 (HG)
Econ 213 uke 16 (HG) Hypotesetesting I Løvås: 6.4.1 6, 6.5.1-2 1 Testing av µ i uid modellen (situasjon I Z-test ). Grunnbegreper. Eksempel. En lege står overfor følgende problemstilling. Standardbehandling
DetaljerEKSAMENSOPPGAVER STAT100 Vår 2011
EKSAMENSOPPGAVER STAT100 Vår 2011 Løsningsforslag Oppgave 1 (Med referanse til Tabell 1) a) De 3 fiskene på 2 år hadde lengder på henholdsvis 48, 46 og 35 cm. Finn de manglende tallene i Tabell 1. Test
DetaljerLoven om total sannsynlighet. Bayes formel. Testing for sykdom. ST0202 Statistikk for samfunnsvitere
2 Loven om total sannsynlighet La A og Ā være komplementære hendelser, mens B er en annen hendelse. Da er: P(B) P(B oga)+p(b ogā) P(B A)P(A)+P(B Ā)P(Ā) ST0202 Statistikk for samfunnsvitere Bo Lindqvist
DetaljerUNIVERSITETET I OSLO
Deleksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 13. oktober 2010. Tid for eksamen: 15:00 17:00. Oppgavesettet
Detaljer6.2 Signifikanstester
6.2 Signifikanstester Konfidensintervaller er nyttige når vi ønsker å estimere en populasjonsparameter Signifikanstester er nyttige dersom vi ønsker å teste en hypotese om en parameter i en populasjon
DetaljerH 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Kap.10 Hypotesetesting
Hypotesetesting H 0 : Null hypotese. Konservativ. H 1 : Alternativ hypotese. Endring. Rettsvesen hypotese Tiltalte er uskyldig inntil det motsatte er bevist. Hypoteser H 0 : Tiltalte er uskyldig H 1 :
Detaljerα =P(type I feil) = P(forkast H 0 H 0 er sann) =1 P(220 < X < 260 p = 0.6)
TMA4245 Statistikk Vår 212 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving 4 blokk II Løsningsskisse Oppgave 1 4 personer spurt. Hvis mellom 22 og 26 personer svarer
DetaljerTMA4240 Statistikk Høst 2007
TMA4240 Statistikk Høst 2007 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b4 Løsningsskisse Oppgave 1 Eksamen juni 1999, oppgave 3 av 3 a) µ populasjonsgjennomsnitt,
DetaljerVerdens statistikk-dag. Signifikanstester. Eksempel studentlån. http://unstats.un.org/unsd/wsd/
Verdens statistikk-dag http://unstats.un.org/unsd/wsd/ Signifikanstester Ønsker å teste hypotese om populasjon Bruker data til å teste hypotese Typisk prosedyre Beregn sannsynlighet for utfall av observator
DetaljerOppgaver til Studentveiledning 3 MET 3431 Statistikk
Oppgaver til Studentveiledning 3 MET 3431 Statistikk 24. april 2012 kl 17.15-20.15 i B2 Handelshøyskolen BI 2 Oppgaver 1. Eksamensoppgaver: Eksamen 01/06/2011: Oppgave 1-7. Eksamensoppgaven fra 06/2011
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Kapittel 2: Beskrivende analyse og presentasjon av data for én variabel Bo Lindqvist Institutt for matematiske fag http://wiki.math.ntnu.no/st0202/2012h/start 2 Grafisk
DetaljerECON Statistikk 1 Forelesning 2: Innledning
ECON2130 - Statistikk 1 Forelesning 2: Innledning Data, beskrivende statistikk, visualisering Jo Thori Lind j.t.lind@econ.uio.no 1. Beskrivende statistikk Typer variable Nominelle: Gjensidig utelukkende
DetaljerForkaste H 0 "Stikkprøven er unormal" Akseptere H 0 "Stikkprøven er innafor normalen" k kritisk verdi. Utgangspunkt for H 0
* 6.2. Hypotesetest i normalfordeling med kjent σ v.h.a. kritisk verdi (fra i går) Overordnet mål med hypotesetest i normalfordeling: vurdere en påstand om µ ("er den påståtte verdien for µ riktig, eller
DetaljerForelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling
Forelesning 23 og 24 Wilcoxon test, Bivariate Normal fordeling Wilcoxon Signed-Rank Test I uke, bruker vi Z test eller t-test for hypotesen H:, og begge tester er basert på forutsetningen om normalfordeling
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Loven om total sannsynlighet La A og Ā være komplementære hendelser, mens B er en annen hendelse. Da er: P(B) =P(B oga)+p(b
DetaljerDataanalyse. Hva er en dataanalyse og hvordan gå frem for å gjennomføre en dataanalyse av det innsamlede datagrunnlaget fra en feltundersøkelse?
Hva er en dataanalyse og hvordan gå frem for å gjennomføre en dataanalyse av det innsamlede datagrunnlaget fra en feltundersøkelse? Skrevet av: Kjetil Sander Utgitt av: estudie.no Revisjon: 1.0 (Sept.
DetaljerSkoleeksamen i SOS Kvantitativ metode
Skoleeksamen i SOS1120 - Kvantitativ metode Hjelpemidler Ordbok Alle typer kalkulatorer Tirsdag 30. mai 2017 (4 timer) Lærerbok (det er mulig mulig å ha med en annen, tilsvarende pensumbok, som erstatning
DetaljerFordelinger, mer om sentralmål og variasjonsmål. Tron Anders Moger
Fordelinger, mer om sentralmål og variasjonsmål Tron Anders Moger 20. april 2005 1 Forrige gang: Så på et eksempel med data over medisinerstudenter Lærte hvordan man skulle få oversikt over dataene ved
DetaljerFra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: Signifikansnivå α. evt.
Fra i går Signifikanssannsynlighet (p verdi) vs. signifikansnivå Utgangspunkt for begge: H 0 : µ = µ 0 H 1 : µ < µ 0 eller µ > µ 0 Signifikanssannsynlighet p Angir sannsynligheten for å få en X som er
DetaljerDeskriptiv statistikk., Introduksjon til dataanalyse
Introduksjon til dataanalyse Deskriptiv statistikk 2 Kapittel 1 Denne timen og delvis forrige time er inspirert av Kapittel 1, men vi kommer ikke til å gå igjennom alt fra dette kapittelet i forelesning.
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1110 FASIT. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet er på 5 sider. Vedlegg: Tillatte
DetaljerDeskriptiv statistikk., Introduksjon til dataanalyse
Introduksjon til dataanalyse Deskriptiv statistikk 2 Kapittel 1 Denne timen og delvis forrige time er inspirert av Kapittel 1, men vi kommer ikke til å gå igjennom alt fra dette kapittelet i forelesning.
DetaljerSensorveiledning: skoleeksamen i SOS Kvantitativ metode
Sensorveiledning: skoleeksamen i SOS1120 - Kvantitativ metode Tirsdag 30. mai 2016 (4 timer) Poenggivning og karakter I del 1 gis det ett poeng for hvert riktige svar. Ubesvart eller feil svar gis 0 poeng.
DetaljerForelesning 9 Kjikvadrattesten. Kjikvadrattest for bivariate tabeller (klassisk variant) Når kan vi forkaste H 0?
Forelesning 9 Kjikvadrattesten Kjikvadrattesten er den mest benyttede metoden for å utføre statistiske generaliseringer fra bivariate tabeller. Kjikvadrattesten brukes til å teste nullhypotesen om at det
DetaljerGruppe 1 Gruppe 2 Gruppe a) Finn aritmetisk gjennomsnitt, median, modus og standardavvik for gruppe 2.
Sensurveiledning Ped 3001 h12 Oppgave 1 Er det sammenheng mellom støtte fra venner og selvaktelse hos ungdom? Dette spørsmålet ønsket en forsker å undersøke. Han samlet data på 9. klassingers opplevde
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 9: Inferens om én populasjon I Kapittel 8 brukte vi observatoren z = x µ σ/ n for å trekke konklusjoner om µ. Dette
DetaljerST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag Situasjonen er som i quiz-eksempelet: n = 4, p = 1/3 ( suksess betyr å gjette riktig alternativ), q = 2/3. Oppgave: Finn
DetaljerFasit for tilleggsoppgaver
Fasit for tilleggsoppgaver Uke 5 Oppgave: Gitt en rekke med observasjoner x i (i = 1,, 3,, n), definerer vi variansen til x i som gjennomsnittlig kvadratavvik fra gjennomsnittet, m.a.o. Var(x i ) = (x
DetaljerInferens i fordelinger
Inferens i fordelinger Modifiserer antagelsen om at standardavviket i populasjonen σ er kjent Mer kompleks systematisk del ( her forventningen i populasjonen). Skal se på en situasjon der populasjonsfordelingen
DetaljerLøsning eksamen desember 2017
Løsning eksamen desember 017 Oppgave 1 Innfører hendelsene D: enheten er defekt K: enheten blir kassert a i Disse sannsynlighetene kan leses ut av oppgaveteksten: P D = 0, 10 P K D = 0, 07 P K D = 0, 95
DetaljerAnalyseoversikt, Uke 35
Analyseoversikt, Uke 35 STK1000 Uke 35, 2016. Studentene forventes å lese Ch 1.1-1.3 i læreboka (MMC). Avsnittet om Stem-and-leaf-plot er ikke pensum. Ulike typer data Kategoriske data MMC: «Kvalitative
DetaljerEksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi
Psykologisk institutt Eksamensoppgave i PSY1011/PSYPRO4111 Psykologiens metodologi Faglig kontakt under eksamen: Ingvild Saksvik-Lehouillier Tlf.: 73 59 19 60 Eksamensdato: 30. mai 2016 Eksamenstid (fra-til):
DetaljerTMA4240 Statistikk H2010 (22)
TMA4240 Statistikk H2010 (22) 10.11-10.12: Testing av andelser 10.13: Testing av varians i ett N utvalg Mette Langaas Foreleses onsdag 3.november, 2010 2 Laban strakk seg ikke lenger, men smaker den bedre?
DetaljerKapittel 10: Hypotesetesting
Kapittel 10: Hypotesetesting TMA445 Statistikk 10.1, 10., 10.3: Introduksjon, 10.5, 10.6, 10.7: Test for µ i normalfordeling, 10.4: p-verdi Turid.Follestad@math.ntnu.no p.1/19 Estimering og hypotesetesting
DetaljerKap. 8: Utvalsfordelingar og databeskrivelse
Kap. 8: Utvalsfordelingar og databeskrivelse Utvalsfordelingar Utvalsfordeling for gjennomsnitt (med kjent varians) ( X ) Sentralgrenseteoremet (SGT) Utvalsfordeling for varians (normalfordeling) Utvalfordeling
DetaljerST0103 Brukerkurs i statistikk Høst 2014
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag ST0103 Brukerkurs i statistikk Høst 2014 Løsningsforslag Øving 1 2.1 Frekvenstabell For å lage en frekvenstabell må vi telle
DetaljerHypotesetesting av λ og p. p verdi.
Forelesning 7, kapittel 6 Hypotesetesting av λ og p. p verdi. Det som gjøres i denne forelesningen er nær opptil det vi gjorde da vi konstruerte z test for µ, og styrkefunksjon for denne. I tillegg til
DetaljerTid: 29. mai (3.5 timer) Ved alle hypotesetester skal både nullhypotese og alternativ hypotese skrives ned.
EKSAMENSOPPGAVE, bokmål Institutt: IKBM Eksamen i: STAT100 STATISTIKK Tid: 29. mai 2012 09.00-12.30 (3.5 timer) Emneansvarlig: Trygve Almøy (Tlf: 95141344) Tillatte hjelpemidler: C3: alle typer kalkulator,
DetaljerSammenlikninger av gjennomsnitt. SOS1120 Kvantitativ metode. Kan besvare to spørsmål: Sammenlikning av to gjennomsnitt
SOS1120 Kvantitativ metode Forelesningsnotater 10. forelesning høsten 2005 Per Arne Tufte Sammenlikninger av gjennomsnitt Sammenlikner gjennomsnittet på avhengig variabel for ulike grupper av enheter Kan
DetaljerStatistikk. Forkurs 2018
Statistikk Forkurs 2018 Hva er statistikk? Undersøke Registrere Lage oversikt Presentasjon av informasjon Formidle Arbeidet med statistikk kan vi dele inn i to hovedområder: Samle inn og ordne opplysninger
DetaljerECON240 VÅR / 2016 BOKMÅL
ECON240 VÅR / 2016 BOKMÅL UNIVERSITETET I BERGEN EKSAMEN UNDER SAMFUNNSVITENSKAPELIG GRAD [ DATO og KLOKKESLETT FOR EKSAMEN (START OG SLUTT) ] Tillatte hjelpemidler: Matematisk formelsamling av K. Sydsæter,
Detaljer