Tors eminente Statistikk notater Revisjon 6

Like dokumenter
Regler om normalfordelingen

TMA4245 Statistikk Eksamen mai 2016

Econ 2130 uke 15 (HG)

Regler om normalfordelingen

Notat 1: Grunnleggende statistikk og introduksjon til økonometri

Løsningsforslag Eksamen i Statistikk Nov 2001 Oppgave 1 a) Det fins 8 mulige kombinasjoner. Disse finnes ved å utelate ett og ett tall.

Econ 2130 uke 19 (HG) Inferens i enkel regresjon og diskrete modeller

Forelesning 19 og 20 Regresjon og korrelasjons (II)

Regler om normalfordelingen

STK1100 våren Estimering. Politisk meningsmåling. Svarer til sidene i læreboka. The German tank problem. Måling av lungefunksjon

Det ble orientert i plenum under eksamensdagen om følgende endringer i forhold til oppgaven:

TMA4245 Statistikk Eksamen august 2014

Analyse av sammenhenger

Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Oversikt over tester i Econ 2130

STK1100 våren Konfidensintevaller

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Sannsynlighetsregning med statistikk

1. Konfidens intervall for

Forelesning Ordnings observatorer

som vi ønsker å si noe om basert på data Eksempel. Uid-modellen: X1, X ,,,

Forelesning Enveis ANOVA

Oversikt over tester i Econ 2130

TMA4240 Statistikk Høst 2016

Formler og regler i statistikk ifølge lærebok Gunnar Løvås: Statistikk for universiteter og høgskoler

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Forelesning 25 og 26 Introduksjon til Bayesiansk statistikk

Oppgave 1 Det er oppgitt i oppgaveteksten at estimatoren er forventningsrett, så vi vet allerede at E(ˆµ) = µ. Variansen til ˆµ er 2 2 ( )

Statistikk med anvendelse i økonomi

ÅMA110 Sannsynlighetsregning med statistikk, våren Estimering. Målemodellen. Estimering. Målemodellen. Kp. 5 Estimering. Målemodellen.

Løsningskisse seminaroppgaver uke 17 ( april)

Seminaroppgaver for uke 13 (Oppgave (1), (2), og (3))

Om enkel lineær regresjon II

Løsningsforslag (ST1201/ST , kontinuasjonseksamen) ln L. X i = 2n.

Seminaroppgaver for uke 13

Eksempel 1 - Er gjennomsnittshøyden for kvinner i Norge økende?

Oversikt over konfidensintervall i Econ 2130

Om enkel lineær regresjon II

EKSAMEN løsningsforslag

Forelesning 21 og 22 Goodness of fit test and contingency table ( 2 test og krysstabell)

TMA4245 Statistikk Eksamen 21. mai 2013

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 29. mai 2007

Forelesning Punktestimering

Om enkel lineær regresjon II

STK1110 høsten Lineær regresjon. Svarer til avsnittene i læreboka (med unntak av stoffet om logistisk regresjon)

ÅMA110 Sannsynlighetsregning med statistikk, våren 2007

Mer om Hypotesetesting (kap 5) Student t-fordelingen. Eksamen. Fordelingene blir like ved stor n:

Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL

OBLIGATORISK OPPGAVE 1 INF 3340/4340/9340 HØSTEN 2005

Oppgave 1 ECON 2130 EKSAMEN 2011 VÅR

Oversikt over tester i Econ 2130

Oversikt 1. forelesning. ECON240 Statistikk og økonometri. Visuell/grafisk presentasjon av data. Datainnsamling; utdanning og inntekt

Makroøkonomi - B1. Innledning. Begrep. B. Makroøkonomi. Mundells trilemma går ut på følgende:

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT. Innleveringssted: Ekspedisjonen i 12. etasje (mellom ) OG Fronter (innen klokken 15).

Introduksjon til økonometri, kap 8, 9.1 og 9.2. Hva er formålet med økonometri? Utvalgskorrelasjoner To-variabel regresjoner

Forelesning 3 MET3592 Økonometri ved David Kreiberg Vår 2011

(ii) Anta vi vet om en observasjon av X at den ikke er større enn 5. Hva er da sannsynligheten for at den er lik 5? (Hint: Finn PX ( = 5 X 5) ).

Econ 2130 uke 13 (HG)

Forelesning Z-, t-test, test for forventningsdifferanser

Positive rekker. Forelest: 3. Sept, 2004

Gråtonehistogrammer. Histogrammer. Hvordan endre kontrasten i et bilde?

Medisinsk statistikk, del II, vår 2008 KLMED Lineær regresjon, Rosner Regresjon?

Medisinsk statistikk, del II, vår 2009 KLMED 8005

Kap. 9: Inferens om én populasjon

Kap. 9: Inferens om én populasjon

Kapittel 8: Estimering

Forelesning 2 MET3592 Økonometri ved David Kreiberg Vår 2011

Anne Vedø Estimering av materialfordelingen til husholdningsavfall i 2004 Dokumentasjon av estimeringsmetoder

Erling Siring INNHOLD

Kapittel 1: Beskrivende statistikk

FORELESNINGSNOTATER I SPILLTEORI Geir B. Asheim, våren 2001 (oppdatert ).

Forelesning 3 mandag den 25. august

TMA4240/4245 Statistikk Eksamen august 2016

i B maksimal b Fundamentalteoremet for lineærprogrammering Den leksikografiske metode Blands pivoteringregel MoD233 - Geir Hasle - Leksjon 4 2

Enveis variansanalyse (One-way ANOVA, fixed effects model) (Notat til Kap. 12 i Rosner)

ØVINGER 2017 Løsninger til oppgaver

Høgskolen i Telemark Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 12. desember 2008

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

Om enkel lineær regresjon I

Statistikk og økonomi, våren 2017

X ijk = µ+α i +β j +γ ij +ǫ ijk ; k = 1,2; j = 1,2,3; i = 1,2,3; i=1 γ ij = 3. i=1 α i = 3. j=1 β j = 3. j=1 γ ij = 0.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

Om enkel lineær regresjon I

Alle deloppgaver teller likt i vurderingen av besvarelsen.

ARBEIDSNOTAT ARBEIDSNOTAT

Kort repetisjon fra kapittel 4. Oppsummering kapittel ST0202 Statistikk for samfunnsvitere. Betinget sannsynlighet og trediagram

Seleksjon og uttak av alderspensjon fra Folketrygden

Econ 2130 Forelesning uke 11 (HG)

Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?

Estimering 1 -Punktestimering

Estimering 1 -Punktestimering

Oppgaver fra boka: Med lik men ukjent varians antatt har vi fra pensum at. t n1 +n 2 2 under H 0 (12 1) (12 1)

H 1 : µ 1 µ 2 > 0. t = ( x 1 x 2 ) (µ 1 µ 2 ) s p. s 2 p = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2

Konfidensintervall. Notat til STK1110. Ørnulf Borgan, Ingrid K. Glad og Anders Rygh Swensen Matematisk institutt, Universitetet i Oslo.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Løsningskisse for oppgaver til uke 15 ( april)

Forelesning 4 og 5 MET3592 Økonometri ved David Kreiberg Vår 2011

Randi Johannessen. Mikroindeksformel i konsumprisindeksen. 2001/64 Notater 2001

Investering under usikkerhet Risiko og avkastning Høy risiko. Risikokostnad prosjekt Snøskuffe. Presisering av risikobegrepet

Kap. 9: Inferens om én populasjon. Egenskaper ved t-fordelingen. ST0202 Statistikk for samfunnsvitere. I Kapittel 8 brukte vi observatoren

Transkript:

Tors emete Statstkk otater Revsjo 6 Tor Pederse V03 t.e.ederse@studmed.uo.o

Kattel : Hvorda forstå og beskrve tall Setralmål Gjeomstt: x x Påvrkes stor grad av ekstreme verder Meda: Order observasjoee stgede rekkefølge, medae er da defert som de mdterste av dem, alteratvt gjeomsttet av de to mdterste Mål for avvk stadardavvk Emrsk stadardavvk defert som s s (kvadratrot av emrsk varas Emrsk varas: s ( x x s Varasjoskoeffsete: VK x Gruerte data Data grueres klasser avgreset av øvre og edre grese Klassemdtukt m og hyghet f Gruert gjeomstt x m f 0 Gruert varas s ( m x f m f ( x Gruert meda F klasse observasjo ummer (/ hører uder, trekk fra atallet observasjoer klassee uder. Reste deles å atall observasjoer klasse, dee adele gages med klassebredde og adderes klasses edre grese for å g medae. Fraktler greser som har e gtt megde roset av materalet uder seg Bereges lkt som gruert meda (som er 50%-fraktle, bare at ma fer observasjo ummer roset 00 Medsske begre Isdes : Nye tlfeller er tdsehe t Prevales: Atall tlfeller ved et gtt tdsukt Overlevelseskurver Overlevelseskurve: Overlevelse over td (y-akse: adel overlevede/beståede, x-akse: tdseheter Kala-Meer-lott Y-akse: Overlevelsessasylghet, x-akse: levetd år fra bestemt ukt Starter med rett lje fra y.0, ved første dødsfall faller kurve med (/atall aseter gje stude Noe av de observerte dør kke mes stude ågår, og vl derfor være lve ved observasjoes slutt, dsse kalles sesurerte tder, og dsse gjør at kurve slutter ved y > 0,0. (v får kke vte oe mer om hvorda det går med dem

Kattel 4: Sasylghetsregg Gruleggede regeregler Komlmetregele: P ( A P( A Addsjosregele: P( A B P( A P( B P( A B uo, dvs. A og/eller B stt, dvs A og B Total sasylghet: P( A P( A B P( A B Utvdet komlmetregel: P( A B P( A B Gustge/mulge-metode Ved uform sasylghetsmodell dvs. alle utfall er lke sasylge Gustge Telle utfall: P Mulge Praktsk: Ved utregg av mst -ogaver ka det være yttg å bruke komlmetrege le for å sare td OBS: Vær alltd øye med å få med ALLE utfallsmulgheter, for eksemel ved recessv edarvg er utfallsmulghetee {aa, Aa, AA}(kke a, og {aa}a Betget sasylghet Ofte vl et utfall/faktor vrke å sasylghete for et aet utfall Eks: P(kreft øker med aldere Skrves: P(A B (A gtt at B Regeregler: P( A B P( A B P( B > Multlkasjosregele: P( A B P( A B P( B P( B A P( A > Alteratv total sasylghet: P( A P( A B P( B P( A B P( B Stokastsk uavhegghet A og B åvrker kke sasylghete tl hveradre > P ( A B P( A Bayes lov P( A B P( A B P( B Setg: P( B A P( A P( A B P( B P( A B P( B Praktsk: Geetsk veledg med Bayes lov Sett utfall B Har geet og A At oe har/kke har skjedd (Eks: At asete er symtomfr gtt alder, at asete har så og så mage frske bar, etc Praktsk: Dagostske tester Fe P for false ostves/egatves ved screeg-tye tester Sett utfall A Postvt fu og B Er syk Sestvtet: P ( A B Sesfstet: P ( A B Postv redktv verd: P ( B A Negatv redktv verd: P ( B A 3

OBS: Postv/egatv redktv verd er avhegg av revalese (omvedt roorsjoale! Husk: P( A B P( A B Kombatorkk brukes med gustge/mulge-metode Kombasjoer: Ordet/uordet (rekkefølge sller e rolle Med/ute tlbakeleggg Et utvalg å s trekkes ut fra megde : Med tlbakeleggg Ute tlbakeleggg Ordet s ( ( ( s Uordet! ( ( ( ( ( s Kalles ermutasjoer s s s! 4

Kattel 5: Fordelger for tellevarabler Sasylghetsfordelg: E beskrvelse av de tlfeldge varasjoe av e stokastsk varabel og des sasylgheter! ( ( ( s - Bomsk koeffset x x!( x! x! Praktsk: Trekker ut y objekter fra utvalg. Sasylghet for å trekke ut x objekter fra grue g: g g Eks: Tar ut 4 elever fra klasse med 5 jeter, 5 6 x y x P ( x 6 gutter: P( jete 3 00 P( j 330 4 y Gruformler: Forvetg E(: Et mål å tygdeuktet setrum e sasylghetsfordelg E ( ( x P( x alle Varas VAR(: Et mål å sredge av fordelge VAR ( ( x E( P( x alle Stadardavvk SD( SD ( VAR( Regeregler for forvetg og varas E ( a b ae( b VAR ( a b a VAR( SD ( a b a SD( OBS: Dette gr også: SD ( SD( SD( SD( E ( E( E( E( VAR ( VAR( VAR( VAR( Krever stokastsk uavhegge! Bomsk fordelg Krav: I De ekelte forsøk er uavhegg av hveradre II I hvert forsøk regstreres det ku om A treffer eller e ( A III P(A er de samme hvert forsøk x x Sasylghetsberegg: P( x ( der P(A x TI-83: Får å løse P( x ogaver bruk PRGM BINOMSUM OBS: Dersom x er stor er det vktg at ags med stor ressjo, dvs med mage desmaler Gr: E ( og VAR ( ( Utledes: I I I I ( er summe av mage ekeltforsøk 5

E( I ( x P( x 0 ( alle ( VAR( I (0 ( E( VAR ( ( ( Possofordelge tlærmg tl bomsk fordelg OBS: Ka ku brukes år: 0.05 og 50 Sasylghetsberegg: λ E ( x λ λ e P( x x! Gr: E ( λ og VAR ( λ Utledes: VAR( ( λ(, da er svært lte blr (- VAR ( λ Possorosesse E samlg av feomeer som otrer tlfeldg og helt uavhegg av hveradre Eks: Bakterer et glass va, barefødsler over td, etc Krav: I Forvetet atall objekter er ehet (td, flate, volum, etc er kostat II Objektee otrer uavhegg av hveradre III To objekter ka kke være fullstedg sammefallede lasserg Regel: Betrakt et område og la Y være atall objekter dette området. Y er da Possofordelt med λ lk forvetet atall forekomster området. Praktsk: Tysk ogave hadler om forekomst av e sykdom over td, med varerede atall forekomster er (tdsehet (eksemel varerede sdes gjeom mage måeder. Fordelge av atall ye tlfeller vl da være Possofordelt. Ogave vl gjere ha e delogave som hadler om å sammelge observerte atall tlfeller med forvetede (fht Possofordelge. 6

Kattel 6: Hyotesetestg Radomserte tester: Gr A eller B, tlfeldg fordelt Bldtester Ekeltbld: Paset vet kke om ha/hu får A eller B Dobbeltbld: Verke aset eller lege vet om asete får A eller B Klske utrøvger Overkryssgsstude: E testgrue røver alle rearatee/metodee etter tur (alle røver alt Parallellstude: Forskjellge gruer som får forskjellge rearater eller behadlgsmetoder Grubegreer Nullhyotese H 0 : Status quo/ull effekt utgagsukt Formulere e alteratv hyotese H A som ser at oe aet er tlfelle Sgfkasvået: Forhådsbestemt grese for forkastg, oftest 5% Agr rskoe for fel: Eks. sgfkasvå å 5% gr e 5% sasylghet for fel. P-verde: Sasylghete for observerte data gtt at H 0 gjelder. V forkaster H 0 dersom P-verde < Sgfkasvået Forklarg: Når v tester e hyotese udersøker v hvor sasylg det er får å få det observerte tlfellet gtt at ullhyotese stemmer om sasylghete for at det ka være e re tlfeldghet er svært lte, ka det tyde å at ullhyotese ka være fel (styrker de alteratve hyotese. Teststuasjo Esdg: H A går e bestemt retg, eks: >0,5 Tosdg: H A ka gå begge retger, eks 0, 5 OBS: Når ma skal berege -verde må ma også ta med sasylghete for alle mer ekstreme utfall, dersom kke sasylghetee for dsse utfallee blr så små at ma ka se bort fra dem. OBS: Når ma reger med e tosdg teststuasjo må ma rege P-verde med begge sder, oe som vl doble -verde forhold tl e esdg test! Praktsk: E uvat tye ogave ber om å ag om gtte data gr grulag for at forvetg/sasylghet er over e gtt verd x e slk ogave må løses ved å vse at ullhyotese (forvetg/sasylghet x er usasylg med e esdg ormalfordelgstest. (eks: Ogave B60(b Tyer fel ved hyotesetestg Tye I: Forkaster H 0 selv om de er rktg (rsko bestemmes av sgfkasvået Tye II: Forkaster kke H 0 selv om de er fel (rsko bestemmes av datamegde 7

Kattel 7: E fordelg for målevarabler To tyer stokastske varabler Tellevarabler (dskrete [,, osv] ekeltutfall Målevarabler (kotuerlg [ > ] kotuerlg skala Sasylghetstetthet ved målevarabler Sasylghetstetthete gtt ved fuksjo f(x agr sasylghete for e vlkårlg gtt verd skalae Krav: I f ( x 0 for alle gyldge verder av x II Totalt areal uder kurve gtt ved f(x blr III P( a b er lk arealet uder f(x fra a tl b Defsjoer Meda: Det uktet å x-akse som deler arealet tl grafe av f(x to lke store deler Forvetg og varas: Når øker vl de beregede verdee for x og de emrske varase s gå mot hver s greseverd. Det er dsse verdee som er de sae E( og VAR( Normalfordelge Fordelg som følger de bestemte kurveformele: ( x µ f ( x ex πσ σ Forvetg µ og stadardavvk σ som gruformlee µ ± σ dekker ca 68%, µ ± σ dekker ca 95% (de øyaktge verde er,96σ Hvs er ormal( µ, σ ka v føre e y stokastsk varabel: Y µ σ Forklarg: Ved å trekke fra µ tellere får de stt setrum 0 Ved å dele å σ blr SD(Y lk Y er ormal(0,, kalles Stadardormalfordelge. Praktsk: Utreggsmåte: ( 0 µ µ µ P 0 P ( Y σ σ σ Gr f. eks: P ( 0.85 Y.38 P( Y.38 P( Y 0.85 (het så verder fra tabelle over ormalfordelge TI-83: Bruk PRGM YTEST Forklarg: Det v gjør her er å fe dfferase mellom de observerte verde og de forvetede. Dette avvket deles å stadardavvket, og da får v tallet for hvor mage stadardavvk det observerte avvket utgjør. Dee verde ka v så slå o tabelle over ormalfordelge for å få sasylghete. Setralgreseteoremet et teoretsk grulag for ormalfordelge Foreklet defsjo: E stokastsk varabel vl være tlærmet ormalfordelt hvs de ka ofattes som e sum av mage uavhegge størrelser, slk at ge av dsse har domerede flytelse å resultatet. 8

Kattel 8: Statstsk aalyse av tellevarabler Tlærmelser tl ormalfordelge Bomsk fordelg: Når vokser blr de mer og mer lk ormalfordelge Tlærmge tl ormalfordelge er rmelg god år 5 og ( 5 TI-83: Bruk STAT -ProZTest Possofordelge: E tlærmg tl bomsk fordelg år er stor(>50 og er lte (<0.05 Tlærmge tl ormalfordelge er rmelg god år λ 5 Praktsk: For å vse at ormaltlærmge ka stemme for e gtt ogave ka ma vse hvorda data brukes fht. setralgreseteoremet (tlfeldge utfall der ge får domerede flytelse å resultatet, se kattel 7 Praktsk: Når ma bruker tlærmg tl ormalfordelg tl å berege sasylghet brukes regemåte agtt kattel 7 ( P( Y x osv (Halvkorreksjo: Ved utregg med små ka det fort bl oe uøyaktg Dette ka korrgeres ved halvkorreksjo, dvs. at ma adderer/subtraherer 0.5 tl/fra de øvre/edre grese, slk at ma skrer at alle data faller efor de to gresee blr tatt med (å bekostg av at oe data utefor blr tatt med. Eks: P ( 4 vl kke ta med selve 4.0, og dermed blr oe av data utelatt. I stedet halvkorrgerer ma og bereger P ( 4.5 Brukes også ved ormaltlærmg av Possofordelg Estmerg av sasylghet V estmerer sasylghete ut fra et utvalg: Uskkerhet kyttet tl * : Hvor reresetatvt er egetlg utvalget? Kofdestervall for sa : Defsjoer, gtt at data er tlfeldge og ute systematske avvk (skjevt utvalg E ( Forklarg: E ( / E( / / SD( ( Estmert stadardfel: Forklar g: VAR / VAR ( ( ( ( S ( Kofdestervallet for de sae blr da: [ S, ] tervall, ka vareres TI-83: Bruk STAT -ProZIterval Sammelkg av sasylghet to gruer Ulke mål for forskjell: Sasylghets/rskodfferase: RD Relatv rsko: RR S ( (her: ca 95% 9

0 Odds-rato: ( ( OR Metode for aalyse av rskodfferase OBS: Y her agr sasylghete for ( dfferase P, for å få P-verde må ma (dersom Y>0 trekke dette fra, dvs. ( verd dfferase P Formel ved bomsk fordelg: ( ( Y. Bruker deretter tabell for ormalfordelg jfr. ka 7 OBS: Dee teste ka bare brukes med to uavhegge gruer, kke ved overkryssgsstuder eller sammelgg med oulasjosgjeomsttet grue hører uder! TI-83: Bruk STAT -ProZTest Forklarg ma ser hvorda dfferase asser med H 0 : De observerte dfferase er, Hvs ullhyotese holder stkk, skal det kke være forskjell, altså: 0 µ ( ( ( ( ( ( * VAR VAR SD Da v kke kjeer, ka v stedet bruke Dee størrelse er mer skker e *, me mdre skker e de sae. Formel ved Possofordelg: Y (Forutsetter at OBS: Dee teste ka bare brukes med to uavhegge gruer, kke ved overkryssgsstuder og lgede! Forklarg ma ser hvorda dfferase asser med H 0 : Da : sette ma ka svært lte er ( ( ( ( ( Y

Praktsk: Brukes blat aet ved aalyse om e edrg har skjedd, for eksemel atallet døde er år, etc. Kofdestervall for relatv rsko Deferer hjelestørrelse: S RR Et 95% kofdestervall for relatv rsko er da gtt ved:,96 ( S,96 RR e S RR, RR e RR TI-83: Bruk PRGM RR Metode for aalyse av tabeller Sette o tabell over observerte data: Utfall Grue Grue Ikke A (Ikke A A (A (grue (grue Bereg forvetede verder for hver celle tabelle Forvetede atall utfall A gtt at sasylghete er de samme begge gruer: felles 3 Bereg for hver celle: ( O E E Der: O Observerte verdog E forvetet verd for celle ( O E 4 Summer o cellee (uthevet med stor skrft E 5 Bereg frhetsgra der (# rader (# koloer 6 Slå o summe ukt 4 kj-kvadratfordelge med det beregede atall frhetsgrader TI-83: Bruk STAT? Test

Kattel 9: Statstsk aalyse av gjeomstt Gruformler forutsetter at,, 3, osv er stokastsk uavhegge E ( µ σ σ VAR( SD( (E fredoblg av datamegde gr halverg av stadardavvket Utledg: E ( µ E( { E( E( E( } { µ } µ VAR( VAR( VAR( VAR( VAR( σ σ { } { } består av mage uavhegge stokastske varabler... som har hver se forvetger og stadardavvk og vl oftest være ormalfordelte OBS: Gjeomsttet at uavhegge observasjoer er ær ormalfordelt selv om fordelge av ekeltobservasjoee k ke er det. Bevs: Når vl setralgreseteoremets forutsetger være ofylt (mage uavhegge størrelser, der ge har domerede effekt, altså vl det bl tlærmet ormalfordelt. Regg med studetfordelge Studetfordelge mer sredt utover e ormalfordelge Sredge mker år atallet frhetsgrader øker, blr mer og mer lk ormalfordelge µ Gjeomstt og forvetg: t σ TI-83: Bruk STAT T-Test Estmert stadardfel (emrsk V kjeer kke de sae σ, v må derfor bruke det emrske stadardavvket s. s De estmerte stadardfele for gjeomsttet blr da: s T-test med studetfordelge brukes år v kke kjeer forvetge µ Ved at v kjeer gjeomsttet og de estmerte stadardfele x s ka v med e t-test teste hyoteser om forvetge µ. Praktsk: Avedelse å ardata Hvs v har to sett data for e grue (eks: to målger er erso ka v bruke e ett-utvalgs t-test tl å udersøke om det er e geu bakeforlggede forskjell mellom de to datasettee (eks: forskjell målemetode, aarat, etc. Ma fer gjeomstt og stadardfel for dfferase mellom de to datasettee (målgee, og tester hvorvdt forvetge 0 (ge bakeforlggede forskjell mellom datasettee er sasylg.

Kofdestervall for forvetge Et kofdestervall som eholder µ med sasylghet - α, der α er felsasylghete (et lavt tall, ofte 0.05, er gtt ved: c S, c ( S Tallet c er hetet fra tabelle over studetfordelge, med frhetsgrader OBS: Verdee fra tabelle er bereget er sde av fordelge (husk at det er to sder av fordelge uder/tl vestre og over/tl høyre, derfor vl α 0.05 deles å to sder og gr 0,05 å hver sde og det er dette tallet som skal slås o tabelle, kke 0,05!!! Eks: 4 frhetsgrader og α 0,05 gr c,776 TI-83: Bruk STAT TIterval Testg av hyotese om forvetge ett-utvalgs t-test Bytter ut σ med s teststørrelse ovefor for å teste hyoteser om µ. Sde v erstatter σ med de mer uskre s må det komeseres med at v bruker studetfordelge (med frhetsgra der Sammelkg av to gjeomstt to-utvalgs t-test Forutsetger: I Uavhegge data II Sredge, målt med stadardavvket, må kke være veldg forskjellg de to gruee V tester H 0 : µ µ mot H A : µ µ Felles stadardavvk: Teststørrelse: t S S f f ( s ( s Fer så sasylghet ut fra Studetfordelge med frhetsgrader. Praktsk: Tysk ved sammelkg av verder for to ulke gruer, tester om hvorvdt det er e reell forskjell mellom gruee (som gjelder utover utvalget. TI-83: Bruk STAT -SamTTest Kofdestervall for dfferase mellom og Gtt ved: ( ± c S f Tallet c bestemmes fra studetfordelge ( frhetsgra der TI-83: Bruk STAT -SamTIt 3

Kattel 0 Regresjosaalyse Tlasg av e rett lje Tar utgagsukt et scatter-dagram med ukter (x,y Mste-kvadraters-lje Kvadrate av summe av dstasee fra uktee tl lje skal bl mst mulg Geerell formel for rett lje er: f ( x ax b Matematsk sett blr mste-kvadraters-lje: dfferase sxy Gtt ved dervasjo får v: a ˆ og bˆ y aˆ x s Hjelestørrelse S xy er gtt ved: Sxy ( x x ( y y x ( y b ax Restdfferase blr: dfferase ( y b ax ( ( s y aˆ sxy Stadardavvk for varasjoe uktee rudt lje: Uskkerhet kyttet tl helge tl lja Kofdestervall for â gtt ved aˆ ± c s reg ( s x s reg restdfferase Størrelse c er hetet fra studetfordelge med (- frhetsgrader. Korrelasjo hvor godt stemmer lja med uktee? sxy Korrelasjoskoeffsete r sx sy Alltd mellom - og, korrelasjo blr bedre jo ærmere korrelasjoskoeffsete blr. 4

Kattel : Bayesaske metoder statstkk De klassske/frekvetstske defsjoe: Sasylghet Relatv hyghet av et utfall år atall forsøk går over alle greser Ofte at sasylgheter er subjektve Eks: Skal jeg ta med araly dag? Valg meds med subjektve sasylgheter Eks: Lege som ut fra erfarg aslår at røykere med vektta og hoste har 80% sasylghet for å ha lugekreft Bayes-aalyse av klske forsøk Sasylghet ka være: A ror: De subjektve sasylghete før et forsøk A osteror: De korrgerte subjektve sasylghete v har etterkat av forsøket. A ror forvetgsfordelge: (ser å sasylghete for at asetee vl ha bedre effekt av et ytt legemddel N e av gammelt legemddel G Ikke-formatv: Aser alle sasylgheter for lke mulge Iformatv: Utelukker mulghete for mer ekstreme avvk fra a ror forvetg. Agr e fordelg med sasylghetstetthet for de ulke sasylghetsverdee, med setrum a ror sasylghete. Tre mulge stllger: Nøytral aror: Fordelge favorserer verke G eller N (0.5 (se s.86 Otmstsk aror: Fordelge favorserer N fora G (se s.87 Pessmstsk aror: Fordelge favorserer G fora N (se s.87 Etter forsøkee vl ma kue komme frem tl e lgede fordelg for aosteror (se s.86-87 Ut fra dee ka ma berege sasylghete for at G er å foretrekke ved å berege flateholdet ( sasylghete uder kurve o tl x0.5 Et slags motstykke tl P-verde 5

Kattel : Statstkk og årsakssammeheg Eksermetell metode: Kotrollerer forsøksbetgelsee Trekke relatvt skre slutg Ikke-eksermetell metode: Observerer det som skjer ature/samfuet Edemolog: Statstsk kartleggg av sykdommers forekomst og årsaksforhold Tre hovedtyer: Retrosektve: Skuer tlbake tde Problem: Uskre olysger ga uskker/dyamsk hukommelse Ulk grad av hukommelse mellom gruer (eks: syke er mer obs å tdlgere levesett Husker mer Prosektve: Følger et stort atall meesker over td Problem: Må være stor og vare over legre td ( DYR! Tverrsttsstuder: Ikke tdsasekt observasjo å et bestemt tdsukt Problem: Ka kke vse edrger over td > Problem med å avgjøre hva som er årsak og hva som er vrkg (hva kom først? Regresjosfeomeet: Tlbakevedg tl det ormale, av seg selv Eks: Paset går kke tl lege før sykdomme år stt verste. Får behadlg og blr frsk, me skyldes det selve behadlge eller det at asete uasett hadde ådd maks syk og var å bedrges ve? > Behov for studer av et større atall forsøksersoer (mot ekeltersoer, samt behov for e kotrollgrue for å utelukke regresjosfeomeet. 6

Kattel 3: Om laleggg av udersøkelse Geeralserg fra utvalg tl oulasjo To hovedroblemstllger: Hvorda fremskaffe et reresetatvt utvalg? Bruk av radomserg Problem med frafall, klusjos/eksklusjoskrterer Tl hvlke oulasjo ka v geeralsere koklusjoe basert å et gtt utvalg? Plaleggg: Protokoll E detaljert, skrftlg la for stude Vktge ukter Studes formål Hyotesee som skal testes 3 Utvelgelse av forsøkssubjekter (kl. klusjos/eksklusjoskrterer 4 Statstsk bestemmelse av ødvedg størrelse 5 Beskrvelse av forsøksla 6 Hva skal regstreres? Hoved-effektmål 7 Prosedyrer for målger og regstrerger 8 Hvorda skal evaluerg av forsøksersoer skje? Hådterg av frafall? 9 Statstske aalyser som e teker å gjeomføre Varasjo Vktgste klder: Observatør Istrumet Måleuskkerhet (de uskkerhet som blr gje år alle adre klder er kostate Dag-tl-dag varasjo hos ett dvd Bologsk varasjo mellom dvder Tlfeldg varasjo Noe begreer: Relabltet: I hvlke grad gjetagelse av e målg leder tl samme resultat Eks: BT har lte relabltet, legdemål har stor relabltet Valdtet: Hvorvdt det som måles svarer tl det v egetlg øsker å få formasjo om. Vktg år studer skal lalegges: At varasjoee blr mst mulge (ressjo målger Effekte av varasjoe reduseres ved gjetagelser (husk: Varasjoe som forelgger må kke slå skjevt ut Beregg av utvalgsstørrelse Ved estmerg Estmerg av sasylghet Treger et aslag å omtret vå: Plotstude: E lte stude bereget å å g et aslag om forekomste 7

Hvlke uskkerhet? Måler med a, defert ved: a er det maksmale avvk fra de sae, dvs. målet er at estmatet kommer efor tervallet (sa ± a 4 ( Beregg av utvalgsstørrelse : a Utledg: V oererer med e ca 95% sasylghet for at estmatet kommer efor (sa ± a, altså må a være ca stadardavvk (egetlg,96. Dette gr: ( a SD( Løser ut ved kvadrerg og får formele for beregg. Estmerg av gjeomstt Treger å aslå stadardavvket(σ oulasjoe (eks. va lotstude Alteratv ka ma aksetere at a utgjør e bestemt adel av σ, som gr verde for σ/a, ute at v treger kjee σ. σ Formel for beregg: 4 a σ Utledes: a SD( Løser ut med kvadrerg og får formele for beregg. Gr med ca 95% sasylghet at estmatet for kommer efor ( sa ± a. Ved sammelgg av to gruer Mål: Forsøket må være så stort at e forskjell som er klsk sgfkat også slår ut som statstsk sgfkat Må bestemme sgfkasvå: α ( (fel tye I Sasylghet for å odage dee forskjelle [ - β] (β (fel tye II Slår o α og β e krysstabell (se tabell 3. s 08: f(α,β Bestemme mste forskjelle mellom gruee som det er vktg å odage: Varasjo målgee mellom ekeltersoer: σ OBS: Forsøksstørrelse gr atallet som må være hver grue! ( ( Sammelgg av sasylgheter: f ( α, ( β σ Sammelgg av gjeomstt: f ( α, β 8