ARBEIDSNOTAT ARBEIDSNOTAT
|
|
|
- Oskar Dahl
- 9 år siden
- Visninger:
Transkript
1 A r b e d s o t a t e r f r a H øg s k o l e B u s k e r u d r. 67 ARBEIDSNOTAT ARBEIDSNOTAT Avedt statstkk Jo Reertse
2
3 Arbedsotater fra Høgskole Buskerud Nr. 67 Avedt statstkk Av Jo Reertse Høefoss 8
4 HBus publkasjoer ka koperes frtt og vdereformdles tl adre teresserte ute avgft. E forutsetg er at av på utgver og forfatter(e ags- og ags korrekt. Det må kke foretas edrger verket. ISSN X
5 INNHOLD. Iledg s. 4. Bokstavbruk statstkk s Ltt beskrvede statstkk s Ekel regresjo s.3 5. Ekel korrelasjo s Ikkeleær regresjo s Noe vktge kotuerlge fordelger. s.55 Setralgreseteoremet. 8. Statstsk feres. Estmerg s Hypotesetestg s.68. Iferes kyttet tl ett gjeomstt s.73. Iferes kyttet tl to gjeomstt s.9. Kjkvadrattester s. 3. Iferes for e adel s.9 4. Iferes for to adeler s Ikkeparametrske metoder s Varasaalyse s.5 7. Regresjo og varasaalyse s.6 8. Multppel regrsjo s Oppgaver s.7 Avedt Statstkk 3
6 . Iledg. Dette heftet daer utgagspukt for et kurs avedt statstkk som utgjør halvparte av kurset MAT 4 (gruleggede og avedt statstkk. MAT 4 utgjør ¼-del av årsehete matematkk på valgfag på almelærerutdage. Før ma starter på dette kurset avedt statstkk har studetee som et mmum vært gjeom et kurs gruleggede matematsk aalyse og ddaktkk (5 studepoeg høstsemesteret samt de første dele av kurset MAT 4 vårsemesteret. I de gruleggede statstkkdele av kurset har ma behadlet begreper som dskrete sasylghetsmodeller (geerelt, kombatorkk og utvalgsmodeller, betget sasylghet og uavhegghet, stokastske varable, forvetg og varas, oe valge sasylghetsfordelger (bomsk-, hyper-geometrsk-, Posso- og ormalfordelg, estmerg og hypoteseprøvg. Dsse temaee forutsettes kjet år ma starter på dette heftet. Jeg har allkevel valgt å legge oe av det som er behadlet de gruleggede statstkke slk at de som evetuelt øsker å lese dette separat ka gjøre det ute for stor utstrekg å måtte slå opp e grubok. Dette gjelder speselt teore kyttet tl estmerg og hypoteseprøvg. Avedt Statstkk 4
7 .Bokstavbruk statstkk. I statstkk bruker e kosekvet bokstaver fra det orske (egelske alfabetet tl å betege begreper utvalget, og greske bokstaver tl å betege begreper populasjoe. For eksempel beteges det artmetske gjeomsttet utvalget med ( strek, mes gjeomsttet populasjoe beteges med de greske bokstaveµ ( my. Stadardavvket utvalget beteges med s, mes stadardavvket populasjoe beteges med de greske bokstave σ ( sgma.osv. Mage av de greske bokstavee vl bl brukt på forskjellge temaer dette heftet, og derfor følger her e presetasjo av det greske alfabetet (med store og små bokstaver og uttale Α Β Γ Ε Ζ Η Θ Ι Κ Λ Μ α alfa β beta γ gamma δ delta ε epslo ς zeta η eta θ teta ι ota κ kappa λ lambda µ my Ν ν y Ξ ξ ks Ο ο omkro Π π p Ρ ρ rho Σ σ sgma Τ τ tau Υ υ ypslo Φ φ f Χ χ kj Ψ ψ ps Ω ω omega Noe tlleggskommetarer : Du kjeer skkert utrykket: Hu var alfa og omega (f.o.m. alfa (første bokstav t.o.m. omega (sste bokstav, dvs. hele alfabetet, dvs. hu betydde alt. Hvs du e gag framtde kommer tl Hellas er det gret å kue det greske ordet for apotek: ΦΑΡΜΑΣΙΑ ( Farmasa. E, to, tre på gresk er ENA ( ea, ΥΟ (" dyo", ΤΡΙΑ (" tra" De mest brukte bokstavee statstkk er: α, β, ε, θ, λ, µ, π, ρ, σ, χ,θ og Σ Avedt Statstkk 5
8 3. Beskrvede statstkk. Belggehetsmål. Ata at v har gjeomført forsøket og har de resultatee av e kvattatv varabel :,,L L. Dette skrves også ofte,,,, og kalles for råmateralet, ford det er det ubehadlede tallmateralet. I mage sammeheger er det yttg å ag ett tall som represetat for alle tallee. For å s oe om hvor tallee lgger plassert på tallja (eller er lokalsert så er det valg å ag et såkalt belggehetsmål (også kalt mål på setral tedes. Dvs. det er et tall som ser oe om hvor tallmasse er lgger (eller er lokalsert. Det artmetske mddeltall (the arthmetc mea er det mest brukte belggehetsmålet. Det er defert ved: M.a.o. f summe av -ee og dvder så på atall observasjoer, dvs. SUM ( for de med - fob Eks. Ata at tallmateralet,,,, er gtt ved:,,, 3, 4, 3,,, 3,. Da blr , 3 (* Tallet,3 er å et tall som represeterer de tallee, og forteller hvor dsse tallee er lokalsert ( eller lgger Ser e ltt ærmere på tallee som går tellere ser e at e del av tallee er byrdes lke. Det medfører at e ka skrve , 3 (** Om ma her reger ut ved hjelp av (* eller (** spller kke oe særlg rolle, me hvs tallmateralet hadde vært stort, og mage av observasjoee var lke, så vlle det vært svært besparede å bruke (**. Ma ser her at frekvese (hyppghete (the frequecy av tallet er, frekvese av tallet er 4, frekvese av tallet 3 er 3, og frekvese av tallet 4 er. Dette skrves Avedt Statstkk 6
9 f, f 4, f 3 3 og f 4 De geerelle formele for beregg av år flere av observasjoee er byrdes lke (dvs. verde k har frekvese f k, k,, m, der m er atall forskjellge verder av. I eks. fora er m4. (m.a.o. verde forekommer f gager, verde forekommer f gager,, verde m forekommer f m gager, blr dermed: k m f k k f f L f m m eller bare kortere f k k k eller eå kortere f Et aet me kke så mye brukt mål på setral tedes er typetallet (eg.: the mode ~ (T som gaske ekelt er de observerte verd med størst frekves. Eks. I eks. over er typetallet ~ ford verde forekommer hyppgst, emlg 4 gager. Noe gager eholder våre tallmateraler ekelte ekstreme verder forhold tl de fleste adre. ( dsse kalles av oe utelggere etter det egelske outler. Se defsjoe s.. I slke tallmateralet blr det artmetske gjeomsttet lett påvrket retg av de( ekstremt store/små verdee. Eks. Ata at ma har observert aldere på 5 persoer og fuet: :,, 3, 4, og 6. Bereger e her gjeomsttsaldere ved hjelp av det artmetske gjeomsttet fer e (år 5 5 som eppe ka ses å være et represetatvt tall for tall for dataee. I slke sammeheger er det ma bruker et mål på setral tedes som kke så lett lar seg påvrke av ekstreme verder. Det fes flere slke mål. Et mye brukt mål er de såkalte medae. Medae M er det tallet som deler det ordede tallmateralet ( ordet stgede eller avtagede rekkefølge to lke store deler. Medae ses derfor ofte å være de mdterste observasjoe det ordede tallmateralet hvs det er et odde atall observasjoer, og gjeomsttet av de to mdterste hvs det er et lke atall observasjoer. Eks. La være:, 5, 3, 4, 6. Order ma tallmateralet har e:, 3, 4, 5, 6 og da ser e at medae blr 4. Eks. Sløyfer e å for eksempel observasjoe ser e at det kke leger er oe observasjo mdte, og medae er dermed gjeomsttet av de to mdterste, d.v.s. Avedt Statstkk 7
10 4 5 M 4,5 Medae behøver m.a.o. kke være e observasjo. Ma ser ofte at medae M er de verde som er slk at 5% av tallmateralet(det ordede lgger uder dee og 5% lgger over dee. Adre yttge belggehetsmål er de såkalte kvartlee Q, Q og Q3. De deler også det ordede tallmateralet to deler: Q slk at 5% av observasjoee lgger uder og 75% lgger over dee. Q slk at 5% av observasjoee lgger uder og 5% lgger over dee. Q slk at 75% av observasjoee lgger uder og 5% lgger over dee. 3 Det betyr m.a.o. at medae M og.kvartl Q er de samme. I små tallmateraler ( < så bereger e medae ved å fe observasjo r. ordede tallmateralet. Tlsvarede fer e kvartlee Q og Q 3 som heholdsvs observasjo r. og r. 3 små tallmateraler. 4 4 det I større tallmateraler ( så leter e tlsvarede etter observasjo r., r. og r. 4 3 det ordede tallmateralet. Grue tl dette er at det lte forskjell på (for eksempel 4 og år er stor. Dee takemåte er praktsk år ma skal bruke adre mål e 4 4 kvartler. Et tallmaterale ka deles mdre deler på mage måter. Noe adre mye brukte er: Deslee D, D,..., D deler tallmateralet -deler aalogt tl over. Det betyr at D deler tallmateralet to slk at % lgger uder D og 9% lgger over dee verde, D deler tallmateralet to slk at % lgger uder D og 8% lgger over dee verde, osv. 9 E bereger å tlsvarede her observasjo r., r., r det ordede tallmateralet. Prosetlee P, P,..., P deler tallmateralet -deler aalogt tl over. Det betyr at P deler tallmateralet to slk at % lgger uder P og 99% lgger over dee verde. Helt 99 aalogt bereger e å tlsvarede her observasjo r., r., r det ordede tallmateralet år ma skal berege prosetlee P, P,..., P. Avedt Statstkk 8
11 Spredgsmål. To forskjellge tallmateraler ka ha samme belggehetsmål. Bl.a. for å kue sklle mellom dsse så føres såkalte spredgsmål, som gr et mål på hvor stor spredg det er observasjoee. Eks. Tallmateralee :, 4, 5, 9, og y : 3, 5, 7, 9 er forskjellge, me har allkevel samme artmetske gjeomstt (kotroller selv. Er medaee lke? Spredge de to tallmateralee er mdlertd forskjellg. Varasjosbredde (the rage er et ekelt, me kke så mye brukt varasjosmål. Det er defert som dfferase mellom de største og de mste observasjoe, dvs. V maks m Eks. I tallmateralee over fer e V og V y Kvartbredde (the terquartlrage er et aet varasjosmål, som er oe mer brukt e varasjosbredde. Det er dfferase mellom 3. og. kvartl, dvs. Kv.br. Q3 Q IQR Det betyr at kvartlbredde er avstade mellom de to verdee ( Q og Q3 som er slk at 5% av observasjoee det ordede tallmateralet lgger mellom dsse (75% lgger på edsde av 3.kvartl og 5% lgger på edsde av.kvartl IQR brukes ofte tl å defere hva e outler (ekstremverd er for oe. E observasjo kalles e outler hvs de er < Q, 5IQR eller > Q, 3 5IQR Hvs observasjoe er < Q 3IQR eller > Q 3IQR 3 kalles de ofte for e ekstrem outler Eks. Gtt tallmateralet :, 5, 4, 7, 6, Spørsmålet er å om 6 er e outler. Legger e tallee kalkulatore fer e Q og Q 3 heholdsvs tl 4 og 7. Greer du å se hvorledes kalkulatore bereger kvartlee? E fer å m.a.o. IQR og dermed Q,5 IQR 7,5 3,5. Dvs at 3 6 er e outler sde de er >,5. dermed bør dee observasjoe fjeres fra tallmateralet før e gjør oe aalyser. Avedt Statstkk 9
12 Varase er det klart mest brukte spredgsmålet. Dette målet forteller hvor mye observasjoee avvker fra stt gjeomstt med. Varase er defert ved σ (( ( ( L ( E ser m.a.o. mer presst at varase først reger ut hvor mye avvker fra med, deretter kvadreres dette, så gjøres det tlsvarede for, osv., tlslutt gjøres det for. Etter dette deles alle dsse kvadrerte avvkee med, dvs. m.a.o. s at varase er gjeomsttlg kvadrert avvk fra gjeomsttet for alle observasjoee. Grue tl at ma kvadrerer er at ma ellers vlle få hver eeste gag, ford det ka vses geerelt at ma alltd har at Forklarg på dette er: ( ( ( L ( ( L ( L L ( Eks. Betrakter å tallmateralet på sde 9 der,,,, var gtt ved:,,, 3, 4, 3,,, 3,. Her fat v,3. Dermed blr varase σ ( (( ( ( L ((,3 (,3 L (,3,8 E ser m.a.o. at først så bereges avvkee fra gjeomsttet for hver eeste observasjo: (,3, (,3, L, (,3 (Vs at summe av dsse avvkee Deretter kvadreres dsse avvkee før de så adderes. Summe av de kvadrerte avvkee blr 8, (kotroller selv. Tlslutt deles summe av dsse kvadrerte avvkee på, e reger m.a.o. ut gjeomsttlg kvadrert avvk for de tallee. Som vst over må ma altså gjøre oe med avvkee før ma deler på ellers vl ma ku få gjeomsttlg avvk hver eeste gag. De ee mulghete er altså som her å kvadrere avvkee (da blr de egatve avvkee kvadrert postve. De adre mulghete er å berege absoluttverdee av avvkee, og så addere dsse og tlslutt dvdere med. Grue tl at ma har valgt kvadrerge er at dette de geerelle teore som er utvklet forbdelse med dette gr mye bedre matematske arbedsforhold. E ulempe med kvadrerge er mdlertd at varase får e ae beevg e de opprelge data. Tek for eksempel at de tallee er beløp kroer. Da vl gjeomsttlg beløp være,3 kroer, mes varase blr,8 kroer (m.a.o.,8 kvadratkroer, hva å det måtte være for oe?. For å korrgere for dette ( m.a.o. ha et spredgsmål med samme beevg som dataee så føres det såkalte stadardavvket som er kvadratrote av varase. M.a.o.: Stadardavvket σ Varase Avedt Statstkk
13 Det betyr at stadardavvket tallmateralet over er σ, 8,9 (kroer. Ma ka her aalogt tl overgage fra tl f k k k sette opp e tlsvarede kortere bereggsformel for varase ved å slå samme de lke leddee: ((,3 (,3 (,3 (3,3 (,3 (3,3 (,3 (4,3 (3,3 (,3 ( (,3 4 (,3 Dette leder dermed tl følgede formel: 3 (,3 (3,3,8 σ m f ( ( ( ( ( k k f f L f m m k der m er atall forskjellge -verder. Dette er jo praktsk (foreklede år ma har mage lke tall å arbede med og skal gjøre bereggee for håd, me så fort e overlater bereggee tl TI-83 `s statstkkprogrammer eller SPSS er det helt uvesetlg hvlke bereggsformel som lgger bak. Nå er det kaskje oe som husker at ma skal dele på (- og kke år ma bereger varase. Når skal ma gjøre hva? Det er valg å kalle σ for populasjosvarase, dvs. varase tl alle elemetee e øyeblkket teresser seg for. Nå er det valg at kke hele populasjoe er kjet, me at ma tar et tlfeldg utvalg for å få kuskap om populasjoe. I dette utvalget ka ma så berege varase som dermed kalles for utvalgsvarase, og beteges med s. Dee utvalgsvarase vl jo måtte være et tall ærhete av σ sde utvalget vårt er represetatvt. Det ka de matematske statstkke vses at s lgger ærmere σ (treffer bedre år ma deler på (- e hvs ma deler på. Mer presst: Det ka vses at E( S σ, m.a.o. S (varabele kyttet tl s er e forvetgsrett estmator for σ. Det betyr da at s f ( f m ( ( ( ( k k f L f m m k er et bra estmat for σ. Det er valg å bruke s år ma opererer med et utvalg av data. Kjeer ma hele populasjoe bruker ma σ. Når tallmateralee blr store spller det lte rolle om ma deler på (- eller. Avedt Statstkk
14 Avedt Statstkk Eks. Ata at summe av de kvadrerte avvkee er 5 og at 5. Da blr σ 5 4, 5 5, mes s 59 4, 5 5 som resulterer følgede stadardavvker: σ,,5 4 og 3,,59 4 s M.a.o. det blr helt ubetydelge forskjeller. For å kue skjele ltt bedre mellom σ og s bruker e oe bøker N på atallet populasjoe, og på atallet utvalget. Det betyr at populasjosvarase blr gtt ved ( ( ( ( ( f f f N f N m m m k k k L σ og utvalgsvarase blr gtt ved ( ( ( ( ( f f f f s m m m k k k L Grupperte tallmateraler. Det er ofte slk at e del store tallmateraler er ordet tabellform, for å skape mer overskt (se for eksempel statstsk årbok e det råmateralet gjør. Dette vl da være e tlærmet agvelse av de opprelge dataee. Eks. Ata at et tlfeldg utvalg på observasjoer er gtt ved: :, 3, 6, 5, 7,, 8, 9,4,,, 5, 3, 6, 6, 4, 9, 8, 7,3 Først skal v rege eksakt på dette tallmateralet, for deretter å orgasere tallee e tabell og så sammelke resultatee. Det ordede tallmateralet gjør det ltt lettere mht. bereggee. : (, 3, 3, 5, 5, 6, 6, 6, 7, 7, 8, 8, 9, 9,,,, 3,4,4 E fer å det artmetske gjeomsttet f f f f m m m k k k L L 7,9 og utvalgsvarase ( ( ( ( ( f f f f s m m m k k k L
15 ( ( 7,9 (3 7,9 L (4 7,9,9 (,9368 Dermed blr stadardavvket s,9 3, 6 ( I mage sammeheger er et slkt tallmaterale gtt tabellform som følger: Klassegreser Frekves Klassemdtpkt. f k k [, 5 3,5 [ 5, 7,5 [, 5 6,5 Da er kke råmateralet kjet slk som her. Det betyr at e å ku vet at det er 3 observasjoer mellom fra og med og tl 5, observasjoer mellom 5 (f.o.m. og (tl, osv.. Ma velger å puktet mdt klasse som represetat for de ukjete verdee. M.a.o. det er 3 observasjoer som er,5 (eksakt er de, 3 og 3 hvs ma ser på råmateralet, observasjoer som er 7,5, osv. Med dee tlærmge fer e å k m f k k f f L f m m 3,5 7,5 6,5 8,3 (8,5 som avvker ltt fra de eksakte verde på 7,9. Nå skal det bemerkes at ved større tallmateraler så blr forskjellee gjeomgåede mye mdre. Tlsvarede fer ma varase tabelle: m s f ( (3 (,5 8,3 (7,5 8,3 6 (,5 8,3 k k,3 k Herav fer e da stadardavvket s,3 3, 4 Øsker ma å legge dsse tallee lstee TI 84 går e fram som følger: Trykk først på STAT-taste. Da får du opp følgede blde: Trykk så på ENTER-taste og du får opp følgede blde: Avedt Statstkk 3
16 Kalkulatore er å klar tl å ta mot tall de forskjellge lstee. Legger så klassemdtpuktee lste, L, og frekvesee lste, L. Dette gr da følgede blde: Nå trykker e så på STAT-taste gje, me velger å stede alteratvet CALC (calculatos. Dette gr følgede blde: E bruker å : -Var Stats ( evarabelstatstkk på følgede måte: Trykk først på ENTER og deretter på ND, så på kommataste, og tlslutt på ND. Du vl da få opp følgede blde: Trykker e å på ENTER-taste får e følgede blde: Avedt Statstkk 4
17 Her får e å bekreftet bereggee over, og tllegg bereget de tre kvartlee. E ser at dette avvker e del fra bereggee råmateralet: :, 3, 6, 5, 7,, 8, 9,4,,, 5, 3, 6, 6, 4, 9, 8, 7,3 Hvor e fat Q 5 og Q 3, me det skyldes de forskjelle som er mellom råmateralet og tabellmateralet ' :.5,.5,.5, 7.5, 7.5, 7.5, 7.5, 7.5, 7.5, 7.5, 7.5, 7.5, 7.5, 7.5,.5,.5,.5,.5,.5,.5. E har at medae M er gtt ved 7,5. Q og Q3 ser e blr heholdsvs 7,5 og,5. Legg merke tl at og M blr lke. Hvorda vl du kommetere dette? Q Nå ka medae ( og kvartlee bereges ved hjelp av tabelle på e tlærmet måte. E har at Re st M L v f der L edre klassegrese de klasse hvor medae lgger, f frekvese de klasse hvor medae lgger, v klassevdde medaklasse og Rest det e magler for å komme fram tl medae (dvs det atall observasjoer e magler fra L og fram tl observasjo r. observasjo r. år er et lte tall** I vårt eksempel fer e M Re st,5 3 L v 5, 5, 8,4 f det medae er observasjo r.,5 som lgger klasse r som har edre klassegrese 5, e klassevdde på 5 og e frekves på. Rest blr dermed,5-3 der 3 er det atall observasjoer som lgger klassee før medaklasse (her ku klasse r Avedt Statstkk 5
18 De samme tekkke ka brukes tl å berege Q og. E har å tlsvarede Q 3 Q st L Re v f der L edre klassegrese de klasse hvor.kvartl lgger, f frekvese de klasse hvor.kvartl lgger, v klassevdde klasse hvor medae lgger og Rest det e magler for å komme fram tl.kvartl (dvs det atall observasjoer e magler fra L og fram tl observasjo r. observasjo r. år er et lte tall Helt aalogt fer e Q 3 ved 4 st Q 3 L Re v f bortsett fra at ma å leter etter observasjo r. 3. Bereg å selv 3. kvartl og vurder 4 om svaret dtt er rmelg. ** At er et lte tall skal her bety at <. Hvs så leter e etter observasjo r 3,,,..osv år ma skal berege kvartlee. Dette er e mye eklere og logsk 4 4 tekemåte. Når ma for eksempel skal fe deslee ( de verdee som deler tallmateralet 3 9 deler leter e etter observasjo r.,,, L,. Det er dessute veldg lte forskjell på de to metodee år er stor Ata for eksempel at 5, at L edre klassegrese de klasse hvor.kvartl lgger 39,5 ; at f frekvese de klasse hvor.kvartl lgger 47, at v klassevdde medaklasse, og at det lgger 5 observasjoer før klasse som eholder første kvartl. Nå blr 6.75 og 4 4 6,5. Dermed blr Rest det e magler for å komme fram tl.kvartl 6, ,75 eller 6,5-5 37,5. Det betyr at. kvartl bereget ved de metodee blr heholdsvs Re st 37,75 Q L v 39,5 47,53 f 47 37,75 Q 39,5 47,48 47 Det blr mao. e forskjell på,5 ved de to bereggsmetodee. Avedt Statstkk 6
19 Skjevhet * V har tl å sett på mål på setral tedes og mål på spredg. Dsse kalles ofte heholdsvs første- og adre-ordes mål. I e del sammeheger er det også yttg å se på høyere ordes mål. Ata at v har observasjoer,,l L V deferer derfor å det såkalte r.teordes mometet omkrg ved m r r ( r,, 3,.. hvs alle observasjoee er forskjellge, eller ved m r f k ( k k r r,, 3,.. hvs e del av observasjoee er lke, eller dataee er gruppert. Det er kke egetlg oe forskjell på de to formlee (jfr. de to formlee for varas det hvs alle frekvesee var lk så er alle -ee forskjellge og formel fremkommer. E ae tg er at e godt ka bruke formel alle tlfellee, me e blr da sttede å addere mage lke ledd der e har lke observasjoer stedefor å multplsere (m.a.o er tygre å rege ut e 9*5 Det betyr m.a.o. at formel er e kortere (og greere formel å bruke e formel år det er mage lke data. Det ka vses at m uasett tallmaterale (se regeregler for summer Sydsæter App.A m Dessute har e at ( ( m ( varase et tallmaterale σ (egetlg populasjosvarase Nå skal v også betrakte m 3 og m 4. Dsse har betydg for e del av aalysee som skal gjøres seere. Tredjeordesmometet omkrg defert ved m 3 f k ( k k 3 brukes tl å berege skjevhete ( the skewess e fordelg. Hvs e fordelg har ekelte små verder som skller seg fra de øvrge (fordelge vl da ha e hale mot vestre så ser ma at skjevhete er egatv. Hvs fordelge er symmetrsk så Avedt Statstkk 7
20 er skjevhete. Har fordelge ekelte store verder som skller seg fra de øvrge (fordelge har da e hale mot høyre så er skjevhete postv. Ifølge Jøreskog ( Formulas for Skewess ad Kurtoss 999 så bereges skjevhete ved først å rege ut m3 m3 g 3 3 m s der s er stadardavvket. g vl være egatv hvs m 3 er egatv, og postv hvs m 3 er postv. Deretter bereges ( justert g G ( g (justert g som er forvetgsrett (ormaltetsforuts. Nå skal v prøve å kotrollrege dee verde, og v treger altså både m og m 3. 9 V har tdlgere fuet s, 5 m, 5,69. I tllegg fer e å m 3 ved m 3 Dermed blr f k ( k k og dermed fer e 3 3 (,5 8,5 g m m 3 (7,5 8,5 5,7 3 (, ,64 6 (,5 8,5 3-5,7 ( 9 G g (,64,78 8 Det ka vses at stadardavvket tl g er gtt ved ( 6W N ( WN se g ( W ( W ( W 3 N N N Avedt Statstkk 8
21 N N der WN w ( vektee for observasjo L observasjoer. Dvs. at N, der N er atall 6N( N 6 9 se ( g,5 ( N ( N ( N Dette er et tall som ka brukes tl hypotesetestg og estmerg (kofdestervaller. Spsshet * Et aet vktg mål e fordelg baserer seg på fjerdeordesmometet omkrg, og dette måler grade av spsshet (kurtoss fordelge. Nå er flg. def. s.7 m 4 f k ( k k 4 Defer så g ved g m m 4 Grue tl at 3-tallet kommer er at ormalfordelge er spsshete akkurat lk 3,. Det betyr dermed at hvs e fordelg er spssere e ormalfordelge (spsshet > 3, så er g >, og hvs de er mdre spss e ormalfordelge så blr g <. Tlsvarede tl defsjoe av G deferes å G ved G 3 g ( ( 3 [( 6] ( som også er e forvetgsrett estmator uder ormaltetsforutsetge. Prøver å å sjekke bereggee MINITAB-utskrfte. Må da først fe m 4 ( m er kjet fra før. 4 f k ( k m 4 k Dermed blr 3 (,5 8,5 4 (7,5 8,5 m4 6, g m, (,5 8,5 4 6,95 og det forvetgsrette estmatet G Avedt Statstkk 9
22 9 G [( g 6] [ (.77 6] -,5495 -,55 ( ( som stemmer svært så bra med MINITAB s verd som er -,548. Fordelge er m.a.o. ltt mdre spss e ormalfordelge. På SPSS s hjemmesde fer ma også formele tl stadardfele (les stadardavvket tl g : se ( g 4( N ( se( g ( N 3( N 5 som satt N og se g,5 gr ( 4( (,5 se ( g,99 ( 3( 5 Dette ka da gje brukes tl å gjeomføre hypotesetestg og etmerg. Noe grafske framstllgsmetoder. For å skape e overskt og et blde av stuasjoe så bruker e ofte grafske framstllger av tallmateralet. Dette ka gjøres på flere måter. Hvlke metode e bruker er delvs avhegg av tallmateralet ( dvs. om varabele er dskret, kotuerlg, eller e kategorvarabel og hvlket publkum som skal se grafkke. Stolpedagram (bar chart Ata at ma har et tlfeldg utvalg på 3 karakterer matematkk e ugdomsskoleklasse. Varabele karakter er her dskret og ka ata verdee,,, 3, 4, 5 og 6. Ata at resultatet av udersøkelse ble: Elev Kar Nå bruker ma et såkalt stolpedagram for å framstlle dsse dataee grafsk: Legger e dsse dataee MINITAB vl e få følgede stolpedagram: Avedt Statstkk
23 Chart of C 4 3 Cout 3 C E ser at MINITAB velger å tege rektagler. Det er også valg å tege vertkale streker. Noe av de mest brukte grafske framstllgee for kotuerlge tallmateraler er hstogram og kurvedagram. Hstogram. Eks. Går e å tlbake tl tallmateralet på sde (aldersfordelge på bar og legger dette TI får e følgede hstogram av råmateralet: Abs. frek. f Har e mage observasjoer så blr dette fort uoversktlg. E lager derfor et passe atall tervaller (klasser. Her må e bruke skjø. E valg tommelfgerregel er å bruke 8- tervaller år det er e vss størrelse på tallmateralet. Velger e for eksempel klassevdde på tallmateralet over gr TI følgede grafske blde: (E bør å ha Wdow stlt som følger: Avedt Statstkk
24 Legg speselt merke tl at Xscl å er satt tl Abs. frek. f Bruker e dermot tabelle som utgagspukt (klassevdde 5 får e Velger e dermot å framstlle tabellmateralet grafsk fer e Abs. frek. f E må egetlg hver ekelt stuasjo avgjøre hva som best for at det grafske bldet skal represetere tallee på e best mulg måte. Har e for små klassevdder vl e lage et for detaljert blde, har e for store klassevdder vl e del detaljer bl vsket bort. Prøv selv med oe adre klassevdder. For kotuerlge data ka e alteratvt bruke kurvedagram stedefor hstogram. Her avsetter e puktee ( f, k,,.., K der K er atall klasser og teger rette ljer k, k mellom dsse. Det er svært valg ta med e start-klasse og e avslutgsklasse med frekves og dermed avsette puktet ( og puktet (. Da vl arealet av hstogrammet og, kurvedagrammet bl lke store. Tallmateralet tabelle vl da g følgede kurvedagram: K, Avedt Statstkk
25 Abs. frek. f Teg hstogrammet og kurvedagrammet samme koordatsystem og overbevs deg selv om at de dekker samme areal. Sumfordelgskurve ( sumpolygo E meget yttg kurve som ka brukes tl å lese av mage av de målee som v har bereget fora er de såkalte sumfordelgskurve. Her bereger e først de kumulatve relatve frekvesee Rk R( X k (mao. summe av de relatve frekvesee r k opp tl og med klasse k. Avsetter e lags førsteakse, R k lags adreakse og tlvekstrektagelet hver klasse framkommer de såkalte sumfordelgskurve ved å tege dagoalee gjeom hvert tlvekstrektagel. Eks. Går v å tlbake tl tabelle på sde har v å: Klassegreser Frekves Klassemdtpkt. Relatv frekv. Kumulatv rel. f k k r k frekves R k [, 5 3,5,5,5 [ 5, 7,5,55,7 [, 5 6,5,3, Framstller e dette grafsk får e: R k 5 5 Her er mao. kurve dagoalt gjeom rektaglee (som er hstogrammet tl dataee tabelle bare teget på e ltt ae måte fra puktet (, tl puktet (5, selve sumfordelgskurve. Dee kurve skal v å bruke tl å lese av.,. og 3. kvartl. For å Avedt Statstkk 3
26 fe Q lar e R k, 5 ( det betyr at ma har delt tallmateralet to slk at 5% lgger uder og 75% lgger over det tallet v å søker. E går så fra,5 på.akse og horsotalt bort tl sumfordelgskurve, deretter går e vertkalt ed tl. akse og leser der av Q : Q Q Q 3 Herav fer e at Q 5,8; Q medae 8, og Q, 3 8. Da har e at IQR,8-5,8 5, som er øyaktg de verde v fat ved regg for IQR. Noe adre grafske framstllgsmåter er: Kakedagram (Pechart Ata at det e klasse er 5 jeter og gutter. Legger e dette MINITAB og ber om pechart får e følgede blde: Pe Chart of C JJeter GGutter Category G J G 4,% 6,% J Stamme- og bladdagram (Stem ad leaf Ata at e klasse med 3 elever har hatt e matematkkprøve og resultatee ble: 37, 45, 56, 54, 38, 3, 45, 67, 65, 43, 3, 78, 98, 75,, 34, 45, 59, 67, 87, 76, 5, 8, 47, 88, 77, 59, 4, 9, 9. Avedt Statstkk 4
27 Legger e dsse tallee e koloe C MINITAB og gr følgede kommadoer GRAPH STEM AND LEAF C OK Får e følgede grafske framstllg: ( Av første rad ser e av tallet første koloe at det er observasjoer de første klasse og at dsse er heholdsvs ( -tallet fra koloe og tallet fra koloe 3 og 9 ( -tallet fra koloe og 9-tallet fra koloe 3. Tallee koloe kalles for stamme og tallee koloe 3 kalles for bladee. Tallee koloe forteller hvor mage observasjoer det er over/uder de aktuelle klasse med utak av klasse hvor medae lgger. Her dkerer (5 at medae lgger. Hvs ma teger hstogrammet for dee stuasjoe vl det ha samme form som tallee helt tl høyre (bladee bare dsse drees 9 grader. Tdsrekke (tdssere-plot Ata at e mdre bedrft har otert salget av et produkt de sste 8 måedee og fuet 56, 37, 59, 67, 49, 6, 78, 49 Fremstller e dette MINITAB va Tme Seres Plot får e følgede blde: 8 Tme Seres Plot of C 7 6 C Ide Avedt Statstkk 5
28 Dette er realtete kke oe aet e et kurvedagram hvor e avsetter tde lags førsteakse og de observerte verdee lags adreakse. Forskjelle er å mdlertd at kurve starter.pukt (salget måed og kke på selve.-akse som v gjorde for kurvedagrammet. Boksplot E mye brukt ekel fgur som samtdg vser mste -verd, største -verd, og de 3 kvartlee er det såkalte boksplottet som for de 3 karakteree eksempelet fora blr seede ut som følger: Boplot of C 8 6 C 4 De 5 målee på setral tedes som ags boksplottet kalles ofte på egelsk for the fveumber summary e datamegde. Selve bokse starter ved Q og slutter ved Q 3, de horsotale streke gjeom bokse vser medae de vertkale strekee over og uder bokse starter ved de mste -verde og slutter ved de største -verde. På kalkulatore blr dette seede ut som følger: Avedt Statstkk 6
29 4 6 8 Ehete på.akse er her, mes de på.akse er. E ser å at bokse er lk på de fguree bortsett fra at de sste lgger varett. Det såkalte modfserte boksplottet agr også evetuelle outlere datamateralet. Ata v har spurt 5 bar om hvor mage tmer de drver med dataspll på e valg hverdag. Resultatet av udersøkelse ble: :,, 3,,,, 3,,,,, 4, 7,, Outler E ser her at verde 7 er e outler og dermed blr fjeret fra dataee før boksplottet teges (dette ser e blat aet av at største verd å er 4. Kotroller å ved hjelp av regg 7 er e outler og at dette boksplottet er rktg. Geometrske fgurer. I mage sammeheger så bruker ma geometrske fgurer ( trekater, frkater, srkler, tegg av hus, meesker,.. år ma skal beskrve et tallmaterale. Speselt ofte brukes det år ma skal sammelke data for to forskjellge tdspukt. Fguree teges slk at arealet er proporsjoalt med de gtte tallee Ata for eksempel at omsetge år 4 var mllo kroer, mes de 5 økte tl mlloer. Hvorda skal dette teges ved hjelp av to kvadrater? Velger ma for eksempel e frkat for 4 som har sde cm, så må frkate for 5 være cm ( hvorfor det? Avedt Statstkk 7
30 4 5 Hvorfor blr det galt å velge sde cm for kvadratet for 5? Hvorda blr dette seede ut hvs ma velger srkler stede og radus for 4-srkele skal være cm? Normal kvatlplot (Normal quatleplot I mage sammeheger år v seere skal drve med estmerg og hypotesetestg så er e betgelse at tallmateralet er ormalfordelt ( eller tlærmet ormalfordelt Det er flere måter å sjekke dette på. E måte er å tege det såkalt kvatlplottet. Dette gjøres ved først å orde tallmateralet fra de mste tl de største. Har e for eksempel de 4 observasjoee 6,9; 5,8; 6,7; 7,6 (som er trukket på kalk. radnorm(7,,5 med desmal så blr dette ordet: : 5,8; 6,7; 6,9; 7,6 ( De 4 ordede observasjoee deler å arealet uder ormalfordelge ( 5 lke store deler som hver har et areal på, ( 5 E bereger så z-score svarede tl hver av dsse 4 puktee. De blr som følger z z vnorm(.. z.4 vnorm(.4 3 z. vnorm(.6 4 z. vnorm(.8,84 z, 5 z, 5 z, 84 E framstller så puktee z, et z- koordatsystem, mao. puktee ( ( (-.84, 5.8, (-.5, 6.7, (.5, 6.9 og (.84, 7.6 Hvs dsse puktee blr lggede tlærmet på e rett lje så kokluderer e med at tallee kommer fra e ormalfordelt populasjo. Legger e tallee på kalkulatore, får e følgede grafske blde: Avedt Statstkk 8
31 z E ser at puktee tlærmet lgger på svakt stgede rett lje, og kokluderer dermed at dataee er trukket fra e ormalfordelt populasjo. Hvs ma å stede velger å bruke MINITAB ved først å legge de 4 observasjoee koloe (C og så bruke kommadoee: STAT BASIC STAT Normalty test Select C Aderso-Darlg så får e følgede resultat: Probablty Plot of C Normal Percet Mea 6,75 StDev,746 N 4 AD,7 P-Value,66 5 5, 5,5 6, 6,5 C 7, 7,5 8, 8,5 Avedt Statstkk 9
32 Legg merke tl at MINITAB avsetter de observerte -verdee lags førsteakse og de kumulerte prosetvse z-scoree lags adreakse. E ser også her etter om puktee blr lggede (ev tlærmet lggede på e rett lje. Det testes (se hypoteseprøvg også om dataee er ormalfordelte gjeom følgede ullhypotese og alteratv hypotese: mot H : Dataee er trukket fra e ormalfordelt populasjo H A : Dataee er kke trukket fra e ormalfordelt populasjo E ser at MINITAB agr e P-verde på,66. Dette betyr mao. at H kke ka forkastes. Det er gaske sterke sgaler på at H er rett. De to adre testee MINITAB, Rya-Joer og Kolmogorov-Smrov, gr helt tlsvarede resultater dog med ltt lavere P-verd. Hvs dataee kke er ormalfordelte så ka ma prøve om det hjelper med e trasformasjo. Noe valge trasformasjoee hvs dataee eholder for mage store verder er: Logartmsk trasformasjo, dvs. bereg y l( Kvadratrottrasformasjo, dvs. bereg y Ivers trasformasjo, dvs. bereg y Test så om de ye dataee (y-verdee er ormalfordelte ved e av testmetodee over. Noe adre valge trasformasjoer hvs tallmateralet eholder for mage små verder er: Potestrasformasjo, dvs. bereg Ekspoetell trasformasjo, dvs. bereg a y der a > y a der a > Test så om de ye dataee (y-verdee er ormalfordelte ved e av testmetodee over. Hvs kke oe av dette fører fram så fes det såkalte kkeparametrske tester som ka brukes. 4. Ekel regresjo. Ata ma har parobservasjoer (, y der er gtte verder av e tlfeldg varabel X og y er verde av e tlfeldg varabel Y. Avedt Statstkk 3
33 .. 3 y y y.. 3 y Avsetter ma puktee (, y,,,3,., et y-koordatsystem fremkommer det såkalte spredgsdagrammet (the scatterplot : Eks. Ata ma har observert følgede sammeheg mellom X og Y y Spredgsdagrammet blr dette tlfellet Scatterplot of C vs C 8 C C 6 8 Ser e på spredgsdagrammet observerer ma at det er e postv rettljet tred sammehege mellom og y. Dette ka da beskrves ved følgede modell (husk at e modell er e etterlkg og foreklg av vrkelghete ( som her er represetert ved de parobservasjoee: y α β ε der ε er N(, σ (* ε kalles ofte støye ( eller felleddet, eg.:the error og atas å være ormalfordelt med forvetg og med e varas σ ( se ormalfordelge s 4 α β kalles ofte for regresjoslkge (de teoretske (eller sae for y med hesy på, eller av og tl for sgalet. Det betyr at ma ka s at y sgal støy. I statstkk er det valgst å ag lkge for e rett lje med ab stedefor ab som er valgst orske matematkkbøker. Modelle (* over gjelder selvfølgelg for alle observasjosparee. Ofte beskrves modelle derfor oe mer presst som følger: De tlfeldge varablee Y, Y,..., Y (gtt de tlsvarede -ee er uavhegge med Avedt Statstkk 3
34 eller ekvvalet forvetg µ α β og varas Y σ der Y α β e,,,..., e, e,..., e er uavhegge felledd som har forvetg og varas σ Lkgeµ α β kalles ofte for populasjosregresjoslkge for Y m.h.t.. Y Dee skal v prøve å estmere ved hjelp av et utvalg av observasjospar. V ka da fe e såkalt estmert regresjoslkg eller e såkalt utvalgsregresjoslkg som beteges ved y ˆ a b Dee vl da kue brukes tl å estmere fremtdge verder av Y, dvs. å lage progoser. a og b er da estmater for heholdsvs α og β. Dsse fer e ved hjelp av de såkalte mste kvadraters metode, som går ut først å berege avvkee e observert y verd estmert y verd y yˆ for all de puktee Scatterplot of C vs C 8 C C 6 8 Det betyr at hvert eeste pukt så bereges avvket mellom de observerte y-verde og de y-verde de ukjete lja y ˆ a b (det som er ukjet er a og b; det som er kjet er at det v skal fe er e rett lje. Ma bereger først e y yˆ y ( a b for,, 3,, Nå kvadreres alle dsse avvkee og deretter adderes de. Ma bereger m.a.o. Avedt Statstkk 3
35 f ( a, b e ( y ( a b for de leddee. Dette vl dermed være e fuksjo av varable (a og b, mer presst e aegradsfuksjo som beteges med f ( a, b. Hva tror du er grue tl at avvkee a og b kvadreres?. Fuksjoe f som altså er e fuksjo av varable derveres å (partelt med hesy på a og på b. Dette gjøres for å bestemme mmum av f. Ma bereger mao. f ( a, b f ( a, b og a b Deretter settes de derverte lk, dvs. ma løser lkgee f ( a, b a og f ( a, b b Dette utgjør to lkger med to ukjete (fortsatt a og b. Løses dsse to lkgee m.h.p. a og b fer e: a a( b( b( Dsse to lkgee kalles for ormallkgee regresjosaalyse utledet ved mste kvadraters metode. Grue tl at metode kalles mste kvadraters metode er ma først fer summe av de kvadrerte avvkee, og deretter mmum av dette. Dette betyr m.a.o. Eks. Går v tlbake tl vårt talleksempel på s. fer e, y y y y dermed blr ormallkgee: a 65b 76 65a437b 5 Løser e dsse m.h.p. a og b (ved e eller ae metode fer e a,57 og b,64 (med 3 desmalers øyaktghet Nå skal v kotrollere dsse bereggee ved hjelp av kalkulatores statstkkprogram og MINITAB. Avedt Statstkk 33
36 Regresjosaalyse ved hjelp av kalkulator: Med TI-83 gjør ma følgede : Trykk på STAT-taste. Trykk på ENTER. Du er å klar tl å legge tallee lste (-ee og lste (y-ee. Legg så tallee. Kalkulatore vser å: Trykk så på STAT- taste på ytt. v Gå så bort tl CALC med pltastee. v Gå så ed tl 8:LReg(ab v Trykk så ENTER. v Skrv så L, L rett etter LReg(ab (ved å trykke d deretter, (kommataste og tlslutt d v Trykk så ENTER Du vl å se at kalkulatore vser. M.a.o. v får bekreftet våre beregger over og tllegg oe beregger kyttet tl begrepet korrelasjo som v kommer tl ltt seere. Regresjosaalyse ved hjelp av MINITAB: STAT REGRESSION REGRESSION Avedt Statstkk 34
37 Respoce C (y-verdee, Predctors C (-verdee OK Du vl å få e utskrft som eholder flere mometer som eå kke er omtalt. De fleste av dsse skal v komme tlbake tl seere. De sste av tabellee er de v skal bruke å, og de ser ut som følger (selv her er det e del verder som for øyeblkket v kke skal kommetere Regresso Aalyss: C versus C The regresso equato s C,57,6 C Predctor Coef SE Coef T P Costat,57,448,9,6 C,6379,7337 4,5, S,6763 R-Sq 95,5% R-Sq(adj 95,% Aalyss of Varace Source DF SS MS F P Regresso 96,96 96,96,, Resdual Error 4,57,457 Total,667 Her ser e at de estmerte koeffsetee er,57 og,64 for h.h.v. α og β, hvlket stemmer med våre tdlgere beregger. I tllegg ags stadardfele tl estmatoree tl α og β tl h.h.v.,443 og,73. Koloe som agr de stadardserte koeffsetee baserer seg på varablee agtt på såkalte stadardform (dvs z-scoree som framkommer ved å berege z s og tlsvarede for y-ee før aalyse gjeomføres. er det artmetske gjeomsttet og s er stadardavvket. Det betyr at beevge teller og ever blr lke, og dermed blr varablee dmesjosløse, dvs de blr uavhegge av de ehetee som brukes. Hvs ma ser på det geerelle lkgssystemet på s. 4, og løser dette (geerelt mhp. a og b, så ka det vses at b s y s og a y b der e har ført s y ( ( y y Avedt Statstkk 35
38 (som ofte kalles for kovarase mellom og y og s ( som er utvalgsvarase -dataee ( se sde 4 Eks. Nå ka det vses (ved å multplsere ut ( ( y y og ved å summere leddvs at s y ( ( y y y y og at s ( Dsse reduserte utrykkee gjør det lettere å berege a og b ved formlee over. Ma får ved hjelp av TI-83 og kommadoee følgede blde STAT CALC : -VAR STAT ENTER ND, ND ENTER Herav fer e da grett og s y y y 5 8, Avedt Statstkk 36
39 s ( 7,796 Dermed har ma: og herav: b sy 8,,638..,64 s 7, a y b,638,57 5. Ekel korrelasjo Ata ma har parobservasjoer (, y der er verde av e tlfeldg varabel X og y er verde av e tlfeldg varabel Y... 3 y y.. 3 y y Merk å at kke er gtte verder av X som uder regresjo, me verder av e tlfeldg varabel, og det betyr at de kke ka bestemmes på forhåd. M.a.o. er å både og y verder av tlfeldge varable. E ser (ltt foreklet at regresjoslkge forteller hvorda sammehege mellom X og Y er. Hvor god sammehege er, dvs. hvor godt puktee er kyttet tl lja måles ved de såkalte korrelasjoskoeffsete r som er et tall mellom - og. y Hvs det gjeomgåede er slk at små -verder hører samme med små y-verder, og store -verder hører samme med store y-verder, så ser v at X og Y er postvt korrelerte (dvs. at < r < y Eks. Vekt og høyde er to varable som er postvt korrelerte. Ata ma har målt høyde og vekt hos e tlfeldg valgt gruppe på meesker og fuet: y Spredgsdagrammet med regresjoslje vl da se ut som følger: Avedt Statstkk 37
40 95 Scatterplot of C4 vs C C C Hvs ma å ber MINITAB å rege ut korrelasjoskoeffsete ved kommadoee STAT BASIC STATISTICS CORRELATION får ma følgede utskrft: Correlatos: Høyde; Vekt Pearso correlato of Høyde ad Vekt,748 P-Value,3 Herav ser e at korrelasjoskoeffsete er,748 (m.a.o. postv Nå skal v kotrollrege dee utskrfte. Det ka vses at korrelasjoskoeffsete gtt ved: s y r y (* s s y r y er der s y og s er defert som fora på sde 8, og y s er gtt ved s y ( y y Hva tror du at dee størrelse represeterer? ( Vk: Sammelk med s Utrykket for r y gtt ved (* over er dvdert med s og s y for at r y skal være et tall mellom Avedt Statstkk 38
41 - og. Husk at s y sammeheg mellom X og Y. Dermed er m.a.o. sammeheg. Nå tlbake tl talleksempelet: E fer her: (kovarase mellom X og Y også måler grade av leær r y et stadardsert mål på grade av leær s s y y y y 6 65 L L ( 9, (,77... Dermed fer e tl slutt : s y ( ( y y y y (( L 7 85 [ 33 74,8 75,] 75, 6 9 r y s s y s y 9,6 75,6,77,748 som stemmer overes med MINITAB-utskrfte. Ata at sammehege mellom X og Y er som følger: y Spredgsdagrammet blr dermed som følger: Avedt Statstkk 39
42 Scatterplot of y vs 4 y og ma ser at sammehege er perfekt hvlket betyr at korrelasjoskoeffsete. Dette bekrefter også MINITAB: Correlatos: ; y Pearso correlato of ad y, P-Value * Hvs det gjeomgåede er slk at små -verder hører samme med store y-verder, og store -verder hører samme med små y-verder v at det er egatv korrelasjo mellom X og Y. Et eksempel på dette er følgede observerte sammeheg mellom etterspørsele (y og prse ( på e vare: y MINITAB gr å: Correlatos: ; y Pearso correlato of ad y -,954 P-Value,3 Kotrollreg selv at tallee over stemmer. E ser m.a.o. at korrelasjoe mellom X og Y er egatv, og este lk -. Avedt Statstkk 4
43 Hvs det er perfekt leær sammeheg mellom to varable og de er egatvt korrelerte vl korrelasjoskoeffsete være øyaktg lk -. Eks y 7, 6,9 6,8 6,7 6,6 MINITAB vser å: Bruker e kalkulatore fer e: Correlatos: ; y Pearso correlato of ad y -, P-Value * Teger e spredgsdagrammet samme med regresjoslkge fer e: Her har ma e perfekt leær egatv sammeheg (hvs ma ka se bort fra de dårlge grafkke på kalkulatore, og fer dermed e korrelasjoskoeffsete lk - ( Kotroller selv at på etter eller aet vs at dette stemmer I de stuasjoee v har sett på her har r vært ærhete av eller -, me mage stuasjoer er r ærhete av. Det betyr at utvalget vser at det tyder på at det kke er oe grad av leær sammeheg mellom de to varablee som er volvert, og det er e vktg koklusjo og evetuelt komme fram tl. Dette skal v komme ærmere tlbake tl seere uder avsttet om hypotesetestge. Imdlertd skal v kort bemerke her at år MINITAB-utskrfte ederst Avedt Statstkk 4
44 på sde 3 agr e sg.(sgfkassasylghet på.3 betyr det at v forkaster påstade om at populasjoskorrelasjoskoeffsete er, og påstår at de er forskjellg fra. Rskoe ( sasylghete for at v tar fel er,3. Eks. Hvs det kke ser ut tl å være oe leær samme heg mellom de to varablee, som for eksempel de observerte sammehege: y 3 4,5 4 Spredgsdagrammet blr dee stuasjoe: 4 Scatterplot of y vs 3 y,,5 3, 3,5 4, MINITAB gr å: Correlatos: ; y Pearso correlato of ad y, P-Value, E ser av tabelle og spredgsdagrammet at det kke er oe tedes verke de ee eller adre retge, og dette bekreftes av tabelle som agr r,. Et klasssk eksempel på e slk stuasjo er sammehege mellom skoummer og tekt. Ma ka mdlertd kke kokludere at det er årssaksammeheg mellom to varable selv om ma fer e korrelasjoskoeffset som er sgfkat forskjellg fra. Det fes mage eksempler på såkalt oseskorrelasjo hvor ma ka sette samme data fra to varable e tabell og så få reget ut e korrelasjoskoeffset. Et par adre klassske eksempler på dette er sammehege mellom atall barefødsler og atall regstrerte storker Damark, eller sammehege mellom lærerløgee Norge og atall prester på Jamaca. Avedt Statstkk 4
45 Hvs ma ku har observerte y-verder og ge kjeskap tl de tlsvarede -verdee, og ma øsker å lage e progose så vl det være aturlg å bruke y. Har ma dermot også de tlhørede -verdee, og det er e vss gru tl å tro at det er e sammeheg mellom og y så ka ma bruke dee tlleggskuskape tl å lage e mye bedre progose. Ata at (, y er et av de observasjosparee, og at sammehege mellom og y er beskrevet ved de estmerte regresjoslje for mhp. y ( y ˆ a b. V deferer å det såkalte totalavvket ved y y, (eg.: total devato det såkalte forklarte avvket ved yˆ y (eg.: eplaed devato og det såkalte uforklarte avvket y yˆ. (eg.: ueplaed devato E ser at totalavvket forklart avvk uforklart avvk ( vs dette Geometrsk ser dette ut som følger: (,y y Totalavvk Uforklart avvk Forklart avvk. Nå ka det vses hvs ma hvert eeste pukt kvadrerer og summerer avvkee over at ( y y ( yˆ y ( y yˆ Avedt Statstkk 43
46 (hopp gjere over dee forklarge, me det krever kke så mye matematkk ut over det at ( a b a ab b og at summe av flere ledd ka summeres leddvs Dette uttrykker e ofte som følger: Total varasjo Forklart varasjo uforklart varasjo Legg merke tl at kvadrerte avvk (eg.: squared devato beteges med begrepet varasjo (eg.: varato. De uforklarte varasjoe kalles også ofte restvarasjo, og er de dele av totalvarasjoe som kke blr forklart av regresjosaalyse. Det er også valg å kalle X- e for e forklargsvarabel det verde av dee er med på å forklare verde av Y. E ae måte å tolke korrelasjoskoeffsete r på er ved følgede sammeheg: Det ka vses at r ( yˆ ( y y y Forklart varasjo y Total varasjo y Det betyr at de kvadrerte korrelasjoskoeffsete kommer ærmere og ærmere ettersom de forklarte varasjoe kommer ærmere og ærmere de totale varasjoe, ( husk at: Total varasjo Forklart varasjo Uforklart varasjo dvs at de uforklarte varasjoe ærmer seg. r agr dermed et mål på hvor god regresjosaalyse er, og er et forklargsmål. På egelsk kalles de ofte for the coeffeset of determato. Eks. V går å tlbake tl eksempelet på sde 8 hvor de observerte sammehege mellom og y var som følger y V fat her r,748 hvlket gr r,56. Dette betyr at dee regresjosaalyse forklarer X 56% av totalvarasjoe Y, hvlket gje betyr at 44% av totalvarasjoe Y forblr uforklart ( skyldes adre faktorer. Legger ma å dsse dataee på ytt MINITAB så får ma bl.a. følgede utskrfter ved å gjøre e regresjosaalyse Regresso Aalyss: y versus The regresso equato s y - 67,5,86 Avedt Statstkk 44
47 Predctor Coef SE Coef T P Costat -67,48 44,77 -,5,7,86,558 3,9,3 S 7,38448 R-Sq 56,% R-Sq(adj 5,5% Aalyss of Varace Source DF SS MS F P Regresso 555,36 555,36,8,3 Resdual Error 8 436,4 54,53 Total 9 99,6 Herav ser e bl.a. agvelse av de kvadrerte korrelasjoskoeffsete som stemmer med R,56, 748 som v bereget tdlgere. R R Square,56 I tllegg tl dette er 7 6 L 85 y 75, Dermed er det mulg å berege forklart varasjo og totalvarasjo ved å sette opp følgede tabell: y y y -5, -3, 5,8 6,8 -, -6, 7,8-8,,8 9,8 y ˆ y -, -8,,5 9,9 5,8-5,6 5, -4, -,7 -,3 Herav fer e og ( y y ( 5, ( 3, L 9,8 99,6 (Kotroller bereggee over. Dermed blr ( ˆ y y (, ( 8, L (,3 555, r ( yˆ ( y y y Forklart varasjo y Total varasjo y 555,,56 99,6 som stemmer med bereggee over. Avedt Statstkk 45
48 6. Ikkeleær regresjo V skal å se på hvorledes v ka bruke kalkulatore og MINITAB tl å bestemme adre treder e leære. Dvs. v skal se på e del ekle kkeleære fuksjoer f som passer tl de gtte dataee. Utgagspuktet er gje mste kvadraters metode, dvs v bestemmer fuksjoe f slk at ( yˆ f ( mmeres. Dette gjøres gje ved å partelldervere dette utrykket med hesy på de forskjellge parametree som går utrykket og sette alle dsse utrykkee lk. Dette gr p lkger med p ukjete hvs det er p parametre som går modelle. Kvadratsk regresjo. Ata at v å har et tallmaterale som har e tred hvor det er tydelg å se at det passer dårlg med e leær tlærmg. Eks. Ata at v har observert følgede sammeheg mellom og y: y Teger e spredgsdagrammet ser at det passer dårlg med e rettljet modell, me dermot bedre med e kvadratsk modell. Scatterplot of y vs 9 y V atar å at v har modelle y ˆ f ( a b c Avedt Statstkk 46
49 Lar å først MINITAB prøve å fe dee aegradsfuksjoe. E bruker da følgede kommadoer: STAT REGRESSION FITTED LINE PLOT QUADRATIC og fer. Ftted Le Plot y,9 3,4 -,685 ** S,355 R-Sq 86,7% R-Sq(adj 8,% 8 y E ser mao. at MINITAB foreslår at y ka estmeres ved hjelp av ˆ y f ( a b c,685 3,4,9 Er det mulg å kotrollere dee modelle? Ifølge mste kvadraters metode skal altså modelle bestemmes slk at ˆ ( yy ( y ( a b c mmeres. Dette utrykket er e fuksjo av de tre parametree a, b og c. Mmum av dee fuksjoe fer e av de tre lkgee : f ( a, b, c a f ( a, b, c b og f ( a, b, c c Nå ka det vses at dette fører tl følgede ormallkger: a a b c 3 b c 3 4 b c Dette er mao. tre lkger med de tre ukjete a, b og c. a y y y Avedt Statstkk 47
50 Å fe dsse summee og løse dette lkgssystemet er e tekologsk me overkommelg utfordrg på kalkulatore: Start med å legge - og y-verdee lste og. -varabelstatstkk på lste og lste gr da følgede summer: 4, For å fe de resterede 3 summee av L og L. Lag så 38, 3, y 57 og 4 og y 3 L 3 L og utfør -varabelstatstkk på y må e lage ye lster ved hjelp L. Dette gr da Lag deretter 3 L 4 L og utfør -varabelstatstkk på L 4. Dette gr: Tlslutt fer e (prøv selv 5437 y Lkgssystemet blr da på forme: 7a 4a 4b 38b 38c 88c a 88b 693c 5437 Dette ka løses på mage måter ved hjelp av kalkulatore. Bruker e matrseotasjo (forutsetter MAT 45 har e: a 7 b 4 c 38 Ved hjelp av kalkulatore fer e å a,685 b 3,4 c,9 som stemmer med bereggee MINITAB. Avedt Statstkk 48
51 Kubsk regresjo. Ata å at spredgsdagrammet har e form som gjør at det er mer aturlg å bruke e tredjegradskurve som modell, dvs ata at 3 y ˆ f ( a b c d Eks. Ata at ma å har observert følgede sammehørede verder mellom X og Y: X Y Spredgsdagrammet blr da: Scatterplot of y vs 9 y MINITAB gr å følgede modell med Ftted Le Plot: Ftted Le Plot y -,778 5,868 -,8768 **,3546 **3 y S,38 R-Sq 86,% R-Sq(adj 77,8% Avedt Statstkk 49
52 E fer mao. ˆ 3 3 y f ( a b c d,3546,8768 5,868,778 I oe sammeheger vl også e kubsk modell kue være bedre e e kvadratsk modell. Prøver v å å tlpasse e tredjegradskurve tl dataee eksempelet uder kvadratsk regresjo fer e: Ftted Le Plot y,59 4,58 -,5685 **,667 **3 y S,38957 R-Sq 89,4% R-Sq(adj 78,9% Nå ser e at forklargsgrade har økt fra 86,7% (kvadratsk modell tl 89,4% (kubsk modell Hvs ma prøver det tlsvarede på kalkulatore fer e etter å ha utført kommadoee STAT CALC 6:CubcReg ENTER L,L ENTER Teger e spredgsdagrammet samme med de fuee tredjegradskurve vser TI: Avedt Statstkk 5
53 E ser at dette stemmer perfekt med det som e fat MINITAB. Ser e ærmere på TI ser e at kalkulatore har et mye bedre utbygd apparat (flere mulgheter e det e fer på LeFt MINITAB. STAT CALC vser følgede mulgheter: E har tllegg tl leær regresjo (både yab og yab, kvadratsk regresjo ( modell ya^bc og kubsk regresjo (modell ya^3b^cd som MINITAB har også følgede: Med-Med regresjo som fer e leær regresjoslje som baser seg på å berege medae for -ee og for y-ee og la dsse legge grulaget for avvksmålee regresjosaalyse motsetg tl valg leæer regresjo hvor e bruker gjeomsttlg - verd og gjeomsttlg y-verd. Dette er fordelaktg år e har ekelte ekstremverder det medaee kke lar seg så lett påvrke av slke som gjeomsttee. Ser e å på eksempelet på sde 43 Avedt Statstkk 5
54 y hvor v brukte leær regresjo fer v å ved hjelp av Med-Med aalyse Mao. E fer å y -84,3,99 mot y -67,5,86. Prøv selv å fe ut hvlke av de to aalysee som har størst forklargsgrad. 7: QuartReg hvor modelle er de geerelle 4.gradskurve ya^4b^3c^de fer e kke MINITAB. E slk kurve ka være (geerelt ete på forme eller E behøver mdlertd kke ha et forløp som følger hele kurve. Prøver e å med e fjerdegradsmodell på eksempelet på sde 47 fer e følge TI: y,,6,478 4,594,48877 Avedt Statstkk 5
55 med e R, 879 mot R, 8944 med e tredjegradsmodell. Mao. e ltt dårlgere forklargsgrad. Spredgsdagrammet og de tlpassede fjerdegradskurve. kvadrat vser da følgede. Teger e hele kurve ser e at kurves forløp blr som følger: Nå skal ma mdlertd være svært forsktg med å bruke modelle for lagt ut over det området hvor ma har gjort se observasjoer. 9: LReg (logartmsk regresjo bruker modelle y abl. E atar å med adre ord at det er e leær sammeheg mellom Y og de aturlge logartme tl X. Det ma å gjør er først å berege de aturlge logartmee tl de observerte -verdee og deretter utførerer e valg leær regresjo på det ye tallmateralet ( y og l. Nå har v vst matematkkurset høst at y a b l y l A l b y l( A b der e har satt a l A Har e A,3 og b,45 vl kurve se ut som følger: Avedt Statstkk 53
56 : EpReg ( ekspoetell regresjo tar utgagspukt modelle y ab Herav har e l y l a l b l y A B Der e har satt l a A og l b B. Det betyr at å ka e utføre leær regresjo på tallmateralet beståede av de opprelge -verdee og de aturlge logartme tl de observerte y-ee, og deretter rege seg tlbake tl de opprelge modelle Dette er kke ødvedg med TI det e får resultatet drekte. Ata for eksempel at ma har observert følgede sammehag mellom og y: Bruker e å kommadoee y gr TI STAT CALC :EpReg L, L ENTER y,975 3,7 A:PwrReg (potesregresjo bruker modelle b y a Herav har e l y l a b l z A Bw dvs. at ma å ka utføre leær regresjo dataee ( w, z (l,l y. Igje så ka modelle fes drekte av TI ute å gå vee om leær regrsjo. Avedt Statstkk 54
57 Det fes også logstsk regresjo og sustlpasset regresjo, me dsse skal v kke komme på her. 7. Noe vktge kotuerlge fordelger. Setralgreseteoremet V skal å kort repetere oe vktge temaer fra de gruleggede dele av statstkkurset (ormalfordelge og setralgresesetge, me også ta opp e del adre vktge kotuerlge fordelger (t-fordelge, kjkvadratfordelge og Fsherfordelge som v kke har drøftet. Normalfordelge er ute tvl de vktgste av de kotuerlge fordelgee, for kke å s de vktgste av alle fordelger. Det skyldes prmært at mage varable prakss vser seg å være ormalfordelt eller tlærmet ormalfordelt. Mage varable ka dessute gjeom trasformasjoer bl ormalfordelte. Normalfordelge kalles også ofte Gaussfordelge etter de tyske matematker og flosof Carl Fredrch Gauss ( Mage dskrete og kotuerlge fordelger ka tlærmes med ormalfordelge (uder gtte betgelser. Mage av de testee og estmergstekkkee som v skal se på seere forutsetter at populasjoe er ormalfordelt. Av dee gru blr også ormalfordelge meget setral dette heftet. Hstogram of C4 Normal 7 6 Mea, StDev,4 N 5 5 Frequecy 4 3 7, 8,4 9,6 C4,8, 3, Dataee over er fremkommet ved å la MINITAB smulere 5 ormalfordelte data med µ, og σ,. dette gjøres ved å bruke kommadoee: CALC RANDOM DATA Normal Geerate 5 rows of data Sett Mea, og stadarddevato, Store (for eksempel C4 OK Avedt Statstkk 55
58 E ser at de 5 smulerte dataee gr et gjeomstt på, og et stadardavvk på,4. E ormalfordelg er teget samme med hstogrammet.. V skal å bare ledgsvs se på oe egeskaper kyttet tl ormalfordelge. Normalfordelgskurve er e etoppet symmetrsk glatt kurve. Toppuktet er ved µ som er gjeomsttet de teoretske fordelge (dvs. målet på setraltedes fordelge Ved hjelp av kalkulatore ka e tege ormalfordelge ved hjelp av kommadoee Y ND VARS :ormalpdf( X GRAPH Det er her vktg å passe på å la gå mellom -3 og 3, mes y går mellom og,5. E vl da få følgede blde: X er ormalfordelt med parametre µ ( E ( X ogσ ( Var( X Sasylghetstetthete f tl X er gtt ved Dette skrves ofte: I grafe over er µ og σ c X ~ N( µ, σ ( µ σ f ( e der < < π σ Sasylghete for at utvalg av ormalfordelte data skal lgge mellom det teoretske gjeomsttet mus et stadardavvk og det teoretske gjeomsttet pluss et stadardavvk er tlærmet,68. Det vl m.a.o. s at år ma har ormalfordelte data så Avedt Statstkk 56
59 vl ca. 68% av de som er med udersøkelse falle efor det evte tervallet over. Mer presst : Hvs X er ormalfordelt med parametre µ ( E ( X ogσ ( Var( X så er P ( µ σ < X < µ σ,687 TI 83 vser å Sasylghete for at utvalg av ormalfordelte data skal lgge mellom det teoretske gjeomsttet mus to stadardavvk og det teoretske gjeomsttet pluss to stadardavvk er tlærmet,95. Det vl m.a.o. s at år ma har ormalfordelte data så vl ca. 95% av de som er med udersøkelse falle efor det evte tervallet over. Mer presst : Hvs X er ormalfordelt med parametre µ ( E ( X ogσ ( Var( X så er P ( µ σ < X < µ σ,9545. TI-83 vser å. Hvs ma stedet for å gå stadardavvk går,96 stadardavvk vl sasylghete bl press,95. Dee kuskape vl ma få bruk for seere både uder estmerge og hypotesetestge. TI-83 vser å Avedt Statstkk 57
60 Hvs ma speselt har µ og σ så fremkommer de såkalte stadardormalfordelg som er e ormalfordelg som lgger symmetrsk omkrg.-akse. Det er valg å betege e stadardormalt fordelt varabel med Z, og ma skrver ofte Z ~ N(, Tabeller over dee fordelge fer ma de fleste statstkkbøker. Sammehege mellom e varabel X ~ N( µ, σ og e varabel Z ~ N(, er gtt som følger: Z X µ σ Det betyr m.a.o. at Z ~ N(, fremkommer ved at e vlkårlg ormalfordelt X stadardseres (reduseres med µ og dvderes med σ. Av resultatee over må ma dermed ha at P ( < Z <,687 og P ( < Z <,9545 Dette kotrollerer ma lett på kalkulatore ved kommadoee: d VARS :ENTER ormalcdf(-, ENTER som gr,68689 og helt aalogt gr ormalcdf( -,, Eks. Normalfordelge ka også med stor grad av øyaktghet brukes tl å berege dskrete sasylgheter. Ata at X er bomsk fordelt med og p,4 Da er P(X 45,8689. Tlærmet har v å ved hjelp av ormalfordelge: 45µ 45,4 P( X 45 P( Z P( Z P( Z,,846 σ,4 (,4 Bruker ma tllegg de såkalte,5-korreksjoe fer ma 45,5,4 P ( X 45 P( Z P( Z,,8686,4 (,4 som ku har e fel på,8689-,8686,3. Det går også a å agrpe tlærmgsbereggee drekte ute å gå vee om Z (de stadardserte varable. Ved hjelp av kalkulatore har ma da (med,5-korreksjoe: Avedt Statstkk 58
61 P ( X 45 Normalcdf ( 99, 45.5,.4,.4 (,4, der er det største egatve tallet kalkulatore ka gree. Det skulle egetlg være. I mage av de avedelsee v skal se på bryr ma seg kke om dee,5-korreksjoe. Helt tlsvarede ka ormalfordelge brukes tl å berege tlærmede verder for de hypergeometrske fordelg, Possofordelge, og egetlg alle fordelger som har e form som lker på ormalfordelge. Se for øvrg Lllestøls bok. De omvedte stuasjoe er også vktg. Dvs. Hvlke z-verd svarer tl gtt e sasylghet på,5? Dette og lkede problemer ( sasylghete er rskoe for å gjøre fel blr setrale estmergsteore og hypoteseprøvg. E bruker å ete e omvedt ormalfordelgstabell eller kalkulatores vnorm: som gr verde -,6449. d VARS 3: ENTER vnorm(.5 ENTER Tlsvarede fer vnorm(,95,6449 og vnorm(,99,363. E svært vktg setg som legger grulaget for e rekke avedelser av ormalfordelge er de såkalte Setralgresesetge: Ata at X, X, K, X er uavhegge stokastske varable med samme sasylghetsfordelg. Ata dessute at forvetge µ og stadardavvket σ populasjoe ekssterer. La å S X X L X Da ka det vses at : S er tlærmet ormalfordelt med forvetg µ og stadardavvk stor. Dermed at de stadardserte varable σ år er S µ ~ N (, ( tlærmet σ E har også at : Avedt Statstkk 59
62 X X L X σ X ~ N( µ, (tlærmet år er stor. Dermed vl de stadardserte varable X µ ~ N (, ( tlærmet σ M.a.o. E sum av stokastske varable ( alle med samme sasylghetsfordelg vl (uasett hva slags fordelg de følger være tlærmet ormalfordelt bare er tlstrekkelg stor. Det samme gjelder dermed også for gjeomsttet. Matematsk er dette et gaske tugt bevs som v selvfølgelg kke skal ta her. Det vses også at år så vl resultatee over være eksakte. Dette er e setg som har stor ytteverd det ma mage sammeheger kke kjeer populasjosfordelge, me bruker ofte metoder hvor ormalfordelg er e forutsetg. Det fes også mer geerelle versjoer av setge. t-fordelge: Hvs X ~ N( µ, σ så er X µ Z ~ N (, σ I de fleste stuasjoer så er mdlertdσ ukjet og må dermed estmeres. Tl dette formålet brukes utvalgsstadardavvket s gtt ved s ( Betrakter e å X µ s så ka det vses at dee er tlærmet ormalfordelt år er stor, me de er såkalt t- fordelt med v - frhetsgrader år er lte. De beteges med t. E har m.a.o. at t X µ ~ t s Det ka vses at t-fordelge er e e-toppet symmetrsk kurve som har samme symmetrpukt ( som ormalfordelge, og at t-fordelge ærmer seg ormalfordelge år vokser og blr stor. Sasylghetstetthete tl t er gtt ved Avedt Statstkk 6
63 f ( t v Γ( t ( v v πv Γ( v der Γ er de såkalte gammafuksjoe som er gtt ved et tegralutrykk. Det ka mdlertd vses at Γ ( Γ ( > og at Γ ( (-! N Dessute er Γ( π og Γ( Γ( Dette gjør det lettere å fe utrykket for t-fordelge år v er gtt. Ata f..eks. at atall frhetsgrader v 5. Da blr sasylghetstetthete tl t f ( t 5 Γ( t ( 5 5 π 5 Γ( ( t 5π 5 Hvs du teger dee samme med de stadardormale kurve så vl du se at t- fordelge har ltt tygre haler e ormalfordelge, me at de to kurvee for øvrg kke er så veldg forskjellge selv med ku v5 frhetsgrader, dvs. med ku 6 forsøk. Imdlertd ka ma ved å overse de forskjelle som allkevel er der ved et lte atall forsøk fort komme tl å trekke motsatt koklusjo år ma lager kofdestervaller eller gjeomfører hypoteseprøvg. På kalkulatore lgger både ormalfordelge og t-fordelge ( se: d VARS :ormalpdf og 4:tpdf. Hvs ma øsker å tege ormalfordelge og for eksempel t- fordelge med 5 frhetsgrader så går e på Y og skrver: Y ormalpdf ( X Y tpdf ( X,5 Trykker e å på GRAPH vl e få følgede grafske blde: Normalfordelge er de øverste av de to kurvee ær, og de som fortest ærmer seg.- akse. Avedt Statstkk 6
64 Lar e å atall frhetsgrader v øke så vl e se hvorledes t-fordelge ærmer seg ormalfordelge. I mage tabeller så stopper v på 3. Dvs at år >3 så ka e lke gjere bruke ormalfordelge stedefor t-fordelge. Teger du Y ormalpdf ( X Y tpdf ( X,3 så vl du skjøe hvorfor. E skal mdlertd være oppmerksom på at det selv opp mot v er forskjeller på de to fordelgee. V kommer mer tlbake tl dette seere uder estmerg og hypotesetestg. Arealer uder de to kurvee er vktge efor dette området. Bruker e å kalkulatore så har e for eksempel Uder ormalfordelge: P( X.96 Normalcdf (.96,^ ,5 Uder t-fordelge med 3 frhetsgrader: P( t.96 tcdf (.96,^99, V har m.a.o. ku e forskjell på,97-,5,47. Dette ka mdlertd ha e vss betydg hvs ma skal multplsere med et stort stadardavvk. χ (kjkvadrat-fordelge. De tredje av de kotuerlge fordelgee som v skal eve er kjkvadratfordelge. De er yttg år ma tar utvalg fra ormalfordelte (eller tlærmet ormalfordelte populasjoer. De ka brukes tl å teste om dataee kommer fra bestemte fordelger. (for eksempel: Er våre data ormalfordelte? De ka brukes tl å teste evetuell uavhegghet mellom varable. Det ka vses at hvs v X ~ N (, så er X ~χ (kjvadratfordelt med frhetsgrad, og hvs v X, X L, X er uavhegge og stadardormalfordelte varable ( dvs. X ~ N(,,,,, så er v X L χ (kjkvadratfordelt med frhetsgrader X X ~ Hvs X ~ χ v så er sasylghetstetthetsfuksjoe tl X gtt ved f ( v v Γ( ellers v e v, > der Γ er de såkalte gammafordelge gtt på sde 49. Avedt Statstkk 6
65 Hvs for eksempel v 6 ( atall frhetsgrader så er 6 3 f ( e e, > Γ( som er e etoppet høyreskjev kurve som lett lar seg tege ved hjelp av kalkulatore. For øvrg lgger også kjkvadratfordelge på kalkulatore. Øsker ma å tege kjkvadratfordelge over med 6 frhetsgrader drekte så bruker e som før 6 Y d VARS 6: χ pdf ( X,6 GRAPH så vl e få følgede grafske blde på kalkulatore: Når vokser vl forme på kjkvadratfordelge bl mer og mer lk ormalfordelge. Det ka vses at hvs X er kjkvadratfordelt med v frhetsgrader så vl e ha at for store v så er tlærmet X ~ N( v, v Prøv for eksempel med v 5 å tege χ -fordelge og ormalfordelge samme. La og Y χ pdf ( X,5 Y Normalpdf ( X,5, E ser da at det er helt ubetydelge forskjeller på de to kurvee. Arealer uder kjkvadratfordelge, og verder på.akse med gtte arealer (les sasylgheter er vktge efor områdee estmerg og hypotesetestg. Ata at X er kjkvadratfordelt med frhetsgrader. Da er for eksempel eksakt: P( X 3 χ cdf (3,^99,, Bruker e stede ormalfordelge fer e tlærmet: P ( X 3 Normalcdf (3,^99,, Avedt Statstkk 63
66 Fsherfordelge. De sste fordelge som v skal se på er de såkalte Fsherfordelge som er oppkalt etter e av verdes mest berømte statstkere gjeom tdee ( Sr Roald Fsher. De blr brukt forbdelse med såkalt varasaalyse, som skal brukes forbdelse med testg av flere (e tre gjeomstt opp mot hveradre og forbdelse med regresjosaalyseaalyse. X Hvs X ~ χ v og Y ~ χ v så ka det vses at Z ~ F v, v ( leses: er Fsherfordelt Y med v og v frhetsgrader. Mao. E Fsherfordelt varabel fremkommer ved å dele to kjkvadratfordelte varable på hveradre. Sasylghetstetthete tl Z er gtt ved : v v Γ( f ( z Γ( Γ( For øvrg så er f. v v ( v v v v ( z ( z for z >. v v v v Har e for eksempel v og v 4 får e 8 Γ(6 Γ(4 Γ( f z ( z ( z 3z ( z for z > ( Legger e dette utrykket på kalkulatore fremkommer følgede graf : E ser at grafe har e form som lker ltt på kjkvadratfordelge. De er etoppet og ærmer seg asymptotsk mot. Nå ka også Fsherfordelge hetes drekte på kalkulatore. Ved hjelp av kommadoee Y ND VARS DISTR Avedt Statstkk 64
67 8: FPdf( ENTER Y FP (,8,4 GRAPH X får e øyaktg samme graf som over. 8. Statstsk feres. V skal å ledgsvs repetere oe av de vktgste begrepee feres fra det gruleggede statstkkpesumet. Statstsk feres består av to hoveddeler som ble beteget med estmerg og hypoteseprøvg. Estmerg går ut på å aslå verder kyttet tl ukjete størrelser populasjoe. Hypoteseprøvg går ut på teste påstader kyttet tl de samme ukjete størrelsee. Estmerg. Puktestmerg. Ata at θ er e ukjet størrelse populasjoe (dvs e ukjet størrelse som går de sasylghetsfordelge som gjelder for populasjoe. E slk størrelse kalles e parameter. Det ka for eksempel være adele populasjoe som er for EU, adele defekte et varepart, alkoholkosetrasjoe blodet (oe tmer etter e fest osv. E slk størrelse er det ofte øskelg å kue aslå, dvs det v statstkke kaller å estmere. Når v skal estmere e parameter så betrakter v e stokastsk varabel, dvs e varabel vss verder det lage løp (hvs v gjør flere forsøk vl treffe det ukjete tallet θ som v er på jakt etter. E slk varabel kalles for e estmator, og beteges med Θˆ (les teta hatt. Se det greske alfabetet. Når forsøket er gjeomført ka v berege verde av estmatore Θˆ, som kalles for estmatet for θ, og beteges med θˆ. E god estmator Θˆ for θ er slk at E ( Θ ˆ θ. De kalles da for e forvetgsrett estmator.dvs. at gjeomsttsverde av Θˆ er det lage løp lk θ. Og de skal dessute være slk at Var(Θˆ er så lte som mulg. Dvs at spredge/uskkerhete kyttet tl Θˆ er så lte som mulg. Det fes forvetgsrette estmatorer som har mdre varas e alle adre forvetgsrette Avedt Statstkk 65
68 estmatorer ( hele uverset. Slke estmatorer kalles for mmum varace ubased estmator Ata at X ~ b(, p og at v øsker å estmere p som står for sasylghete for at det treffer e suksess hvert av de forsøkee. Uder avsttet om bomsk fordelg så evte v at E(X p. Herav ka det vses at I tllegg ka det vses at X E ( p X Var( p( p og at dee varase er mdre e varase tl alle adre forvetgsrette estmatorer for p. X P ˆ er m.a.o. de beste forvetgsrette estmatore for p som fes. Hvs ma å observerer X 38 så er dermed et forvetgsrett estmat for p, 38 p ˆ,38. Itervallestmerg. Når ma agr ett tall som estmat for de ukjete parametere så ser v at v puktestmerer. Nå er det mdlertd mye valgere å tervallestmere. Dvs å ag et tervall [ a, b] på tall-lja som med e vss sasylghet* eholder de ukjete parametere θ. Dee sasylghete kalles for kofdeskoeffsete. *Mer presst så represeterer dee sasylghete metodes påltelghet det e parameter kke er e varabel, og således kke ka ha e sasylghet kyttet tl seg. (dette gjøres mdlertd såkalt Bayesask statstkk som v kke skal komme på her Hvs ma øsker å ag et tervallestmat e bomsk stuasjo så ka det vses at ( ˆ( ˆ,96 p p ± pˆ ±,96 pˆ ±,96SE( pˆ daer utgagspuktet for å lage et 95% kofdestervall for p. Legg merke tl at kofdestervallet består av puktestmatet for p pluss/mus et såkalt felledd som eholder tallet,96 (arealet uder de ormalfordelte kurve mellom -,96 og,96 er akkurat,95 og et estmat for stadardavvket tl estmatore P ˆ X Avedt Statstkk 66
69 p ˆ( pˆ SE ( pˆ er et estmat for de såkalte stadardfele (stadarderror eller X stadarsavvket tl tl P ˆ. I e gallup utført av MMI for Dagbladet 8.desember 4 blat 86 stemmeberettgede er et estmat for Arbederpartets oppslutg 4,8% og for vestres oppslutg,7%. 95% kofdestervall for Arbederpartets og Vestres oppslutg blr da heholdsvs,48(,48,48±,96,48±,5 86,7(,7,7±,96,7±,6 86 Legg merke tl at pluss-mus-leddet er størst for Arbederpartet. Det skyldes at p ˆ( pˆ vokser med pˆ så lege pˆ er mellom og,5 (deretter avtar de år pˆ er mellom,5 og, Det ka m.a.o. vses at et 95% kofdestervall for e vlkårlg parameter θ ofte (ved symmetrske fordelger er på forme ˆ θ ±,96σ ( ˆ θ ˆ θ ±,96SE( ˆ θ m.a.o. estmatet for θ pluss-mus,96 multplsert med stadardavvket tl estmatore. De sste skrvemåte de sste skrvemåte er de mest brukte av de to. Forutsetge er at Θˆ ka tlærmes med ormalfordelge. SE (θˆ er verde av SE (Θˆ, som er stadardavvket tl estmatoreθˆ. I de fleste stuasjoer er SE (Θˆ ukjet, og må derfor estmeres. Det betyr at kofdestervallet atar forme ˆ θ ±,96SEˆ( ˆ θ der SE ˆ ( ˆ θ er et estmat for SE (Θˆ. Hvs ma øsker e større kofdeskoeffset (for eksempel 99% så erstattes,96 med,58 (vnorm(,5 og tervallet blr selvfølgelg bredere. I e del stuasjoer følger kke Θˆ ormalfordelge, me e ae fordelg som for eksempel t-fordelge eller kjkvadratfordelge. Dermed må ma fe fram de tlsvarede fraktle uder de gtte fordelge ( dette gjelder speselt år er lte. Kofdestervallet blr dermed på forme ˆ± f θ α SEˆ( ˆ θ Avedt Statstkk 67
70 der f er ( α / % fraktle de aktuelle fordelge, dvs. de verde på.- α akse som gr et areal på ( α / uder kurve tl vestre for dee (eller ekvvalet de verde på.-akse som gr et areal på α / uder kurve tl høyre for dee. Det betyr at arealet mellom og f er press ( α som er lk sasylghete som agr metodes påltelghet. f α α P.g.a. setralgresesetge så ka mdlertd ormalfordelge brukes år er stor de fleste stuasjoer. Hvs ma øsker å fe kofdestervall for dfferase mellom to adeler populasjoe, p p, så har e å følge resultatee over følgede 95% kofdestervall for p p: ˆ θ ±,96 ˆ( σ ˆ θ pˆ pˆ ±,96 pˆ ( pˆ pˆ ( pˆ der ˆp og ˆp er forvetgsrette estmater for heholdsvs p og p, og er atall elemeter de to uavhegge utvalgee. Ata for eksempel at ma er teressert å fe et kofdestervall for dfferase mellom adele me ( p og adele kver ( p Norge for EU. Ata ma har to uavhegge utvalg på heholdsvs 45 me og 45 kver, og ma fat at adele me for EU utvalget var ˆp,53, og de tlsvarede adele kver var ˆp,44. Da har ma følgede utgagspukt for å fe 95% kofdestervall for p p : pˆ pˆ ±,96 pˆ ( pˆ pˆ ( pˆ,53,44±,96,53(,53,44(, ,9±,3.. Mer presst: Vår metode påstår med e skkerhet på 95% at dfferase mellom adele me og adele kver for EU lgger mellom 6% og %. V ser også dermed at det er e sgfkat forskjell mellom adele me og adele kver som er for EU. Se for øvrg avsttet om hypoteseprøvg. Dvs. at kofdestervallett blr [,6;,] 9. Hypotesetestg. Hypotesetestg ( eller hypoteseprøvg går ut på å avgjøre om e påstad skal forkastes eller kke. Påstade som testes kalles for ullhypotese og beteges med H H testes alltd mot e alteratv hypotese H A ( eller H, dvs. dsse to påstadee stlles alltd opp mot hveradre. Avedt Statstkk 68
71 Som H brukes este* alltd de påstade som ma kke har tro på ( vl ha bret opp, mes H A er de påstade som ma har tro på. Hvs v forkaster H så påstår v at H A er rktg med e vss (lte sasylghet for å ta fel. * I vsse typer modellkotroll, for eksempel at ma har tro på at dataee er ormalfordelte, så lar e H være: dataee er ormalfordelt og håper på at H kke skal forkastes, dvs. e håper på å fe e stor P-verd. Eks. I USA hadde ma rudt 985 framstlt e meds, AZT,(beståede av bl.a. e bestemt type sopp som ma mete vrket mot AIDS. N85 paseter med lagt fremskrede AIDS ble delt tlfeldg to grupper. 43 paseter fkk AZT, og de resterede N- 4 pasetee fkk e arremeds. Ige av pasetee og ge av de som behadlet pasetee vsste hvem som var Behadlgsobjekter og hvem som var Kotrollobjekter. Dette kaller ma statstkke å gjøre dobbelte bldforsøk. Før forsøket ble gjeomført formulerte ma følgede H og H : H : AZT vrker kke mot AIDS og H : AZT vrker mot AIDS A Etter 6 md var 7 paseter døde og kode ble brutt. Da vste det seg at ma hadde fått følgede resultater ( dette meget brutale forsøket. Husk mdlertd at ma på de tde kke hadde oe meds mot AIDS, og at alle de 85 pasetee var så syke at de var oppgtt av helseveseet: A Res. etter 6md Gruppe Død I lve SUM Fkk AZT 4 43 Fkk arremed SUM E ser altså at av de 7 som var døde var hele 6 kotrollgruppa ( de som fkk arremeds. Når dette ble oppdaget så lot ma umddelbart alle pasetee få AZT. Det vste seg mdlertd etter ytterlgere oe måeder at AZT kke hadde oe helbredede effekt mot AIDS. Medse hadde ku de effekt at de mdlertdg bremset opp utvklge av AIDS. For å kue gjeomføre hypoteseprøvg treger ma data, og de sammeheg observerer v e stokastsk varabel X som v kaller for testobservatore. For å kue gjøre beregger må ma kjee fordelge tl X. I eksempelet over hvor dataee er gtt er det aturlg å la X atall paseter som er lve etter 6 md av de som fkk AZT ( eller X atall paseter som er døde etter 6 md av de som fkk AZT. Dette ka e velge frtt. Bereggee vdere blr mdlertd ltt forskjellge Avedt Statstkk 69
72 Hvs det er rmelg å forkaste H år X k så ser v at store verder av X er sgfkate, hvs det er rmelg å forkaste H år X k så ser v at små verder av X er sgfkate. Valget av X vl avgjøre om store eller små verder er sgfkate. I begge tlfeller kaller v k for de krtske verde. Hvs v eksempelet over velger X atall paseter som er lve etter 6 md av de som fkk AZT, så er store verder av X sgfkate ( det det er rmelg å forkaste påstade om at AZT kke har oe vrkg og påstå at de har vrkg år det er mage av behadlgsobjektee som er lve etter 6 md Velger v stede X atall paseter som er døde etter 6 md av de som fkk AZT, så er små verder av X sgfkate. Det betyr lte bereggsmessg om ma velger de ee eller de adre testobservatore. Krtsk verd k bestemmes slk at sasylghete for å gjøre fel blr lte. Mer presst betyr det at sasylghete for å forkaste H år H er rktg er lte blr lte. Valgst valg av dee sasylghete som beteges med α er,5. Hvs testobservatore er slk at H forkastes år X k ( store verder av X er sgfkate så bestemmes altså k slk at ( X k α P H Idekse H sgalserer at sasylghete skal bereges år H er rktg. Noe skrver dee sasylghete P X k H der er det valge symbolet som brukes år ma ( skal rege ut betgede sasylgheter( les gtt H. α kalles for testes sgfkasvå ( eller bare kortere testes vå. Noe gager ser ma også at α beteger sasylghete for å gjøre fel av type I. Ma ka også gjøre e ae fel ved hypoteseprøvg : Akseptere (godta H år H er gal (dvs år H A er rktg. Dee fele beteges med β og kalles for fel av type II. Hvs store verder av X er sgfkate, dvs. at H forkastes hvs X k, som gje betyr at H aksepteres hvs X < k så er β gtt ved: β PH A < ( X k E må vurdere hvert ekelt tlfelle hvlke fel som er vktgst å ugå. Eks. Hvs ma har plukket sopp som ma har stor tro på er spselg vl det være aturlg å teste H : Soppe er gftg mot H A : Soppe er spselg I dee stuasjoe vl fel av type I (forkaste H år H er rktg medføre at ma at påstår at soppe er spselg år de er gftg. Fel av type II (akseptere H år H er gal ( dvs år H A er rktg vl medføre at ma ser at soppe er gftg år de er spselg. E ser her at det er vktgst å ugå fel av type I. E ae vktg sasylghet kyttet tl hypoteseprøvg er de såkalte styrke. Dee agr sasylghete for å forkaste H år H er gal (dvs H A er rktg. Dee Avedt Statstkk 7
73 sasylghete beteges med π og bør være så stor som mulg. E har hvs store verder av X er sgfkate at Nå er Dermed ser e at π β PH A ( X k PH A < ( X k π β π vl (som β være avhegg av forskjellge verder av parametere uder alteratvet. E betrakter derfor ofte de såkalte styrkefuksjoe π (θ. Dee ka framstlles grafsk med θ lags førsteakse og styrke π lags adreakse. Dette er da e kurve som ka brukes tl å lese av styrke for ehver øskelg verd uder alteratvet. Jo brattere kurve går jo fortere stor blr dermed π og jo større er dermed sasylghete for å oppdage at H kke gjelder. Styrkefuksjoe kalles derfor for av og tl for oppdagelsesfuksjoe. I oe stuasjoer så brukes styrke et gtt pukt samme med vået tl å bestemme krtsk verd k og atall forsøk e treger gjøre. Eks. Går e å tl gallupeksempelet på sde 48 hvor Vestre har e oppslutg på,7% desembermålge, mes de valget hadde e oppslutg på 3,9% ka ma stlle spørsmålet om Vestre har hatt e sgfkat tlbakegag fra populasjosadele på,39 på 5%-vået. V tester derfor mot H H A : p,39 : p<,39 Både spørsmålet og H og H A bør formuleres før e ser dataee, ellers drver e såkalt datafskg. La å X atall persoer (av de 86 som har stemt Vestre. Små verder av X er sgfkate. Dvs. at H forkastes hvs X k. Krtsk verd k bestemmes slk at P H ( X k,5 For så store tall er det valgst å bruke ormaltlærmelse ( og rege tlærmet k,5 86,39 P ( X k P( Z,5( egetlg,5 86,39 (,39 Herav får e da følgede lkg k,5 86,39 86,39 (,39,645( egetlg,645 Avedt Statstkk 7
74 dvs. at k 86,39,5,645 86,39 (,39 3,8 Det betyr mao. at ullhypotese forkastes hvs X atall persoer (av de 86 som har stemt Vestre 3 ( sde X må være et heltall og vået kke skal overstge,5. Det betyr at hvs X 3 så forkastes påstade om at p, 39, og ma påstår at p <, 39 (vestre har fått e redusert oppslutg populasjoe. Sasylghete for at ma tar fel er <,5 (vået Nå er det faktsk akkurat 3 persoer (av de 86 som stemmer Vestre. Det betyr at H forkastes på 5%-vået. Reger ma stede ut P-verde har e dette tlfellet at dee blr 3,5 86,39 PH ( X 3 PH ( Z,375<,5 86,39 (,39 H : p,39 forkastes på 5%-vået. Nvået på teste er da egetlg,375. Hvs ma kke vet oe om Vestre har fått e tlbakegag eller framgag før ma ser tallee er det aturlg å teste H : p,39 mot H A : p,39 dvs. at ma tester med tosdg alteratv. Da vl H forkastes ete hvs k blr lte eller k blr stor dvs. k 86,39,5,96 86,39 (,39,98 eller k 86,39,5,96 86,39 (,39 45,5 Det betyr at H forkastes hvs X eller X 46. Hvs v å går tlbake gje tl de første stuasjoe med esdg testg hvor e hadde H A : p<,39 og atar (for eksempel at p,3 så vl sasylghete for å akseptere H år H er gal bl 3,5 86,3 β PH ( X > 3 P ( Z >, , 75 A 86,3 (,3 M.a.o e gaske stor sasylghet for å begå fel av type II. E ser også at styrke π β,5. Det er m.a.o. kke så stor sasylghet for å oppdage at vestre har fått e tlbakegag år det vrkelghete har skjedd. Avedt Statstkk 7
75 V skal å se på e del vktge klassske stuasjoer som er mye bruk avedelser. De bygger alle på dee ledede teore estmerg og hypoteseprøvg, me bærer mye preg av e kokebokoppskrft.. Iferes for ett populasjosgjeomstt. Hypotesetestg. Ata at v har e populasjo hvor det er e eller ae teressat størrelse med et gjeomstt på µ (ukjet eller evetuelt kjet fra tdlgere målger. Ata at ma å meer at det har skjedd edrger populasjoe slk at µ har edret seg på de ee eller adre måte. Dette er e stuasjo hvor e ka bruke feres. Ata at populasjosvarase σ er kjet (fra tdlgere eller lkede målger. Ata at v å øsker å teste H : µ µ mot et eller aet alteratv (esdg eller tosdg Vår testobservator er å Z Estmat hypoteseprøvgsverde s ta dardavvket tl estmatet X σ µ Legg merke tl at de måler dfferase mellom det gjeomsttet som ma å fer utvalget og det gjeomsttet ma har hatt populasjoe. I hehold tl setralgresesetge er Z ormalfordelt. Dette er vktg forhold tl de bereggee som v etter hvert skal gjøre. I: V ser å først på testg av H : µ µ mot H A : µ > µ Klasssk testg: H forkastes (det store verder av Z er sgfkate hvs z (verde av Z zα krtsk verd på vået α ( z α,645 hvs α, 5 Beregg av sgfkassasylghet (P-verd. P-verde ( Z P H z Avedt Statstkk 73
76 z α Eks. Ata at v øsker å teste H : µ 4,5 mot H : µ > 4, 5 med vået α, 5. Et tlfeldg utvalg på 5 vste et gjeomstt på 4,8. Krstsk verd z, 5 er å,645. De fer e som vst gruleggede statstkk ved hjelp av TI og følgede kommadoer: Kalkulatore vser da ND VARS 3: vnorm ENTER.95 ENTER A Nå blr verde av testobservatore 4,8 4,5 z,5,6 E ser da at z,5>, 645 krtsk verd. Koklusjoe blr dermed at H : µ 4, 5 forkastes på 5%-vået og v påstår dermed H : µ > 4, 5. 5 A Bereger e å alteratvt P-verde fer e ved hjelp av kalkulatore følgede : P H ( Z P H ( Z,5,6 z Sde dee er mdre e vået på,5 så ser e at ullhypotese forkastes på 5%- vået. Det e mdlertd også ser er at H forkastes helt ed tl,6%-vået. Forklar hvorfor. Beregge av P-verde gjøres med følgede kommadoer: Avedt Statstkk 74
77 Kalkulatore vser å: ND VARS :ormalcdf( ENTER.5, 99 ENTER Velger e å å bruke kalkulatores testpakke fer e ved følgede kommadoer: STAT TESTS :Z-Test ENTER Her må e å legge de gtte verdee for µ, σ, og. Dessute må kalkulatore få vte hva alteratvet skal være. E får da følgede blde på kalkulatore: Her fortelles kalkulatore at det skal teges e ormalfordelg og ags e p- verd.(kommadoe Draw er skjult bak det svarte feltet helt ederst tl høyere, kurser står her og blker, og dette resulterer det svarte feltet Trykker e ENTER får e følgede resultat: Velger e stede kommadoe CALCULATE får e følgede resultat: Avedt Statstkk 75
78 Prøver å å bruke MINITAB for å løse de samme oppgave. E gjør da bruk av følgede kommadoer: Stat Basc Statstcs Z Sample Z.. Her må e så velge alteratvet Summarzed data, og deretter legge Sample sze på 5, Mea på 4,8, Stadarddevato på,6, test mea på 4,5 og tlslutt uder optos velge alteratvet greater tha. Velger e så OK får e følgede utskrft: Oe-Sample Z Test of mu 4,5 vs > 4,5 The assumed stadard devato,6 95% Lower N Mea SE Mea Boud Z P 5 4,8, 4,66,5,6 MINITAB gr ge grafkk ved Summarzed data. II: Ata at v å øsker å teste H : µ µ mot H A : µ < µ Ved klasssk testg så forkastes H hvs z (verde av Z z α.(nå er små verder av testobservatore sgfkate α krtsk verd på vået Avedt Statstkk 76
79 - z α Krtsk verd er å det samme som ved testge uder I, me med motsatt forteg. P-verde blr å ( Z P H z III: Ata at v å øsker å teste H : µ µ mot H A : µ µ Ved klasssk testg så forkastes å H hvs z z α eller hvs z z α.(nå er både små og store verder av testobservatore sgfkate Prøv å forklare hvorfor! - z α z α P-verde blr å ( Z der z som fora er de observerte verde av Z. Legg P H z merke tl at e multplserer med ford ma å drver med tosdg testg. Eks. Ata at v øsker å teste H : µ 7,3 mot H : µ 7, 3 med vået α, 5. Et tlfeldg utvalg på 3 vste et gjeomstt på 6,9. Krtsk verder - z, 5 og z, 5 er å -,96 og,96. z, 5 fer e som vst gruleggede statstkk ved hjelp av TI og følgede kommadoer: A Avedt Statstkk 77
80 ND VARS 3: vnorm ENTER.975 ENTER Hvorfor brukes verde,975? De tlsvarede egatve krtske verde - z, 5 er de som (p.g.a. symmetr har motsatt forteg av de krtske verde v fat. Ved klasssk testg så forkastes mao. å H hvs z, 96 eller hvs z, 96. Nå blr verde av testobservatore 6,9 7,3 z,83, 3 E ser da at z,83>, 96 krtsk verd. Koklusjoe blr dermed at H : µ 7, 3 kke ka forkastes på 5%-vået. Bereger e å alteratvt P-verde fer e ved hjelp av kalkulatore følgede : P H ( Z P H ( Z,83,679 z Dette fer e ved hjelp av følgede kommadoer på kalkulatore Kalkulatore vser å: ND VARS :ormalcdf( ENTER - 99,-.83 ENTER Kofdestervall. Ata å som fora at v har e ormalfordelt populasjo hvor det er e eller ae teressat størrelse med et gjeomstt på µ (ukjet eller evetuelt kjet fra tdlgere målger. Ata at ma å meer at det har skjedd edrger populasjoe slk at µ har edret seg på de ee eller adre måte. Dette er e stuasjo hvor e ka bruke feres. Ata at populasjosvarase σ er kjet (fra tdlgere eller lkede målger og at v å øsker å fe et kofdestervall for µ. V tar også å utgagspukt varabele X µ Z σ Avedt Statstkk 78
81 som v gjorde ved hypoteseprøvge. Hvs v å øsker et ( α% kofdestervall for µ og Z er ormalfordelt må følgede gjelde: Herav har e da P ( z Z z α α α X µ P ( zα zα α σ V skal å behadle de dobbelt ulkhete e paretese som v løser e hvlke som helst valg dobbel ulkhet a type 5 4 m.h.p. slk at v å blr ståede med e ulkhet kyttet tl µ tlsvarede at ulkhete med gr dvs dvs dvs 3 3 Løs ulkhete selv både algebrask og geometrsk. Legg merke tl at ulkhete kue vært skrevet Nå skal v bruke de samme framgagsmåte på ulkhete z α X µ z σ α hvor å µ svarer tl ulkhete over. E får å: z α σ X µ z α σ ved å multplsere med og får σ på begge sder. Deretter trekker v fra X over hele ulkhete Avedt Statstkk 79
82 Avedt Statstkk 8 z X z X σ µ σ α α Ved så tl slutt å multplsere med (- over hele ulkhete fremkommer z X z X σ µ σ α α Det betyr mao. følge α σ µ α α ( z X z P at e dermed må ha at α σ µ σ α α ( z X z X P Ma ser da at tervallet [ ] z X z X B A σ σ α α,, daer et (-α % kofdestervall for µ. Legg merke tl at utrykket α σ µ σ α α ( z X z X P er det X som er varabele, mes µ er e kostat (de ukjete parametere. Når utvalget er kjet er verde av X,, også kjet. Dermed blr det beregede ( α % kofdestervallet for µ : [ ] z z b a σ σ α α,, der a z σ α og b z σ α kalles heholdsvs edre og øvre kofdesgrese. Forutsetge for at dette gjelder er at populasjoe er ormalfordelt (se sde.. eller at 3. Det sste er kke evt tdlgere me bygger på det faktum at (se gruleggede statstkk, Lllestøl sde. X Z σ µ er ormalfordelt (tlærmet år 3 (jo større jo bedre tlærmelse selv om populasjoe kke er ormalfordelt. Det betyr at
83 σ σ [ a, b] z, z α er et (-α % kofdestervall for µ selv om populasjoe kke er ormalfordelt forutsatt at σ er kjet og 3. Dessute vl da s s [ a, b] zα, zα være et (-α % kofdestervall for µ år populasjoe kke er ormalfordelt, σ er ukjet og 3. α Eks. Ata at det er tatt et utvalg på observasjoer fra e ormalfordelt populasjo hvor σ,8 og at ma fat følgede verder av varabele X : : 4,5; 3,7; 4,9; 5,3; 6,; 3,9; 5,; 5,5; 5,9; 3,9; 4,8; 5, Legger e dette e lste på kalkulatore gr -Vars Stats blat aet følgede: Det betyr at et 95% kofdestervall for µ dermed blr: σ σ,8,8 [ a, b] z, z 4,89,96,4,89,96 [ 4,44; 5,34] α α Vær oppmerksom på at det kke er µ som med e sasylghet på,95 lgger mellom 4,44 og 5,34. Dette er e valg msforståelse. Grue tl det er at µ er e kostat og at det dermed kke er mulg å kytte e sasylghet tl dee. Dette er forbeholdt varabler. Hva betyr så resultatet over? Resultatet skal tolkes som følger: Det er metodes påltelghet som er agtt ved,95. Alteratvt ka ma s at det det her går e varabel emlg X.,8,8 P ( X,96 µ X,96,95 Hvs ma å øsker å bruke kalkulatores statstkkfuksjoer optmalt bruker e å følgede kommadoer: Avedt Statstkk 8
84 STAT TESTS 7: ZIterval Data Legger e her sgma,8 ; 4,89( vl e ha følgede blde: Bak det markerte feltet har kommadoe Stats. Ved kommadoe Stats må gjeomsttet og stadardavvket reges ut først og så legges her. Går e å ed tl Calculate og trykker ENTER får e følgede blde: E ser at dette stemmer med de resultatee over. hvs ma har lagt dataee e lste (f.eks.lste ka e lke gjere bruke kommadoe Data. Prøv dette selv. Legg da merke tl at kalkulatore også bereger utvalgsstadardavvket s,78. I MINITAB er de tlsvarede kommadoee: Stats Basc Statstcs Z: -Sample Z Summarzed data E legger så atall observasjoer, deres gjeomstt og verde av sgma. Resultatet av dette blr da: Oe-Sample Z The assumed stadard devato,8 N Mea SE Mea 95% CI 4,8967,394 (4,4393; 5,3443 som gje stemmer med resultatet fora. Avedt Statstkk 8
85 Også MINITAB ka ma legge resultatee e lste og referere tl dee år ma skal lage kofdestervall. Forutsetge for at formele for kofdestervallet gjelder er at populasjoe er ormalfordelt (se sde.. eller at 3. Det sste er kke evt tdlgere me bygger på det faktum at (se gruleggede statstkk, Lllestøl sde. Z X µ σ er ormalfordelt (tlærmet år 3 (jo større jo bedre tlærmelse selv om populasjoe kke er ormalfordelt. Det betyr at σ σ [ a, b] z, z α er et (-α % kofdestervall for µ selv om populasjoe kke er ormalfordelt forutsatt at σ er kjet og 3. Dessute vl da s s [ a, b] zα, zα være et (-α % kofdestervall for µ år populasjoe kke er ormalfordelt, σ er ukjet og 3. Eks. Ata at ma har tatt et utvalg på 4 fra e populasjo (som kke ødvedgvs kke er ormalfordelt og hvor populasjosstadardavvket er ukjet. Ma fat et gjeomstt 3,6 og et stadardavvk s 4,7 utvalget. Da får e følgede 95% kofdestervall for populasjosgjeomsttet µ : [ a, b] z, z 3,6,96 ; 3,6,96 [,4; 5,6] α s α s 4,7 4 α 4,7 4 Ata å at populasjoe er ormalfordelt, < 3 og at σ er ukjet. Da betrakter ma µ t stedefor s der t er verde av varabele z µ σ Avedt Statstkk 83
86 T X µ S som følge teore sde følger t-fordelge med ( - frhetsgrader ( ofte skrevet som d.f. ( -; der d.f. er forkortelse for degrees of freedom I: V ser å gje først på testg av H : µ µ mot H A : µ > µ Klasssk testg: H forkastes (det store verder av T er sgfkate hvs t (verde av T t krtsk verd på vået α ( α t α,79 hvs α, 5 og (dvs. at d.f.9 Beregg av sgfkassasylghet (P-verd. P-verde ( T P H t Eks. Ata at ma har tatt et utvalg på fra e ormalfordelt populasjo hvor det tl å har vært et gjeomstt på 7,5. Det er sgaler som å tyder på at dette har økt. Ma øsker å gjeom hypotesetestg å avgjøre om dette er tlfellet. Utvalget gr et gjeomstt på 7,9 og et stadardavvk på,. V tester å H : µ 7,5 mot H : µ > 7, 5 Det betyr å at H forkastes hvs verde av T blr mst,79, dvs hvs t,79. E fer å A t µ 7,9 7,5,85<,79 s, Det er mao. kke sterke ok sgaler om at det er gru tl å påstå at µ > 7, 5. Reger e alteratvt ut P-verde fer e PH ( T t P ( T,85,3 H Det sste fer e ved å bruke kalkulatore og følgede kommadoer: ND VARS 5:tcdf( ENTER.85, ^99, 9 ENTER Avedt Statstkk 84
87 Dette gr følgede blde: Velger e alteratvt å bruke kalkulatores statstkkfuksjoer optmalt fer e ved følgede kommadoer: STAT TESTS :T-Test ENTER Stats Legger e så µ 7.5, 7,9, s., µ > µ og Calculate får e følgede blde: : Velger e stede kommadoe Draw stedefor Calculate får e følgede blde: Her er t-fordelge med 9 frhetsgrader teget. Det skraverte arealet er lk P-verde som e ser er,5. Øsker e å bruke MINITAB må e g følgede kommadoer: Stat Basc Statstcs -t sample Summarzed data Avedt Statstkk 85
88 og legge Sample sze, Mea 7,9, Stadard devato,, Test Mea 7,5 og velg så tlslutt uder Optos alteratvet greater tha. Dette resulterer følgede utskrft: Oe-Sample T Test of mu 7,5 vs > 7,5 95% Lower N Mea StDev SE Mea Boud T P 7,9,, ,884,85, Dette ser e stemmer med resultatee fora. I tllegg er det agtt et 95% esdg kofdestervall. Prøv selv å berege dette. Vk: Ta utgagspukt og bruk T X µ S X µ P ( zα α S tl å vse at et ( α % esdg kofdestervall for e edre grese forµ blr s [, t, a α II: V ser så på testg av H : µ µ mot H A : µ < µ Klasssk testg: H forkastes (det små verder av T er sgfkate hvs t (verde av T t krtsk verd på vået α α t α Avedt Statstkk 86
89 Beregg av sgfkassasylghet (P-verd. P-verde ( T. Her vl valgvs t være egatv (hvorfor det? P H t III. Tlslutt ser v så på testg av H : µ µ mot H A : µ µ som v tdlgere har kalt -sdg testg. Her er både store og små verder sgfkate. Det betyr ved testg på vået α : Ved klasssk testg at H forkastes hvs t (verde av T t α eller hvs krtske verdee på vået α t t α de Eks.Ata at ma har tatt et utvalg på 5 fra e ormalfordelt populasjo hvor det tl å har vært et gjeomstt på 6. Det er sgaler som å tyder på at dette har edret seg. Ma øsker å gjeom hypotesetestg å avgjøre om dette er tlfellet. Utvalget gr et gjeomstt på 5, og et stadardavvk på,. V tester å H : µ 6, mot H : µ 6, Hvs v å øsker et vå 5% betyr det at H forkastes hvs verde av T blr mst,45 eller høyst -,45; dvs hvs t,45 eller t, 45. E fer å A t µ 5, 6,,95<,45 s, 5 E ser mao. at resultatet er sgfkat på 5%-vået, dvs. at H : µ 6, forkastes tl fordel for H : µ 6, med e sasylghet på høyst,5 for at v tar fel. A Hvs v stede bereger P-verde fer v dee ved: ( T,95 tcdf ( ^99,.95,4,5 P H som gr samme koklusjo som over me med de forskjell at sasylghete for at v å tar fel å ku er,5. Hvorfor multplseres det med? Hvs ma å bruker kalkulatore optmalt med kommadoee: STAT TESTS :T-Test Stats Avedt Statstkk 87
90 ,legger de gtt dataee, velger alteratvet µ : µ og tlslutt Calculate får e følgede resultat: Gå å selv og bruk MINITAB for å se at du får samme resultat. Kofdestervall. V skal å se på hvorledes kofdestervallee ser ut de tlfellee v må bruke t- fordelge. Ata å som fora at v har e ormalfordelt populasjo hvor det er e eller ae teressat størrelse med et gjeomstt på µ (ukjet eller evetuelt kjet fra tdlgere målger. Ata at ma å meer at det har skjedd edrger populasjoe slk at µ har edret seg på de ee eller adre måte. Dette er e stuasjo hvor e ka bruke feres. Ata at populasjosvarase σ er ukjet og hvor <3. V øsker å gje å fe et kofdestervall for µ. V tar utgagspukt varabele T X µ s som v gjorde ved hypoteseprøvge. Hvs v å øsker et ( α% kofdestervall for µ og T er t-fordelt med (- frhetsgrader må følgede gjelde: Herav har e da P ( t T t α α α X µ P ( tα tα α s Helt aalogt tl hva v gjorde på sde 77/78 ka v å utlede følgede ( α% kofdestervall for µ : s s [ a b] t, t, α α Avedt Statstkk 88
91 Prøv selv og se om du får det tl (ute å se etter på sde 78 Eks. Ata at det er tatt et utvalg på observasjoer fra e ormalfordelt populasjo hvor σ er ukjet og at ma fat følgede verder av varabele X : (se eks. sde 8 : 4,5; 3,7; 4,9; 5,3; 6,; 3,9; 5,; 5,5; 5,9; 3,9; 4,8; 5, Legger v dsse tallee e lste på kalkulatore (for eksempel lste gr (som før gr STAT CALC :-Var Stats ENTER ND ENTER (bl.a. følgede : Herav fer e de ødvedge målee e treger for å berege kofdestervallet med utak av α t α ( fraktle t-fordelge. t α Øsker e å et 95% kofdestervall fer e t α t,5, år e som her har d.f. (hvorfor Avedt Statstkk 89
92 E fer å følgede 95% kofdestervall for µ. s, t,5, t, 5 [ a b] s,77864, ,8967,,4,8967, [,397;,386] Hypotesetestg og kofdestervall. Det er e ær sammeheg mellom tosdg hypoteseprøvg og kofdestervaller. (Det er også e sammeheg mellom esdg hypoteseprøvg og kofdestervaller, me da må v først utlede såkalt esdge kofdestervall og det skal v kke komme på her dette heftet. Ata at v øsker å teste H : µ µ mot H A : µ µ På vået α. Ata at v har fuet et ( α% for µ. Ata at dette tervallet basert på dataee ma har blr [ a, b] (mao. fra og med a tom. b. Da gjelder følgede: Hvs µ [ a, b] (mao. hvs µ kke faller efor kofdestervallet så forkastes H : µ µ på vået α. Sde v ved hypotesetestg ku har to alteratver så vl v kke forkaste H : µ µ på vået α hvs µ [ a, b]. Eks. Hvs v å gjeomfører testge av H : µ 6, mot H : µ 6, (se eks. sde 86 ved hjelp av et 95% kofdestervall fer e først kofdestervallet Eks.Ata at ma har tatt et utvalg på 5 fra e ormalfordelt populasjo hvor det tl å har vært et gjeomstt på 6. Det er sgaler som å tyder på at dette har edret seg. Ma øsker å gjeom hypotesetestg å avgjøre om dette er tlfellet. Utvalget gr et gjeomstt på 5, og et stadardavvk på,. V tester å H : µ 6, mot H : µ 6, Hvs v å øsker et vå 5% betyr det at H forkastes hvs verde av T blr mst,45 eller høyst -,45; dvs hvs t,45 eller t, 45. E fer å A A, 5 [ a, b] t, t 5..45, [ 4.44, 5.76] α s α s, 5 Avedt Statstkk 9
93 Det betyr mao. at H : µ 6, forkastes på 5%-vået det 6, a. µ [, b] [ 4.44, 5.76]. Iferes for to populasjosgjeomstt. Ata at v har to ormalfordelte populasjoer med hvert stt gjeomstt (ukjet eller evetuelt kjet fra tdlgere målger. Ata at dsse er heholdsvs µ og µ. Tl å er det all gru tl å tro at µ µ, me å meer ma at det har skjedd edrger populasjoee slk at µ og µ har edret seg på de ee eller adre måte. Dette er e stuasjo hvor e ka bruke feres. Ata at populasjosvarasee σ og σ er kjete (fra tdlgere eller lkede målger, og at det tas uavhegge tlfeldg utvalg fra de to populasjoee på heholdsvs og. Ata at v å øsker å teste H : µ µ (det er ge forskjell på de to populasjosgjeomsttee mot et eller aet alteratv (esdg eller tosdg Vår testobservator er å Z Estmat hypoteseprøvgsverde s ta dardavvket tl estmatet X X ( σ µ µ σ X σ X σ år H er rktg (hvorfor det?. Legg merke tl at testobservatore måler dfferase mellom dfferase av utvalgsgjeomsttee og dfferase av populasjosgjeomsttee år H er rktg. Dette er e størrelse som hehold tl setralgreseteoremet er ormalfordelt. I: V ser å først på testg av H mot H A : µ > µ : µ µ Klasssk testg: H forkastes (det store verder av Z er sgfkate hvs z (verde av Z zα krtsk verd på vået α ( z α,645 hvs α, 5 Beregg av sgfkassasylghet (P-verd. P-verde ( Z P H z Avedt Statstkk 9
94 z α Eks. Ata at ma øsker å teste : µ µ H mot H A : µ > µ med vået α,5. Det blr tatt to uavhegge tlfeldge utvalg på heholdsvs 3 og fra de to populasjoee og ma fer X, 6 og X, 8. Ata at de to populasjosvarasee σ og σ er heholdsvs,4 og 3,. Ved klasssk testg fer e å at H : µ µ kke forkastes på 5%-vået det z,6,8,<,645 (krtsk verd på 5%-vået,4 3 3, Bereger e å alteratvt P-verde fer e ved hjelp av kalkulatore følgede : P H ( Z P H ( Z,,5 z Sde dee er større e vået på,5 så ser e at ullhypotese kke ka forkastes på 5%-vået. Beregge av P-verde gjøres med følgede kommadoer: ND VARS :ormalcdf( ENTER 99,, ENTER Kalkulatore vser å: Avedt Statstkk 9
95 Velger e å å bruke kalkulatores testpakke fer e ved følgede kommadoer: STAT TESTS 3: -SampZtest ENTER Her må e å legge de gtte verdee for X og X, de to populasjosvarasee og σ og tlslutt verdee av og Dessute må kalkulatore få vte hva alteratvet skal være. E velger her H A Da får e følgede blde på kalkulatore: : µ > µ σ Velger e å kommadoe CALCULATE får e følgede resultat. Velger e stede kommadoe Draw får e følgede resultat: Prøver å å bruke MINITAB for å løse de samme oppgave. E gjør da bruk av følgede kommadoer: Avedt Statstkk 93
96 Stat Basc Statstcs t Sample t.. Her må e så velge alteratvet Summarzed data, og deretter legge sample sze på 3 og, mea på,6 og,8, stadarddevato på,55 og,76 og tlslutt uder optos velge alteratvet greater tha. Velger e så OK får e følgede utskrft: Two-Sample T-Test ad CI Sample N Mea StDev SE Mea 3,6,55,43,8,76,5 Dfferece mu ( - mu ( Estmate for dfferece:,8 95% lower boud for dfferece: -,3485 T-Test of dfferece (vs >: T-Value, P-Value, DF Legg merke tl at v her må bruke e t-test det MINITAB kke dekker dee stuasjoe. Det betyr at ma følge utskrfte brukes df. stedefor df. som er stuasjoe hvs ma skal bruke ormalfordelge som gjort med kalkulatore over. Dette blr dermed e tlærmg. Dette ser e bl.a. av forskjelle P-verdee som er,47 ved ormalfordelge (kalkulator og, ved t-fordelge(minitab. Grue tl at MINITAB kke dekker dee stuasjoe er de sjelde brukes prakss. Dette skyldes at det er svært sjelde at ma kjeer stadardavvket e populasjo mes gjeomsttet er utkjet. II: V ser så på testg av : µ µ H mot H A : µ < µ Klasssk testg: H forkastes (det små verder av Z er sgfkate hvs z (verde av Z zα krtsk verd på vået α ( z α -,645 hvs α, 5 Beregg av sgfkassasylghet (P-verd. P-verde ( Z P H z z α Avedt Statstkk 94
97 Eks. Ata at ma øsker å teste : µ µ H mot H A : µ < µ med vået α,5. Det blr tatt to uavhegge tlfeldge utvalg på heholdsvs 5 og 7 fra de to populasjoee og ma fer 8, og 8, 8. Ata at de to populasjosvarasee σ og σ er heholdsvs,5 og,7. Ved klasssk testg fer e å at H : µ µ forkastes på 5%-vået det 8, 8,8 z, 7< -,645 (krtsk verd på 5%-vået,5,7 5 7 Bereger e å alteratvt P-verde fer e ved hjelp av kalkulatore følgede : P H ( Z P H ( Z,7,435 z Sde dee er mdre e vået på,5 så ser e at ullhypotese forkastes på 5%- vået. Beregge av P-verde gjøres med følgede kommadoer: ND VARS :ormalcdf( ENTER 99 -,-,7 ENTER Velger e å å bruke kalkulatores testpakke fer e ved følgede kommadoer: STAT TESTS 3: -SampZtest ENTER Her må e å legge de gtte verdee for X og X, de to populasjosvarasee og σ og tlslutt verdee av og Dessute må kalkulatore få vte hva alteratvet skal være. E velger her H A E får da følgede blde på kalkulatore: : µ < µ σ Avedt Statstkk 95
98 Velger e så kommadoe CALCULATE vser kalkulatore: Velger e alteratvt kommadoe får e følgede blde: III: V ser så tlslutt på testg av : µ µ H mot H A : µ µ Dette er e test som brukes år e har mstake om at gjeomsttee er forskjellge, me e kke vet oe apror om hvlke av de som er størst. Dette ka som fora gjeomføres ete ved klasssk testg eller ved beregg av p-verde eller evetuelt bruk av kofdestervall. Klasssk testg: H forkastes (det både store og små verder av Z er sgfkate hvs z (verde av Z eller z ( z,96 hvs α, 5 ( se fgur este sde z α z α Beregg av sgfkassasylghet (P-verd. P-verde ( Z α P H z Avedt Statstkk 96
99 z α z α Bereg ( α% kofdestervall. Eks.. Ata at ma øsker å teste H : µ µ mot H A : µ µ med vået α,5. Det blr tatt to uavhegge tlfeldge utvalg på heholdsvs 35 og 38 fra de to populasjoee og ma fer 8, 5 og 9,. Ata at de to populasjosvarasee σ og σ er heholdsvs,5 og 3,7. Ved klasssk testg fer e å at H : µ µ kke ka forkastes på 5%-vået det 8,59,,5 35 3,7 38,7>,96 z.5 Hvs e stede øsker å berege 95% kofdestervall må dette først utledes: Kofdestervall. Ata å som fora at v har to ormalfordelte populasjoer med gjeomstt heholdsvs µ og µ. Ata at populasjosvarasee σ ogσ er kjete (fra tdlgere eller lkede målger og at v å øsker å fe et kofdestervall for dfferase mellom µ og µ. V tar å utgagspukt varabele Z X X ( µ µ σ σ som v gjorde ved hypoteseprøvge. A v å øsker et ( α% kofdestervall for µ - µ. Ford Z er ormalfordelt må e ha : Avedt Statstkk 97
100 Avedt Statstkk 98 α α α ( z Z z P Herav har e da α σ σ µ µ α α ( ( z X X z P Dvs. α σ σ µ µ σ σ α α ( ( z X X z P Dvs. α σ σ µ µ σ σ α α ( ( ( ( z X X z X X P Dvs. α σ σ µ µ σ σ α α ( ( (( z X X z X X P Herav har e mao. at ( α % kofdestervall for µ - µ (år dataee er gtte er (, ( z z σ σ σ σ α α I vårt eksempel fer e dermed følgede 95% kofdestervall: 38 3,7 35,5,96 9, 8,6, 38 3,7 35,5,96 9, 8,5 ( [ ],3,3; Her av ser e at verde av µ - µ uder H er eholdt kofdestervallet og dermed har e at H kke ka forkastes på 5%-vået. Prøv selv å berege P-verde og se at du får samme koklusjo som over.
101 Hvs ma øsker å kotrollere dsse bereggee ka det gjøres ved hjelp av kalkulatores statstkkfuksjoer: STAT TESTS 3: -SampZtest ENTER Her må e å huske å be om tosdg testg, dvs velge H A : µ µ. Dette gr da følgede resultat: Legg merke tl at det å er skravert to arealer med e samlet verd på,36. dette kommer av ma tester tosdg og da er både store og små verder av testobservatore sgfkate. Sjekk at de P-verde du fat ved drekte regg stemmer med dette resultatet. (Vk: Husk at P-verde P ( Z,7 Hvs å σ og σ er ukjete har ma et problem som løses ved at ma testobservatore Z Estmat hypoteseprøvgsverde s ta dardavvket tl estmatet X X ( µ µ σ σ X σ X σ erstatter σ og σ med de respektve utvalgsstadardavvkee s og s. Dette ka e gjøre forutsatt at utvalgee er store og det vl som valg s at utvalgee og begge er større e eller lk 3. Det betyr mao. at testobservatore å uder forutsetg at H er rktg atar forme Z X s X s der Z som valg står for e varabel som er N (,. Testge gjeomføres å øyaktg på samme måte som over. Jeg velger derfor kke å g oe eksempler dee stuasjoe. Avedt Statstkk 99
102 Ata så at σ og σ er ukjete og og kke ødvedgvs er større e eller lk 3. Da må e som ett-utvalgsstuasjoe bruke t-fordelge stedefor ormalfordelge. I dee stuasjoe skal v betrakte to mulgheter. V skal ata at σ σ ( σ, me fortsatt at de er ukjete. V skal kke gjøre atagelse om at stadardavvkee er lke, me fortsatt at de er ukjete. V ser å først på stuasjo. V tar å utgagspukt følgede testobservator: X X ( µ µ σ σ X σ X σ X X σ detσ σ ( σ Ford σ er ukjet så må dee estmeres. Dette gjøres med de såkalte sammeslåtte varase s som er et veet gjeomstt av utvalgsvarasee s og s. E har at p s p ( s ( s og dermed følgede testobservator: T s X X p som er t-fordelt med ( frhetsgrader, mao. d.f.. I: V ser å først på testg av H mot H A : µ > µ : µ µ Klasssk testg: H forkastes (det store verder av T er sgfkate hvs t (verde av T t krtsk verd på vået α. α Beregg av sgfkassasylghet (P-verd. P-verde ( T P H t z α Avedt Statstkk
103 Eks. Ata at ma øsker å teste H : µ µ mot H A : µ > µ med vået α,5. Det blr tatt to uavhegge tlfeldge utvalg på heholdsvs 3 og fra de to populasjoee og ma fer X 9, 5 og X 9,. Ata at de to populasjosvarasee s og s er heholdsvs,4 og,6. Da blr s p ( s ( s (3,4 (,6, (3 Legg merke tl at s p ka skrves som s p,4 9,6 Herav ser e tydelg at s p er det veede gjeomsttet av,4 ( s og,6 ( s. 9 Vektee er heholdsvs og. Hvorfor legges det mer vekt på,4 ( s e,6 ( s? Bruker e å klasssk testg fer e først t 9,5 9,,4857 3,78 Med df. fer e krtsk verd t. 5 på 5%-vået av tabell over t- fordelge (eller evetuelt av vers t på kalkulatore tl t. 5,7. Dermed ser e at t,78 <,7 t. 5 og koklusjoe blr dermed at H : µ µ kke ka forkastes på 5%-vået. Bereger e å alteratvt P-verde fer e ved hjelp av kalkulatore følgede : P H ( T P H ( T,78, t Sde dee er større e vået på,5 så ser e at ullhypotese kke ka forkastes på 5%-vået. E ae måte å s dette resultatet på er ma måtte hatt et vå på,% for at ullhypotese skal forkastes, eller mao. hvs ma hadde valgt å forkaste H : µ µ så hadde e hatt e rsko på,% for at ma trekker gal koklusjo. Beregge av P-verde gjøres med følgede kommadoer: ND VARS 5:tcdf( Avedt Statstkk
104 Kalkulatore vser å: ENTER 99,78,, ENTER Velger e å å bruke kalkulatores testpakke fer e ved følgede kommadoer: STAT TESTS 4: -SampTTest ENTER Her må e å legge de gtte verdee for X og X, de to populasjosvarasee og σ og tlslutt verdee av og Dessute må kalkulatore få vte hva alteratvet skal være. E velger her H A Da får e følgede blde på kalkulatore: : µ > µ σ Legg merke tl at e her blr spurt om det er rmelg å tro at σ σ gjeom est sste lje: Pooled: No Yes, mao ka ma slå samme varasee eller kke? V velger her alteratvet Yes. Velger e å kommadoe CALCULATE får e følgede resultat. Avedt Statstkk
105 E ser at bereggee fora stemmer med kalkulatorutreggee. Velger e stede kommadoe Draw får e følgede resultat: Prøver å å bruke MINITAB for å løse de samme oppgave. E gjør da bruk av følgede kommadoer: Stat Basc Statstcs t Sample t.. Her må e så velge alteratvet Summarzed data, og deretter legge sample sze på 3 og, mea på 9,5 og 9,, stadarddevato på. 4 og. 6 og tlslutt uder optos velge alteratvet greater tha. Velger e så OK får e følgede utskrft: Two-Sample T-Test ad CI Sample N Mea StDev SE Mea 3 9,5,8,33 9,,6,4 Dfferece mu ( - mu ( Estmate for dfferece:,4 95% lower boud for dfferece: -,488 Avedt Statstkk 3
106 T-Test of dfferece (vs >: T-Value,78 P-Value, DF Both use Pooled StDev,89 II: V ser så på testg av H mot H A : µ < µ : µ µ Klasssk testg: H forkastes (det små verder av T er sgfkate hvs t (verde av T t krtsk verd på vået α. α Beregg av sgfkassasylghet (P-verd. P-verde ( T P H t Eks. Ata at ma øsker å teste z α H mot H A : µ < µ : µ µ med vået α,5. Det blr tatt to uavhegge tlfeldge utvalg på heholdsvs 6 og 5 fra de to populasjoee og ma fer X 4, 5 og X 6, 7. Ata at de to populasjosvarasee s og s er heholdsvs, og,. Da blr s p ( s ( s (6, (5,,48... (6 5 Bruker e å klasssk testg fer e først t 4,5 6,7, ,76 Med df. 9 fer e krtsk verd -t. 5 på 5%-vået av tabell over t- fordelge (eller evetuelt av vers t på kalkulatore tl -t. 5 -,699. Dermed ser e at Avedt Statstkk 4
107 t -4,76 < t. 5 og koklusjoe blr dermed at H : µ µ forkastes på 5%- vået. Bereger e å alteratvt P-verde fer e ved hjelp av kalkulatore følgede : P H ( T P H ( T 4,76, t Mao. resultatee er sgfkate dvs H : µ µ forkastes tl fordel for H : µ < µ Beregge av P-verde gjøres med følgede kommadoer: A Kalkulatore vser å: ND VARS 5:tcdf( ENTER 99 -,-4.76, 9 ENTER Velger e å å bruke kalkulatores testpakke fer e ved følgede kommadoer: STAT TESTS 4: -SampTTest ENTER Her må e å legge de gtte verdee for X og X, de to populasjosvarasee og σ og tlslutt verdee av og Dessute må kalkulatore få vte hva alteratvet skal være. E velger her e H A : µ < µ Velger e å kommadoe CALCULATE får e følgede resultat. σ Avedt Statstkk 5
108 E ser at bereggee fora stemmer med kalkulatorutreggee. Velger e kommadoe Draw får e følgede resultat: Prøver å å bruke MINITAB for å løse de samme oppgave. E gjør da bruk av følgede kommadoer: Stat Basc Statstcs t Sample t.. Legger e å de gtte dataee får e Two-Sample T-Test ad CI Sample N Mea StDev SE Mea 6 4,5,45,36 5 6,7,48,38 Dfferece mu ( - mu ( Estmate for dfferece: -, 95% upper boud for dfferece: -,3495 T-Test of dfferece (vs <: T-Value -4,8 P-Value, DF 9 Both use Pooled StDev,4657 III: V ser så tlslutt på testg av H : µ µ mot H A : µ µ Igje så har v 3 mulgheter for å gjeomføre hypoteseprøvge: Avedt Statstkk 6
109 Klasssk testg: H forkastes (det både store og små verder av T er sgfkate hvs t (verde av T eller t α t t α Beregg av sgfkassasylghet (P-verd. P-verde ( T P H t t α Bereg ( α% kofdestervall. t α Eks.. Ata at ma øsker å teste H : µ µ mot H A : µ µ med vået α,5. Det blr tatt to uavhegge tlfeldge utvalg på heholdsvs 4 og 3 fra de to populasjoee og ma fer, 9 og,. Ata at de to utvalgssvarasee s og s er heholdsvs,5 og,3. Ved klasssk testg fer e å at H : µ µ forkastes på 5%-vået hvs t t. 5 -,6 eller t t, 6. Nå blr.5,9, t,985 <,6, Mao. H : µ µ ka kke forkastes på 5%-vået. Hvs e stede øsker å berege 95% kofdestervall må dette først utledes: Kofdestervall. Helt aalogt tl sde 97 hvor det ble utledet ( α% kofdes tervall for µ µ tl Avedt Statstkk 7
110 ( σ σ, ( zα z α σ σ forutsatt at σ og σ var kjete, ka e å utlede ( α% kofdes tervall for µ µ år σ og σ er ukjete (me lke. E tar å utgagspukt T X X s ( µ µ p og at P ( t T t α α α Da fer e følgede ( α% kofdestervall for µ µ (prøv å utlede selv: ( t s α p, ( t s α p Hvs e bruker tallee fra eksempelet over fer følgede 95% kofdestervall: (,9,,6,845 4, (,9,,6,845 3 [,76;,6] 4 3 Bruker e å kalkulatore drekte med kommadoee STAT TESTS :-SampTIt ENTER får e følgede blde Avedt Statstkk 8
111 E velger også å at varasee skal slås samme ved å velge Yes på alteratvet Pooled. Sde v øsker et 95% kofdestervall velger v alteratvet.95 på C-Level. Calculate gr å: E ser mao. at ma får samme resultat som over. Velger e å tl sst å bruke MINITAB må e bruke følgede kommadoer: Stat Basc Statstcs t -Sample t Summarzed data (legg de gtte verdee Optos (velg her Cofdece level 95,, testdfferace, og Alteratve: ot equal Da får e opp følgede blde: Two-Sample T-Test ad CI Sample N Mea StDev SE Mea 4,9,87,5 3,,8,5 Dfferece mu ( - mu ( Estmate for dfferece:,7 95% CI for dfferece: (-,764999;,64999 T-Test of dfferece (vs ot : T-Value,99 P-Value,334 DF 4 Herav ser e tredje ederste lje at kofdestervallet blr det samme som fora. Nå skal v se på de sste mulghete. Hva gjør ma hvs det kke er rmelg å ata at σ σ ( σ. Ata som fora at σ og σ er ukjete og og kke ødvedgvs er >3. Avedt Statstkk 9
112 E må å bruke testobservatore T X X ( s µ s µ som er t- fordelt med a frhetsgrader. E har som før at utvalgsvarasee, estmater for de ukjete populasjosvarasee σ og σ. E har å to alteratver med hesy tl atall frhetsgrader: s og s, er Det forsktge (koservatve alteratvet er å velge a m(, (a velges mao. som det mste av tallee og. Det betyr mdlertd at ma kaster bort e del formasjo (data. På de adre sde så vl det resultatet e kommer fram tl være mst være så godt som det ma fer ( P-verde vl mao. være mdre e de v kommer fram tl Det ka vses at atall frhetsgrader a tlærmet er gtt ved a s s s s Eks. La oss å se på et eksempel fra sde ute å ata atσ σ. V testet her H : µ µ mot H A : µ < µ med vået α,5. Det blr tatt to uavhegge tlfeldge utvalg på heholdsvs 6 og 5 fra de to populasjoee og ma fer X 4, 5 og X 6, 7. Ata at de to populasjosvarasee s og s er heholdsvs, og,. E fer da først t ( s µ s µ 4,5 6,7,, 6 5-4,73 som e ser avvker svært lte fra -4,76 som v fat år v slo samme varasee. Nå må e mdlertd bestemme atall frhetsgrader før e ka trekke oe koklusjo. Dette ka e som evt gjøre på to måter: Avedt Statstkk
113 Bruk atall frhetsgrader a m( 6,5 m(5,4 4 (a velges mao. som det mste av tallee og. Med 4 frhetsgrader fer e krtsk verd -t. 5 på 5%-vået av tabell over t- fordelge (eller evetuelt av vers t på kalkulatore tl -t. 5 -,76. Dermed ser e at t -4,73 < t. 5 og koklusjoe blr dermed som fora at H : µ µ forkastes på 5%-vået. Alteratvt reger e ut atall frhetsgrader ved hjelp av formele på sde 9. a s s s s, 6, 6 6, 5, 5 5 8,63 Dette ruder e ed tl 8. Da blr krtsk verd -,7 og e får samme koklusjo som over. E ser at det blr e vss forskjell på de koservatve (og ekle metode som gr 4 frhetsgrader og dee metode som gr 8 frhetsgrader. Bereger e å alteratvt P-verde fer e ved hjelp av kalkulatore følgede : hvs e bruker metode og ( T 4,73 tcdf (, 4,73,4 99 P H ( T 4,73 tcdf (, 4,73, 8 99 P H,47,3 hvs e bruker metode. Bruker 8,63 stedefor å rude av tl 8 (det er kke oe problem verke for kalkulatore eller MINITAB å rege med df 6,48 fer e ( T 4,73 tcdf ( ; 4,73; 8,63 99 P H,7 Velger e alteratvt å bruke kalkulatores statstkkpakke med kommadoee STAT TESTS 4: - SampTTest ENTER og så legge de gtte verdee av gjeomsttee og stadardavvkee, velge rktg alteratv, be om at varasee kke skal slås samme ( Pooled: No og tl slutt CALCULATE fer e: Avedt Statstkk
114 Velger e tlslutt å bruke MINITAB fer e følgede: Two-Sample T-Test ad CI Sample N Mea StDev SE Mea 6 4,5,45,36 5 6,7,48,38 Dfferece mu ( - mu ( Estmate for dfferece: -, 95% upper boud for dfferece:-,33 T-Test of dfferece (vs <: T-Value -4,7 P-Value, DF 8 som stemmer meget bra med kalkulatores beregger. Mao. resultatee er sgfkate dvs H : µ µ forkastes tl fordel for H A : µ < µ E ser at det blr e vss forskjell på resultatee selv om e får samme koklusjo. Det ka mdlertd lett bl slk at e får forskjellg koklusjo med de forskjellge metodee.. Kjkvadrattester. V skal å se på såkalte kjkvadrattester. Dette er tester hvor e sammelker de observerte verdee med de forvetede verdee som ma ka rege ut år H er rktg. Det fes to hovedtyper av kjkvadrattester: A. Kjkvadrattester for modellkotroll. A. For helspesfserte modeller/hypoteser A. For delvs spesfserte modeller/hypoteser B. Kjkvadrattester for uavhegghet. V skal å se på A. som brukes tl avgjøre om e statstsk modell er god/brukbar eller kke. Avedt Statstkk
115 V ser først på et gaske baalt, me allkevel struktvt eksempel. Ata at e perso skal kaste e myt gager. V tester da H : Modelle for mytkast (P(M P(K,5 er holdbar mot H : Modelle for mytkast (P(M P(K,5 er kke holdbar. A Ata at ma å observerer Res. Myt Kro Sum Hyp. O 6 4 Teste går å ut på å sammelke de observerte verdee (O med hva ma ka forvete å få (E hvs modelle er holdbar (brukbar. Idet atall suksesser (kro eller myt er bomsk fordelt med og P(suksess,5 så har e følgede forvetede verder: Res. Myt Kro Sum E p 5 5 Som testobservator skal v slke tester bruke χ m ( O E som måler avvkee mellom O og E. E ser at hvs forskjellee mellom O og E blr store så vl også forkastes hvs χ bl stor. V har derfor at store verder χ k α,( m E χ er sgfkate. Ma.o. H krtsk verd på vået α og med υ (m- frhetsgrader (atall mulge utfall modelle -. Velger e α,5 fer e av tabelle over kjkvadratfordelge at k α,( m k.5,( 3,84. M.a.o. H forkastes hvs bereget χ 3, 84. E fer å χ m ( O E E (6 5 5 (4 5 5 Koklusjoe blr dermed at H forkastes på 5%-vået.,, 4, Velger e alteratvt å berege P-verde forsøket fer e av TI-83: P( χ 4, χ cdf (4., 99,,455 som er mdre e,5 og dermed har e (selvfølgelg samme koklusjo. Avedt Statstkk 3
116 A. Ata å at v øsker å teste om v har e bomsk modell hvor p er ukjet, me hvor 3. Det betyr at v har e delvs spefsert modell. V tester derfor: mot H : X ~ b(3, p H : X kke ~ b(3, p Der X som valg represeterer atall suksesser på 3 forsøk. A Ata at det å gjøres forsøksserer med 3 forsøk hver sere og at ma observerer 3 SUM O Når ma å skal begye å rege ut de forvetede verdee får e et problem. p er ukjet og dermed ka kke fe de forvetede verdee. Dette løser e som alltd statstkke med å fe et estmat, pˆ, for p, og så bruke dette stede. p estmeres å ved p ˆ, ,4 6 6 Vår delvs spesfserte modell og ullhypotese blr da gtt ved: H : X ~ b(3;,4 Dvs. at sasylghetsfordelge p tl X er gtt ved Dermed har e 3 p(,4,59 3,,,,3 3 SUM p(,54,48,975,689 E 4,8 85,64 59,5 3,78 O Nå forkastes H : X ~ b(3;,4 hvs χ m ( O E E χ α, mt Legg å merke tl at atall frhetsgrader kke leger er m, me å er gtt ved Avedt Statstkk 4
117 df. m t - der m som før er atall mulge utfall modelle og t er atall parametre som må estmeres først for å kue rege ut forvetgsverdee. Dette er ku aktuelt der ma har e delvs spesfsert modell. Da må ma bruke ltt av eerge tallmateralet først og atall frhetsgrader blr dermed redusert. I eksempelet over er t og ma har dermed df. m - t Av tabelle over χ fordelge fer e å følgede krtsk verd på 5%-vået : χ.5, 5,99 V må å rege ut χ tallet og sammelke det med 5,99. E fer å : χ ( O E (4 4,8 4,8 L E (3,78 3,78 7,39 Koklusjo: H : X ~ b(3;,4 forkastes på 5%-vået sde χ 7,39> 5, 99. Det tyder på at modelle X ~ b(3;,4 er kke holdbar ( ka lgge tl gru for de observerte dataee. Bereger e å stede P- verde fer e ved hjelp av kalkulatore P P( χ 7,39,48 Dette fer e ved hjelp av følgede kommadoer: ND VARS 7: E får da følgede resultat: χ cdf( ENTER 7.39, ^99, ENTER Kjkvadrattester ka også brukes tl å teste uavhegghet mellom to varable X og Y som ofte preseteres e r c -tabell. Uavhegghetsteste baserer seg også på å sammelke observerte og forvetede verder, og dermed på m ( O E χ E som testobservator. Avedt Statstkk 5
118 Eks. Ata at ma øsker å teste om det er oe sammeheg mellom aldere på e perso og mege om et produkt. V øsker derfor å teste H : Det er ge sammeheg mellom alder og meg om produktet mot H : Det er sammeheg mellom alder og meg om produktet A tlfeldg valgte persoer ble spurt om hva de syes om produktet. Ata at resultatet av udersøkelse ble (de forvetede verdee står paretes Meg Dårlg Mddels Bra SUM Alder -3 år (8, 5(, 3(5, år 8(, (3,4 34(8, år 8(7,6 (,5 5(4,9 63 SUM Her ser e for eksempel at aldersgruppe tl 3 år så er det O persoer som meer at produktet er dårlg. I dee gruppe ka v forvete 65 E 56 8, persoer forutsatt at ullhypotese er rktg osv. I aldersgruppe 4 tl 5 år så er det O9 5 persoer som meer at produktet er bra. I dee gruppe ka 63 v forvete E9 79 4, 9persoer forutsatt at ullhypotese er rktg. Bereger e så kjkvadrattallet for hele matrse fer e χ m ( O E E (8, 8, (5 4,9 L 4,9 6,97 Herav fer e følgede P-verd ved TI-83 (det store verder av testobservatore sgfkate det e her har ( χ 6,97 χ cdf (6.97,, 4, P H d.f.(at.rader-(at. koloer - (3-(3-4, Sde P-verde,34 <,5 ser v at resultatet er sgfkat på 5%-vået. Koklusjoe blr m.a.o at H forkastes tl fordel for H. A χ er Avedt Statstkk 6
119 Kalkulatores statstkkpakke ka også brukes drekte tl å gjeomføre e uavhegghetstest. Det gjøres på følgede måte: Først må e legge de observerte verdee kalkulatores matrsefuksjo. Tl det bruker e følgede kommadoer: ND EDIT Første gag ma bruker dee kommadoe vl e å få opp følgede blde: E må å velge e av de mulge matrsee ( A tom. J og legge tallee. Jeg velger her å bruke de første matrse A. Jeg trykker derfor ENTER e gag tl og får opp følgede blde: Hvs ma tdlgere har brukt kalkulatore tl matrseregg vl de gamle matrse A lgge her. De matrse v å øsker å legge er e 3 3- matrse og dette må v forberede kalkulatore på. Det gjøres ved å skrve 3-tall oppe på -tallee og trykke ENTER. Da får e følgede blde: På de 9 ullee legger e å et og et av de observerte tallee og får: Nå må e så gå ut av dette ved hjelp av kommadoee ND MODE også deretter gå tl statstkkfuksjoee: Avedt Statstkk 7
120 STAT TESTS C: χ Test ENTER Kalkulatore vser da følgede blde Velger e å kommadoe Calculate får e følgede blde: Velger stede kommadoe DRAW får e følgede blde: Velger e stede å bruke MINITAB må e først legge de observerte verdee regearket dvs. meg dårlg koloe (C, meg mddels koloe (C og meg bra koloe 3(C3. I rad, og 3 legger e heholdsvs aldergruppe [ 5,5>, [ 5,35> og [ 35,45>. Deretter må e g følgede kommadoer: Stat Tabels χ Ch-Square Test og deretter legge de gtte observasjosmatrse. Valget OK gr å Avedt Statstkk 8
121 Ch-Square Test:Meg( Dårlg; Mddels; Bra mot Alder ((5,5, (5,35, 3(35,45 Epected couts are prted below observed couts Ch-Square cotrbutos are prted below epected couts Dårlg Mddels Bra Total ,,3 5,68 3,695,7, ,6 3,4 8,44,3,494, ,64,48 4,89 6,84, 3,97 Total Ch-Sq 6,968; DF 4; P-Value, 3. Iferes for adeler. E adel. Ata at v har e populasjo hvor v er teressert å fe ut oe om adele dvder med e bestemt egeskap ( kjeeteg A. Det ka for eksempel være dysleks, fargebld, stemmer Arbederpartet, er mot EU, har dabetes,. La oss betege dee adele med p. V skal å ata at v har e bomsk populasjo, dvs. Hvorvdt et dvd har egeskape er uavhegg av om adre har egeskape. Ete så har ma egeskape ( Suksess eller så har ma de kke ( Fasko ( det er altså bare to mulge utfall (derav forstavelse b Suksess eller Fasko Sasylghete for at et vlkårlg valgt dvd populasjoe har egeskape ( p er kostat hele populasjoe. Det er dee parametere p v å øsker å uttale oss om ete gjeom estmerg eller gjeom hypoteseprøvg. Ata at v har tatt et utvalg på fra dee populasjoe. La X atall dvder utvalget med egeskape A. Da har e at X ~ b(, p Da har e fra kurset gruleggede statstkk at E ( X p og Var( X p( p og dermed at Avedt Statstkk 9
122 X E ( p og X Var( p( p p X Dermed ser e at P ˆ er e forvetgsrett estmator for p. Nå er geerelt et ( α% kofdestervall for θ på forme Θˆ ± f α SE( Θˆ der α f α er - fraktle fordelge tl Θˆ. Nå er Z X p Pˆ p ~ N(, (tlærmet for stor p( p p( p Dermed blr ( α% kofdestervall på forme pˆ ( pˆ pˆ ± z α (for stor Eks. La å p være adele stemmeberettgede Norge som er for orsk medlemskap EU. Ma øsker å et 95% kofdestervall for dee adele. Ata det er tatt et tlfeldg utvalg på persoer og at ma her fat 495 persoer som var for orsk medlemskap EU. Et 95% kofdestervall for p fer e da av ( pˆ( pˆ 495 p ˆ ±,96 ±,96,43±,8 Mao. Selve tervallet for p blr dermed [,385;,44] Bruker e stede kalkulatore drekte med følgede kommadoer: STAT TESTS A: -PropZIt ENTER Legger e så 495 og får e opp følgede blde: Avedt Statstkk
123 Velger e å kommadoe CALCULATE får e : som stemmer med bereggee fora. Går e å tl MINITAB må e bruke følgede kommadoer: Stat Basc Statstcs P Proporto Her velger e Summarzed data og legger Number of trals Number of evets 495 Deretter velger e optos og ber om Cofdece level 95, og trykker OK får e blat aet følgede blde (e må også her gjeomføre hypotesetestg, me jeg bryr meg kke om dette å Fjerer e å alt som har med hypoteseprøvge å gjøre får e CI for Oe Proporto X N Sample p 95% CI 495,45 (,384647;,44353 Kofdestervallet fora er bereget uder forutsetg av at de bomske fordelge ka tlærmes med ormalfordelge. Hvs e uder optos velger å kke bruke ormaltlærmelse gr MINITAB: CI for Oe Proporto Eact X N Sample p 95% CI 495,45 (,384474;,44956 Avedt Statstkk
124 E ser at det er margale forskjeller mellom det eksakte kofdestervallet over og det hvor ma har gjort bruk av ormalfordelge. Det kommer av at ormalfordelge er meget god tlærmg tl de bomske fordelge år er så stor som. E valg tommelfgerregel er at tlærmge er svært god år Med vår og p,4 har e Av dette ser e for eksempel at Var ( X p( p Var ( X p( p.4 (,4 9,8 p( p p( p Dette gr følgede sammeheg mellom og p : p bør mst være,, 63,3 48,4 4,5 4 Hypotesetestg med e adel. Ata at v å øsker å teste H : p p der p er e spesfkk verd av populasjosadele p. V skal som valg se på tre forskjellge alteratve hypoteser: p p, p p og p p. Som testobservator skal v å bruke Z Pˆ p p ( p der Pˆ som fora er gtt ved stor ok. P ˆ X. Z er tlærmet ormalfordelt (,forutsatt at er I. V ser som valg først på testg av Avedt Statstkk
125 H : p p mot H A : p> p Ved klasssk testg så forkastes H på vået α hvs eller hvs P-verde Z z α (krtsk verd på vået α P H ( Z z blr tlstrekkelg lte. z er som valg de observerte verde av Z Eks. Ata v har e populasjo hvor kjeeteget A (vl stemme arbederpartet ved este valg tl å har lgget på 3%. Ma meer å at dee adele har økt oe (mdre udersøkelser tyder på det. V øsker derfor å teste H : p,3 mot : p>, 3 der p er adele populasjoe som vl stemme Arbederpartet ved este valg. Ata at et utvalg på 873 vser 33 persoer med egeskape A. Krtsk verd på 5%-vået er å Nå blr verde av Z : z,5 H A,645 z pˆ p p ( p 33,3 873,3(, ,35 Koklusjoe blr dermed at H : p, 3 forkastes tl fordel for H A : p>, 3 på 5%- vået det z 3, 35> z, 645.,5 Bereger e stede P-verde får e P H ( Z P H ( Z 3,35 Normalcdf(3.35,^99, z som gr samme koklusjo som over. Velger e å å bruke kalkulatore drekte må e gjøre bruk av følgede kommadoer: STAT TESTS 5: -PropZTest ENTER Avedt Statstkk 3
126 Legger e så de aktuelle tallee over vl e få følgede blde: Velger e så tl slutt kommadoe Calculate får e følgede blde: som bekrefter resultatee over. Hvs ma øsker å bruke MINITAB må e bruke følgede kommadoer: Stat Basc Statstcs P Proporto Her velger e Summarzed data og legger Deretter velger e Optos og ber om Number of trals 873 Number of evets 33 Test proporto Alteratve,3 greater tha og haker av feltet hvor e skal avgjøre om e skal rege tlærmet eller kke (Use test ad terval based o ormal dstrbuto or ot. Trykker e tl slutt på OK får e følgede resultat: Test ad CI for Oe Proporto Test of p,3 vs p >,3 95% Lower Sample X N Sample p Boud Z-Value P-Value ,34779,3578 3,4, Avedt Statstkk 4
127 Legg merke tl at ma her også får et esdg 95% kofdestervall (selv om e kke ber om dette. Kofdestervallet er esdg ford e øsker et esdg alteratv uder hypotesetestge. Dette tervallet fer e av: p > pˆ( pˆ pˆ z, 5,347-,645,347(, ,35 V påstår mao. at p >,35 hvor metodes påltelghet er 95%. II. ata v å øsker å teste La å som fora H : p p mot H A : p< p Z Pˆ p p ( p Ved klasssk testg så forkastes H på vået α hvs eller hvs P-verde Z z α (krtsk verd på vået α P H ( Z z blr tlstrekkelg lte. z er som valg de observerte verde av Z. I dee stuasjoe vl z valgvs være egatv. Det betyr at P-verde alteratvt ka bereges ved der z beteger absoluttverde tl z. ( Z P H z Eks. Ata at adele røykere blat kver over flere år har lgget stablt på 35%. E stor kampaje mot røykg blr gjeomført både på skoler, avser og på TV over e 3 måeders perode og ma har stor tro på at dee kampaje skal vrke. Ma øsker derfor å å teste H : p,35 mot : p<, 35 E har å krtsk verd z, 645 hvs v som valg tester på 5%-vået. Nå fer,5 e et tlfeldg på 75 kver tatt etter at kampaje var ferdg 5 røykere. H A Avedt Statstkk 5
128 Nå blr z pˆ p p ( p 5,35 75,35(,35 75,88 E ser å at z,88>, 645 hvlket medfører at H : p, 35 kke ka forkastes på 5%-vået. Det tyder altså kke på at det oe sgfkat edgag adele kvelge røykere. Reger e ut P-verde ser bedre hvlke rsko det er forbudet med evetuelt felaktg å forkaste H : p, 35. P-verde blr ( Z,88 Normalcdf (,,88 99 P H,894 E ser da altså at v måtte hatt et vå på 8,94% før v kue forkaste H. Brukes e å kalkulatore drekte fer e ved hjelp av kommadoee: STAT TESTS 5: -PropZTest ENTER Legger e så de aktuelle tallee over vl e få følgede blde: Hvs ma å velger kommadoe Draw får e følgede blde: Avedt Statstkk 6
129 Hvs ma øsker å bruke MINITAB må e gje gjøre bruk av kommadoee over. Velger så Summarzed data og legger Deretter velger e Optos og ber om Number of trals 873 Number of evets 33 Test proporto Alteratve,3 less tha og haker av feltet hvor e skal avgjøre om e skal rege tlærmet eller kke (Use test ad terval based o ormal dstrbuto or ot. Jeg velger å å prøve både eksakt og tlærmet utregg for å se evetuelle forskjeller. Eksakt utregg blr Test ad CI for Oe Proporto Test of p,35 vs p <,35 95% Upper Eact Sample X N Sample p Boud P-Value 5 75,334667,3645, Reger e tlærmet får e: Test ad CI for Oe Proporto Test of p,35 vs p <,35 95% Upper Sample X N Sample p Boud Z-Value P-Value 5 75,334667,3638 -,88,89 E ser at det kke er store forskjeller på (for eksempel de to P-verdee som begge gr samme koklusjo. I adre stuasjoer vl e mdlertd kue få forskjellg koklusjo. III. Ata v å øsker å teste La å som fora betrakte testobservatore H : p p mot H A : p p Avedt Statstkk 7
130 Z Pˆ p p ( p Ved klasssk testg så forkastes H på vået α hvs Z z α eller Z z α ( de krtske verdee på vået α eller hvs P-verde ( Z P H z blr tlstrekkelg lte. z er som valg de observerte verde av Z. I dee stuasjoe vl z ete være egatv eller postv. Eks. Ata at adele defekte av e masseprodusert artkkel fram tl å har lgget på 7%. Etter ma har begyt å mportere oe bllgere råstoff fra et aet lad er ma uskker på om dette edrer kvaltete på artkkele eller kke. La p P(E vlkårlg uttrukket artkkel er defekt med det ye råstoffet. V øsker derfor å teste H : p,7 mot : p, 7 Bestem å de krtske verdee med hesy på adele (og atall defekte et tlfeldg utvalg på 5 produserte artkler med det ye råstoffet. Hvs v velger et vå på 5% så forkastes mao. H : p, 7 hvs H A Pˆ p Z,96 eller Z, 96 p ( p der,96 er fuet av tabell eller kalkulator som z,5 vnorm(,975. Nå er ˆ X X P og p 7 5, Pˆ p P ˆ,7 slk at Z,96 p ( p,7(,7 5 betyr at P ˆ,7,96,7(,7 5 dvs ˆP, 7,96,7(,7,7,, 5 48 Tlsvarede fer e at Z, 96 gr P ˆ,7,, 9. Avedt Statstkk 8
131 Mao. H : p, 7 forkastes tl fordel for H A : p, 7 på 5%-vået hvs adele defekte utvalget pˆ ( verde av ˆP ete er, 48 eller er, 9. Det vl gje s at H forkastes hvs ˆ X X P, 48 dvs at X, eller 5 X, Mao. hvs atall defekte et utvalg på 5 er mdre e eller lk 4 eller større e eller lk 46 så er det gru tl å påstå at defektadele har edret seg fra,7. Ata at et tlfeldg utvalg på 5 vser 49 defekte. Sde så forkastes H : p,7 på 5 % -vået. P-verde for dette resultatet relatvt tl ullhypotese og alteratvet over er dermed PH ( X 49 ( P ( X 48 ( bomcdf (5,.7, 48,33( eksakt H Bruker e alteratvt ormaltlærmelse har e P H 99 ( X 49 Normalcdf (48.5,, 5.7, 5.7 (.7,8 Bruker e å kalkulatore drekte fer e etter kommadoee STAT TESTS 5: -PropZTest ENTER og etter å ha lagt de aktuelle tallee får e opp følgede blde: Velger e så kommadoe Calculate får e følgede blde: Hvs ma øsker å bruke MINITAB må e gje gjøre bruk av kommadoee over. Velger så Summarzed data og legger Number of trals 5 Avedt Statstkk 9
132 Deretter velger e Optos og ber om Number of evets 49 Test proporto Alteratve,7 ot equal og haker av feltet hvor e skal avgjøre om e skal rege tlærmet eller kke (Use test ad terval based o ormal dstrbuto or ot. Eksakt utregg gr Test ad CI for Oe Proporto Test of p,7 vs p ot,7 Eact Sample X N Sample p 95% CI P-Value 49 5,98 (,73383;,7489, Tlærmet utregg gr: Test ad CI for Oe Proporto Test of p,7 vs p ot,7 Sample X N Sample p 95% CI Z-Value P-Value 49 5,98 (,794;,46,45,4 E ser at begge utreggee stemmer godt med resultatee over. E ser at det eksakte 95% kofdestervall for de ye defektadele går fra og med 7,3% tl og med,7%. Kotroller selv at dette stemmer. 4. Iferes kyttet tl to adeler. Ata at v å har to populasjoer som begge atas å være bomsk fordelt med parametre heholdsvs pog p. Ata v er teressert å fe ut om det er oe forskjell mellom dsse adelee og hva dee forskjelle evetuelt er. La A være det kjeeteget som v teresserer oss for. Ata at det tas to uavhegge tlfeldge utvalg på heholdsvs og fra de to populasjoee og la X og X være atall dvder med kjeeteget A (heholdsvs de to utvalgee. Dermed ka e defere de to estmatoree ˆP og ˆP for heholdvs pog p ved Avedt Statstkk 3
133 ˆ X P og P ˆ X Det ka da vses at at stadardavvket tl Pˆ ˆ P er gtt ved E( Pˆ ˆ p p, P og dermed at SE p ( p p ( p p ˆ p ˆ Z ( Pˆ Pˆ ( p p ~ N (, p( p p ( p Ved hjelp av dee ka e som tdlgere utlede følgede ( α% kofdestervall p ( p p( p pˆ ( pˆ pˆ ( pˆ for p p (Prøv selv. Vk: Erstatt med og ta utgagspukt at P ( z Z z α α α pˆ ˆ p ± zα pˆ ˆ ( p pˆ ˆ ( p Eks. Ata at to uavhegge utvalg av me og kver på heholdsvs 5 og 48 vste at blat meee var det som var tlhegere av EU medlemskap og blat kvee var 56 tlhegere. F et 95% kofdestervall for dfferase mellom adele me ( p og adele kver ( p som er tlhegere av orsk EU medlemskap. E har å at estmater for heholdsvs p og p er gtt ved p ˆ og 5 p ˆ dermed har e følgede utgagspukt for å lage et 95% kofdestervall for p p : pˆ pˆ 5 ± z,5 56 ±,96 48 pˆ ( ˆ p ( pˆ ( ˆ p ( Avedt Statstkk 3
134 ,63±,59 Dermed vl det edelge kofdestervallet gå fra og med,4 og tl og med,. Velger e å å bruke kalkulatore drekte gjeom kommadoee STAT TESTS B: -PropZIt ENTER og så legge de observerte verdee får e følgede blde: Velger e så kommadoe Calculate får e opp følgede resultat: som bekrefter bereggee over. Hvs ma øsker å bruke MINITAB må e (som før bruke følgede kommadoer: Stat Basc Statstcs P Proporto Her velger e Summarzed data og legger Trals Evets Frst 5 Secod Går så på Optos og velger 95% Cofdece level. E får da følgede resultat ( bruker kke sammeslått estmat (gjelder ku hypoteseprøvg: Avedt Statstkk 3
135 Test ad CI for Two Proportos Sample X N Sample p 5, ,35 Dfferece p ( - p ( Estmate for dfferece:, % CI for dfferece: (,48;,7 som gje gr e bekreftelse av resultatee over. Jeg har her valgt å kke ta med de dele av utskrfte som har med hypoteseprøvg å gjøre. Det skal v å straks behadle. Hypoteseprøvg for to adeler. Ata som over at v har to populasjoer som begge atas å være bomsk fordelt med parametre heholdsvs p og p. La A være det kjeeteget som v teresserer oss for. Ata at det tas to uavhegge tlfeldge utvalg på heholdsvs og fra de to populasjoee og la Z ( Pˆ Pˆ ( p p p( p p ( p som over. Ata at v å øsker å teste H : p p V skal som valg se på tre forskjellge alteratve hypoteser: p p, p p og p p. Som testobservator skal v å bruke Z ( Pˆ Pˆ pˆ( pˆ( det p ( p p ( p p( p( der det p p p (de felles verde uder H Avedt Statstkk 33
136 Nå er mdlertd p ukjet, og må estmeres. Det gjøres ved hjelp av atall med egeskape A totalt de to utvalgee pˆ totalt atall utva lgte I. V ser som valg først på testg av H : p p mot H A : p > p Ved klasssk testg så forkastes H på vået α hvs eller hvs P-verde z z α (krtsk verd på vået α P H ( Z z blr tlstrekkelg lte. z er som valg de observerte verde av Z. La oss å se på eksempelet over hvor det ble tatt to uavhegge utvalg av me og kver på heholdsvs 5 og 48 som vste at blat meee var det som var tlhegere av EU medlemskap og blat kvee var 56 tlhegere. Test å på 5%- vået om adele me ( p og adele kver ( p som er tlhegere av orsk EU medlemskap er lke eller om det er slk at adele me er større. E har å at estmat for p (de felles verde av p og p er gtt ved Dermed blr pˆ, z ( pˆ pˆ pˆ( pˆ ( ,358(,358( 5 48,9 Koklusjoe blr dermed at forkastes tl fordel for på 5%-vået ford H : p p H A : p > p z,9,645 z,5 Avedt Statstkk 34
137 Det betyr mao. at v med e sasylghet på høyst,5 for å ta fel påstår at adele me for EU populasjoe er større e adele kver. Et ltt sterkere resultat får e ved å berege sgfkassasylghete (P-verde ved ( Z,9 Normalcdf (.9, 99 P H,8 Mao. v får samme koklusjo, me rskoe for å ta fel er å,8. Det eeste v ka s ved hjelp av klasssk testg er at rskoe for å ta fel er mdre e,5. Ved å berege p-verde har v altså fuet et (tlærmet mål på sasylghete for å trekke gal koklusjoo. Bruker e å kalkulatore drekte fer e etter kommadoee STAT TESTS 6: -PropZTest ENTER og etter å ha lagt de aktuelle tallee og valgt alteratv hypotese H A : p > p får e opp følgede blde Velger e å kommadoe Calculate får e opp følgede blde: og ser at ma får samme koklusjo som fora. Hvs ma øsker å bruke MINITAB må e (som før bruke følgede kommadoer: Stat Basc Statstcs P Proporto Her velger e Summarzed data og legger Avedt Statstkk 35
138 Trals Evets Frst 5 Secod Går så på Optos og velger alteratvet greater tha og 95% Cofdece level. E får da følgede resultat etter å ha valgt pooled estmate (sammeslått estmat Test ad CI for Two Proportos Sample X N Sample p 5, ,35 Dfferece p ( - p ( Estmate for dfferece:, % lower boud for dfferece:,3737 Test for dfferece (vs > : Z,9 P-Value,8 Dette er gje e bekreftelse på bereggee over. Dessute ser e at edre grese et 95% esdg kofdestervall er,37. Hva betyr dette? I et ( α% esdg kofdestervall utledes de edre grese av pˆ ˆ p zα pˆ ˆ ( p pˆ ˆ ( p Et 95% esdg kofdestervall har da edre grese: 5 56, ( ( 48 48,635,497,38 som stemmer gaske bra med MINITAB s beregg. II. Ata å at v skal teste H mot H A : p < p : p p Ved klasssk testg så forkastes H på vået α hvs eller hvs P-verde z z α (krtsk verd på vået α Avedt Statstkk 36
139 P H ( Z z blr tlstrekkelg lte. z er som valg de observerte verde av Z. Eks. Ata at ma øsker å teste om det er slk at adele jeter som må få ekstra leseopplærg på et bestemt klassetr er mdre e de tlsvarede adele gutter. Mao. e øsker å teste H : p p mot H A : p < p der p er adele jeter som må få ekstra leseopplærg og p er de tlsvarede adele gutter. I to tlfeldge utvalg på heholdsvs 385 jeter og 45 gutter fat ma at blat jetee var det 3 som tregte ekstra leseopplærg og blat guttee var det 45. Tester å på 5%-vået om adele jeter ( p er lk adele gutter ( p som må få ekstra leseopplærg eller om det er slk at adele jeter er mdre. Nå forkastes H : p p på 5%-vået hvs z z,645,5. E har å et estmat for p (de felles verde av p og p gtt ved p ˆ ,95 Da fer e følgede verd av Z: z ( pˆ pˆ pˆ ( pˆ ( ,95(,95( ,59 Koklusjoe blr dermed at H : p p kke ka forkastes på 5%-vået det z kke har bltt mdre e -,645. Bereger e alteratvt P-verde fer e 99 P H ( Z,59 Normalcdf (,,59, 559 Her ser at hvs H forkastes så er sasylghete for å gjøre fel (felaktg forkastg,559 hvlket er større e (så vdt vået på.5 (de øvre grese for å gjøre fel. Me der er all gru tl å følge opp dette med ytterlgere udersøkelser. Bruker e å kalkulatore drekte fer e etter kommadoee STAT TESTS Avedt Statstkk 37
140 6: -PropZTest ENTER og etter å ha lagt de aktuelle tallee og valgt alteratv hypotese H A : p < p får e opp følgede blde: Velger e så kommadoe Draw stedefor Calculate ser e følgede: Dette bekrefter bereggee over. Hvs ma øsker å bruke MINITAB må e (som før bruke følgede kommadoer: Stat Basc Statstcs P Proporto Her velger e Summarzed data og legger Trals Evets Frst Secod Går så på Optos og velger alteratvet less tha og 95% Cofdece level (dette sste må gjøres selv om ku øsker hypoteseprøvg. Hvs ma kke skrver oe dette feltet velger allkevel MINITAB 95%. E får da følgede resultat etter å ha valgt pooled estmate (sammeslått estmat Avedt Statstkk 38
141 Test ad CI for Two Proportos Sample X N Sample p 3 385, , Dfferece p ( - p ( Estmate for dfferece: -, % upper boud for dfferece:, Test for dfferece (vs < : Z -,59 P-Value,56 Legg merke tl at edre kofdesgrese er praktsk talt lk (,9. hvlket også bekrefter at resultatee este var sgfkate (jfr. P-verde på,56. Prøv selv å berege dee edre grese III. Tl sst skal v se på testg av H mot H A : p p : p p Ved klasssk testg så forkastes H på vået α hvs eller hvs P-verde z z α eller z z α (krtske verder på vået α ( Z P H z blr tlstrekkelg lte. z er som tallverde av de observerte verde av Z. Eks. Ata at v øsker å teste om det er oe forskjell på adele persoer Oslo og Berge som følger med fast på e bestemt TV-sere. Sde v kke har data fra oe tdlgere udersøkelser og v kke vet oe om tedeser de ee eller adre retge må v her teste: H mot H A : p p : p p Ata at det ble foretatt to uavhegge tfeldge utvalg på heholdsvs 854 Berge og 93 Oslo og at ma fat at det utvalget Berge var 83 og at det Oslo var 95 som fulgte med på TV-programmet. Nå forkastes H : p p på 5%-vået hvs z z,,5 645eller z z,5, 645. E har å et estmat for p (de felles verde av p og p gtt ved Avedt Statstkk 39
142 p ˆ , Da fer e følgede verd av Z: z ( pˆ pˆ pˆ( pˆ( ,(,( ,43 Koklusjoe blr dermed at H : p p kke ka forkastes på 5%-vået det z verke har bltt mdre e -,645 eller større e,645. Mao. det tyder kke på at p p. Bereger e alteratvt P-verde fer e 99 P H ( Z,43 Normalcdf (.43,,343, 686 Herav ser at H slett kke ka forkastes på 5%-vået og kke e gag på 34%-vået. Det er mao. gaske sterke sgaler om at H : p p er rktg ( les: kke bør forkastes Bruker e å kalkulatore drekte fer e etter kommadoee STAT TESTS 6: -PropZTest ENTER og etter å ha lagt de aktuelle tallee og valgt alteratv hypotese H A : p p får e opp følgede blde: Velger e kommadoe Calculate får e opp følgede blde: Avedt Statstkk 4
143 Som stemmer bra med resultatee over. Hvs ma øsker å bruke MINITAB må e (som før bruke følgede kommadoer: Stat Basc Statstcs P Proporto Her velger e Summarzed data og legger Trals Evets Frst Secod Går så på Optos og velger alteratvet less tha og 95% Cofdece level (dette sste må gjøres selv om e ku øsker hypoteseprøvg. Hvs ma kke skrver oe dette feltet velger allkevel MINITAB 95%. E får da følgede resultat etter å ha valgt pooled estmate (sammeslått estmat Test ad CI for Two Proportos Sample X N Sample p , ,95 Dfferece p ( - p ( Estmate for dfferece: -, % CI for dfferece: (-,336455;,744 Test for dfferece (vs ot : Z -,4 P-Value,687 som gje stemmer med bereggee over. Her ser e dessute at 95% kofdestervall for p p går fra -,33 tl,. Vs dette resultatet og forklar hvorda du ka bruke dette forbdelse med hypoteseprøvge. Mer om kofdestervaller for e og to adeler. E adel. Eks.(Se Moore & McCabe s 573 Ata at v ma kpser e myt 3 gager og får 3 kro. Basert på dette vl 3 estmatet for kro være p ˆ og et estmat for stadardavvket være 3 Avedt Statstkk 4
144 pˆ( pˆ (. Det betyr at v estmerer sasylghete for kro ved 3 mytkast tl med et stadardavvk på (mao. ge uskkerhet ved vårt estmat. Dette er kke foruftg. For å korrgere for slke stuasjoer ka ma gjøre bruk av følgede de. Lat som ma har 4 tlleggsobservasjoer hvorav er suksesser og er faskoer. E estmator for p er da ~ X P 4 Dee estmatore ble først foreslått av Edw Bdwell Wlso 97 og kalles derfor for Wlso estmatore. Ford p ~ (det ye estmatet for p er basert på e populasjosstørrelse (4 så har e tlærmet at Z ~ P p p( p 4 ~ N(, Dermed blr ( α% kofdestervall på forme ~ ± z ~ p ( ~ p 4 p α som kke vl avvke så mye fra kofdestervallet på sde 9 pˆ ± z α pˆ( pˆ år er stor. I eksempelet på sde hvor p er adele stemmeberettgede Norge som er for orsk medlemskap EU fat v et 95% kofdestervall for p ved ( pˆ( pˆ 495 p ˆ ±,96 ±,96,43±,8 Lager e å stede kofdestervallet basert på Wlsoestmatore fer e ~ ± z p α ~ p ( ~ p ±, ( ,43±,8 Avedt Statstkk 4
145 M.a.o med 3 desmalers øyaktghet er det ge forskjell på dsse to tervallee. Hvs dermot kke er stor så vl Wlsotervallet g et mer påltelg forslag e det valge kofdestervallet. Eks. Ata for eksempel at at det ku var persoer med utvalget og at ma da fat at det var 5 av dsse som var for EU-medlemskap. 95% kofdestervall ved de to metodee vlle da gtt følgede resultater: og 5 5 ( pˆ ( pˆ 5 p ˆ ±,96 ±,96,47±,88 (drekte 5 5 ~ ~ ( ~ p ( p 5 p± z, α ±,49±,87 (Wlso Her ser e mao. e vss forskjell, me de er kke dramatsk stor. Legg mdlertd merke tl at ± leddet har økt gaske kraftg fra kofdestervallee basert på et utvalg på. Hva skyldes dette? To adeler. På sde 3 utledet v følgede ( α% kofdestervall for p p : pˆ ˆ p ± zα pˆ ˆ ( p pˆ ˆ ( p Hvs ma gje bruker Wlsotekkke fora og å justerer resultatee med suksesser og faskoer på følgede måte: Legg tl suksess og fasko hvert av utvalgee. Wlsoestmatoree for heholdvs p og p er da: ~ X P og og herav har følgede estmator for p- p : ~ P X ~ ~ P P X X ~ ~ Stadardavvket tl P P er da tlærmet gtt ved Avedt Statstkk 43
146 σ p( p p ( p ~ ~ P P Dermed ka e utlede følgede justerte ( α% kofdestervall for p p : ~ ~ p ± p zα ~ p ( ~ p ~ p ( ~ p Går e å tlbake tl eksempelet kyttet tl ekstra leseopplærg hvor e hadde to tlfeldge utvalg på heholdsvs 385 jeter og 45 gutter og fat at blat jetee var det 3 som tregte ekstra leseopplærg og blat guttee var det % kofdestervall for dfferase mellom adele gutter og adele jeter som treger ekstra leseopplærg blr da: pˆ pˆ ±.96 ± ( 45 pˆ ( ˆ p pˆ ( ˆ p ( ,33±,4 Velger e å stede å bruke Wlsometode får e følgede 95%-kofdestervall: ~ ~ p ± z p α ~ p ( ~ p ~ p ( ~ p ( ( 47 3 ± ,33±, Altså ok e gag ge forskjell på de to metodee ford utvalgee er forholdsvs store. 5. Ikkeparametrske tester. V skal å se på oe forskjellge tester som brukes år ma skal sammelke to metoder ( behadlger A og B. Tradsjoell metode (A er de metode som har vært praktsert opp tl dag, mes y metode (B er de metode ma å øsker å prøve ut mot tradsjoell metode og som ma de fleste sammeheger har håp om at skal være bedre. Dette er testmetoder blat aet er mye brukt efor meds, me som også ka brukes efor skoleforskg. Gruppe av forsøksobjekter som skal være med udersøkelse bør være så homogee (lke som mulg. Dette gjøres ved at ma lar e ekspertgruppe bestemme hvem som skal Avedt Statstkk 44
147 være med utvalget. Det betyr at det kke er oe tlfeldghetsmekasme så lagt forsøket. For å få dette mometet og dermed kue bruke sasylghetsregge skal v se på to metoder: Fullstedg radomserg (tlfeldggjørg og radomserg e blokker. Fullstedg radomserg: Fra gruppe av forsøksobjekter trekker e tlfeldg ut (for eksempel ved loddtrekg de som skal være behadlgsobjekter, dvs de som skal behadles med tradsjoell metode. De resterede blr såkalte kotrollobjekter. Tlfeldggjørg e blokker: Forsøksobjektee deles først (etter skjø flere grupper (også kalt blokker på e slk måte at forsøksobjektee hver gruppe blr så homogee som mulg. Deretter trekker e tlfeldg ut e hver blokk de som skal være behadlgsobjekter. De øvrge blr kotrollobjekter. V skal bare betrakte de stuasjoe hvor hver blokk består av forsøksobjekter slk at hver blokk gr et behadlgobjekt og et kotrollobjekt, og v sakker da om såkalte parvse sammelkger. Avedt Statstkk 45
148 V skal å først se på to tester som brukes år ma har fullstedg radomserg. Fsher-Irw-teste. Eks. Ata at N 5 karaktermessg lke elever skal få opplærg et fremmedspråk. Det ka gjeomføres ved to metoder: Valg klasseromsudervsg og ved et opplegg hvor elevee stor utstrekg skal arbede på egehåd grupper, me søke veledg hos lærere år det er påkrevet. Det ka se ut som elever ved skole gjeom gruppearbed kke greer å arbede lke effektvt og dermed kke oppår så gode resultater på tester. Ma bestemmer seg for å trekke tlfeldg ut M 3 elever (behadlgsobjektee av de 5 som alle får udervsg ved gruppearbedsmetode. De øvrge N-M elevee får tradsjoell udervsg. Ata at elevee etter 4 dager får e relatvt vaskelg test hvor resultatet blr som følger: Resultat Metode Godkjet Ikke godkjet SUM Tradsjoell metode 8 4 (klasseromsud. Ny metode (selvstudum SUM 4 5 Ma øsker å å teste mot H : Det er ge forskjell på de to udervsgsmetodee. H : Gruppearbedsmetode gr dårlgere resultat e tradsjoell metode. A Som testobservator skal v å bruke X Atall behadlgsobjekter (får y metode som får kke godkjet Små verder av X er sgfkate. Hvs H er rktg så er X hypergeometrsk fordelt med N ( det totale atall forsøksobjekter 5, M ( atall speselle elemeter, dvs atall elever som får kke godkjet og ( atall utvalget, dvs atall elever som blr trukket ut tl å være behadlgsobjekter 3 Nå observeres X 4. P-verde blr da: Avedt Statstkk 46
149 P( X 4 P( X P( X LP( X L,68>, (kotroller bereggee selv Mao. H ka kke forkastes. Det er mao. ge gru tl å påstå at gruppearbedsmetode gr dårlgere resultat e tradsjoell metode. De ærmeste teste MINITAB er de såkalte Ma-Whtey-teste som tester om medaee de to utvalgee er lke. Dvs. at dee stusjoe testes det: Wlcooteste for to utvalg. Ata å at v har samme stuasjo som eksempelet fora uder Fsher-Irwteste, me at v å tllegg har poegee som de ekelte elev har fått på teste ( Poeg er tldelt fra tl. For å bestå prøve må e ha mst 5 poeg Tradsjoell metode: 34, 5, 68, 88, 45, 8, 78, 4, 38, 74, 4, 6 Ny metode : 43, 63, 5, 9, 3, 8, 9, 3, 47, 56, 57,, 7 Igje så tester v: mot H : Det er ge forskjell på de to udervsgsmetodee. H : Gruppearbedsmetode gr dårlgere resultat e tradsjoell metode. A Me å ragorder v dataee fra de mste poegsumme og opp tl de største og tldeler rag fra og opp tl Rag ,5 3, Når flere observasjoer er lke så tldeles tallee gjeomsttsrage av de ragtallee de skulle hatt om de hadde vært forskjellge. Mao hadde de to observasjoee på 5 vært Avedt Statstkk 47
150 forskjellge (for eksempel 5 og 5 skulle de hatt rag heholdsvs 3 og 4, dvs tl 3 4 samme 7 rag. Sde dsse å er lke får de stede begge rage 3, 5 (mao. fortsatt 3,53,5 7 tl samme rag. Som testobservator skal v å bruke de såkalte Wlcocoobservatore W so er gtt ved W ragsumme tl behadlgsobjektee Når H er rktg så ka det vses at W er tlærmet ormalfordelt med ( N E ( W og ( N ( N Var ( W Nå er små verder av W sgfkate. Tabelle over gr å følgede verd av W (se ragee med uthevet skrft Dermed blr P-verde w 34563, , ,5.5 P ( W 48,5 P( Z P( Z,9, E ser mao. fortsatt at det kke er oe gru tl å forkaste H. Velger e å bruke MINITAB fer ved kommadoee Statstcs Noparametrcs Ma-Whtey de såkalte Ma-Whtey-teste som tester på medaee, mao. mot H η (medaee de to gruppee er lke : η H A : η > η (medae kotrollgruppa er større e medae behadlgsgruppa Dette blr e ltt ae test e Wlcooteste, me som mdlertd også baserer seg på ragerg av dataee. E fer her ved først å legge dataee to koloer, og så velge kofdeskoeffset på 95% (må velges selv om e her ku øsker å drve hypoteseprøvg og så velge alteratvet η > η. Resultatet blr da: Avedt Statstkk 48
151 Ma-Whtey Test ad CI: C4; C5 N Meda C4 55,5 C5 39,5 Pot estmate for ETA-ETA s 3,5 95,6 Percet CI for ETA-ETA s (-,;33, W 57, Test of ETA ETA vs ETA > ETA s sgfcat at, Herav ser e altså at v får e P-verd på, som er ltt mdre e de de tlærmede P-verde på,35 som v fat fora. Fortegsteste. Ata at persoer skal utføre e arbedoperasjo gager; gag med tradsjoell metode og gag med e y og forhåpetlgvs bedre metode. Det trekkes lodd for hver perso om hvke motode som skal brukes først. Her vl mao. hver perso utgjøre forsøksobjekter. De ekelte er behadlgsobjekt med y metode og kotrollobjekt med tradsjoell metode. Ata at resultatet av forsøket ble (tde på operasjoe ble målt sekuder Perso Tradsj metode Ny metode Dfferes - - Der ma har satt et teg hvs tde med tradsjoell metode hos e perso er leger e med y metode. Hvs kke har ma satt et - teg. V tester å som før: mot So m testobservator skal v å bruke: H : Det er ge forskjell på de to metodee. H : Ny metode gr bedre resultat e tradsjoell metode. A X atall gager ( av de at y metode var best atall teg de forsøkee (herav fortegsteste Avedt Statstkk 49
152 Når H er rktg så er X bomsk fordelt med og p,5. Grue tl at p,5 er at det uder H (ge forskjell på de to metodee er lke sasylg at det blr som -. Nå observeres X 8 og sde store verder av testobservatoere er sgfkate blr P- verde P H ( X 8,547 >,5 Koklusjoe blr dermed at H ( så vdt kke forkastes på 5%-vået. Fortegsteste kalles også ofte bare tegteste (eg. sgtest Velger e å bruke MINITAB fer ved kommadoee Statstcs Noparametrcs -Sampl. Sg etter at ma har lagt tallee koloe C og C og bereget C3 C-C, og tl slutt bedt om at det testes på tallee C3: Sg Test for Meda: C3 Sg test of meda, versus >, N Below Equal Above P Meda C3 8,547 4, E ser at e får øyaktg samme P-verd som over. Hva betyr det for øvrg at ma MINITAB tester på medae? Fortegsteste er e ekel, me kke så veldg god test det de kaster bort e del formasjo. Om dfferese td er eller 36 vektlegges lke mye. E test som tar bedre vare på tallmateralet er de såkalte Wlcooteste for parvse sammelkger. Wlcooteste for parvse sammelkger. Hvs v eksempelet uder fortegsteste også hadde reget ut selve tdsdfferase vlle ma tatt mye bedre vare på tallmateralet. Ved bare å tldele eller kaster ma bort mye formasjo. Hvs ma tllegg hadde ragordet dsse dfferasee hehold tl deres absoluttverd vlle e fått: Avedt Statstkk 5
153 Perso Tradsj metode Ny metode Dfferes Rag 9 5,5 3,5 5,5 7 3,5 8 Ragerg (etter absoluttverd av dfferasee:, 3, 5, -5, -6, 6, 7, 8,, 36 Dsse skulle (hvs de alle hadde vært forskjellge ha ragtallee:,, 3, 4, 5, 6, 7, 8, 9 og. Me sde oe av observasjoee er lke så tldeles gjeomsttsragee. Nå tester e som over: H : Det er ge forskjell på de to metodee. mot H : Ny metode gr bedre resultat e tradsjoell metode. A Som testobservator skal v å bruke E fer her V 5,53,5 9 V Ragsumme tl de egatve dfferasee Nå er små verder av V sgfkate. Når H er rktg ka det vses at V tlærmet er ormalfordelt med : ( E ( V 4 der atall forsøksobjekter. og ( ( Var( V 4 P-verde blr da: 9,5 P 4 H ( V 9 P( Z P( Z 4 99 Normal(,.83,336 <,5,83 Koklusjo: H forkastes å på 5%- vået. Det tyder mao. på at y metode er bedre (raskere e tradsjoell metode. Egetlg burde ma her hatt e,5 stedefor e,5- korreksjo. Hvorfor? Gjeomfør testge med,5-korreksjo. Avedt Statstkk 5
154 Hvs ma å øsker å bruke MINITAB så bereger e først dfferasee mellom de kolloee og utfører så e Wlcootest på de ye koloe. E bruker da kommadoee: Statstcs Noparametrcs Ma-Whtey (som gr de såkalte Ma-Whtey-teste som tester på medaee Resultatet av dette blr: Wlcoo Sged Rak Test: C3 Test of meda, versus meda >, N for Wlcoo Estmated N Test Statstc P Meda C3 46,,33 5, E ser at dette stemmer med beregge av P-verde over med ormaltlærmelse hvor v fkk, Varasaalyse. V skal å se på e geeralserg av to-utvalgs t-tester. ANOVA(aalyss of varace - tester er e metode hvor ma ka sammelke mer e to populasjosgjeomstt samtdg. Som kjet ka Studets t-tester ka ku brukes for og gjeomstt. Forutsetge er som for t-tester at ma har ormalfordelte populasjoer. Helt geerelt teker v oss å at v har k ormalfordelte populasjoer hvor populasjo har et gjeomstt på µ og e varas på σ, hvor populasjo har et gjeomstt på µ og e varas på σ, og.., hvor populasjo k har et gjeomstt på µ k og e varas på σ. De k populasjoee atas mao. alle å ha lk varas. E øsker å å teste om de k gjeomsttee er lke eller om det er slk at mst ett av de er forskjellge fra de øvrge. Ma tester mao. mot H : µ µ L µ k ( gjeomsttet er lkt alle populasjoee H A : Mst e av µ ee er forskjellg fra de øvrge V teker oss å at det tas et tlfeldg utvalg på fra hver av de k populasjoee. Som det lgger avet så baserer teste seg på varasjoe tallmateralet ( og dermed på var asjo varase: varasjo ( og varas der df som før står for atall df frhetsgrader. Avedt Statstkk 5
155 Ata å at j er observasjo r j utvalg (gruppe r. E vl dermed få følgede datamatrse: Resultatmatrse fra de k utvalgee (de k observasjoee Utvalg (gruppe M M Utvalg (gruppe Utvalg (gruppe k. k. k M M M M M M. k k der de k gjeomsttee,,.., k er heholdsvs gjeomsttet utvalg (gruppe, utvalg,.., utvalg k. Legg merke tl at e her har omvedt otasjo av hva som er valg år det gjelder matrseregg hvor j beteger elemet rad r og koloe r j det e her har at j er observasjo r j utvalg (gruppe r. V får også bruk for gjeomsttet av alle de k observasjoee, som ofte kalles det store gjeomsttet. E har mao. Som testobservator skal ma å bruke k j, j Varase mellom gruppee( utvalgee F Varase efor gruppee ( utvalgee Hvs mage av µ ee er forskjellge så vl varasjoe (og dermed varase mellom gruppee bl stor, og dette fører gje tl at F vl bl stor. Mao. jo større F blr jo mer sasylg er det at H A er rktg dvs.: Mst e avµ ee er forskjellg fra de øvrge og dermed at det er gru tl å forkaste H : µ µ L µ. Mao. k H forkastes hvs F k (krtsk verd. Legg merke tl at F kke ka bl egatv. Hvorfor er dette tlfellet? Nå er varasjoe mellom gruppee gtt ved SSTr k j ( k ( forutsatt at det er lke mage observasjoer hvert utvalg. Dette er mdlertd ofte kke tlfelle og da er SST gtt ved Avedt Statstkk 53
156 Avedt Statstkk 54 k j k SSTr ( ( der k,,, K er atall observasjoer de forskjellge utvalgee. E ser at SST sammelker gjeomsttet hvert utvalg med det totale gjeomsttet. Varase mellom gruppee er dermed ( k k SSTr frhetsgrader Atall SSTr MSTr k forutsatt at det er lke mage observasjoer hver gruppe. Aalogt er å varasjoe e gruppee gtt ved k j j SSE ( forutsatt at alle utvalgee er lke store. Her ser e at hver eeste observasjo blr sammelket med stt gruppegjeomstt det hvs ma skrver ut dobbeltsumme får e: ] ( ( [( k SSE L ( ( ( ( ( ( ( ( ( k k k k k k L M M M L L L Hvs utvalgee kke er lke store så bruker e stede k j j SSE ( Varase e gruppee er dermed ( ( ( k k SSE frhetsgrader atall SSE MSE k j j
157 forutsatt at det er lke mage observasjoer hver gruppe. E ser av utrykket for SSE over (utskrevet at dee kke påvrkes samme grad som SST år mst et av populasjosgjeomsttee er forskjellg fra de øvrge. Dermed blr Varase mellom gruppee(utval gee F Varase efor gruppee(utval gee MST MSE også stor år mst et av populasjosgjeomsttee er forskjellg fra de øvrge. Når H : µ µ L µ k er rktg ka det vses at F er såkalt Fsherfordelt med (k- og (-k frhetsgrader. Det betyr mao. at H forkastes på vået α hvs F f ( k,( k,α der de krtske verde f( k,( k, α er de såkalte α -fraktle Fsherfordelge med (k- og (-k frhetsgrader. Det er valg å sette alle dsse summee og frhetsgradbereggee e såkalt ANOVA-tabell. De ser ut som følger: Varasjosklde Kvadratsum Frhetsgrader Varas Verd av F P-verd Mellom SSTr k- MSTr MSTr P ( grupper f H F f MSE Ie SSE k(- MSE grupper Total SST k- I tllegg tl summee og frhetsgradee som er evt fora er det også satt SST som som står for totalvarasjoe (SumSquaredTotal. Dee er gtt ved SST k j ( j hvs alle utvalgee er lke store, og Det ka vses (matematsk at SST k j ( j Avedt Statstkk 55
158 k j k ( j ( ( j k j j eller mao. at SST SSTr SSE Dvs. at totalvarsjoe er lk summe av varasjoe mellom utvalgee og varasjoe e utvalgee. Dette er yttg år ma skal rege med papr og blyat, ford ma da ka kotrollere om summee er reget rktg ut. Dette er jo mdlertd helt uteressat år ma ete bruker MINITAB eller kalkulator. Eks. Ata at e perso har tatt tde hu bruker på å kjøre tl jobbe på de forskjellge ukedagee. Hu har valgt å ta 6 tlfeldg tder på hver ukedag. (Hvorda ka hu gjøre dette. Ata at resultatet av udersøkelse ble: Td mutter: Madag Trsdag Osdag Torsdag Fredag Herav fer e de forskjellge ukedagees gjeomsttskjøretder: Målgee vser e ltt høyere gjeomsttstd på madag e på de øvrge ukedagee. Dessute ka det se ut som om gjeomsttstde på fredag er ltt lavere e de adre dagee. V øsker å å teste : H µ : µ µ µ µ dvs at gjeomsttlg kjøretd ( populasjoee er lke, mot H A : Mst e avµ µ er forskjellge fra de øvrge, µ, µ 3, µ 4, 5 Hva forstår du med gjeomsttlg populasjoskjøretd dee sammehege? V må å rege ut de forskjellge SS-summee, deretter de tlhørede varasee og tlslutt sette opp selve ANOVA-tabelle som brukes tl å trekke koklusjo. Spørsmålet v skal Avedt Statstkk 56
159 besvare er mao.: ka v på bakgru av de samlede dataee forkaste påstade om at gjeomstlg kjøretd ( det lage løp for dee persoe er lk på de forskjellge ukedagee slk at de avvkee hu har observert på de forskjellge ukedagee ku skyldes tlfeldgheter. V fer å først j 44 k 5, j Forklar hvorfor dette stemmer. Hvorda ka du kotrollere dsse bereggee? Deretter fer ma k SSTr ( ( j 6[(49 44 (43 44 k L (4 44 ] 64 og [(45 49 (4 43 ( SSE k j (53 49 (43 43 (39 4 ( j L (5 49 L (43 43 LLLLLL L (4 4 ] Kotroller utreggee (ft utgagspukt for hoderegg over. Bereg så SST og kotroller at SST SSTr SSE Dermed fer e følgede ANOVA-tabell: Varasjosklde Mellom grupper Kvadratsum SST r 64 Ie SSE grupper 6 Total SST 39 Frhet s- grader k- 4 k(- 5 k- 9 Varas Verd av F P-verd MSTr 66 MSE 5,4 MSTr f MSE P ( F 3,95 3,95.. H 6,956E^-6,6956 Avedt Statstkk 57
160 Der P-verde er reget ut ved hjelp av kalkulatore med følgede kommadoer: - ND VARS 9: Fcdf( ENTER Ved å å legge gresee og 3,95, samt frhetsgradee 4 og 5 fer e å arealet 5 uder F-fordelge mellom,3 og uedelg tl,46 ( dvs.,... TI-84 vser å: Det betyr at H : µ µ µ µ µ forkastes på,% vået og det tyder da på at mst et av populasjosgjeomsttee er forskjellge fra de øvrge. E ka også gjeomføre hele varasaalyse på kalkulatore. Da må e først legge tallee (dataee fra de 5 forskjellge ukedagee 5 forskjellge lster L, L, L, L5. Dette gjøres ved kommadoee STAT EDIT ENTER Når dette er gjort så bruker e kommadoee STAT TESTS F:ANOVA ENTER Legger så L, L, L, L5 slk at kalkulatore vser ANOVA( L, L, L3, L4, L5. Trykker e deretter ENTER får e følgede skjermblde: Avedt Statstkk 58
161 Dette ser e stemmer godt overes med de F- og P-verde e har fått over. Velger e å å bruke MINITAB drekte, får e ved hjelp av følgede kommadoer: STATISTICS ANOVA Oe-Way (ustacked Oe-way ANOVA: Madag; Trsdag; Osdag; Torsdag; Fredag Source DF SS MS F P Factor 4 64, 66, 3,, Error 5 6, 5,4 Total 9 39, S,45 R-Sq 67,69% R-Sq(adj 6,5% Idvdual 95% CIs For Mea Based o Pooled StDev Level N Mea StDev Madag 6 49,,898 (----*---- Trsdag 6 43,,98 (-----*---- Osdag 6 43,,366 (-----*---- Torsdag 6 45,,9 (-----*---- Fredag 6 4,,44 (----* ,5 4, 45,5 49, Pooled StDev,45 E ser at dette (selvfølgelg også stemmer med bereggee over Når dataee er gtt som her med e koloe for madagsdatee, e koloe for trsdagdataee, osv må e velge alteratvet Oe-Way (ustacked. Hvs dataee (kjøretdee alle samme lå e koloe og dagee madag (for eksempel, trsdag (for eksempel osv fredag (for eksempel 5 lå e ae koloe skulle e ha brukt kommadoe Oe-Way. Forutsetge for å bruke evesvarasaalyse er som evt tdlgere at populasjoee er ormalfordelte med gjeomstt µ, µ, µ 3,..., µ k og med ukjet varas (me lk varas σ alle populasjoee. Se på hvlke utstrekg du meer dette er oppfyllt. (Vk: Se på utvalgsvarasee Hva betyr det at 95% kofdestervallee er dvduelle? Bereg ved hjelp av adre kommadoer MINITAB et av dsse kofdestervallee og se om du får samme svar. Hvs det hadde vært slk at det også hadde vært 6 forskjellge sjafører volvert kue e ha gjeomført e såkalt -ves varasaalyse restvarase MSE vlle å bltt mdre ford e å får to SSE- summer som sum er mdre e de opprelge SSE. V skal kke komme på dette dee boka, me ku gjøre oppmerksom på at hvs ma har tlleggsopplysger om varabel tl så bør dee være med aalyse dette blr e bedre aalyse (tar bedre vare på tallmateralet Avedt Statstkk 59
162 7. Regresjo og varasaalyse. På sde 3 så v på de ekle regresjosmodelle Y α β e,,,..., der e, e,..., e er uavhegge felledd som har forvetg og varas σ Lkgeµ α β som v kalte for populasjosregresjoslkge for Y m.h.t. Y X. estmerte v ved hjelp av et utvalg av observasjospar. V fat da e såkalt estmert regresjoslkg eller e utvalgsregresjoslkg som v beteget ved y ˆ a b ved hjelp av de såkalte mste kvadraters metode. Øsker e å å teste mot H A H : β β β < β eller : β > β eller β β så bruker e testobservatore T vss verder er gtt ved ˆ β β t ˆ σ ( S (* Bruker e gje eksempelet (fra sde 3med sammehørede verder mellom vekt (Y og høyde (X, der v blat aet uder avsttet om kofdestervaller bereget følgede størrelser: S ( s (9, ,598.. Hvs ma å først øsker å teste ˆ σ ( y ˆ y 436,5 6,67 Avedt Statstkk 6
163 mot H : β (Det er ge sammeheg mellom X og Y H : β > (Det er e ( postv sammeheg mellom X og Y A så blr ˆ β β t ˆ σ ( S,86 6,67 ( 833,598 3,89 Bereger e stede t ved formele ˆ β β ˆ β β t S der ˆ σ SE( ˆ β e SE( ˆ β ˆ σ S e (det sste uttrykket er kaskje det mest brukte av de to, og dette skal v komme tlbake tl seere E fer å av det ye utrykket ˆ β β,86 t 3,89 SE( ˆ β,56.. Dermed blr P-verde 99 P H ( T 3,89 tcdf (3.89,,8,64 og ma ser at resultatee er sgfkate på %-vået. Dvs at H : β (Det er ge sammeheg mellom X og Y forkastes på %-vået, og ma påstår H A : β > (Det er e ( postv samme heg mellom X og Y. I MINITAB fer v å ( se dataee sde 36 ved hjelp av kommadoee STAT REGRESSION REGRESSION Respoce C (y-verdee, Predctors C (-verdee OK Regresso Aalyss: C versus C The regresso equato s C - 67,5,86 C Predctor Coef SE Coef T P Costat -67,48 44,77 -,5,7 C,86,558 3,9,3 S 7,38448 R-Sq 56,% R-Sq(adj 5,5% Avedt Statstkk 6
164 Herav ser e at t-verde blr 3,9 som stemmer godt overes med 3,89 over. Det som mdlertd kke stemmer så godt overes er P-verde Sg.,3. Dette forklares mdlertd grett år ma får vte at MINITAB tester tosdg, dvs. H : β mot H : β (det er e sammeheg mellom X og Y og dermed blr P-verde (pga. symmetr P H A 99 ( t 3,57 tcdf (3.89,,8,64,8,3 Legg også merke tl at ma får e såkalt varasaalyse utskrft (uasett om ma øsker det eller kke. Dette er e ae måte å gjeomføre regresjosaalyse på. Legg mdlertd merke tl at P-verde er de samme som uder regresjosaalyse. Nå ka det vses (se sde 4 hvs ma hvert eeste pukt kvadrerer og summerer avvkee over at dvs. at ( y y ( yˆ y ( y yˆ Total varasjo Forklart varasjo Uforklart varasjo eller at Bruker e tallmateralet sde 36 fer e SST SSR SSE y ŷ -67,5,86 63, 67, 86,7 85, 8, 69,6 8, 7, 74,5 7,9 og herav 75 SST ( y y y y 5754 (, , 59 SSR ( yˆ y [ (63,-75,. (7,9-75, ] 555, SSE ( y yˆ [ (7-63,. (85-7,9 ] 436,8 E ser at e får bekreftet påstade om at SST SSR SSE Avedt Statstkk 6
165 De llle forskjelle mellom vestresde og høyresde skyldes avrudger. ( SST 99,5 og SSR SSE 99,38 Bruker e så MINITAB og bruker Varasaalyse tl å gjeomføre regresjosaalyse ( mao. e bruker varasee regresjo tl å dae F får e (se sste del av MINITAB utskrfte Aalyss of Varace Source DF SS MS F P Regresso 555,36 555,36,8,3 Resdual Error 8 436,4 54,53 Total 9 99,6 Mao. øyaktg samme resultat som ved t-teste over ( P-verd,3. Legg merke tl at t 3,9, 8 F. Dette er et resultat som ka vses helt geerelt. Testg vedrørede korrelasjoskoeffsete. I mage sammeheger er ma teressert å teste hypoteser kyttet tl forskjellge verder av korrelasjoskoeffsete mellom to varable X og Y. Oftest er dee verde lk, ford ma øsker å teste om det er oe sammeheg mellom varablee X og Y mot H : ρ ( Det er ge sammeheg mellom X og Y > eller H A : ρ < eller hvor de tre forskjellge alteratvee represeterer hhv. Det er postv korrelasjo mellom X og Y, det er egatv korrelasjo mellom X og Y og det er ge korrelasjo mellom X og Y. Hvs v gje ser på tallmateralet fra sde 9, og legger dette MINITAB og bruker kommadoee STAT BASIC STATISTICS CORRELATION og legger tallee, gr dette følgede utskrft: Correlatos: C; C Pearso correlato of C ad C,748 P-Value,3 Avedt Statstkk 63
166 Det betyr mao. at korrelasjoskoeffesete mellom X og Y er,748, som v har fuet tdlgere, og at testg av mot H : ρ (Det er ge korrelasjo mellom X og Y H : ρ (Det er korrelasjo mellom X og Y A gr e sgfkassasylghet på,3 som er press samme sgfkassasylghet som de ma fat på sde hvor ma testet mot H : β (Det er ge sammeheg mellom X og Y H : β (Det er e sammeheg mellom X og Y A Hvorda ka det ha seg slk? Jo, korrelasjoskoeffsete måler jo ettopp grade av sammeheg (leær mellom to varable. Dsse ullhypotesee er mao. helt ekvvalete. At det vrkelg er slk ser e av utrykkee for b og r y ( se sde? og? s b s y r y s s y s y Av det første uttrykket fer e å s b y s som så settes det adre utrykket og gr r y s b s y Mao.: Herav ser e at hvs r så er b og omvedt. ( s og s > y > y 8. Multppel regresjo. Fora heftet (sde 3 betraktet v de ekle regresjosmodelle Y α β e,,,..., der e,...,, e e er uavhegge felledd som har forvetg og varas σ Avedt Statstkk 64
167 Lkgeµ α β som v kalte for populasjosregresjoslkge for Y m.h.t. Y X estmerte v ved hjelp av et utvalg av observasjospar. V fat da e såkalt estmert regresjoslkg eller e utvalgsregresjoslkg som v beteget ved y ˆ a b ved hjelp av de såkalte mste kvadraters metode. I dee stuasjoe er det varabele X (alee som skal forklare varasjoe Y. I de fleste stuasjoer ( vrkelghetes verde vl det som regel være flere forklargsvarable kyttet tl e varabel. V skal å ata at v har k forklargsvarable modelle for multppel regresjo å blr X,, X, K X k slk at de statstske Y β β β L β k k ε,,,..., der ε ~ N(, σ for,,..., atas å være uavhegge. Det betyr at µ β β β L β Y,... k k k som gje kalles for populasjosregresjoslkge. Dee estmeres så ved hjelp av de såkalte utvalgsregresjoslkge y ˆ b b b L b k k som gje bereges ved mste kvadraters metode ved hjelp av et utvalg av k observasjoer, dvs det er tatt observasjoer hver av de k uderpopulasjoee: X er kyttet tl populasjo, X er kyttet tl poulasjo,., og X k er kyttet tl populasjo k. De (k ukjete estmatee b, b, b, L, bk fer e som tdlgere ved å mmere de kvadrerte avvkee e yˆ ( y Dette leder tl de såkalte ( k ormallkgee: b b b L bk k b b b L bk k b k b k b k bk k L y k y y Avedt Statstkk 65
168 der summe av de observasjoee fra populasjo, y y summee de observerte y- verdee, osv.., y y produktsumme av de observasjoee fra populasjo k og de observerte y- verdee. Eks. Ata at ma øsker å sjekke sammehege mellom varablee prs (Y, klometerstad ( X og alder ( X på blmerket Toyazda MZW et bestemt dstrkt på Østladet. Ata at ma tar et tlfeldg utvalg på bler og fer følgede: k k Km-stad ( km Prs y ( kr. Alder ( md 7 4,7 3 8,5 45 5, 8 8, , 9,8 5 36,3,7 3 5,4 4 3,4 V skal å gjøre bruk av de leære regresjosmodelle Det vl egetlg s at Y Y β β β ε β β β ε,,,..., Estmat for β, β og β gtt ved heholdsvs b, b og b gr dermed de estmerte regresjoslkge y ˆ b b b Lkgsystemet over atar å forme b b b b b b b b b V må mao. bestemme 8 summer (hvorfor kke flere?, deretter sette opp de 3 lkgee med de 3 ukjete og så løse dsse. y y y Avedt Statstkk 66
169 Nå fer e (legg de tre koloee lste, og 3 på kalkulatore 7 3 L L L L L y,7,5 L,4,4 4,5 y 7,7 3,5 L 3,4 4,4 773,9 y 4,7 8,5 L 5,4 3,4 66,8 Med fer e da følgede lkgssystem: b 33b 86b 33b 3864b 34b 86b 34b 834b 4,5 773,9 66,8 Løser e dette ved hjelp av kalkulatore eller ved papr og blyat fer e b,8988, b, 3 og b, 94 For de som har tatt kurset leæralgebra har e b b 33 b ,5, ,9,3 66,8,9 Det betyr mao. at de estmerte regresjoslkge (eller utvalgsregresjoslkge blr yˆ b b b,8988,3, 9 For de som kke har dette kurset må de selv velge hvlke måte de øsker å løse lkgssystemet på. Det greeste er kaskje gjeom settgsmetode å skaffe seg lkger med ukjete og derfra løse dsse ete med setgsmetode e gag tl eller bruke addsjosmetode. Avedt Statstkk 67
170 Det betyr for eksempel at e Toyazda MZW som har kjørt km og er md. gammel skal koste 8988 kroer ( Nå er y prs på dee modelle 9 kroer. Hvorda vl du forklare at v å ser at de skal koste 8988 kroer? Hvs de har kjørt 5 km og er 8 md gammel skal de koste (estmert prs y ˆ,8988,3 5,9 8,646 mao. de vl koste 646 kroer følge modelle. Bruker e å MINITAB med kommadoee Stat Regresso Regresso og så legger dataee får e følgede utskrft: Regresso Aalyss: Prs versus Km; Alder The regresso equato s Prs,9 -,336 Km -,8 Alder Predctor Coef SE Coef T P Costat,8995,388 74,7, Km -,336,77 -,4,56 Alder -,799,88-4,,4 S, R-Sq 96,6% R-Sq(adj 95,6% E ser at dette stemmer gaske bra med bereggee over. V skal å se på de øvrge utreggee MINITAB og hva de brukes tl. I modelle over har v sagt at feleddee ε ~ N(, σ. Mao. at feleddee er ormalfordelte med e forvetg på og et stadardavvk påσ. Det ka vses at ka estmeres med s der s er gtt ved σ s e k k ( y yˆ Bruker e å dataee tabelle over fer e Avedt Statstkk 68
171 Km-stad Alder Prs Estmert Estmert y verd avvk ( km ( md ( kr ŷ e 7 4,7,68, 3 8,5,49, 45 5,,6 -,4 8 8,6,59, 67 63,,93,7 9,8,75,5 5 36,3,3,7,69, 3 5,4,5 -, 4 3,4,4 -, Herav fer e så s e (,, (, L k,8 (,,3 7 og dermed tlslutt s,558 som stemmer meget bra med MINITAB-utskrfte hvor s, SE Coef som agr stadardfele (avvket tl de estmerte koeffesetee b, b og b er e del vaskelgere å rege ut så v skal kke komme på det her. For de som allkevel øsker å komme tl bus dette ka f.eks se etter Joh E. Freuds bok: Mathematcal Statstcs wth applcatos (7. ed sde 465. foklarge her bygger e del på kuskaper leær algebra. t-verdee fer e av b j b t SEb j j der b j er de verde av parametere som e tester ved ullhypotese. Det mest valge er å teste H : β b j j og det er det som er gjort MINITAB-aalyse. Det betyr mao. at t b j SEb j Ser e å på tallee tabelle over fer e Avedt Statstkk 69
172 t Cost,8995,388 74,7 t Km t Alder,336,4,77,799 4,,88 som stemmer med tallee tabelle. E fer da følgede P-verder (ved hjelp av kalulatore år ma tester H : β b mot H : β j j j For kostate : P ( t 74,7,, For atall kjørte km: P ( t,4, 55 For alder: P ( t 4,4, 4 Her er alle sasylghetee reget ut ved hjelp av kalkulatore med df -k- --7 frhetsgrader. Kotroller selv at bereggee stemmer. E ser mao. at ullhypotese og 3 forkastes, mes ullhypotese kke ka forkastes. Hvs e stede velger å gjeomføre varasalyse de multple regresjosstuasjoe får e ved hjelp av MINITAB Aalyss of Varace Source DF SS MS F P Regresso,6355,377 98,48, Resdual Error 7,45,36 Total 9,65 De geerelle ANOVA-tabelle multppel regresjo er som følger: Avedt Statstkk 7
173 Klde Modell (regresjo Fel (resdualfel Atall frhetsgrader df p -p- Varasaalyse Sum av kvadrater SS SSM ( yˆ y SSE ( y yˆ Total - SST ( y y Gj.s. kvadrat summer MS SSM MSM p SSE MSE p F MSM MSE Sjekk selv om verdee over MINITAB-utskrfte stemmer. Legg merke tl at det også her er mulghet tl å kotrollere oe av mellomreggee det følgede gjelder:. df.tot df.modell df.fel. SST SSM SSE Hva er det så ma tester her? Jo motsetg tl over hvor v har testet H : β b mot H : β j j j for j, og 3. Mao. 3 ullhypoteser testes hver for seg. Dermed gjelder resultatee også hver for seg. Med varasaalyse tester e dermot mot H : β β L β p H : Mst e avβ ee j Det vl mao. s eksempelet over at ma tester samtdg mot H H : β β : Mst e avβ og β Legg merke tl at ma her ku tester på koeffsetee tl predktoree (forklargsvarablee og på koeffsete tl kostatleddet. Avedt Statstkk 7
174 9. Oppgaver Oppgave Bereg gjeomsttet tallmateralee a, 5, 3, 6, 7, 4, 9,, 8, 3 b 6, 5, 9, 8,,, 7, 33, 4, 39. c Ser du oe sammeheg mellom de to tallmateralee og deres gjeomstt? Oppgave Bereg gjeomsttet tallmateralee a 3, 4, 6, 5, 9,, 8, 3, 4, 3 b 3, 4, 6, 5, 9,, 8, 3, 4, 3 c Ser du oe sammeheg mellom de to tallmateralee og deres gjeomstt? Oppgave 3 Ata at et tallmaterale er gtt ved,,, L, Bereg gjeomsttet tallmateralee a y k,, L der k er e vlkårlg kostat, c,, L, b z der c er e vlkårlg kostat Oppgave 4 Oppgave 5 a Bereg typetallet oppgave. a b Bereg typetallet oppgave. a c Hva er typetallet tallmateralet 3, 4, 3, 8, 9, 5, 6, 5, 9, F medae tallmateralee a 3, 5,, 4,8, 6, 9 b 3, 5,, 4,8, 6 c F gjeomsttet b og sammelk med medae. Kommeter kort. Avedt Statstkk 7
175 Oppgave 6 Bereg σ tallmateralet, 3, 6, 4, 7, 3, 8, 9,, 5 a ved hjelp av b ved hjelp av ( ( og c Bereg stadardavvket σ Oppgave 7 Bereg s tallmateralet, 3, 6, 4, 7, 3, 8, 9,, 5 a ved hjelp av b ved hjelp av ( ( og c Bereg stadardavvket s. d Legg tallee e lste på kalkulatore og bereg σ og s. Kommeter kort forskjellee. Oppgave 8 a Vs at ( ( b Vs at ( (, a b a ( Vk: ( a b a ab b ka k a der k er e vlkårlg kostat ( b og Avedt Statstkk 73
176 Oppgave 9 Gtt de to tallmateralee :, 4, 5,, 5, 8, 7, 9, 3, 8, 9 og y : 3, 4, 6, 7, 6, 8, 9, 8,, 7, a Bereg varasjosbredde de to tallmateralee. b F varasee de to tallmateralee (betrakt dataee som utvalg c Bestem første, adre og tredje kvartl. d F tlslutt kvartlbredde de to tallmateralee. Oppgave Gtt de to tallmateralee :, 4, 5,, 5, 8, 7, 9, 3, 8, 9 og y :, 4, 5,, 5, 8, 7, 9, 3, 8, 9. (begge utvalg a Bereg varase de to tallmateralee. Kommeter kort resultatee. b y La tallmateralet z være gtt ved z. F varase dette tallmateralet. Kommeter kort resultatet. Oppgave a Vs at hvs y k der k er e vlkårlg kostat så har tallmateralee samme varas. b Vs at hvs y k så er varase tl y-ee der k er e vlkårlg kostat så er varase tl y-ee, s y, gtt ved s k y s der s er varase tl -ee. Oppgave Gtt tallmateralet : 3, 8, 6, 9, 3, 7,,, 4, 5 a F første og tredje kvartl tallmateralet ved regg. b Legg tallee e lste på kalkulatore. F så første og tredje kvartl ved hjelp av kalkulatore. c Legg så tallee e koloe MINITAB og f kvartlee. d Sammelk resultatee a, b og c og kommeter evetuelle forskjeller. Avedt Statstkk 74
177 Oppgave 3 Gtt tallmateralet :, 3,,,, 4, 5, 5, 6, 7, 7, 3, 4, 5, 7,, 7, 8, 8, 5 a F kvartlee og medae. b Avgjør om observasjoe 5 er e outler. Hvs så er tlfellet så fjer de fra datamegde. c F gjeomsttet på eklest mulg måte. d Bestem stadardavvket s og f adele observasjoer som faller efor ± s Oppgave 4 Gtt tallmaterallmateralet,,,.,5 som er framkommet ved å be kalkulatore lage 5 tlfeldge heltall mellom og (radt(,, 5 gager og lagre og tall lste,, lste 5. a Bereg gjeomsttet og medae tallmateralet. Kommeter kort resultatee. b F første og tredje kvartl og kvartlbredde c F % og 9% percetlee og herav -9 percetlbredde P 9 P Oppgave 5 Oppgave 6 a Smuler 5 tlfeldge trekger fra e ormalfordelt populasjo med gjeomstt på 8 og stadardavvk på 7 ved hjelp av kalkulatore ( radnorm (8, 7, 5. Lagre dsse e tlfeldg lste og bruk så kalkulatore tl å gjeomføre -Var Stats på dsse dataee b Gjør det samme MINITAB og bruk kommadoe descrptve statstcs. Gtt tallmateralet :, 3,,,, 4, 5, 5, 6, 7, 7, 3, 4, 5, 7,, 7, 3, 4, 5 Avedt Statstkk 75
178 a Bereg 3.ordesmometet m 3 gtt ved m 3 f k ( k 3 ved hjelp av kalkulatore. Kommeter kort resultatet. b Bereg så g og G gtt ved heholdsvs m ( 3 g og G 3 g m 3 c Legg så dataee MINITAB og bereg skjevhete (the skewes Oppgave 7 Smuler et utvalg på ormalfordelte observasjoer på kalkulatore fra e populasjo hvor µ 5 og σ 3. a Bereg 4.ordesmometet m 4 gtt ved m 4 f k ( k 4 ved hjelp av kalkulatore. Kommeter kort resultatet. b Bereg så g og G gtt ved heholdsvs m4 g 3 og G [( 6] m g ( ( 3 c Legg så dataee MINITAB og bereg spsshete (the kurtoss (Legg merke tl forskjelle på utrykkee for g og g. I det sste utrykket er brøke redusert med 3 for å kue sammelke med ormalfodelge hvor spsshete er øyaktg lk 3. Det betyr mao. at e fordelg hvor spsshete er større e hos ormalfordelge vl g være større e, e fordelg hvor spsshete er mdre e ormalfordelge vl g være mdre e. d Hva bør g omtret være for dataee dee oppgave? Bereg g og G ved hjelp av kalkulatore. e Bereg g og G dataee oppgave.4. Vrker resultatee rmelge? Avedt Statstkk 76
179 Oppgave 8 Ata at det ble avholdt prøvevalg på e ugdomsskole med 5 elever og at resultatet ble som følger: Part Atall stemmer Arbederpartet 48 Fremskrttspartet 5 Høyere 35 Krstelg Folkepart 3 Rød Valgallase 8 Seterpartet Sosalstsk Vestrepart 48 Vestre 6 a Fremstll dataee grafsk ved hjelp av et stolpedagram (bar chart og ved hjelp av et kakedagram (pe chart b Sammelk grafsk de prosetvse oppslutge tl regjergspartee (AP, SV og SP mot de adres. Oppgave 9 I e klasse ble karakteree avgagsprøve orsk som følger: Karakter Atall Fremstll dataee grafsk både ved hjelp av kalkulatore og ved hjelp av MINITAB Oppgave E utdagsstatstkk fra statstsk setralbyrå for de ordske ladee for 5* vste følgede atall ( mht. høyeste fullførte utdag Utdag (begge kjø Gruskoleutd. V.g. utd. og påbyggg. tl v.g.utd. Uvers.- og høgsk.utd. Damark Flad Islad Norge Sverge Avedt Statstkk 77
180 Lag e passede grafsk framstllg av dsse dataee. (* Tallee fra Islad er fra 4 Oppgave Statstsk årbok fra 7 vser følgede overskt over høyeste fullførte utdag for persoer på 6 år og over perode 97-5 ( proset: År Uv.og høgsk. vå,kort (<4år 5,7 8,8, 7, 7,4 7,7 8, 8,6 9, Lag e passede grafsk framstllg av dsse dataee. Oppgave Oppgave 3 Idel tallmateralet oppgave.6 tre lke klasser (samme klassevdde a Bereg.det artmetske mddeltall og medae tabelle b F første og tredje kvartl ved regg og ved hjelp av kalkulatore c Teg sumfordelgskurve og bruk dee tl å lese av alle tre kvarlee. d F tl sst de tre kvartlee ved hjelp av Rest Kvartl L f I e klasse på 8 elever er det 6 gutter. Teg et kakedagram som llustrerer adele gutter og adele jeter klasse v Oppgaver 4 På e skole er aldersfordelge blat de 4 lærere som følger: 3, 36, 56, 54, 6, 58, 45, 65, 67, 54, 4, 34, 37, 5, 8, 44, 4, 43, 59, 38, 39, 49, 5, 57, 34, 56, 5, 48, 5, 45, 63, 64, 65, 59, 58, 67, 39, 36, 35, 6, 53, 5 a Teg et stamme-blad dagram som llustrerer aldersfordelge. b La MINITAB tege et stamme-blad dagram c Teg et hstogram med klassevdder på år. Avedt Statstkk 78
181 Oppgave 5 I følge statstsk setralbyrå så fordelte atall vokseopplærgskurs perode seg som følger: År Kurs alt Framstll tallmateralet grafsk. Oppgave 6 I følge statstsk setralbyrå så var atall studeter høyere utdag utladet perode som følger: År Atall stud Adel kver 5, 56,7 57,6 a Teg et kurvedagram som vser utvklge på atall kver og et som vser utvklge på atall me de aktuelle perode. b Teg 3 kvadrater som vser utvklge av adele kver høyere utdag utladet. Velg sde cm 995. Oppgave 7 På e hukommelsesprøve ble det lest opp 5 ord som elevee skulle skrve ed flest mulg av etter at opplesge var ferdg. Resultatet blat de 5 elevee ble som følger: :, 3,, 8, 4,3, 4,5, 9,,,,,, 7 a F m, Q, M, Q og maks og boksplottet. b Legg dataee e lste på kalkulatore og teg så det valge boksplottet og det modfserte boksplottet. c Avgjør ved regg om verde 3 er e outler eller kke. Sammelk med det du fer pkt b d F med og ute verde 3. Avedt Statstkk 79
182 Oppgave 8 Gtt tallmateralet : 3, 35,43, 39, 9. Avgjør både ved regg og ved e grafsk framstllg om 9 er e outler. F gjeomsttet og medae med og ute 9. Oppgave 9 Udersøk om de observasjoee,95; 99,64; 99,77; 3,94; 96,4; 99,; 4,66;,85; 5,9; 8,4 ka være ormalfordelt (eller ekvvalet ka ses å være et tlfeldg utvalg fra e ormalfordelt populasjo ved å tege et ormal kvatlplot. Oppgave 3 Legg de 5 observasjoee gtt uder på kalkulatore og avgjør om de ka ses å være ormalfordelt. Bruk kalkulatore optmalt. 9, 8,, 5,,,, 8, 7,, 8, 9, 5,, Oppgave 3 a Smuler 5 ormalfordelte observasjoer med µ 5 og σ 3 på kalkulatore. Lagre observasjoee e lste og teg et sasylghetsplot. b Gjør så det samme MINITAB og gjeomfør e ormaltytest.( Vk: Velg Aderso-Darlg Oppgave 3 A. Ata at ma har målt høyde X tl tlfeldg valgte kvlge: studeter og at ma fat: Høyde ( cm [ 55,6 [ 55,6 [ 55,6 [ 55,6 [ 55,6 [ 55,6 [ 55,6 Frekves Avedt Statstkk 8
183 a Framstll dataee grafsk og f. b F stadardavvket s og adele som faller efor tervallet s, ved regg. [ ] s c F de relatve frekvesee r k og deretter de kumulerte relatve frekvesee R k. Teg sumfordelgskurve og bruk dee tl å kotrollere beregge av adele b. B. Ma øsker å å kotrollere om dataee følger e ormalfordelg med µ 7,5 og σ 7,. La varabele Y N(7,5; 7,. a Vs at da er p P( Y < 6, 37 og p P(6 Y < 65,49. Bereg deretter p P(65 Y 7 og 3 < p 4 P(7 Y < 75. I reste av oppgave ka du bruke (Skal kke vses at p P(75 Y 8,85, p P(8 Y 85 5 <,49 og p P( Y 85, < c La å X høyde på e tlfeldg valgt kvlg studet. Test da med utgagspukt dataee pkt. A om du vl forkaste tl fordel for H : X er ormalfordelt med µ 7,5 og σ 7, H : X er kke ormalfordelt med µ 7,5 og σ 7, Velg vå på 5%. d Gjeomfør testge ved e ormaltetstest MINITAB (kke gtt tl eksame Oppgave 33 E kotrollprøve matematkk gav følgede resultat Poeg k Frekves f k ( 6 poeg er maksmal poegsumm a Framstll dataee grafsk. Avedt Statstkk 8
184 b Bereg det artmetske mddeltallet og medae M. Kommeter kort evetuelle forskjeller. c Framstll sumfordelgskurve grafsk og f adele elever som faller mellom og M både ved regg og ved avlesg. d Bereg stadardavvket s. Et mål på skjevhete (the skewess er gtt ved a 3 ( k k s 3 f k ( I e symmetrsk fordelg er a 3, dvs det er ge skjevhet e Bereg skjevhete dette tallmateralet. Oppgave 34 Ata e har følgede 7 parobservasjoer (, y,,..., Y a Teg spredgsdagrammet. b Avsett puktet (, y spredgsdagrammet og teg de rette lja som passer best puksverme c F lkge for dee rette lja. Dee lja er de såkalte regresjoslja for y mhp. fuet ved grafsk metode. d Ata leær regresjosmodell y α β ε derε er N(, σ og sett så opp ormallkgee tl bestemmelse av a og b de såkalte estmerte regresjoslkg y ˆ a b e Løs ormallkgee mhp. a og b. Teg så dee mste kvadraters regresjoslkg samme koordatsystem som over. Avedt Statstkk 8
185 f Kotroller både ved hjelp av MINITAB og kalkulatore at de beregger over stemmer. g Teg resdualplottet og sjekk om forutsetge regresjosmodelle ka ses å være oppfylt eller kke. Oppgave 35 Ved e skole er det tlfeldg trukket ut bar som alle har vært gjeom e matematkktest og e lesetest. Resultatet av udersøkelse ble: Bar Poeg matematkktest Poeg lesetest y a Teg spredgsdagrammet og se om det er oe tedes tallmateralet. b Bereg, y, s og sy. F så mste kvadraters regresjoslje og. teg de spredgsdagrammet. Estmer atall poeg e elev vl få på leseteste gtt at vedkommede fkk 5 poeg på matematkkteste c F så s y og bruk dee samme med bereggee pukt b tl å fe korrelasjoskoeffsete mellom og y. kommeter kort resultatet lys av pukt a. d Bruk både kalkulatore og MINITAB tl å fe korrelasjos koeffsete. e Sksser spredgsdagrammet. Oppgave 36 Ata e har følgede 8 parobservasjoer (, y,,..., y a Teg spredgsdagrammet. b Avsett puktet (, y spredgsdagrammet og teg de kurve som passer best puksverme. Ag de modelle du fer rmelg å bruke ( foreslå et fuksjosuttrykk, y f (, som du vl bruke Avedt Statstkk 83
186 c Sett opp det atall lkger som du fer rmelg og løs så dette lkgssettet ( Vk: 3 lkger med 3 ukjete d Bruk så kalkulatore og MINITAB tl å fe det estmerte regresjosutrykket. Teg dee kurve samme med de kurve du teget b. Bruk både de kurve du fat b og de kurve du fat c tl å estmere verde av y år er 7. Var du god tl skssere b? Oppgave 37 a F totalvarasjoe, de forklarte varasjoe og de uforklarte varasjoe oppgave.. b Vs at totalvarasjoe er lk de forklarte varasjoe pluss de uforklarte varasjoe. F r ( the coeffeset of determato og herav r. Oppgave 38 Ata e har følgede 6 parobservasjoer (, y,,..., y a Sett opp ormallkgee og bruk dsse tl å fe lkge for regresjoslkge for y mhp.. Teg dee lja et koordatsystem. b Bruk kalkulatore tl å fe totalavvket, det forklarte avvket og det uforklarte avvket alle puktee. Teg dsse avvkee for to av puktee. c F r. Hvorda vl du tolke dee verde? Hva blr korrelasjoskoeffsete mellom og y? d I multppel regresjo (som v kommer tlbake tl seere skal bruke at de såkalte multple korrelasjoskoeffsete (ved mer e to varable volvert er det samme som korrelasjoskoeffesete mellom y og ŷ. Sjekk om dette også er tlfellet ekel regresjo. Oppgave 39 Har v bltt klokere og klokere? E udersøkelse basert på IQ-målger av me på sesjo perode vste følgede sammeheg mellom (td og y (IQ: Avedt Statstkk 84
187 (td y (IQ,, 3,8 5,6 7, a Framstll dataee et spredgsdagram og sett opp ormallkgee tl bestemmelse av regresjoslkge for y mhp.. y ˆ a b, ved å sette 96, 965,, og b Bestem regresjoslkge ved å løse ormallkgee mhp. a og b. Ag et estmat tellgeskvotete år 3. c Test da Ata at populasjosregresjoslkge er gtt ved på 5%-vået. µ y α β H : β,7 mot H : β >, 7 Nå vste målgee fra 985 og fram tl år følgede sammeheg mellom og y : A (td y (IQ 8, 8,8 9,8 9,9 d Sksser å spredgsdagrammet for hele perode 96-. Bestem så ved hjelp av kalkulatore e fuksjo y ˆ f ( som best mulg beskrver det totale tedese fra 96 tl og bruk dee tl å estmere tellgeskvotete (for uge me på sesjo Damark år 3. Oppgave 4 I følge States Isttutt for Folkehelse Norge så utvklet fluesalkede sykdommer seg på følgede måte sste del av 995: Uke r Atall rapporterte tlfeller y a Teg et spredgsdagram for de gtte stuasjoe og bestem lkge for regresjoslje for y med hesy på. Hvor mage rapporterte tlfeller vl du aslå for uke 5? Avedt Statstkk 85
188 Du ka her bruke at 5, y 353, y og 955. Nå utvklet fluesae seg vdere som følger: Uke r Atall rapporterte tlfeller y b Teg et ytt spredgsdagram for alle 9 ukee og vurder å modelle a. Det blr å foreslått å tlpasse e y modell, yˆ A B (dvs. ŷ ( la (lb ab, tl dette tallmateralet fra og med uke 4 tl og med uke 49. Bestem å a og b ved mste kvadraters metode og ag så et estmat for atall rapporterte tlfeller uke 5 og uke ( 996 c F så tlslutt A og B og sett opp de edelge modelle. Nå ble det regstrert 5684 tlfeller uke 5 og 734 uke. sammelg med de estmater og kommeter kort. Oppgave 4 For å udersøke om det er oe sammeheg mellom score ( poegsum tl eksame kvattatve metoder og atall tmer ma hadde studert (uteom forelesgee e valg uke, tervjuet ma tlfeldg valgte studeter m.h.t.arbedsvaer og fat blat aet: At. tmer ma hadde studert pr. uke Score y (maksmal poegsum Avedt Statstkk 86
189 a Teg spredgsdagrammet og sett opp ormallkgee tl bestemmelse av de estmerte regresjoslkge for y mhp., y ˆ a b b Løs dsse lkgee mhp. a og b ved hjelp av kalkulatore. Forklar kort framgagsmåte. c Bereg korrelasjoskoeffesete mellom og y. Vs de ødvedge mellomreggee. d Test H : β mot H : β > A på 5%-vået (β er stggstallet for populasjosregresjoslkgeα β E MINITAB-utskrft av regresjosaalyse vser: Regresso Aalyss: Score versus Atall tmer The regresso equato s Score 8,6 3,97 Atall tmer Predctor Coef SE Coef T P Costat 8,67 5,3 3,56,7 Atall tmer 3,979,4333 9,6, S 7,57 R-Sq 9,3% R-Sq(adj 9,% Stemmer de beregger så lagt med dette? Kommeter kort. e Ag et 95% kofdestervall for β. Test tlslutt H : ρ mot H : ρ > ved å ag P-verde. (ρ er populasjoskorrelasjoskoeffseete Oppgave 4 Er det oe sammeheg mellom år på året ma er født og hvorledes ma scorer på e skrvetest? (maksmum score er 8 et tlfeldg utvalg på elever fra samme klassetr vste følgede resultat: Md. Score Y Avedt Statstkk 87
190 a E regresjosaalyse med MINITAB vser: Regresso Aalyss: Score versus Md The regresso equato s Score 73,3 -,36 Md Predctor Coef SE Coef T P Costat 73,58, 34,89, Md -,36 * -4,77 * S * R-Sq 69,5% R-Sq(adj 66,4% Her er verdee av SE Coef og P fjeret for predktore Md. Dessute magler verde av s ( Se *. F dsse 3 verdee ved å bruke kalkulatore optmalt. Hvorda vl du tolke de verde du fer for P? Forklar kort hvlke uttrykk som lgger tl gru for de beregger og skrv opp oe av leddee som går. b De samme regresjosaalyse ( MINITAB vser også følgede varasaalyse: Aalyss of Varace Source DF SS MS F P Regresso * 64,55,73 * Resdual Error * * Total 38,9 Her er to av SS-verdee, e av MS-verdee og P fjeret ( Se *. F dsse 4 verdee ved å bruke kalkulatore optmalt. Hvorda vl du tolke dee P- verde du fer?.gå forøvrg fram som pkt a. Oppgave 43 Dødelghete y (atall dødsfall pr. av hjertefarkt blat me Norge perode utvklet seg som følger: Td Dødelghet y a Framstll dataee grafsk og teg e rett lje gjeom puktet (, y slk at dee passer best mulg tl dataee. b Bestem regresjoslje y ˆ a b ved mste kvadraters metode. Aslå et estmat for dødelghete år. Avedt Statstkk 88
191 I perode var dødelghete som følger: Td Dødelghet y c Bestem å e regresjoslkg y ˆ f ( for hele perode og bruk dee tl å aslå dødlghete år. Sammelg med resultatet b. Bruk kalkulatore tl å bestemme f (, me foklar kort hva du gjør. Oppgave 44 E udersøkelse foretatt av NHO perode vste følgede sammeheg mellom sykefraværet y ( % for kver (arbedere og tde : År Sykefraværet % 987 3, 988 3, 989, 99,7 99, 99,3 993, a Teg et spredgsdagram for tallee og bestem et estmat for regresjoslkge for y med hesy på ved mste kvadraters metode, dvs. bestem y ˆ a b. Estmer sykefraværet år. Nå var sykefraværet perode og som følger for de samme gruppe: År Sykefraværet % 983,7 984, , 986 3, , ,6 996, b Teg å et ytt spredgsdagram for all 4 åree og vurder modelle a samt estmatet for år. Avedt Statstkk 89
192 d Foreslå e y modell på bakgru av alle dataee over og aslå å sykefraværet år. Forklar kort hvorledes du går fram. ( Vk: Du skal å fe et eksplstt fuksjosuttrykk som er best mulg tlpasset alle dataee Kalkulatore ka å brukes optmalt, dvs at dukke treger å vse oe mellomregg Oppgave 45 De tde som tregs for at e bl skal stoppe etter at sjåføre har oppdaget e stuasjo som ka bl farlg er summe av reaksjostde (tde som går før vedkommede tråkker på bremsepedaleog tde som vedkommede bremser. Ata at det er gjort 9 målger på e lukket bae med samme bl og samme sjafør. Resultatet av førsøkee ble: Hastghet v ( km/t Stopplegde s ( meter a Teg spredgsdagrammet og teg e kurve som passer godt tl tallmateralet. Ag e kkeleær modell. b Bruk så kalkulatoere optmalt tl å bestemme utrykket for aktuelle modelle y ˆ f ( c Bruk modelle tl å estmere stopplegde hvs ble skulle kjøre 85 km/t og hvs de skulle kjøre 5 km/t d F ved regg lkge for de kurve du har skssert a ( Vk: Lag 3 lkger med 3 ukjete Oppgave 46 Målger utført av Nasjoalt folkehelsesttutt perode 976- ppå 4-4 år gamle me Opplad vste følgede sammeheg mellom tde og %-adele y med kraftg overvekt ( Bodymassde BMI 3 : y 7, 7, 8,4 8,5, 5,8 8, a Teg spredgsdagrammet og f regresjoslkge yˆ b b. Vs de ødvedge mellomreggee. Avedt Statstkk 9
193 b Test modelle y H β mot H β : : β β ε. Bruk, 5 α. c Bestem resdualee y res og teg resdualplottet. Bruk dette tl vurdere modelle. Bruk kalkulatore tl å fe e bedre regresjoslkg (kkeleær e de du fat a. Oppgave 47 Ata at ma har et tlfeldg ledede utvalg på 4 tatt fra e ormalfordelt populasjo hvor stadardavvket σ 3, 7. I utvalget fer e gjeomsttet,7. a Sett opp et 95% og et 99% kofdestervall for populasjosgjeomsttet µ. b F de samme to kofdestervallee ved hjelp av kalkulatore og ved hjelp av MINITAB. Ata at ma seere øsker å gjeomføre et større forsøk hvor ma på forhåd bestemmer seg for at bredde på det ye 95% kofdestervallet skal være,. c Bestem hvor stort utvalget skal være for oppfylle dette kravet. Hvs ma stedefor 95% hadde øsket et 99% kofdestervall med samme bredde hva måtte da utvalgsstørrelse være. Oppgave 48 E kjøttbedrft er flere gager bltt tatt for kke å oppg korrekt vekt på se kgs pakger med kaboadedeg. Bedrfte påstår å å ha ordet opp problemet. Det blr tatt et tlfeldg utvalg på 3 av e kotrollstas. Ma fer å at gjeomsttsvekte dette utvalget er på,5 kg. Ata at ma ut fra tdlgere målger ka ata at pakkemaske pakker med e varas på σ, 4 a Sett opp et 95% kofdestervall for (populasjos- gjeomsttsvekte for karboadedegpakkee etter justerg. Vlle du vært forøyd med dette resultatet? b Hva bør gjeomsttsvekte et utvalg på 3 være hvs ma øsker at edre grese et 95% kofdestervallet på,999? Avedt Statstkk 9
194 Oppgave 49 Bedrfte oppgave 3. gjør ytterlgere edrger og er å gaske skre på at gjeomsttsvekte på pakgee er på mer e, kg. Det tas ok et tlfeldg utvalg av pakker fra de løpede produksjoe, dee gage på 5. a Formuler e H og e H for de gtte stuasjoe. Ag e test observator og avgjør om store eller små verder av dee er sgfkate. b F krtsk verd på 5%-vået og gjeofør testge ved hjelp av dee. c Bestem også P-verde. Sksser også e ormalfordelg og teg de størrelsee du bruker b og c. d Sett opp 95% esdg kofdestervall stuasjoe over. Oppgave 5 I de såkalte Osloudersøkelse 97/973 ble alle me Oslo aldere 4-49 år vtert tl udersøkelse av rskofaktorer for hjerte-og karsykdom. Ma fat da blat aet e gjeomsttsvekt på 77,3 kg. I år ble de såkalte Osloudersøkelse gjeomført og ma fat da et utvalg av me samme aldersgruppe e gjeomsttsvekt på 8,7 kg. Ma har hele tde fra 97/973 og fram tl dag hatt mstake om at vekte vlle gå opp på gru av e gradvs edret lvsstl. a Formuler e H og e H for de gtte stuasjoe. Ag e test observator og avgjør om store eller små verder av dee er sgfkate. b Gjeomfør testge på 5%-vået det du ka bruke at populasjosstadardavvket hele tde har vært 3,5 kg. c Kommeter evetuelle svakheter ved resultatee. Oppgave 5 Er det slk at elever bruker mdre td på lekser hjemme å e for år sde. E større udersøkelse på e skole på Østladet for år sde blat alle 7-klassger vste at de gjeomsttlg brukte 5,8 tmer pr uke på hjemmelekser. Et tlfeldg utvalg på 5 syvede-klassger vste å følgde tder: 3,4; 5,8;,8; 6,5; 8,; 4,3; 5,7; 6,; 3,8; 4,; 5,9; 6,;,8; 3,9 ; 5, a Avgjør først om verde,8 er e outler. Hvs dette er tlfellet så fjer de fra tallmateralet. Avedt Statstkk 9
195 b Formuler e H og e H for de gtte stuasjoe. Ag e testobservator og avgjør om store eller små verder av dee er sgfkate. c Gjeomfør testge på 5%-vået Oppgave 5 Har vrkestoffet Phaseolus Vulgars som ma blat aet fer stoffet Redu som er et ekstrakt fra hagebøer oe effekt på vektreduksjo? Ved Uverstetssykehuset Nord-Norge ble e gruppe overvektge meesker gtt dette 4 uker. Resultatet blat de 4 meeskee som deltok udersøkelse ble e gjeomsttlg vekt reduksjo på 3,94 kg med et stadardavvk på,5 kg. a Sett opp et 99% kofdestervall for de gtte stuasjoe. I e kotrollgruppe på 35 persoer var gjeomsttlg vektreduksjo,77 kg. Stadardavvket var her på,6 kg. b Test om det er oe sgfakat forskjell vektreduksjo på de to gruppee på 5%-vået. Oppgave 53 Er det slk at ma lettere får promlle år ma lager seg e drk med lettbrus e med valg brus? Ved et sykeshus Adelede Australa ble e gruppe studeter på 4 delt tlfeldg to ved loddtrekg. De fkk all samme alkoholmegde drke, me de ee gruppa fkk s alkoholmegde bladet med lettbrus mes de adre gruppa fkk s drk bladet med valg brus. Udersøkelse vste å at e drk med lettbrus gjeomsttlg brukte mutter på å passere gjeom mage med et stadardavvk på,8 mutter. E drk med sukkerhodg væske brukte gjeomsttlg 36 mutter på å passere gjeom mage med et stadardavvk på,9 mutter. a Sett opp 95% kofdestervall for gjeomsttlg passergstd for de to gruppee. Avgjør om det er e sgfkat forskjell. Etter e stud vste det seg at gruppa som fkk drk med lettbrus hadde e gjeomsttlg promlle på,5 med et stadardavvk på,9, mes de adre gruppa hadde e gjeomsttlg promlle på,3 med et stadardavvk på,8.* b Test påstade om at gjeomsttlg promlle med lettbrus målt e stud etter tak blr mdre e gjeomsttlg promlle med sukkerholdg brus. Bruk et vå på,5%. *Legee ved sykehuset meer at årsake tl dette feomeet er at lettbruse får (pga. maglede sukkerhold alkohole tl å gl hurtgere gjeom fordøyelsessystemet og ut blodåree Avedt Statstkk 93
196 Oppgave 54 I det såkalte Betula-prosjektet hvor taleger, psykologer og evrologer Stockholm, Umeå og Tromsø har samarbedet for udersøke påstade om at at eldre med ege teer har bedre hukommelse e dem ute. Det har vært med tlfeldg valgte eldre meesker fra Umeå-området. Dsse ble delt to grupper ; de som hadde trukket mage teer og de som hadde de fleste teee takt. De har blat aet vært gtt e hukommelsesprøve som har gått på huske flest mulg av 3 tlfeldge oppleste ord. Ata at gruppe på 5 av persoer med de fleste teee takt husket ma gjeomsttlg 5,7 ord, mes det de adre gruppe ble husket gjeomstlg,8 ord. Stadardavvket de første gruppa var,7, mes det var 3, de adre gruppa. a Formuler e H og e H for de gtte stuasjoe. Ag e test observator og avgjør om store eller små verder av dee er sgfkate. b Gjeomfør testge både ved å fe krtsk verd og ved å fe P-verde. c Sett opp 95% kofdestervall for dfferase mellom gjeomsttlg atall ord som huskes hos de med de fleste teee takt og gjeomsttlg atall ord hos de som har trukket mage teer. Oppgave 55 E gruppe på bar fkk målt puls før og etter et vsst TV-program som meer kke passer for aldersgruppe (eholder for mye vold. Ata resultatet av målgee ble: Bar Puls etter Puls før a Formuler e H og e H for de gtte stuasjoe. Ag e testobservator og dees fordelg uder H ved å gjøre de ødvedge forutsetgee. Avgjør om store eller små verder av testobservatore er sgfkate. b Gjeomfør testge på 5%-vået ved å fe krtsk verd. Avedt Statstkk 94
197 c Det ka se ut som bar r. er e outler. Avgjør om dette er tlfellet. Gjeomfør evetuelt (Hvs outler teste på ytt ved å bruke kalkulatore optmalt Oppgave 56 Gjeomsttsvektefor et tlfeldg utvalg på 4 årge jeter tatt 975 var 9,8 kg ved e skole på Østladet. Stadardavvket var 3, kg. I år vste et tlfeldg utvalg på 5 årge jeter ved de samme skole e gjeomsttsvekt på 3,9 kg. Stadardavvket var da 3,3 kg. a Avgjør ved hypoteseprøvg om det gru tl å påstå at gjeomsttsvekte på 9-årge jeter ka ses å ha økt ved skole. Velg vå på 5%. Ata at populasjosstadardavvkee var lke 975 og. b Sett opp et 95% kofdestervall for dfferase mellom populasjosgjeomsttsvektee og 975. Oppgave 57 I forbdelse med markedsførge av lettproduktet EKSTRALETT reklameres det med at det på g vare gjeomsttlg skal være 5 g fett ( dvs. at populasjosgjeomsttet µ 5 g. Matvarekotrolle har mdlertd mstake om at produktet gjeomsttlg eholder mer fett e dette. Ma tar derfor et tlfeldg utvalg på EKSTRALETT-produkter og aalyserer dsse. Prøvee vste derfor følgede fetthold gram: 4, 7, 9, 5, 3, 8, 7, 9, 6, 5, 6 a Formuler e ullhypotese og et alteratv for de gtte stuasjoe. Ag testobservator og avgjør om store eller små verder av dee er sgfkate (dvs. gjør at ullhypotese forkastes. b F krtsk verd på 5%-vået og gjeomfør hypotesetesge. Oppgave 58 På e hovedveg hvor det er satt opp sklt om radarovervåkg va foto- og radarutstyr, øsker ma å kotrollere om det er slk at det gjeomsttlg kjøres fortere lke etter passerg av kotrollstedet e rett før. Ata at hastghete blr målt for tlfeldg valgte blster 5m før fotobokse og 5m etter, og at ma fat: Bl r Hast.før Hast.etter Avedt Statstkk 95
198 a Ag e ullhypotese H og e alteratv hypotese H for de gtte stuasjoe. (Vk: Bereg dfferasee for hver bl og bruk e b Velg vå på 5% og gjeomfør testge. c Testge kue også vært gjeomført ved e kkparametrsk testmetode. Gjeomfør testge ved de alteratve metode. Velg også her vå på 5%. Oppgave 59 5 studeter har vært gjeom e matematkktest med heblkk på å kotrollere deres forkuskaper. Resultatee, form av e poegsum for hver perso, fordelte seg som følger: Hyppghet Poeg Me Kver a G e grafsk framstllg av dataee for meee og for kvee. b Bereg gjeomsttet og stadardavvket s både for meee og kvee. c Sett opp e taberll over de kumulatve relatve hyppghetee for både meee og kvee. Teg sumfordelgskurve for begge gruppee og f medaee. d Ut fra tdlgere prøver ka det se ut som kvee gjør det ltt bedre e meee. Ma øsker derfor å å teste H : µ µ H : µ > µ kver me mot kver me Velg vå på 5% og gjeomfør testge. Oppgave 6 Det blr påstått at uge som blr tlbudt alkohol hjemme drkker mer e jevaldrede som kke blr tlbudt alkohol hjemme. For udersøke dee påstade blr det tatt et utvalg på tteårger som blr tlbudt alkohol hjemme og et aet uvhegg Avedt Statstkk 96
199 og tlfeldg utvalg på som kke blr tlbudt alkohol hjemme. Resultatet av udersøkelse blr: Alkoholforbruket pr. år ( omreget lter re sprt Blr tlbudt alkohol hjemme Blr kke tlbudt alkohol hjemme 6,4 7,3 8, 5,9 9, 7, 3,6 7,9 6,9, 3,8 4,,5 5,,7 3, 4,7 a Sett opp 95% kofdestervall for dfferase mellom populasjosgjeomsttee de to gruppee. b Test H : µ µ mot H : µ > µ Velg vå på 5%. d Bruk e alteratv kke parametrsk test tl å løse pukt b. Oppgave 6 Målger ble foretatt av grpestyrke vestre og høyre håd for et tlfeldg utvalg på kjevhedte persoer. Resultatet ble som følgede: Grpestyrke vestre Grpestyrke høyre a Gjeomfør e t-test på 5%-vået for å fe ut om det ka ses at kjevhedete har større grpestyrke vestre e høyre håd. b F et 95% kofdestervall for (forvetge tl dfferase mellom grpestyrke vestre og høyre håd. ( µ ( V µ H d Bruk e alteratv ragbasert test tl å løse pukt a Oppgave 6 For å se om det er oe sammeheg mellom meg om EU-medlemskap og alder har ma tervjuet 33 tlfeldg valgte persoer og fuet: Avedt Statstkk 97
200 Alder år Meg om EU-medl.sk. Ne tl medlemskap Ja tl medllemskap Vet kke a Formuler e H og e H for de gtte stuasjoe. Ag testobservator og avgjør år H forkastes på 5%-vået. b Gjeomfør testge på 5%-vået ved hjelp av a. Hva blr P-verde forsøket? d Gjeomfør testge ved hjelp av MINITAB. Oppgave 63 På spørsmålet: Syes du at Norge bør ta mot betydelge megder arbedskrakt fra adra lad for å fylle stllger helseveseet og adre servcebrasjer, syes du det bør mporteres mst mulg arbedskraft eller har du ge meg om dette? svarte et represetatvt utvalg på 6 orske kver og me som følger: (V.G. 4. oktober Kjø Ma Kve Meg Betydelge megder 75 3 Mst mulg 3 Ige meg 33 7 Ma øsker å å fe ut om det er oe sammeheg (avhegghet mellom kjø og meg om mport av arbedskraft. a Formuler e ullhypotese og et alteratv for de gtte stuasjoe. Ag testobservator og avgjør om store eller små verder av dee er sgfkate. b Gjeomfør testge på 5%- vået. c Bruk kalkulatore og MINITAB tl å gjeomføre testge. Oppgave 64 I e udersøkelse foretatt av Norsk Gallup for VG, svarte 6 tlfeldg valgte orske me og kver som følger på spørsmålet: Avedt Statstkk 98
201 Hvs du reser eller skulle rese med NSB, vlle du føle deg helt trygg eller vlle du føle deg ltt utrygg for at skkerhete er godt ok varetatt? Kjø Ma Kve Meg Helt trygg 5 53 Ltt utrygg Ma lurer på om det på bakgru av udersøkelse ka ses å være oe sammeheg mellom hva slags meg ma har, og om ma er ma eller kve. a Formuler e ullhypotese og et alteratv for de gtte stuasjoe. Ag testobservator og avgjør om store eller små verder av dee er sgfkate. b Gjeomfør testge på 5%-vået ved å bruke krtsk verd. Bruk så kalkulatore tl å fe P-verde. Hvorda ka dee brukes tl å gjeomføre testge? Oppgave 65 For å få kjeskap tl om det er oe sammeheg mellom meg om byggg av gasskraftverk ( med dages tekolog og kjø så utførte MMI e gallup for Dagbladet februar år. På spørsmålet : Er du for eller mot byggg av gasskraftverk med dages tekolog? Fkk ma følgede resultat: Kjø Me Kver Meg For 79 9 Imot 37 Vet kke 8 95 a Sett opp e ullhypotese og et alteratv for de gtte stuasjoe. Ag testobservator og avgjør om store eller små verder av dee er sgfkate (gjør at ullhypotese må forkastes b Gjeomfør testge på 5%-vået på bakgru av tallee fora. Hvor sgfkat er resultatet? ( Vk: Hva blr P-verde? e Gjeomfør testge ved hjelp av kalkulatore. e Gjeomfør testge ved hjelp av MINITAB. Avedt Statstkk 99
202 Oppgave 66 I e kommue på Østladet er det gjort e udersøkelse for å se om det er oe samme heg mellom leseferdghet og kjø. Resultatet av udersøkelse blat 5 tlfeldg valgte 7.-klassger ble: Leseferdghet Dårlg Mddels God Sum Kjø Jeter 45 9 Gutter Sum 58 5 a Fyll ut tabelle og g e grafsk framstllg av dataee. Formuler e ullhyptese og et alteratv for de gtte stuasjoe. b Ag e testobservator og avgjør om store eller små verder av dee er sgfkate. Bestem krtsk verd på 5%-vået og gjeomfør testge. Oppgave 67 Utlåee på bbloteket på HIBU (avdelg Høefoss e tlfeldg uke 7 var som følger : Ukedag Ma T O To Fr Atall utlåte bøker Test påstade om at atall utlåte bøker fordeler seg lkt gjeom uke. Formuler ullhypotese og alteratv hypotese, ag testobservator og gjeomfør testge på 5%-vået. Oppgave 68 Ata at e terg kastes gager og at ma observerer: Atall øye Frekves O Gjeomfør e kjkvadrattest for å avgjøre om terge ka ses å være rettferdg. Oppgave 69 E produset av fskesører har de sste åree mportert råstoff fra et dustralsert lad og observert at de det lage løp har produsert 4 kvalteter: D(dårlg og må vrakes, C(god, B( bedre og A (best med følgede fordelg: Avedt Statstkk
203 Kvaltet A B C D Fordelg proset Nå har mdlertd prse på råstoffet bltt så dyrt at produsete bestemmer seg for å mportere fra lavkostlad tl e mye lavere prs. Det bekymrer mdlertd ledelse ved bedrfte at råstoffet mulges holder mye dårlgere kvaltet. Før de evetuelt bestemmer seg for å bytte leveradør gjeomfører de e prøveproduksjo av fskesører. Et tlfeldg utvalg på fskesører produsert med det ye råmateralet gr følgede fordelg av kvalteter: Kvaltet A B C D Atall O a Formuler e ullhypotese og et alteratv for de gtte stuasjoe. Bestem krtsk verd på %-vået. b Gjeomfør testge både ved hjelp av krtsk verd og ved å fe P-verde. Oppgave 7 Ata at ma har kastet 5 myter gager og observert atall kroe og at resultatet ble: Atall kro Frekves O a Sett opp sasylghetsmodelle tl dette forsøket og f de forvetede verdee E b Test påstade om at modelle X ~ b(5,.5 er holdbar ( dvs. at myte er OK og avvkee skyldes ku tlfeldgheter på 5%-vået. Oppgave 7 Ata at atall alvorlge trafkkuhell X pr uke på e bestemt sterkt traffkert vestrekg e tlfeldg uke ble observert tl: Atall uhell Frekves O a Ata at X ~ Posso( λ. Ag et estmat λˆ for λ ved hjelp av dataee over. b Sjekk ved hjelp av e kjkvadrattest atagelse om modelle over ka ses å være rmelg. Bruk % vå. Avedt Statstkk
204 Oppgave 7 Ata at ma har målt høyde X på 5 tlfeldg valgte malge studeter på HIBU og fuet a F og s. Høyde cm Frekves O b Ata at X ~ N( µ, σ. Ag et estmat for µ og σ. F så de tlsvarede forvetede verder E de 8 klassee. c Test ved e kjkvadrattest om atagelse b ka ses å være rmelg. Bruk et vå på 5%. d F også P-verde og fortell kort hva du ka slutte av de. e Bruk MINITAB og kalkulatore tl å gjeomføre e ormaltetstest Oppgave aprl 6 vste Dagbladets partbarometer ( utført MMI følgede oppslutg for de 7 største poltske partee Norge aprl. Udersøklese baserer seg på telefotervju med 9 stemmeberettgede persoer: Part Frp. Ap. Høyre SV Krf. Set.p. V Oppslutg 3,3 8,3 3,7 9,7 5,6 5, 4,9 % a Sett opp 95% kofdestervall for Ap.s og for Frp.s oppslutg aprl 6 basert på Dagbladets partbarometer. b Ved valget 5 hadde Ap. E oppslutg på 3,7%. Avgjør ved hypoteseprøvg om Ap. Nå ka ses å ha fått e sgfkat tlbakegag på 5%- vået ved å teste H : p,37 mot H : p, 37 ( Vk: Bruk ormaltlærmelse < Avedt Statstkk
205 d Reg ut styrke for teste fora år p,3;,3;,8;,6 og,4. Bruk gjere kalkulatore de beregger. Sksser styrkefuksjoe. Oppgave 74 I e megsmålg offetlggjort Afteposte 6. mars 3 kue fe følgede statstkk basert på spørsmålet: Dersom det var folkeavstemg om orsk medlemskap EU morge, hva vlle du da stemme? Ja ( % Ne ( % Tdspkt. Des. Ja.3 Feb.3 Mar.3 De sste udersøkelse er basert på tervjuer. 8% har avgtt svar om holdg tl EU-medlemskap. Udersøkelse er foretatt ved telefotervju. a Ag et 95% kofdestervall for adele av de som har bestemt seg og vl stemme e, og et 95% kofdestervall for adele av de som har bestemt seg og som vl stemme ja mars 3. b Framstll dataee grafsk. I pkt. a er det kke tatt hesy tl de 9% vet kke stemmee. Hvorda vl dsse påvrke det grafske blledet og kofdestervallee a? Gjør de ødvedge bereggee. c Bestem aeordes tredkurver y ˆ a b c både for Ja-sde og Nesde ved hjelp av kalkulatore. Kommeter kort resultatee. Oppgave 75 % av alle blførere bruker fortsatt mobltelefoe mes de kjører bl, ute at de har hadsfree -opplegg. Ata at det blr gjeomført e kampaje meda og at det samtdg blr gjort e rekke kotroller av poltet. Dette meer ma vl få ed adele p som felaktg bruker mobltelefoe mes de kjører bl. Ata at ma øsker å gjøre e ledede udersøkelse med 5 tlfeldg valgte sjafører. a Formuler e H og e H for de gtte stuasjoe. Ag e testobservator og dees fordelg uder H. Bestem krtsk verd k på 5%-vået. (Vk: Bruk ormaltlærmelse b Av de 5 sjaføree brukte 9 mobltelefoe felaktg. Hvlke kolusjo vl du da trekke? Sett også opp et 95% kofdestervall for p. Avedt Statstkk 3
206 Ata at ma hovedudersøkelse øsker P ( P ˆ p <,, 95 der Pˆ estmatore for adele p. c Hvor mage persoer bør da være med udersøkelse for å oppfylle dette kravet? Oppgave 76 E udersøkelse utført av MMI for Dagbladet oktober basert på et tlfeldg utvalg på 97 stemmeberettgede vste blat aet følgede oppslutg for Ap., Frp., H. og Krf. Part Ap. Frp. H Krf. Oppslutg 4,9 3,6,4 3,3 a Sett opp 95% kofdestervall for Ap.s og Frp.s oppslutg. b Er det gru tl å tro at Krf. Har større oppslutg populasjoe e H? Gjør de ødvedge bereggee. c Hva er grue tl at ± leddet kofdestervallet ( og dermed uskkerhete er størst for Frp? Hva er de største verde ± leddet ka ha for et slkt utvalg (dvs. med 97 d Test ullhypotese om at Høyre har e oppslutg på 4,3% ( Høyres oppslutg ved sste stortgsvalg mot alteratvet at de har fått e tlbakegag. Velg vå på 5%. Oppgave 77 Et frma som selger takreme SOLIBOKS har e markedsadel på 8%. De vl gjere øke dee adele og kjører derfor e reklamekampaje på TV 7. Dette meer de bestemt vl føre tl økt markedsadel. Etter kampaje tar de et tlfeldg utvalg på persoer og tervjuer mht. hvlke takrem ma bruker. a Formuler e ullhypotese og e alteratv hypotese for de gtte stuasjoe. Ag testobservator og avgjøer om store eller små verder av dee er sgfkate. b Bestem krtsk verd på 5%-vået. Nå svarer 35 av de at de bruker SOLIBOKS. Hva betyr dette? Ata at de ye markedsadele er 3%. c Hva er da sasylghete for felaktg å påstå at markedsadele fortsatt er 8%? Hva er testes styrke dette tlfellet? Avedt Statstkk 4
207 Oppgave 78 Vl plaster med cellegft kue forlege lvet tl kreftpaseter? I følge e artkkel Dagbladet ble plasteret som kalles for Gldel og er utvklet av Guldford farmasøytske frma Baltmore, Marylad prøvd på 33 paseter USA og Skadava. Fordele med dee metode er at de har mdre bvrkger e valg cellegft. Resultatet av udersøkelse ble. Resultat I lve etter Døde løpet Be- år det første året Sum hadlgsmetode Behadlet med plaster Behadlet med tradsjoell metode Sum Aalyser dataee tallmateralet ved e Fsher-Irwtest. (Formuler e ullhypotese og et alteratv, ag testobservator og gjeomfør testge. Oppgave 79 Ata ma har følgede 6 observasjospar av varabelee X (forklargsvarabele og Y (resposvarabele: y Ata at regresjosmodelle ka brukes. y β β ε der ε ~ N(, σ og uavhegge,, 3,., a Bestem lkge for regresjoslje for y mhp. ved mste kvadraters metode b Ag et estmat for σ c Ag estmat for stadardfele tl β og β og sett opp et 95% kofdestervall for β. d Test ullhyoptese om at β mot alteratvet β. Test også ullhypotese at β -,8 mot alteratvet β <, 8 Avedt Statstkk 5
208 Oppgave 8 Ata ma har følgede 5 observasjospar av varabelee X og Y y a Test H : ρ mot H : ρ på 5% vået ved å fe krtsk verd. b Hva er p-verde teste over? c Test H : ρ mot H : ρ tallmateralet oppgave 79. Oppgave 8 Et tlfeldg utvalg på t 6.klassger har bltt testet matatematkk. De samme t elevee har også besvart et spørreskjema kyttet tl skole- og hjemmestuasjoe. Resultatet av udersøkelse vste bl.a. følgede sammeheg mellom varablee Y poeg på matematkkteste ( fra tl X mors utdag ( atall år ut over gruskole Elev r y Ata at du har e ormal regresjosmodell. a Teg spredgsdagrammet og f de estmerte regresjoslkge for y med hesy på. y ˆ a b (Vs mellomregge b Bruk kalkulatore tl å bestemme resdualee y res gtt ved y y y y yˆ res obs pred ( Forklar kort hvlke kommadoer du bruker. Teg resdualplottet og kommeter (kort dette. c Sett opp et 95% kofdestervall for β. Avedt Statstkk 6
209 I dee samme udersøklese har ma også spurt elevee om hvorvdt de øsker å lære matematkk, for seere å kue bruke det e jobb. Dee varabele beteges med X og ka ata følgede verder: svært ueg, meget ueg, 3 ueg, 4 verke ueg eller eg, 5 eg, 6 meget eg og 7 svært eg. Resultatet av dette ble: Elev r E MINITAB-utskrft av de multple regresjosaalyse med X og X som forklargsvarable vser å bl.a: Regresso Aalyss: Poeg versus Mors utd.; Matem./jobb The regresso equato s Poeg 65,,398 Mors utd.,56 Matem./jobb Predctor Coef SE Coef T P Costat 65,7,87 74,7, Mors utd.,3978,383,67,39 Matem./jobb,5565,43 3,78,7 S,68 R-Sq 94,% R-Sq(adj 9,4% d Bruk å kalkulatore tl å berege ŷ de multple stuasjoe og f deretter de multple korrelasjoskoeffesete Ry y ˆ ( korrelasjoskoeffesete mellom y og ŷ. Bruk utskrfte tl å kotrollere om du har reget rktg. MINITAB-utskrfte vser også Aalyss of Varace Source DF SS MS F P Regresso 5,55 76,75 55,9, Resdual Error 7 9,55,364 Total 9 6, Source DF Seq SS Mors utd. 33,7 Matem./jobb 9,443 e Vs ved hjelp av kalkulatore at tallee over stemmer. Hva ka du slutte ut av dee utskrfte. Avedt Statstkk 7
210 Ltteraturlste ( Davd S. Moore, George P. McCabe : Itroducto to the Practce of Statstcs ( 6.ed. 8 ( Joste Lllestøl: Sasylghetsregg og statstkk med avedelser (5. utgave 997 (3 De Veau, Vellema og Bock : Itro Stats (. ed. 6 (4 Ajt C. Tamhae, Dorothy D. Dulop : Statstcs ad Data Aalyss, from Elemetary to the Itermedate (. ed. (5 Larso, Farber : Elemetary Statstcs Pcturg the World ( 4. ed. 8 (6 Ala Agrest, Chrste Frakl : Statstcs, The Art ad Scece of learg from Data. (. ed. 8 (7 Mller og Mller : Joh E. Freuds Mathematcal Statstcs wth Applcatos ( 7. ed. 4 (8 Mchael Sullva, III: Statstcs, Iformed Decsos usg Data. (.ed.7 (9 Guar G. Løvås : Statstkk for uverstet og høgskoler (. utgave 5 ( Roald J. Woacot, Thomas H. Woacot : Itroductory Statstcs (4.ed. 985 ( Ala Agrest, Barbara Fley : Statstcal Methods for the Socal Sceces (.ed. 986 ( Rya, Joer : MINITAB Hadbook ( 4.ed. (3 Ruth Meyer, Davd Krueger : A MINITAB Gude to Statstcs (.ed. (4 Teas Istrumets: Bruksavsg TI-84 Plus (3 Avedt Statstkk 8
211
212 Høgskole Buskerud Postboks Kogsberg Telefo: Telefaks:
Analyse av sammenhenger
Kapttel 7.-7.3: Aalyse av sammeheger Korrelasjo og regresjo E vktg avedelse av statstkk er å studere sammeheger mellom varabler: Avgjøre om det er sammeheger. Beskrve hvorda evetuelle sammeheger er. Eksempler:
Forelesning 19 og 20 Regresjon og korrelasjons (II)
STAT111 Statstkk Metoder [email protected] Forelesg 19 og 0 Regresjo og korrelasjos (II) 1. Kofdestervall (CI) og predksjostervall (PI) I uka 14, brukte v leær regresjo for å fage leær sammehege mellom Y og
Notat 1: Grunnleggende statistikk og introduksjon til økonometri
Notat : Gruleggede statstkk og troduksjo tl økoometr Gruleggede statstkk Populasjo vs. utvalg Statstsk feres gjør bruk av formasjoe et utvalg tl å trekke koklusjoer (el. slutger) om populasjoe som utvalget
Om enkel lineær regresjon II
1 ECON 13 HG, revdert aprl 17 Notat tl kapttel 7 Løvås Om ekel leær regresjo II Merk: Det ka løe seg først å lese avstt 4 regresjo-i-otatet på ytt. Regresjosmodelle. La Y være e stokastsk varabel (som
Om enkel lineær regresjon II
ECON 3 HG, aprl Notat tl kapttel 7 Løvås Om ekel leær regresjo II Merk: Det ka løe seg først å lese avstt 4 regresjo-i-otatet på ytt. Regresjosmodelle. La Y være e stokastsk varabel som v kaller resposvarabele
Regler om normalfordelingen
1 HG Revdert mars 013 Notat tl kapttel 5 Løvås Regler om ormalfordelge Kjeskap tl reglee for ormalfordelge er gruleggede for de statstske aalyse kapttel 6 Løvås, og studetee må kue beherske dsse skkkelg
STK1110 høsten Lineær regresjon. Svarer til avsnittene i læreboka (med unntak av stoffet om logistisk regresjon)
TK høste 9 Eksempel.5 (CO og vekst av furutrær Leær regreso varer tl avsttee..4 læreboka (med utak av stoffet om logstsk regreso Ørulf Borga Matematsk sttutt Uverstetet Oslo V vl bestemme sammehege mellom
TMA4245 Statistikk Eksamen august 2014
Norges teksk-aturvteskapelge uverstet Isttutt for matematske fag Løsgssksse Oppgave a) Y 5 PY > 53) PY 53) P ) 53 5 Φ5) 933 668 Vekte av e fylt flaske, X + Y, er e leærkombasjo av uavhegge ormalfordelte
TMA4245 Statistikk Eksamen mai 2016
Norges teksk-aturvteskapelge uverstet Isttutt for matematske fag Løsgssksse Oppgave a) Lar X være kvadratprse. Har da at X N(µ, σ 2 ), med µ 30 og σ 2 2, 5 2. P (X < 30) P (X < µ) 0.5 ( X 30 P (X > 25)
Regler om normalfordelingen
1 HG mars 2009 Notat tl kapttel 5 Løvås Regler om ormalfordelge Kjeskap tl reglee for ormalfordelge er gruleggede for de statstske aalyse kapttel 6 Løvås, og studetee må kue beherske dsse skkkelg dette
Econ 2130 uke 15 (HG)
Eco 130 uke 15 (HG) Kofdestervall Løvås: 6.1., 6.3.1 3. (Avstt 6.3.4 6 leses på ege håd. Se også overskt over kofdestercvall ekstra otat på ettet.) 1 Defsjo av kofdestervall La θ være e ukjet parameter
Regler om normalfordelingen
HG mars 0 Notat tl kapttel 5 Løvås Regler om ormalfordelge Kjeskap tl reglee for ormalfordelge er gruleggede for de statstske aalyse kapttel 6 Løvås, og studetee må kue beherske dsse skkkelg dette kurset.
STK1100 våren Estimering. Politisk meningsmåling. Svarer til sidene i læreboka. The German tank problem. Måling av lungefunksjon
STK00 våre 07 Estmerg Svarer tl sdee 33-339 læreboka Poltsk megsmålg Sør et tlfeldg utvalg å 000 ersoer hva de vlle ha stemt hvs det hadde vært valg 305 vlle ha stemt A A's oslutg er Ørulf Borga Matematsk
Forelesning Enveis ANOVA
STAT111 Statstkk Metoder [email protected] Forelesg 14 + 15 Eves ANOVA 1. troduksjo a. Z-, t- test Uka 1: tester for forvetgsdfferase to populasjoer (grupper) b. ANOVA (aalyss of varace): tester om det er forskjeller
Forelesning 21 og 22 Goodness of fit test and contingency table ( 2 test og krysstabell)
STAT111 Statstkk Metoder [email protected] Forelesg 1 Goodess of ft test ad cotgecy table ( test krysstabell 1.Goodess of ft test ( test Ata at v har et utvalg med observasjoee fra e stokastsk varabel X. Goodess-of-ft
Seminaroppgaver for uke 13
1 ECON 2130 2016 vår Semarpla fra og med uke 13 Semaroppgaver for uke 13 1) Fra eksame Eco 2130, 2004 høst: Oppgave 3: (Fel oppgave på ststuttets overskt over gamle eksamesoppgaver) La X og Y være to uavhegge
Løsningskisse seminaroppgaver uke 17 ( april)
HG Aprl 14 Løsgsksse semaroppgaver uke 17 (.-5. aprl) Oppg. 5.6 (begge utgaver) La X = atall bar utvalget som har lærevasker. Adel bar med lærevasker populasjoe av bar atas å være p.15. Utvalgsstørrelse
Seminaroppgaver for uke 13 (Oppgave (1), (2), og (3))
1 ECON 2130 2017 vår Semarpla fra og med uke 13 Semaroppgaver for uke 13 (Oppgave (1), (2), og (3)) (1) Fra eksame Eco 2130, 2004 høst: Oppgave 3: (Fel oppgave på ststuttets overskt over gamle eksamesoppgaver)
STK1100 våren Konfidensintevaller
STK00 våre 07 Kofdestevaller Svarer tl avstt 8. læreboka Ørulf Borga Matematsk sttutt Uverstetet Oslo Eksempel E kjemker er teressert å bestemme kosetrasjoe µ av et stoff e løsg Hu måler kosetrasjoe fem
Formler og regler i statistikk ifølge lærebok Gunnar Løvås: Statistikk for universiteter og høgskoler
Formler og regler statstkk følge lærebok Guar Løvås: tatstkk for uversteter og høgskoler Kap. Hva er fakta om utvalget etralmål Meda: mdterste verd etter sorterg Modus: hyppgst forekommede verd Gjeomstt:
TMA4240 Statistikk Høst 2016
TMA440 Statstkk Høst 06 Norges teksk-aturvteskapelge uverstet Isttutt for matematske fag Abefalt øvg 0 Løsgssksse Oppgave a Estmatore for avstade a er gjeomsttet av uavhegge detsk fordelte målger, x; a,
Forelesning 3 MET3592 Økonometri ved David Kreiberg Vår 2011
Forelesg 3 MET359 Økoometr ved Davd Kreberg Vår 0 Dverse oppgaver Oppgave. E vestor samler følgede formasjo om markedsavkastge og avkastge på det som ser ut tl å være et attraktvt aksjefod År Aksjefodets
Forelesning Punktestimering
STAT Statst Metoder [email protected] Forelesg 8 + 9 Putestmerg. Fra sasylghetsteor tl statst feres ) Sasylghetsberegg sasylghetsteor: v jeer parametere som besrver modellee, f.es. p boms modell, ormal fordelg,
Løsningsforslag (ST1201/ST , kontinuasjonseksamen) ln L. X i = 2n.
Løsgsforslag ST20/ST620 205, kotuasjoseksame. a Rmelghetsfuksjoe blr Logartme Derverer Løser lgge Løsge er SME: L = 2 e l L = 2 l X X. X + l X. l L = 2 + 2 X = 2. ˆ = 2 X. X. b Her ka ma beytte trasformasjosformele,
OBLIGATORISK OPPGAVE 1 INF 3340/4340/9340 HØSTEN 2005
OBLIGATORISK OPPGAVE INF 0/0/90 HØSTEN 005 Levergsfrst: 0. september 005 Arbedsform: Løses dvduelt Ileverg tl: Aja Bråthe Krstofferse ([email protected] Levergskrav: Det forutsettes at du er kjet med holdet
Statistikk med anvendelse i økonomi
A-6 og A-6-G, 6. ma 08 Emekode: Emeav: A-6 og A-6-G tatstkk med avedelse økoom Dato: 6. ma 08 Varghet: 0900-300 Atall sder kl. forsde 0 Tllatte hjelpemdler: erkader: Kalkulator med tømt me og ute kommukasjosmulgheter.
Medisinsk statistikk, del II, vår 2009 KLMED 8005
Medssk statstkk, del II, vår 009 KLMED 8005 Erk Skogvoll Førsteamauess dr. med. Ehet for Avedt klsk forskg Det medsske fakultet Leær regresjo, Roser..6 Bakgru (.) Modell (.) Estmerg av parametre modelle
Introduksjon til økonometri, kap 8, 9.1 og 9.2. Hva er formålet med økonometri? Utvalgskorrelasjoner To-variabel regresjoner
Itroduksjo tl økoometr, kap 8, 9.1 og 9. Hva er formålet med økoometr? Utvalgskorrelasjoer To-varabel regresjoer Iformasjo fra data Målet med økoometr er å lære oe fra data Øke vår kuskap ved å oppdage
Oversikt over tester i Econ 2130
1 HG Revdert aprl 213 Overskt ver tester Ec 213 La θ være e ukjet parameter (ppulasjs-størrelse) e statstsk mdell. Uttrykket ukjet parameter betyr at de sae verde av θ ppulasje er ukjet. Når v setter pp
Forelesning Ordnings observatorer
[email protected] Forelesg 6 + 7 Ordgs observatorer. Oppsummerg tl Forelesg 4 og 5.) Fuksjoer (trasformasjoer) av flere S.V...) Smultafordelg tl to ye S.V. Ata at v har to S.V., med smultafordelg f ( x, x )
EKSAMEN løsningsforslag
5. aprl 017 EKSAMEN løsgsforslag Emekode: ITD0106 Emeav: Statstkk og økoom Dato:. ma 016 Eksamestd: 09.00 13.00 Hjelpemdler: - Alle trykte og skreve. - Kalkulator. Faglærer: Chrsta F Hede Om eksamesoppgave
Avdeling for estetiske fag, folkekultur og lærerutdanning BOKMÅL 14.12.2007
Høgskole Telemark Avdelg for estetske fag, folkekultur og lærerutdag BOKMÅL 4..7 UTATT PRØVE I MATEMATIKK, Modul 5 studepoeg Td: 5 tmer Hjelpemdler: Kalkulator og vedlagt formelsamlg (bakerst oppgavesettet).
Om enkel lineær regresjon I
1 ECON 130 HG, revdert 017 Notat tl kapttel 7.1 7.3.3 Løvås (Jfr. forelesg uke 11) Om ekel leær regresjo I (deskrptv aalse og ltt om regresjosmodelle tl slutt) 1 Iledg Ekel regresjosaalse dreer seg om
Makroøkonomi - B1. Innledning. Begrep. B. Makroøkonomi. Mundells trilemma går ut på følgende:
B. Makroøkoom Oppgave: Forklar påstades hold og drøft hvlke alteratv v står overfor: Fast valutakurs, selvstedg retepoltkk og fre kaptalbevegelser er kke forelg på samme td. Makroøkoom Iledg Mudells trlemma
Om enkel lineær regresjon I
ECON 30 HG, revdert 0 Notat tl kapttel 4 Løvås Om ekel leær regresjo I Iledg Ekel regresjosaalse dreer seg om å studere sammehege mellom e resposvarabel,, og e forklargsvarabel,, basert på et datamaterale
Positive rekker. Forelest: 3. Sept, 2004
Postve rekker Forelest: 3. Sept, 004 V skal tde utover fokusere på å teste om e rekke kovergerer, og skyve formler for summerg bakgrue. Dette er gje ford det første målet vårt er å lære hvorda v ka fe
Oppgave 1 ECON 2130 EKSAMEN 2011 VÅR
ECON 30 EKSAMEN 0 VÅR Oppgave E bedrf øsker å fordele koraker e vesergsprosjek hel lfeldg på 3 frmaer, A, B og C. Uvelgelse skjer ved loddrekg. Loddrekge er slk a hver av frmaee A, B og C, har e mulghe
Kapittel 1: Beskrivende statistikk
Kapttel : Bekrvede tattkk Defjoer: Populajo og utvalg Populajo: Alle mulge obervajoer v ka gjøre (,,, N ). Utvalg: Delmegde av populajoe (,,, der
Kapittel 1: Beskrivende statistikk
Kapttel : Bekrvede tattkk Defjoer: Populajo og utvalg Populajo: Alle mulge obervajoer v ka gjøre, (,,, N ). Utvalg: Delmegde av populajoe (,,,, der
ECON240 Statistikk og økonometri
ECON240 Statistikk og økoometri Arild Aakvik, Istitutt for økoomi 1 Mellomregig MKM Model: Y i = a i + bx i + e i MKM-estimator for b: b = = Xi Y i 1 Xi Yi Xi 1 ( X i ) 2 (Xi X)(Y i Ȳi) (Xi X) 2 hvor vi
Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og Repetisjon; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10
Repetisjo; 9.1, 9.2, 9.3, 9.4, 9.5, og 9.10 og Geerell defiisjo av : Situasjo: Data x 1,...,x ;utfallav:x 1,...,X ; u.i.f. tilfeldige variable Ukjet parameter i fordelige til X i ee: θ Dersom L og U L
STK1100 våren 2017 Estimering
STK1100 våre 017 Estimerig Svarer til sidee 331-339 i læreboka Ørulf Borga Matematisk istitutt Uiversitetet i Oslo 1 Politisk meigsmålig Spør et tilfeldig utvalg på 1000 persoer hva de ville ha stemt hvis
Introduksjon. Hypotesetesting / inferens (kap 3) Populasjon og utvalg. Populasjon og utvalg. Populasjonsvarians
Hypotesetestig / iferes (kap ) Itroduksjo Populasjo og utvalg Statistisk iferes Utvalgsfordelig (samplig distributio) Utvalgsfordelige til gjeomsittet Itroduksjo Vi øsker å få iformasjo om størrelsee i
MOT310 Statistiske metoder 1, høsten 2011
MOT310 Statistiske metoder 1, høste 2011 Bjør H. Auestad Istitutt for matematikk og aturviteskap Uiversitetet i Stavager 24. august, 2011 Bjør H. Auestad Itroduksjo og repetisjo 1 / 32 Repetisjo; 9.1,
(iii) Når 5 er blitt trukket ut, er det tre igjen som kan blir trukket ut til den siste plassen, altså:
A-besvarelse ECON2130- Statstkk 1 vår 2009 Oppgave 1 A) () Antall kke-ordnede utvalg: () P(Arne nummer 1) = () Når 5 er bltt trukket ut, er det tre gjen som kan blr trukket ut tl den sste plassen, altså:
Forelesning Z-, t-test, test for forventningsdifferanser
STAT Sttstkk Metoder [email protected] Forelesg + 3 Z-, t-test, test for forvetgsdfferser. Sttstsk hypotesetestg ullhypotese): ypotese so først ttt å være st *Forålet ed e test er å udersøke o dtterlet gr grulg
Estimering 1 -Punktestimering
Estimerig 1 -Puktestimerig Dekkes av kap. 8, 9.1-9.3 og 9.15/9.14. Vi har til å settpå e rekke forskjellige sasylighetsfordeliger og sett hvorda disse ka brukes til å modellere mage forskjellige typer
Econ 2130 uke 15 (HG) Poissonfordelingen og innføring i estimering
Eco 130 uke 15 (HG) Poissofordelige og iførig i estimerig 1 Poissofordelige (i) Tilærmig til biomialfordelige. Regel. ( Poissotilærmelse ) Ata Y ~ bi(, p) E( Y ) = p og var( Y ) = p(1 p). Hvis er stor
Randi Johannessen. Mikroindeksformel i konsumprisindeksen. 2001/64 Notater 2001
2/64 Notater 2 Rad Johaesse Mkrodeksformel kosumprsdekse Avdelg for økoomsk statstkk/sekso for økoomske dkatorer Emegruppe: 8.2. Ihold. Bakgru og kokluso...3 2. Levekostadsdekser...4 2.. Kosumetes tlpasg...4
Enveis variansanalyse (One-way ANOVA, fixed effects model) (Notat til Kap. 12 i Rosner)
Eves varasaalyse (Oe-way ANOVA, fxed effects model) (Notat tl Kap. Roser) V reaptulerer først t-teste for to uavhegge utvalg. Stuasjoe var at v hadde to grupper, f.es. G og G og et sett uavhegge og dets
TMA4240/4245 Statistikk Eksamen august 2016
Norges teknsk-naturvtenskapelge unverstet Insttutt for matematske fag TMA44/445 Statstkk Eksamen august 6 Løsnngssksse Oppgave a) Ved kast av to ternnger er det 36 mulge utfall: (, ),..., (6, 6). La Y
Alle deloppgaver teller likt i vurderingen av besvarelsen.
STK H-26 Løsnngsforslag Alle deloppgaver teller lkt vurderngen av besvarelsen. Oppgave a) De normalfordelte: x og sd for hver gruppe. De skjevfordelte og de ekstremt skjevfordelte: Medan og kvartler for
Oppgave 1. (i) Hva er sannsynligheten for at det øverste kortet i bunken er et JA-kort?
ECON EKSAMEN 8 VÅR TALLSVAR Oppgave Vi har e kortstokk beståede av 6 kort. På av disse står det skrevet JA på forside mes det står NEI på forside av de adre kortee. Hvis ma får se kortet med bakside vedt
Estimering 1 -Punktestimering
Estimerig 1 -Puktestimerig Dekkes av kap. 8, 9.1-9.3 og 9.15/9.14. Vi har til å settpå e rekke forskjellige sasylighetsfordeliger og sett hvorda disse ka brukes til å modellere mage forskjellige typer
211.7% 2.2% 53.0% 160.5% 30.8% 46.8% 17.2% 11.3% 38.7% 0.8%
Prøve-eksame II MET 1190 Statistikk Dato 31. mai 2019 kl 1100-1400 Alle svar skal begrues. Når besvarelse evalueres, blir det lagt vekt på at framgagsmåte og resultat preseteres så klart, presist og kortfattet
X = 1 5. X i, i=1. som vil være normalfordelt med forventningsverdi E( X) = µ og varians Var( X) = σ 2 /5. En rimelig estimator for variansen er
Norges tekisk-aturviteskapelige uiversitet Istitutt for matematiske fag Abefalte oppgaver 11, blokk II Løsigsskisse Oppgave 1 a) E rimelig estimator for forvetigsverdie µ er gjeomsittet X = 1 X i, som
Løsningsforslag for andre obligatoriske oppgave i STK1100 Våren 2007 Av Ingunn Fride Tvete og Ørnulf Borgan
Løsigsforslag for adre obligatoriske oppgave i STK11 Våre 27 Av Igu Fride Tvete ([email protected]) og Ørulf Borga ([email protected]). NB! Feil ka forekomme. NB! Sed gjere e mail hvis du fier e feil! Oppgave
Lineær regresjonsanalyse (13.4)
2 Kap. 13: Lieær korrelasjos- og regresjosaalyse ST0202 Statistikk for samfusvitere Bo Lidqvist Istitutt for matematiske fag Kap. 13.1-13.3: Lieær korrelasjosaalyse. Disse avsitt er ikke pesum, me de lieære
Påliteligheten til en stikkprøve
Pålitelighete til e stikkprøve Om origiale... 1 Beskrivelse... 2 Oppgaver... 4 Løsigsforslag... 4 Didaktisk bakgru... 5 Om origiale "Zuverlässigkeit eier Stichprobe" på http://www.mathe-olie.at/galerie/wstat2/stichprobe/dee
Statistikk og økonomi, våren 2017
Statistikk og økoomi, våre 07 Obligatorisk oppgave 6 Løsigsforslag Oppgave E terig kastes 0 gager, og det registreres hvor mage 6-ere som oppås i løpet av disse 0 kastee. Vi ka kalle atall 6-ere i løpet
Oppgave 1 a) Minste kvadraters metode tilpasser en linje til punktene ved å velge den linja som minimerer kvadratsummen. x i (y i α βx i ) = 0, SSE =
Norges tekisk-aturviteskapelige uiversitet Istitutt for matematiske fag Abefalte oppgaver 2, blokk II Løsigsskisse Oppgave a Miste kvadraters metode tilpasser e lije til puktee ved å velge de lija som
Illustrasjon av regel 5.19 om sentralgrenseteoremet og litt om heltallskorreksjon (som i eksempel 5.18).
Econ 2130 HG mars 2012 Supplement tl forelesnngen 19. mars Illustrasjon av regel 5.19 om sentralgrenseteoremet og ltt om heltallskorreksjon (som eksempel 5.18). Regel 5.19 ser at summer, Y = X1+ X2 + +
TMA4240 Statistikk Høst 2016
Norges tekisk-aturviteskapelige uiversitet Istitutt for matematiske fag Abefalt øvig 11 Løsigsskisse Oppgave 1 a) E rimelig estimator for forvetigsverdie µ er gjeomsittet X = 1 X i, som vil være ormalfordelt
UNIVERSITETET I OSLO ØKONOMISK INSTITUTT
Utsatt eksamen : ECON130 Statstkk 1 UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamensdag: 15.0.015 Sensur kunngjøres senest: 0.07.015 Td for eksamen: kl. 09:00 1:00 Oppgavesettet er på 4 sder Tllatte hjelpemdler:
Løsning TALM1005 (statistikkdel) juni 2017
Løsig TALM1005 statistikkdel jui 2017 Oppgave 1 a Har oppgitt at sasyligte for at é harddisk svikter er p = 0, 037. Ifører hedelsee A : harddisk 1 svikter B : harddisk 2 svikter C : harddisk 3 svikter
