TMA4240 Statistikk H2015 Kapittel 6: Kontinuerlige sannsynlighetsfordelinger 6.1 Uniform fordeling 6.2-6.3 Normalfordeling Mette Langaas Institutt for matematiske fag, NTNU wiki.math.ntnu.no/emner/tma4240/2015h/start/
Arbeidshverdag etter endt studium Studere et fenomen (f.eks. kvalitet av produsert maskindel, elektrisitetsprisen, forsikringspremie, holdninger til miljøvennlig energi, ) ved å beskrive og forstå. Med mål å trekke konklusjoner og gjøre beslutninger. Trenger data: samler inn data (subjektive eller objektive) under usikkerhet, studerer fenomenet fra data, kan bruke en SV med tilhørende fordeling til å beskrive fenomenet. Hvilken fordeling? se på prosessen som har skapt dataene. se grafisk på data og studere fordelingens form.
Arbeidshverdag etter endt studium Derfor: kap. 5 (diskret SV) og 6 (kontinuerlig SV): beskrive viktige fordelinger for å lære situasjoner er fordelingen passer forstå hvordan f (x) fremkommer se hva E(X ) og Var(X ) er og forstå hvorfor lære å regne ut f (x), F (x) = P(X x), P(a < X b). Deretter: anslå parametere i fordelingene og trekke konklusjoner under usikkerhet (kap. 9-11).
6.1 Kontinuerlig uniform fordeling Kontinuerlig uniform fordeling: Sannsynlighetstettheten til den kontinuerlige uniforme stokastiske variabelen X på intervallet [A, B] er 1 f (x; A, B) = B A, = 0 ellers. A x B Eksempel: SMS ankommer basestasjon som en Poisson-prosess. Vi vet at det kom en SMS mellom kl 8.15 og 8.20 i dag. Hva er sannsynligheten for at SMSen om mellom 8.19 og 8.20? Du kan bruke at ankomsttiden til SMSen er uniformt fordelt mellom 8.15 og 8.20 (og lære mer om dette i TMA4265 Stokastiske prosesser).
dette kan vi dermed gjøre direkte - men la oss heller se på sammenheng med F(x) Nå går vi tilbake til A og B og utleder F(x) generelt, så tilbake til SMS-eksemplet.
Tilbake til SMS-eksemplet: Hva gjenstår? E(X) og Var(X)
Vi ser grafisk at E(X) må ligge midt mellom A og B.
6.2 Normalfordeling Normalfordeling: Sannsynlighetstettheten til en normalfordelt stokastisk variabel, X, med forventning E(X ) = µ og varians Var(X ) = σ 2, er gitt ved n(x; µ, σ) = 1 e 1 (x µ) 2 2 σ 2, 2 πσ for < x <, der π=3.142 og e 1 = 2.718.
Helseundersøkelsen i Nord-Trøndelag ntnu.no http://www.ntnu.no/hunt/screening HUNT: En av verdens største helseundersøkelser Innsamlingsmetoder og type data Dataene er samlet inn ved hjelp av spørreskjema, intervjustudier, kliniske undersøkelser og analyser av blod- og urinprøver. I tillegg finnes lagrede blod- og urinprøver som kan hentes fram, tines opp og analyseres både på genetiske og andre biologiske markører. HUNT 1 (1984-1986) Den første av de store helseundersøkelsene ble gjennomført fra 1984 til 1986. Alle fylkets innbyggere som var over 20 år den 31. desember 1983 ble invitert. De som deltok fylte ut to spørreskjemaer. Hovedmålet var å kartlegge forekomsten av høyt blodtrykk og diabetes, og å evaluere behandlingskvaliteten av blodtrykkspasienter, personer med diabetes og personer med tuberkulose. Blodtrykk, høyde, vekt og røngten av brystkassa ble målt. HUNT 2 (1995-1997) HUNT 2 var mere omfattende enn HUNT 1 da alle innbyggere over 13 år ble invitert. HUNT 2 var oppdelt i Voksen-HUNT og UNG-HUNT. UNG-HUNT omhandlet aldersgruppa 13-19 år og Voksen-HUNT 20 år og eldre. Det ble tatt blodprøver av de over 20 år. Samlet deltakelse i HUNT 2 var omtrent 75000 personer (70%). Det var flere tilleggsundersøkelser i Voksen-HUNT, bl.a. spirometri og benmassemålinger. HUNT 3 (2006-2008) Den tredje helseundersøkelsen i Nord-Trøndelag, HUNT 3, ble gjennomført fra oktober 2006 til juni 2008. Undersøkelsen ble bygget opp på samme måte som HUNT 2, men omfatter flere temaer. Det ble samlet inn data gjennom spørreskjema og kliniske undersøkelser. I tillegg ble det samlet det inn genetisk materiale, blod, urin (voksne) og celleprøver fra munnhulen (ungdom) som oppbevares i HUNT biobank. UngHUNT (1995-1997, 1999-2000 og 2006-2008) Ungdomsundersøkelsen ble gjennomført første gang samtidig som HUNT 2, dvs. i 1995-1997. Det ble senere foretatt en oppfølgingsundersøkelse i år 1999-2000 som kalles UngHUNT 2. Ung HUNT 3 var en integrert del av HUNT 3-innsamlingen i 2006-2008. Spørreskjemaet ble fylt ut i skoletiden.
Høyde menn og kvinner i HUNT 3: histogram Density 0.00 0.01 0.02 0.03 0.04 120 140 160 180 200 cm
Høyde kvinner og menn i HUNT 3: histogram Density 0.00 0.01 0.02 0.03 0.04 0.05 0.06 Density 0.00 0.01 0.02 0.03 0.04 0.05 0.06 150 160 170 180 190 200 cm 120 140 160 180 cm
Høyde kvinner og menn i HUNT 3: histogram+pdf Density 0.00 0.01 0.02 0.03 0.04 0.05 0.06 Density 0.00 0.01 0.02 0.03 0.04 0.05 0.06 150 160 170 180 190 200 cm 120 140 160 180 cm
Historisk sett Matematisk form av normalfordlingen vist av demoivre i 1733. Laplace brukte normalfordelingen til analyse av måleusikkerhet i eksperimenter rundt 1800. C.F. Gauss publikasjon 1809 matematisk behandling av måleusikkerhet i eksperimenter. Navnet normalfordeling kom rundt 1875 (Peirce, Galton, Lexis) "No scientific discovery is named after its original discoverer."
Lokasjon og spredning PDF1 0.0 0.1 0.2 0.3 0.4 N( 1,1) N(0,1) N(1,1) PDF3 0.0 0.2 0.4 0.6 0.8 N(0,0.5) N(0,1) N(0,2) 4 2 0 2 4 4 2 0 2 4 PDF1 0.0 0.1 0.2 0.3 0.4 N( 1,1) N(1,2) 4 2 0 2 4 6
IQ Poengsummen fra en IQ-test antas ofte å være normalfordelt, og flere av IQ-testene har en forventningsverdi på 100 og et standardavvik på 16. 140 and over Genius or near genius 120-140 Very superior intelligence 110-120 Superior intelligence 90-110 Normal or average intelligence 80-90 Dullness 70-80 Borderline deficiency Below 70 Definite feeble-mindedness Hva er sannsynligheten for at en tilfeldig valgt person fra denne populasjonen har en IQ som er lavere enn 110? Hva er sannsynligheten for å ha en IQ mellom 80 og 120? For å bli med i Mensa må man oppnå en poengsum høyere enn 98 percentilen i fordelingen for testen. Hvor høy IQ-score må man ha for å blir medlem av Mensa?
Standard normalfordeling DFF 6.1: Fordelingen til en normalfordelt stokastisk variabel, Z, med forventning E(Z) = 0 og varians Var(Z) = 1 kalles en standard normalfordeling. 0.0 0.1 0.2 0.3 0.4 0.0 0.2 0.4 0.6 0.8 1.0 3 2 1 0 1 2 3 3 2 1 0 1 2 3 f Z (z) = 1 2π e 1 2σ 2 z2, for < z <, der π=3.142 og e 1 = 2.718.
-3.7.0001.0001.0001.0001.0001.0001.0001.0001.0001.0001-3.6.0002.0002.0001.0001.0001.0001.0001.0001.0001.0001-3.5.0002.0002.0002.0002.0002.0002.0002.0002.0002.0002-3.4.0003.0003.0003.0003.0003.0003.0003.0003.0003.0002-3.3.0005.0005.0005.0004.0004.0004.0004.0004.0004.0003-3.2.0007.0007.0006.0006.0006.0006.0006.0005.0005.0005-3.1.0010.0009 Standard.0009.0009 normalfordeling.0008.0008.0008.0008.0007.0007-3.0.0013.0013.0013.0012.0012.0011.0011.0011.0010.0010-2.9.0019.0018.0018 Φ(z).0017 =.0016 P (Z.0016 z).0015.0015.0014.0014-2.8.0026.0025.0024.0023.0023.0022.0021.0021.0020.0019 z -2.7.00.0035.01.0034.02.0033.03.0032.04.0031.05.0030.06.0029.0028.07.0027.08.0026.09-3.7-2.6.0001.0047.0001.0045.0001.0044.0001.0043.0001.0041.0001.0040.0001.0039.0038.0001.0037.0001.0036.0001-3.6-2.5.0002.0062.0002.0060.0001.0059.0001.0057.0001.0055.0001.0054.0001.0052.0051.0001.0049.0001.0048.0001-3.5-2.4.0002.0082.0002.0080.0002.0078.0002.0075.0002.0073.0002.0071.0002.0069.0068.0002.0066.0002.0064.0002-3.4-2.3.0003.0107.0003.0104.0003.0102.0003.0099.0003.0096.0003.0094.0003.0091.0089.0003.0087.0003.0084.0002-3.3-2.2.0005.0139.0005.0136.0005.0132.0004.0129.0004.0125.0004.0122.0004.0119.0116.0004.0113.0004.0110.0003-2.1.0179.0174.0170.0166.0162.0158.0154.0150.0146.0143-3.2.0007.0007.0006.0006.0006.0006.0006.0005.0005.0005-2.0.0228.0222.0217.0212.0207.0202.0197.0192.0188.0183-3.1.0010.0009.0009.0009.0008.0008.0008.0008.0007.0007-1.9.0287.0281.0274.0268.0262.0256.0250.0244.0239.0233-3.0-1.8.0013.0359.0013.0351.0013.0344.0012.0336.0012.0329.0011.0322.0011.0314.0307.0011.0301.0010.0294.0010-2.9-1.7.0019.0446.0018.0436.0018.0427.0017.0418.0016.0409.0016.0401.0015.0392.0384.0015.0375.0014.0367.0014-2.8-1.6.0026.0548.0025.0537.0024.0526.0023.0516.0023.0505.0022.0495.0021.0485.0475.0021.0465.0020.0455.0019-2.7-1.5.0035.0668.0034.0655.0033.0643.0032.0630.0031.0618.0030.0606.0029.0594.0582.0028.0571.0027.0559.0026-2.6-1.4.0047.0808.0045.0793.0044.0778.0043.0764.0041.0749.0040.0735.0039.0721.0708.0038.0694.0037.0681.0036-2.5-1.3.0062.0968.0060.0951.0059.0934.0057.0918.0055.0901.0054.0885.0052.0869.0853.0051.0838.0049.0823.0048-2.4-1.2.0082.1151.0080.1131.0078.1112.0075.1093.0073.1075.0071.1056.0069.1038.1020.0068.1003.0066.0985.0064-2.3-1.1.0107.1357.0104.1335.0102.1314.0099.1292.0096.1271.0094.1251.0091.1230.1210.0089.1190.0087.1170.0084-2.2-1.0.0139.1587.0136.1562.0132.1539.0129.1515.0125.1492.0122.1469.0119.1446.1423.0116.1401.0113.1379.0110-2.1 -.9.0179.1841.0174.1814.0170.1788.0166.1762.0162.1736.0158.1711.0154.1685.1660.0150.1635.0146.1611.0143-2.0 -.8.0228.2119.0222.2090.0217.2061.0212.2033.0207.2005.0202.1977.0197.1949.1922.0192.1894.0188.1867.0183 -.7.2420.2389.2358.2327.2296.2266.2236.2206.2177.2148-1.9.0287.0281.0274.0268.0262.0256.0250.0244.0239.0233 -.6.2743.2709.2676.2643.2611.2578.2546.2514.2483.2451-1.8.0359.0351.0344.0336.0329.0322.0314.0307.0301.0294 -.5.3085.3050.3015.2981.2946.2912.2877.2843.2810.2776-1.7.0446.0436.0427.0418.0409.0401.0392.0384.0375.0367 -.4.3446.3409.3372.3336.3300.3264.3228.3192.3156.3121-1.6 -.3.0548.3821.0537.3783.0526.3745.0516.3707.0505.3669.0495.3632.0485.3594.3557.0475.3520.0465.3483.0455-1.5 -.2.0668.4207.0655.4168.0643.4129.0630.4090.0618.4052.0606.4013.0594.3974.3936.0582.3897.0571.3859.0559-1.4 -.1.0808.4602.0793.4562.0778.4522.0764.4483.0749.4443.0735.4404.0721.4364.4325.0708.4286.0694.4247.0681-1.3 -.0.0968.5000.0951.4960.0934.4920.0918.4880.0901.4840.0885.4801.0869.4761.4721.0853.4681.0838.4641.0823
Standard normalfordeling Φ(z) = P (Z z) z.00.01.02.03.04.05.06.07.08.09.0.5000.5040.5080.5120.5160.5199.5239.5279.5319.5359.1.5398.5438.5478.5517.5557.5596.5636.5675.5714.5753.2.5793.5832.5871.5910.5948.5987.6026.6064.6103.6141.3.6179.6217.6255.6293.6331.6368.6406.6443.6480.6517.4.6554.6591.6628.6664.6700.6736.6772.6808.6844.6879.5.6915.6950.6985.7019.7054.7088.7123.7157.7190.7224.6.7257.7291.7324.7357.7389.7422.7454.7486.7517.7549.7.7580.7611.7642.7673.7704.7734.7764.7794.7823.7852.8.7881.7910.7939.7967.7995.8023.8051.8078.8106.8133.9.8159.8186.8212.8238.8264.8289.8315.8340.8365.8389 1.0.8413.8438.8461.8485.8508.8531.8554.8577.8599.8621 1.1.8643.8665.8686.8708.8729.8749.8770.8790.8810.8830 1.2.8849.8869.8888.8907.8925.8944.8962.8980.8997.9015 1.3.9032.9049.9066.9082.9099.9115.9131.9147.9162.9177 1.4.9192.9207.9222.9236.9251.9265.9279.9292.9306.9319 1.5.9332.9345.9357.9370.9382.9394.9406.9418.9429.9441 1.6.9452.9463.9474.9484.9495.9505.9515.9525.9535.9545 1.7.9554.9564.9573.9582.9591.9599.9608.9616.9625.9633 1.8.9641.9649.9656.9664.9671.9678.9686.9693.9699.9706 1.9.9713.9719.9726.9732.9738.9744.9750.9756.9761.9767 2.0.9772.9778.9783.9788.9793.9798.9803.9808.9812.9817 2.1.9821.9826.9830.9834.9838.9842.9846.9850.9854.9857 2.2.9861.9864.9868.9871.9875.9878.9881.9884.9887.9890 2.3.9893.9896.9898.9901.9904.9906.9909.9911.9913.9916