7.3 Notkun höfuðsetningar tölfræðinnar
Mikilvægt er að skilja hvenær á að nota höfuðsetningu tölfræðinnar. Ef beðið er um að finna líkur fyrir meðaltal skal nota höfuðsetninguna fyrir meðaltöl. Ef beðið er um að finna líkur fyrir summu eða heild skal nota höfuðsetninguna fyrir summur. Þetta á einnig við um prósentumörk fyrir meðaltöl og summur.
Mikilvægt er að skilja hvenær á að nota höfuðsetningu tölfræðinnar. Ef beðið er um að finna líkur fyrir meðaltal skal nota höfuðsetninguna fyrir meðaltöl. Ef beðið er um að finna líkur fyrir summu eða heild skal nota höfuðsetninguna fyrir summur. Þetta á einnig við um prósentumörk fyrir meðaltöl og summur.
Dæmi um höfuðsetningu tölfræðinnar
Lögmál stórra talna
Lögmál stórra talna segir að ef tekin eru sífellt stærri úrtök úr hvaða þýði sem er, þá færist úrtaksmeðaltalið x̄ nær og nær μ. Samkvæmt höfuðsetningu tölfræðinnar vitum við að þegar n stækkar fylgja úrtaksmeðaltölin normaldreifingu. Því stærra sem n verður, því minna verður staðalfrávikið. Munið að staðalfrávik X̄ er σ/√n. Þetta þýðir að úrtaksmeðaltalið x̄ hlýtur að vera nálægt þýðismeðaltalinu μ. Segja má að μ sé gildið sem úrtaksmeðaltölin nálgast þegar n stækkar. Höfuðsetning tölfræðinnar sýnir lögmál stórra talna.
Lögmál stórra talna segir að ef tekin eru sífellt stærri úrtök úr hvaða þýði sem er, þá færist úrtaksmeðaltalið x̄ nær og nær μ. Samkvæmt höfuðsetningu tölfræðinnar vitum við að þegar n stækkar fylgja úrtaksmeðaltölin normaldreifingu. Því stærra sem n verður, því minna verður staðalfrávikið. Munið að staðalfrávik X̄ er σ/√n. Þetta þýðir að úrtaksmeðaltalið x̄ hlýtur að vera nálægt þýðismeðaltalinu μ. Segja má að μ sé gildið sem úrtaksmeðaltölin nálgast þegar n stækkar. Höfuðsetning tölfræðinnar sýnir lögmál stórra talna.
Dæmi um höfuðsetningu tölfræðinnar fyrir meðaltal og summu
Dæmi 7.8
Rannsókn á streitu er framkvæmd meðal nemenda á háskólasvæði. Streituskorin fylgja jafnri dreifingu þar sem lægsta streituskorið er jafnt og einn og það hæsta jafnt og fimm. Með því að nota úrtak 75 nemenda skal finna:
Látum X vera eitt streituskor.
Liðir (a) og (b) biðja um líkur eða prósentumark fyrir meðaltal. Liðir (c) og (d) biðja um líkur eða prósentumark fyrir heild eða summu. Úrtaksstærðin, n, er 75.
Þar sem einstök streituskor fylgja jafnri dreifingu er X ~ U(1, 5), þar sem a = 1 og b = 5.
μX = (a + b)/2 = (1 + 5)/2 = 3
σX = √((b - a)²/12) = √((5 - 1)²/12) ≈ 1,15
Í formúlunni hér að ofan er gert ráð fyrir að nefnarinn sé 12, óháð endapunktum jöfnu dreifingarinnar.
Fyrir liði (a) og (b) látum við X̄ vera meðalstreituskor 75 nemenda. Þá gildir:
X̄ ~ N(3, 1,15/√75), þar sem n = 75.
a. Finnið P(x̄ < 2). Teiknið línuritið.
b. Finnið 90. prósentumarkið fyrir meðaltal 75 streituskora. Teiknið línuritið.
Fyrir liði (c) og (d) látum við ΣX vera summu 75 streituskora. Þá er ΣX ~ N[(75)(3), (√75)(1,15)].
c. Finnið P(Σx < 200). Teiknið línuritið.
d. Finnið 90. prósentumarkið fyrir heildarsummu 75 streituskora. Teiknið línuritið.
Lausn
a. P ( x ¯ < 2) = 0
Líkurnar á því að meðalstreituskor sé minna en 2 eru nálægt núlli.
normalcdf ( 1,2,3, 1 .15/75 ) = 0
Ábending
Minnsta streituskorið er einn.
b. Látum k vera 90. prósentumarkið.
Finnið k þar sem P(x̄ < k) = 0,90.
k = 3,2
90. prósentumarkið fyrir meðaltal 75 skora er um það bil 3,2. Þetta segir okkur að 90 prósent allra meðaltala 75 streituskora eru í mesta lagi 3,2 og að 10 prósent eru að minnsta kosti 3,2.
invNorm(0.90,3,1.15/√75) = 3,2
c. Meðaltal summu 75 streituskora er (75)(3) = 225.
Staðalfrávik summu 75 streituskora er ( 75 ) (1.15) = 9.96.
P(Σx < 200) = 0
Líkurnar á því að heildarsumma 75 skora sé minni en 200 eru nálægt núlli.
normalcdf (75,200,(75)(3), ( 75 ) (1.15)).
Ábending
Minnsta heildarsumma 75 streituskora er 75, vegna þess að minnsta einstaka skorið er einn.
d. Látum k vera 90. prósentumarkið.
Finnið k þar sem P(Σx < k) = 0,90.
k = 237,8
90. prósentumarkið fyrir summu 75 skora er um það bil 237,8. Þetta segir okkur að 90 prósent allra summa 75 skora eru ekki meiri en 237,8 og að 10 prósent eru ekki minni en 237,8.
invNorm (0.90,(75)(3), ( 75 ) (1.15)) = 237.8
Dæmi 7.9
Gerum ráð fyrir að markaðsrannsóknarsérfræðingur hjá farsímafyrirtæki rannsaki viðskiptavini sem fara fram úr þeim tíma sem innifalinn er í grunnsamningi þeirra. Sérfræðingurinn kemst að því að hjá þeim sem fara fram úr samningsbundnum tíma fylgir umframtíminn veldisdreifingu með meðaltalið 22 mínútur.
Skoðum slembiúrtak 80 viðskiptavina sem fara fram úr þeim tíma sem innifalinn er í grunnsamningi þeirra.
Látum X vera umframtímann sem EINN farsímaviðskiptavinur notar þegar hann fer fram úr samningsbundnum tíma sínum.
X ∼ Exp ( 1/22 ) . Úr fyrri köflum vitum við að μ = 22 og σ = 22.
Látum X ¯ = meðalumframtíma sem úrtak n = 80 viðskiptavina notar sem fara fram úr samningsbundnum tíma sínum.
X̄ ~ N(22, 22/√80) samkvæmt höfuðsetningu tölfræðinnar fyrir úrtaksmeðaltöl.
Finnið 95.
prósentumark fyrir
prósentumark fyrir
meðalumframtíma úrtaks
fyrir úrtak 80 viðskiptavina sem fara yfir grunntímamörk samnings síns. Teiknaðu línurit.
Lausn
Látum k vera 95. prósentumarkið. Finnið k þar sem P(x̄ < k) = 0,95.
k = 26,0 með invNorm(0.95,22,22/√80) = 26,0.
95. prósentumarkið fyrir meðalumframtíma úrtaks er um það bil 26,0 mínútur fyrir slembiúrtak 80 viðskiptavina sem fara fram úr leyfilegum samningstíma.
95 prósent slíkra úrtaka hefðu meðaltöl undir 26 mínútum; aðeins fimm prósent slíkra úrtaka hefðu meðaltöl yfir 26 mínútum.
Dæmi 7.10
Bandarískir vísindamenn sem rannsaka ákveðinn sjúkdóm komust að því að nýr einstaklingur greinist á tveggja mínútna fresti, að meðaltali. Gerum ráð fyrir að staðalfrávikið sé 0,5 mínútur og að úrtaksstærðin sé 100.
- Finnið miðgildi, fyrsta fjórðungamark og þriðja fjórðungamark fyrir meðaltíma greiningar í úrtaki í Bandaríkjunum.
- Finnið miðgildi, fyrsta fjórðungamark og þriðja fjórðungamark fyrir summu greiningartíma í úrtaki í Bandaríkjunum.
- Finnið líkurnar á því að greining taki að meðaltali á milli 1,75 og 1,85 mínútur.
- Finnið gildið sem er tveimur staðalfrávikum ofan við meðaltal úrtaksins.
- Finnið fjórðungaspönn (IQR) fyrir summu úrtakstímanna.
Lausn
- Við höfum μx̄ = μ = 2 og σx̄ = σ/√n = 0,5/√100 = 0,05. Þess vegna er 50. prósentumarkið = μx̄ = μ = 2, 25. prósentumarkið = invNorm(0.25,2,0.05) = 1,97 og 75. prósentumarkið = invNorm(0.75,2,0.05) = 2,03.
- Við höfum μΣx = n(μx) = 100(2) = 200 og σΣx = √n(σx) = √100(0,5) = 5. Þess vegna er 50. prósentumarkið = μΣx = n(μx) = 100(2) = 200, 25. prósentumarkið = invNorm(0.25,200,5) = 196,63 og 75. prósentumarkið = invNorm(0.75,200,5) = 203,37.
- P(1,75 < x̄ < 1,85) = normalcdf(1.75,1.85,2,0.05) = 0,0013.
- Með því að nota jöfnuna fyrir z-gildi, z = (x̄ - μx̄)/σx̄, og leysa fyrir x fæst x = 2(0,05) + 2 = 2,1.
- Fjórðungaspönnin (IQR) er 75. prósentumarkið - 25. prósentumarkið = 203,37 - 196,63 = 6,74.
Dæmi 7.11
Rannsókn var gerð á sjúkdómsástandi sem hefur áhrif á ákveðinn hóp fólks. Aldursbil fólksins var 14 til 61 ár. Meðalaldurinn var 30,9 ár og staðalfrávikið níu ár.
- Hverjar eru líkurnar á því, í úrtaki 25 einstaklinga, að meðalaldur fólksins sé undir 35?
- Er líklegt að meðalaldur úrtakshópsins sé meiri en 50 ár? Túlkið niðurstöðurnar.
- Hverjar eru líkurnar á því, í úrtaki 49 einstaklinga, að summa aldurs þeirra sé ekki minni en 1.600?
- Er líklegt að summa aldurs þessara 49 einstaklinga sé í mesta lagi 1.595? Túlkið niðurstöðurnar.
- Finnið 95. prósentumarkið fyrir meðalaldur úrtaks 65 einstaklinga. Túlkið niðurstöðurnar.
- Finnið 90. prósentumarkið fyrir summu aldurs 65 einstaklinga. Túlkið niðurstöðurnar.
Lausn
- P(x̄ < 35) = normalcdf(-E99,35,30.9,1.8) = 0,9886.
- P(x̄ > 50) = normalcdf(50,E99,30.9,1.8) ≈ 0. Fyrir þennan úrtakshóp er nánast ómögulegt að meðalaldur hópsins sé meiri en 50. Hins vegar er enn mögulegt að einstaklingur í þessum hópi sé eldri en 50.
- P(Σx ≥ 1.600) = normalcdf(1600,E99,1514.10,63) = 0,0864.
- P(Σx ≤ 1.595) = normalcdf(-E99,1595,1514.10,63) = 0,9005. Þetta þýðir að 90 prósenta líkur eru á að summa aldurs í úrtakshópnum, n = 49, sé í mesta lagi 1.595.
- 95. prósentumarkið = invNorm(0.95,30.9,1.1) = 32,7. Þetta gefur til kynna að 95 prósent fólks í úrtaki af stærð 65 séu að meðaltali yngri en 32,7 ára.
- 90. prósentumarkið = invNorm(0.90,2008.5,72.56) = 2101,5. Þetta gefur til kynna að 90 prósent fólks í úrtaki af stærð 65 hafi aldurssummu undir 2.101,5 árum.
Dæmi 7.12
Gerum ráð fyrir að í staðbundnu skólahverfi frá leikskóla til 12. bekkjar (K-12) séu 53 prósent íbúa hlynnt sjálfstætt starfandi skóla (e. charter school) fyrir bekki K til 5. Tekið er einfalt slembiúrtak 300 einstaklinga.
- Finnið líkurnar á því að að minnsta kosti 150 séu hlynntir sjálfstætt starfandi skóla.
- Finnið líkurnar á því að í mesta lagi 160 séu hlynntir sjálfstætt starfandi skóla.
- Finnið líkurnar á því að fleiri en 155 séu hlynntir sjálfstætt starfandi skóla.
- Finnið líkurnar á því að færri en 147 séu hlynntir sjálfstætt starfandi skóla.
- Finnið líkurnar á því að nákvæmlega 175 séu hlynntir sjálfstætt starfandi skóla.
Látum X vera fjölda þeirra sem eru hlynntir sjálfstætt starfandi skóla fyrir bekki K til 5. X ~ B(n,p), þar sem n = 300 og p = 0,53. Þar sem np > 5 og nq > 5 notum við normalnálgun tvíkostadreifingar. Formúlurnar fyrir meðaltal og staðalfrávik eru μ = np og σ = √(npq). Meðaltalið er 159 og staðalfrávikið er 8,6447. Slembibreyta normaldreifingarinnar er Y. Y ~ N(159, 8,6447). Sjá kaflann um normaldreifingu fyrir hjálp við notkun reiknivélar. Fyrir lið (a) tekurðu 150 með, þannig að P ( X ≥ 150) hefur normalnálgunina P ( Y ≥ 149.5) = 0.8641. normalcdf(149.5,10^99,159,8.6447) = 0,8641. Fyrir b-lið tekurðu 160 með þannig að P ( X ≤ 160) hefur normalnálgunina P ( Y ≤ 160.5) = 0.5689. normalcdf(0,160.5,159,8.6447) = 0,5689. Fyrir c-lið sleppirðu 155 þannig að P ( X > 155) hefur normalnálgunina P ( y > 155.5) = 0.6572. normalcdf(155.5,10^99,159,8.6447) = 0,6572. Fyrir d-lið sleppirðu 147 þannig að P ( X < 147) hefur normalnálgunina P ( Y < 146.5) = 0.0741. normalcdf (0,146.5,159,8.6447) = 0.0741 Fyrir e-lið hefur P ( X = 175) normalnálgunina P (174.5 < Y < 175.5) = 0.0083. normalcdf (174.5,175.5,159,8.6447) = 0.0083 Vegna reiknivéla og tölvuhugbúnaðar sem gera auðvelt að reikna tvíkostalíkindi fyrir stór gildi á n er ekki nauðsynlegt að nota normalnálgun tvíkostadreifingarinnar ef slík tæki eru tiltæk. Flestar tölvustofur skóla eru með hugbúnað sem reiknar tvíkostalíkindi. Margir nemendur hafa aðgang að reiknivélum sem reikna líkur fyrir tvíkostadreifingu. Ef slegið er inn „útreikningur tvíkostadreifingar“ í vafra má finna að minnsta kosti eina reiknivél á netinu fyrir tvíkostadreifingu. Fyrir sýnidæmi 7.10 eru líkurnar reiknaðar með eftirfarandi tvíkostadreifingu: n = 300 og p = 0,53. Berið saman svörin úr tvíkostadreifingu og normaldreifingu. Sjá kaflann um strjálar slembibreytur fyrir leiðbeiningar um reiknivélarnotkun fyrir tvíkostadreifingu. P ( X ≥ 150): 1 - binomialcdf (300,0.53,149) = 0.8641 P ( X ≤ 160): binomialcdf (300,0.53,160) = 0.5684 P ( X > 155): 1 - binomialcdf (300,0.53,155) = 0.6576 P ( X < 147): binomialcdf (300,0.53,146) = 0.0742 P(X = 175): Notið tvíkostaþéttifallið, binomialpdf. binomialpdf(300,0.53,175) = 0,0083.