Námsgögn
Innskrá
Hleð efnisyfirliti...
Leita í bók...
Tölfræði (IS)
  • Formáli
  • Introduction
  • 1.1 Definitions of Statistics, Probability, and Key Terms
  • 1.2 Data, Sampling, and Variation in Data and Sampling
  • 1.3 Tíðni, tíðnitöflur og mælistig
  • 1.4 Tilraunahögun og siðfræði
  • 1.5 Tilraun með gagnasöfnun
  • 1.6 Úrtakstilraun
  • Lykilhugtök
  • Kaflarifjun
  • Æfing
  • Homework
  • Tengjum efnið saman: heimaverkefni
  • Heimildir
  • Lausnir
  • Introduction
  • 2.1 Stem-and-Leaf Graphs (Stemplots), Line Graphs, and Bar Graphs
  • 2.2 Histograms, Frequency Polygons, and Time Series Graphs
  • 2.3 Measures of the Location of the Data
  • 2.4 Box Plots
  • 2.5 Lýsistærðir fyrir miðju gagna
  • 2.6 Skewness and the Mean, Median, and Mode
  • 2.7 Mælikvarðar á dreifingu gagna
  • 2.8 Lýsandi tölfræði
  • Lykilhugtök
  • Kaflayfirlit
  • Formúluyfirlit
  • Æfingar
  • Heimaverkefni
  • Tengjum efnið saman: heimaverkefni
  • Heimildir
  • Lausnir
  • Inngangur
  • 3.1 Hugtök
  • 3.2 Óháðir og ósamrýmanlegir atburðir
  • 3.3 Tvær grunnreglur líkindafræðinnar
  • 3.4 Krosstöflur
  • 3.5 Líkindatré og Vennmyndir
  • 3.6 Efni í líkindafræði
  • Lykilhugtök
  • Kaflarifjun
  • Formúluyfirlit
  • Æfingar
  • Tökum þetta saman: Æfingar
  • Heimadæmi
  • Tökum þetta saman: Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 4.1 Líkindafall (PDF) fyrir strjála slembibreytu
  • 4.2 Meðaltal eða væntigildi og staðalfrávik
  • 4.3 Tvíkostadreifing (valfrjálst)
  • 4.4 Rúmfræðileg dreifing (valfrjálst)
  • 4.5 Happdrættisdreifing (valfrjálst)
  • 4.6 Poisson dreifing (valfrjálst)
  • 4.7 Strjál dreifing (spilastokkatilraun)
  • 4.8 Strjál dreifing (lukkuteningatilraun)
  • Lykilhugtök
  • Kaflarifjun
  • Formúluyfirlit
  • Æfingar
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 5.1 Þéttiföll samfelldra líkindadreifinga
  • 5.2 Jöfn dreifing
  • 5.3 Veldisdreifing (valfrjálst)
  • 5.4 Samfelld dreifing
  • Lykilhugtök
  • Upprifjun kafla
  • Formúluyfirlit
  • Æfingar
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 6.1 Staðlaða normaldreifingin
  • 6.2 Notkun normaldreifingar
  • 6.3 Normaldreifing—Hringtímar
  • 6.4 Normaldreifing—Lengd litlafingurs
  • Lykilhugtök
  • Upprifjun kafla
  • Formúluyfirlit
  • Æfingar
  • Heimaverkefni
  • Heimildir
  • Lausnir
  • Inngangur
  • 7.1 Höfuðsetning tölfræðinnar fyrir úrtaksmeðaltöl
  • 7.2 Höfuðsetning tölfræðinnar fyrir summur (valfrjálst)
  • 7.3 Notkun höfuðsetningar tölfræðinnar
  • 7.4 Höfuðsetning tölfræðinnar (smámynt)
  • 7.5 Höfuðsetning tölfræðinnar (smákökuuppskriftir)
  • Lykilhugtök
  • Upprifjun kafla
  • Formúluyfirlit
  • Æfingar
  • Heimaverkefni
  • Heimildir
  • Lausnir
  • Inngangur
  • 8.1 Meðaltal eins þýðis reiknað með normaldreifingu
  • 8.2 Meðaltal eins þýðis reiknað með t-dreifingu Students
  • 8.3 Þýðishlutfall
  • 8.4 Öryggisbil (húsnæðisverð)
  • 8.5 Öryggisbil (fæðingarstaður)
  • 8.6 Öryggisbil (hæðir kvenna)
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfing
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 9.1 Núlltilgátur og gagntilgátur
  • 9.2 Útkomur og villur af gerð I og II
  • 9.3 Dreifing sem þarf fyrir tilgátuprófun
  • 9.4 Sjaldgæfir atburðir, úrtakið og ákvörðun og niðurstaða
  • 9.5 Viðbótarupplýsingar og heildstæð dæmi um tilgátupróf
  • 9.6 Tilgátupróf fyrir eitt meðaltal og eitt hlutfall
  • Lykilhugtök
  • Kaflayfirlit
  • Formúluyfirlit
  • Æfingar
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 10.1 Tvö þýðismeðaltöl með óþekktum staðalfrávikum
  • 10.2 Tvö þýðismeðaltöl með þekktum staðalfrávikum
  • 10.3 Samanburður á tveimur óháðum þýðishlutföllum
  • 10.4 Pöruð úrtök (valfrjálst)
  • 10.5 Tilgátuprófun fyrir tvö meðaltöl og tvö hlutföll
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfing
  • Heimadæmi
  • Tekið saman: Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 11.1 Staðreyndir um kí-kvaðrat dreifinguna
  • 11.2 Próf á mátgæðum
  • 11.3 Próf á óhæði
  • 11.4 Próf á einsleitni
  • 11.5 Samanburður á kí-kvaðrat prófum
  • 11.6 Próf á dreifni í einu þýði
  • 11.7 Tölfræðiverkefni 1: Kí-kvaðrat mátgæðapróf
  • 11.8 Tölfræðiverkefni 2: Kí-kvaðrat próf á óhæði
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfingar
  • Heimadæmi
  • Tekið saman: Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 12.1 Línulegar jöfnur
  • 12.2 Aðhvarfsjafnan
  • 12.3 Prófun á marktækni fylgnistuðulsins (valfrjálst)
  • 12.4 Spá (valfrjálst)
  • 12.5 Fráviksgildi
  • 12.6 Aðhvarfsgreining (fjarlægð frá skóla) (valfrjálst)
  • 12.7 Aðhvarfsgreining (kostnaður við kennslubækur) (valfrjálst)
  • 12.8 Aðhvarfsgreining (eldsneytisnýting) (valfrjálst)
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfingar
  • Heimadæmi
  • Tekið saman: Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 13.1 Einþátta fervikagreining
  • 13.2 F-dreifingin og F-hlutfallið
  • 13.3 Staðreyndir um F-dreifinguna
  • 13.4 Tilgátupróf fyrir tvær dreifnir
  • 13.5 Tölfræðiverkefni: Einþátta fervikagreining
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfingar
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Viðauki A: Yfirlitsæfingar (kaflar 3–13)
  • Viðauki B: Æfingapróf 1–4 og lokapróf
  • Viðauki C: Gagnasöfn
  • Viðauki D: Hóp- og paraverkefni
  • Viðauki E: Lausnablöð
  • Viðauki F: Stærðfræðileg orðasambönd, tákn og formúlur
  • Viðauki G: Athugasemdir fyrir TI-83, 83+, 84 og 84+ reiknivélar
  • Viðauki H: Töflur
  • Atriðaskrá
Tölfræði (IS)Kafli 77.3 Notkun höfuðsetningar tölfræðinnar
77 The Central Limit Theorem

7.3 Notkun höfuðsetningar tölfræðinnar

FYRRI KAFLI

7.2 Höfuðsetning tölfræðinnar fyrir summur (valfrjálst)

NÆSTI KAFLI

7.4 Höfuðsetning tölfræðinnar (smámynt)

Mikilvægt er að skilja hvenær á að nota höfuðsetningu tölfræðinnar. Ef beðið er um að finna líkur fyrir meðaltal skal nota höfuðsetninguna fyrir meðaltöl. Ef beðið er um að finna líkur fyrir summu eða heild skal nota höfuðsetninguna fyrir summur. Þetta á einnig við um prósentumörk fyrir meðaltöl og summur.

Mikilvægt er að skilja hvenær á að nota höfuðsetningu tölfræðinnar. Ef beðið er um að finna líkur fyrir meðaltal skal nota höfuðsetninguna fyrir meðaltöl. Ef beðið er um að finna líkur fyrir summu eða heild skal nota höfuðsetninguna fyrir summur. Þetta á einnig við um prósentumörk fyrir meðaltöl og summur.

ATHUGIÐ

Ef beðið er um að finna líkur fyrir einstakt gildi skal ekki nota höfuðsetningu tölfræðinnar. Notið þá dreifingu viðkomandi slembibreytu.

Dæmi um höfuðsetningu tölfræðinnar

Lögmál stórra talna

Lögmál stórra talna segir að ef tekin eru sífellt stærri úrtök úr hvaða þýði sem er, þá færist úrtaksmeðaltalið x̄ nær og nær μ. Samkvæmt höfuðsetningu tölfræðinnar vitum við að þegar n stækkar fylgja úrtaksmeðaltölin normaldreifingu. Því stærra sem n verður, því minna verður staðalfrávikið. Munið að staðalfrávik X̄ er σ/√n. Þetta þýðir að úrtaksmeðaltalið x̄ hlýtur að vera nálægt þýðismeðaltalinu μ. Segja má að μ sé gildið sem úrtaksmeðaltölin nálgast þegar n stækkar. Höfuðsetning tölfræðinnar sýnir lögmál stórra talna.

Lögmál stórra talna segir að ef tekin eru sífellt stærri úrtök úr hvaða þýði sem er, þá færist úrtaksmeðaltalið x̄ nær og nær μ. Samkvæmt höfuðsetningu tölfræðinnar vitum við að þegar n stækkar fylgja úrtaksmeðaltölin normaldreifingu. Því stærra sem n verður, því minna verður staðalfrávikið. Munið að staðalfrávik X̄ er σ/√n. Þetta þýðir að úrtaksmeðaltalið x̄ hlýtur að vera nálægt þýðismeðaltalinu μ. Segja má að μ sé gildið sem úrtaksmeðaltölin nálgast þegar n stækkar. Höfuðsetning tölfræðinnar sýnir lögmál stórra talna.

Dæmi um höfuðsetningu tölfræðinnar fyrir meðaltal og summu

Dæmi 7.8

Rannsókn á streitu er framkvæmd meðal nemenda á háskólasvæði. Streituskorin fylgja jafnri dreifingu þar sem lægsta streituskorið er jafnt og einn og það hæsta jafnt og fimm. Með því að nota úrtak 75 nemenda skal finna:

Látum X vera eitt streituskor.

Liðir (a) og (b) biðja um líkur eða prósentumark fyrir meðaltal. Liðir (c) og (d) biðja um líkur eða prósentumark fyrir heild eða summu. Úrtaksstærðin, n, er 75.

Þar sem einstök streituskor fylgja jafnri dreifingu er X ~ U(1, 5), þar sem a = 1 og b = 5.

μX = (a + b)/2 = (1 + 5)/2 = 3

σX = √((b - a)²/12) = √((5 - 1)²/12) ≈ 1,15

Í formúlunni hér að ofan er gert ráð fyrir að nefnarinn sé 12, óháð endapunktum jöfnu dreifingarinnar.

Fyrir liði (a) og (b) látum við X̄ vera meðalstreituskor 75 nemenda. Þá gildir:

X̄ ~ N(3, 1,15/√75), þar sem n = 75.

a. Finnið P(x̄ < 2). Teiknið línuritið.

b. Finnið 90. prósentumarkið fyrir meðaltal 75 streituskora. Teiknið línuritið.

Fyrir liði (c) og (d) látum við ΣX vera summu 75 streituskora. Þá er ΣX ~ N[(75)(3), (√75)(1,15)].

c. Finnið P(Σx < 200). Teiknið línuritið.

d. Finnið 90. prósentumarkið fyrir heildarsummu 75 streituskora. Teiknið línuritið.

Lausn

a. P ( x ¯ < 2) = 0

Líkurnar á því að meðalstreituskor sé minna en 2 eru nálægt núlli.

Normaldreifingarferill á láréttum ás. Hæsti punktur ferilsins er við 3 og punkturinn 2 er merktur við vinstri jaðar ferilsins.

normalcdf ( 1,2,3, 1 .15/75 ) = 0

Ábending

Minnsta streituskorið er einn.

b. Látum k vera 90. prósentumarkið.

Finnið k þar sem P(x̄ < k) = 0,90.

k = 3,2

Normaldreifingarferill. Hæsti punktur ferilsins er við 3. Punkturinn k er merktur hægra megin við 3, lóðrétt lína liggur frá k að ferlinum og skyggða svæðið vinstra megin við k sýnir P(x̄ < k) = 0,90.

90. prósentumarkið fyrir meðaltal 75 skora er um það bil 3,2. Þetta segir okkur að 90 prósent allra meðaltala 75 streituskora eru í mesta lagi 3,2 og að 10 prósent eru að minnsta kosti 3,2.

invNorm(0.90,3,1.15/√75) = 3,2

c. Meðaltal summu 75 streituskora er (75)(3) = 225.

Staðalfrávik summu 75 streituskora er ( 75 ) (1.15) = 9.96.

P(Σx < 200) = 0

Normaldreifingarferill á láréttum ás. Hæsti punktur ferilsins er við 225 og punkturinn 200 er merktur við vinstri jaðar ferilsins.

Líkurnar á því að heildarsumma 75 skora sé minni en 200 eru nálægt núlli.

normalcdf (75,200,(75)(3), ( 75 ) (1.15)).

Ábending

Minnsta heildarsumma 75 streituskora er 75, vegna þess að minnsta einstaka skorið er einn.

d. Látum k vera 90. prósentumarkið.

Finnið k þar sem P(Σx < k) = 0,90.

k = 237,8

Normaldreifingarferill. Hæsti punktur ferilsins er við 225. Punkturinn k er merktur hægra megin við 225, lóðrétt lína liggur frá k að ferlinum og skyggða svæðið vinstra megin við k sýnir P(Σx < k) = 0,90.

90. prósentumarkið fyrir summu 75 skora er um það bil 237,8. Þetta segir okkur að 90 prósent allra summa 75 skora eru ekki meiri en 237,8 og að 10 prósent eru ekki minni en 237,8.

invNorm (0.90,(75)(3), ( 75 ) (1.15)) = 237.8

Reyndu sjálf/ur 7.8

Notið upplýsingarnar í sýnidæmi 7.8, en miðið við úrtaksstærðina 55 til að svara eftirfarandi spurningum.

  1. Finnið P(x̄ < 7).
  2. Finnið P(Σx > 170).
  3. Finnið 80. prósentumarkið fyrir meðaltal 55 skora.
  4. Finnið 85. prósentumarkið fyrir summu 55 skora.

Dæmi 7.9

Gerum ráð fyrir að markaðsrannsóknarsérfræðingur hjá farsímafyrirtæki rannsaki viðskiptavini sem fara fram úr þeim tíma sem innifalinn er í grunnsamningi þeirra. Sérfræðingurinn kemst að því að hjá þeim sem fara fram úr samningsbundnum tíma fylgir umframtíminn veldisdreifingu með meðaltalið 22 mínútur.

Skoðum slembiúrtak 80 viðskiptavina sem fara fram úr þeim tíma sem innifalinn er í grunnsamningi þeirra.

Látum X vera umframtímann sem EINN farsímaviðskiptavinur notar þegar hann fer fram úr samningsbundnum tíma sínum.

X ∼ Exp ( 1/22 ) . Úr fyrri köflum vitum við að μ = 22 og σ = 22.

Látum X ¯ = meðalumframtíma sem úrtak n = 80 viðskiptavina notar sem fara fram úr samningsbundnum tíma sínum.

X̄ ~ N(22, 22/√80) samkvæmt höfuðsetningu tölfræðinnar fyrir úrtaksmeðaltöl.

Finnið 95.

prósentumark fyrir

prósentumark fyrir

meðalumframtíma úrtaks

fyrir úrtak 80 viðskiptavina sem fara yfir grunntímamörk samnings síns. Teiknaðu línurit.

Lausn
Normaldreifingarferill. Hæsti punktur ferilsins er við 22. Punkturinn 20 er merktur vinstra megin við 22 og skyggða svæðið hægra megin við 20 sýnir P(x̄ > 20).

Látum k vera 95. prósentumarkið. Finnið k þar sem P(x̄ < k) = 0,95.

k = 26,0 með invNorm(0.95,22,22/√80) = 26,0.

Normaldreifingarferill. Hæsti punktur ferilsins er við 22. Punkturinn k er merktur hægra megin við 22, lóðrétt lína liggur frá k að ferlinum og skyggða svæðið vinstra megin við k sýnir P(x̄ < k) = 0,95.

95. prósentumarkið fyrir meðalumframtíma úrtaks er um það bil 26,0 mínútur fyrir slembiúrtak 80 viðskiptavina sem fara fram úr leyfilegum samningstíma.

95 prósent slíkra úrtaka hefðu meðaltöl undir 26 mínútum; aðeins fimm prósent slíkra úrtaka hefðu meðaltöl yfir 26 mínútum.

Prófaðu 7.9

Notaðu upplýsingarnar í sýnidæmi 7.9, en breyttu úrtaksstærðinni í 144.

  1. Finnið P(20 < x̄ < 30).
  2. Finnið P(Σx er að minnsta kosti 3000).
  3. Finnið 75. prósentumarkið fyrir meðalumframtíma úrtaks 144 viðskiptavina.
  4. Finnið 85. prósentumarkið fyrir summu umframtíma 144 viðskiptavina.

Dæmi 7.10

Bandarískir vísindamenn sem rannsaka ákveðinn sjúkdóm komust að því að nýr einstaklingur greinist á tveggja mínútna fresti, að meðaltali. Gerum ráð fyrir að staðalfrávikið sé 0,5 mínútur og að úrtaksstærðin sé 100.

  1. Finnið miðgildi, fyrsta fjórðungamark og þriðja fjórðungamark fyrir meðaltíma greiningar í úrtaki í Bandaríkjunum.
  2. Finnið miðgildi, fyrsta fjórðungamark og þriðja fjórðungamark fyrir summu greiningartíma í úrtaki í Bandaríkjunum.
  3. Finnið líkurnar á því að greining taki að meðaltali á milli 1,75 og 1,85 mínútur.
  4. Finnið gildið sem er tveimur staðalfrávikum ofan við meðaltal úrtaksins.
  5. Finnið fjórðungaspönn (IQR) fyrir summu úrtakstímanna.
Lausn
  1. Við höfum μx̄ = μ = 2 og σx̄ = σ/√n = 0,5/√100 = 0,05. Þess vegna er 50. prósentumarkið = μx̄ = μ = 2, 25. prósentumarkið = invNorm(0.25,2,0.05) = 1,97 og 75. prósentumarkið = invNorm(0.75,2,0.05) = 2,03.
  2. Við höfum μΣx = n(μx) = 100(2) = 200 og σΣx = √n(σx) = √100(0,5) = 5. Þess vegna er 50. prósentumarkið = μΣx = n(μx) = 100(2) = 200, 25. prósentumarkið = invNorm(0.25,200,5) = 196,63 og 75. prósentumarkið = invNorm(0.75,200,5) = 203,37.
  3. P(1,75 < x̄ < 1,85) = normalcdf(1.75,1.85,2,0.05) = 0,0013.
  4. Með því að nota jöfnuna fyrir z-gildi, z = (x̄ - μx̄)/σx̄, og leysa fyrir x fæst x = 2(0,05) + 2 = 2,1.
  5. Fjórðungaspönnin (IQR) er 75. prósentumarkið - 25. prósentumarkið = 203,37 - 196,63 = 6,74.

Prófaðu 7.10

Samkvæmt gögnum frá National Health Survey hafa konur á aldrinum 18 til 24 ára að meðaltali slagbilsþrýsting (í mm Hg) sem er 114,8, með staðalfrávikið 13,1. Slagbilsþrýstingur kvenna á aldrinum 18 til 24 ára fylgir normaldreifingu.

  1. Ef ein kona úr þessu þýði er valin af handahófi, finndu líkurnar á því að slagbilsþrýstingur hennar sé hærri en 120.
  2. Ef 40 konur úr þessu þýði eru valdar af handahófi, finndu líkurnar á því að meðalslagbilsþrýstingur þeirra sé hærri en 120.
  3. Ef úrtakið væri fjórar konur á aldrinum 18–24 og við þekktum ekki upprunalegu dreifinguna, væri þá hægt að nota höfuðsetningu tölfræðinnar?

Dæmi 7.11

Rannsókn var gerð á sjúkdómsástandi sem hefur áhrif á ákveðinn hóp fólks. Aldursbil fólksins var 14 til 61 ár. Meðalaldurinn var 30,9 ár og staðalfrávikið níu ár.

  1. Hverjar eru líkurnar á því, í úrtaki 25 einstaklinga, að meðalaldur fólksins sé undir 35?
  2. Er líklegt að meðalaldur úrtakshópsins sé meiri en 50 ár? Túlkið niðurstöðurnar.
  3. Hverjar eru líkurnar á því, í úrtaki 49 einstaklinga, að summa aldurs þeirra sé ekki minni en 1.600?
  4. Er líklegt að summa aldurs þessara 49 einstaklinga sé í mesta lagi 1.595? Túlkið niðurstöðurnar.
  5. Finnið 95. prósentumarkið fyrir meðalaldur úrtaks 65 einstaklinga. Túlkið niðurstöðurnar.
  6. Finnið 90. prósentumarkið fyrir summu aldurs 65 einstaklinga. Túlkið niðurstöðurnar.
Lausn
  1. P(x̄ < 35) = normalcdf(-E99,35,30.9,1.8) = 0,9886.
  2. P(x̄ > 50) = normalcdf(50,E99,30.9,1.8) ≈ 0. Fyrir þennan úrtakshóp er nánast ómögulegt að meðalaldur hópsins sé meiri en 50. Hins vegar er enn mögulegt að einstaklingur í þessum hópi sé eldri en 50.
  3. P(Σx ≥ 1.600) = normalcdf(1600,E99,1514.10,63) = 0,0864.
  4. P(Σx ≤ 1.595) = normalcdf(-E99,1595,1514.10,63) = 0,9005. Þetta þýðir að 90 prósenta líkur eru á að summa aldurs í úrtakshópnum, n = 49, sé í mesta lagi 1.595.
  5. 95. prósentumarkið = invNorm(0.95,30.9,1.1) = 32,7. Þetta gefur til kynna að 95 prósent fólks í úrtaki af stærð 65 séu að meðaltali yngri en 32,7 ára.
  6. 90. prósentumarkið = invNorm(0.90,2008.5,72.56) = 2101,5. Þetta gefur til kynna að 90 prósent fólks í úrtaki af stærð 65 hafi aldurssummu undir 2.101,5 árum.

Prófaðu 7.11

Samkvæmt gögnum frá flugvélaframleiðanda tekur Boeing 757 farþegaþotan 200 farþega og hefur dyr með meðalhæðina 72 tommur. Gerum ráð fyrir að í ákveðnu þýði karla sé meðalhæðin 69 tommur og staðalfrávikið 2,8 tommur.

  1. Hvaða hæð dyra myndi gera 95 prósentum karla kleift að ganga inn í flugvélina án þess að beygja sig?
  2. Gerum ráð fyrir að helmingur farþeganna 200 séu karlar. Hvaða meðalhæð dyra uppfyllir það skilyrði að 0,95 líkur séu á að hún sé meiri en meðalhæð 100 karla?
  3. Fyrir verkfræðinga sem hanna 757, hvor niðurstaðan á betur við: hæðin úr lið (a) eða lið (b)? Hvers vegna?

SÖGULEGUR PUNKTUR

Nálgun tvíkostadreifingar með normaldreifingu

Sögulega séð var það að geta reiknað líkur í tvíkostadreifingu ein mikilvægasta notkun höfuðsetningar tölfræðinnar. Tvíkostalíkindi fyrir lítil gildi á n, til dæmis 20, voru birt í töflum í bókum. Til að reikna líkurnar fyrir stór gildi á n þurfti að nota formúlu tvíkostadreifingarinnar, sem gat verið mjög flókið. Að nálga tvíkostadreifingu með normaldreifingu einfaldaði ferlið. Til að nota normalnálgun tvíkostadreifingar er tekið einfalt slembiúrtak úr þýði. Eftirfarandi skilyrði tvíkostadreifingar verða að vera uppfyllt:

  • Það er ákveðinn fjöldi, n, af óháðum tilraunum.
  • Útkoma hverrar tilraunar er annaðhvort jákvæð eða neikvæð.
  • Hver tilraun hefur sömu líkur á jákvæðri útkomu, p.

Rifjum upp að ef X er tvíkostadreifð slembibreyta, þá er X ~ B(n,p). Lögun tvíkostadreifingarinnar þarf að vera svipuð lögun normaldreifingarinnar. Til að tryggja það þurfa stærðirnar np og nq báðar að vera stærri en fimm (np > 5 og nq > 5); nálgunin er betri ef báðar eru að minnsta kosti 10. Viðmiðunin np > 5 og nq > 5 er almennt viðtekin hér. Fyrir það x-gildi sem við skoðum, þ.e. fjölda jákvæðra útkoma, bætum við 0,5 við ef við leitum að líkum fyrir „minna en eða jafnt og“ það gildi. Við drögum 0,5 frá ef við leitum að líkum fyrir „stærra en eða jafnt og“ það gildi. Þá má nálga tvíkostadreifinguna með normaldreifingu með meðaltali μ = np og staðalfráviki σ = √(npq). Munið að q = 1 - p. Til að fá bestu nálgunina skal nota x + 0,5 eða x - 0,5.

Þetta er önnur viðtekin regla. Fyrir það x-gildi sem við skoðum, þ.e. fjölda jákvæðra útkoma, bætum við 0,5 við ef við leitum að líkum fyrir „minna en eða jafnt og“ það gildi. Við drögum 0,5 frá ef við leitum að líkum fyrir „stærra en eða jafnt og“ það gildi. Talan 0,5 kallast leiðrétting fyrir samfellu og er notuð í eftirfarandi sýnidæmi.

Dæmi 7.12

Gerum ráð fyrir að í staðbundnu skólahverfi frá leikskóla til 12. bekkjar (K-12) séu 53 prósent íbúa hlynnt sjálfstætt starfandi skóla (e. charter school) fyrir bekki K til 5. Tekið er einfalt slembiúrtak 300 einstaklinga.

  1. Finnið líkurnar á því að að minnsta kosti 150 séu hlynntir sjálfstætt starfandi skóla.
  2. Finnið líkurnar á því að í mesta lagi 160 séu hlynntir sjálfstætt starfandi skóla.
  3. Finnið líkurnar á því að fleiri en 155 séu hlynntir sjálfstætt starfandi skóla.
  4. Finnið líkurnar á því að færri en 147 séu hlynntir sjálfstætt starfandi skóla.
  5. Finnið líkurnar á því að nákvæmlega 175 séu hlynntir sjálfstætt starfandi skóla.

Látum X vera fjölda þeirra sem eru hlynntir sjálfstætt starfandi skóla fyrir bekki K til 5. X ~ B(n,p), þar sem n = 300 og p = 0,53. Þar sem np > 5 og nq > 5 notum við normalnálgun tvíkostadreifingar. Formúlurnar fyrir meðaltal og staðalfrávik eru μ = np og σ = √(npq). Meðaltalið er 159 og staðalfrávikið er 8,6447. Slembibreyta normaldreifingarinnar er Y. Y ~ N(159, 8,6447). Sjá kaflann um normaldreifingu fyrir hjálp við notkun reiknivélar. Fyrir lið (a) tekurðu 150 með, þannig að P ( X ≥ 150) hefur normalnálgunina P ( Y ≥ 149.5) = 0.8641. normalcdf(149.5,10^99,159,8.6447) = 0,8641. Fyrir b-lið tekurðu 160 með þannig að P ( X ≤ 160) hefur normalnálgunina P ( Y ≤ 160.5) = 0.5689. normalcdf(0,160.5,159,8.6447) = 0,5689. Fyrir c-lið sleppirðu 155 þannig að P ( X > 155) hefur normalnálgunina P ( y > 155.5) = 0.6572. normalcdf(155.5,10^99,159,8.6447) = 0,6572. Fyrir d-lið sleppirðu 147 þannig að P ( X < 147) hefur normalnálgunina P ( Y < 146.5) = 0.0741. normalcdf (0,146.5,159,8.6447) = 0.0741 Fyrir e-lið hefur P ( X = 175) normalnálgunina P (174.5 < Y < 175.5) = 0.0083. normalcdf (174.5,175.5,159,8.6447) = 0.0083 Vegna reiknivéla og tölvuhugbúnaðar sem gera auðvelt að reikna tvíkostalíkindi fyrir stór gildi á n er ekki nauðsynlegt að nota normalnálgun tvíkostadreifingarinnar ef slík tæki eru tiltæk. Flestar tölvustofur skóla eru með hugbúnað sem reiknar tvíkostalíkindi. Margir nemendur hafa aðgang að reiknivélum sem reikna líkur fyrir tvíkostadreifingu. Ef slegið er inn „útreikningur tvíkostadreifingar“ í vafra má finna að minnsta kosti eina reiknivél á netinu fyrir tvíkostadreifingu. Fyrir sýnidæmi 7.10 eru líkurnar reiknaðar með eftirfarandi tvíkostadreifingu: n = 300 og p = 0,53. Berið saman svörin úr tvíkostadreifingu og normaldreifingu. Sjá kaflann um strjálar slembibreytur fyrir leiðbeiningar um reiknivélarnotkun fyrir tvíkostadreifingu. P ( X ≥ 150): 1 - binomialcdf (300,0.53,149) = 0.8641 P ( X ≤ 160): binomialcdf (300,0.53,160) = 0.5684 P ( X > 155): 1 - binomialcdf (300,0.53,155) = 0.6576 P ( X < 147): binomialcdf (300,0.53,146) = 0.0742 P(X = 175): Notið tvíkostaþéttifallið, binomialpdf. binomialpdf(300,0.53,175) = 0,0083.

Reyndu þetta 7.12

Í borg einni styðja 46 prósent íbúa sitjandi borgarstjóra, Dawn Morgan. Tekið er einfalt slembiúrtak 500. Notaðu leiðrétting fyrir samfelluu til að finna líkurnar á því að að minnsta kosti 250 styðji Dawn Morgan sem borgarstjóra.

FYRRI KAFLI

7.2 Höfuðsetning tölfræðinnar fyrir summur (valfrjálst)

NÆSTI KAFLI

7.4 Höfuðsetning tölfræðinnar (smámynt)