8.3 Þýðishlutfall
Á kosningaári sjáum við greinar í dagblöðum sem tilgreina öryggisbil í formi hlutfalla eða prósenta. Til dæmis gæti skoðanakönnun fyrir tiltekinn forsetaframbjóðanda sýnt að frambjóðandinn hafi 40 prósent atkvæða með 3 prósentustiga skekkjumörkum (ef úrtakið er nægilega stórt). Oft eru kosningakannanir reiknaðar með 95 prósenta öryggi, þannig að skoðanakannendur væru 95 prósent vissir um að raunverulegt hlutfall kjósenda sem styddu frambjóðandann væri á milli 0,37 og 0,43 (0,40 – 0,03, 0,40 + 0,03).
Fjárfestar á hlutabréfamarkaði hafa áhuga á raunverulegu hlutfalli hlutabréfa sem hækka og lækka í hverri viku. Fyrirtæki sem selja einkatölvur hafa áhuga á hlutfalli heimila í Bandaríkjunum sem eiga einkatölvur. Hægt er að reikna öryggisbil fyrir raunverulegt hlutfall hlutabréfa sem hækka eða lækka í hverri viku og fyrir raunverulegt hlutfall heimila í Bandaríkjunum sem eiga einkatölvur.
Aðferðin til að finna öryggisbilið, úrtaksstærðina, skekkjumörk fyrir þýði (EBP) og öryggisstig fyrir hlutfall er svipuð og fyrir meðaltal þýðis, en jöfnurnar eru aðrar.
Hvernig vitum við að við erum að fást við hlutfallsdæmi? Í fyrsta lagi eru gögnin sem safnað er flokkuð gögn, sem samanstanda af tveimur flokkum: jákvætt eða neikvætt svar, já eða nei. Dæmi um aðstæður þar sem verið er að reyna að meta raunverulegt þýðishlutfall eru eftirfarandi: Hvaða hlutfall þýðisins reykir? Hvaða hlutfall þýðisins mun kjósa frambjóðanda A? Hvaða hlutfall þýðisins hefur háskólamenntun?
Dreifing úrtakshlutfalla (byggt á úrtökum af stærð n) er táknuð með P′ (lesið „P-prím“).
Höfuðsetning tölfræðinnar fyrir hlutföll segir að úrtakadreifing úrtakshlutfallsins P′ sé um það bil normaldreifð með meðaltalið p og staðalfrávikið √(pq/n), þar sem p er þýðishlutfallið og q = 1 – p.
Öryggisbilið hefur formið (p′ – EBP, p′ + EBP). EBP táknar skekkjumörk hlutfallsins.
p′ = x/n
p′ = metið hlutfall jákvæðra svara (p′ er punktmat fyrir p, hið sanna þýðishlutfall).
x = fjöldi jákvæðra svara.
n = úrtaksstærðin.
Skekkjumörk fyrir hlutfall eru
EBP = (z_(α/2))√(p′q′/n), þar sem q′ = 1 – p′.
Þessi jafna er svipuð jöfnunni fyrir skekkjumörk meðaltals, nema hvað „viðeigandi staðalfrávik“ er annað. Fyrir meðaltal, þegar staðalfrávik þýðis er þekkt, er viðeigandi staðalfrávik sem notað er σ/√n. Fyrir hlutfall er viðeigandi staðalfrávik √(pq/n).
Hins vegar, í jöfnunni fyrir skekkjumörk, notum við √(p′q′/n) sem staðalfrávik í stað √(pq/n).
Í jöfnunni fyrir skekkjumörk eru úrtakshlutföllin p′ og q′ metin gildi á óþekktu þýðishlutföllunum p og q. Metnu hlutföllin p′ og q′ eru notuð vegna þess að p og q eru ekki þekkt. Úrtakshlutföllin p′ og q′ eru reiknuð út frá gögnunum: p′ er metið hlutfall jákvæðra svara og q′ er metið hlutfall neikvæðra svara.
Aðeins er hægt að nota öryggisbilið ef fjöldi jákvæðra svara np′ og fjöldi neikvæðra svara nq′ eru bæði stærri en fimm.
Það er, til að nota jöfnuna fyrir öryggisbil hlutfalla þarf að staðfesta að bæði np′ ≥ 5 og nq′ ≥ 5.
Dæmi 8.10
Gerum ráð fyrir að markaðsrannsóknarfyrirtæki sé ráðið til að meta hlutfall fullorðinna sem búa í stórri borg og eiga farsíma. Fimm hundruð fullorðnir íbúar í þessari borg eru valdir af handahófi og spurðir hvort þeir eigi farsíma. Af þeim 500 sem spurðir voru svöruðu 421 já, þeir eiga farsíma. Reiknið öryggisbil fyrir raunverulegt hlutfall fullorðinna íbúa þessarar borgar sem eiga farsíma miðað við 95 prósenta öryggisstig.
Fyrri lausnin er skref-fyrir-skref (Lausn A).
Seinni lausnin notar aðgerð í TI-83, 83+ eða 84 reiknivélum (Lausn B).
Látum X vera fjölda fólks í úrtakinu sem á farsíma. X er tvíkostadreift. X ~ B ( 500 , 421/500 ).
Til að reikna öryggisbilið þarf að finna p′, q′ og EBP.
n = 500
x = fjöldi jákvæðra svara = 421
p′ = x/n = 421/500 = 0,842
p′ = 0,842 er úrtakshlutfallið; þetta er punktmat á þýðishlutfallinu.
q′ = 1 – p′ = 1 – 0,842 = 0,158.
Þar sem CL = 0,95 er α = 1 – CL = 1 – 0,95 = 0,05 og α/2 = 0,025.
Þá er z_(α/2) = z_0,025 = 1,96.
Notið TI-83, 83+ eða 84+ reiknivél og skipunina invNorm(0,975, 0, 1) til að finna z_0,025. Munið að flatarmálið hægra megin við z_0,025 er 0,025 og flatarmálið vinstra megin við z_0,025 er 0,975. Þetta er einnig hægt að finna með viðeigandi skipunum á öðrum reiknivélum, með tölvu eða með staðlaðri normaldreifingartöflu.
EBP = (z_(α/2))√(p′q′/n) = (1,96)√((0,842)(0,158)/500) = 0,032.
p′ – EBP = 0,842 – 0,032 = 0,810
p′ + EBP = 0,842 + 0,032 = 0,874
Öryggisbilið fyrir raunverulegt tvíkostadreift þýðishlutfall er (p′ – EBP, p′ + EBP) = (0,810, 0,874).
Túlkun
Við metum með 95 prósenta öryggi að á milli 81,0 prósents og 87,4 prósenta allra fullorðinna íbúa þessarar borgar eigi farsíma.
Útskýring á 95 prósenta öryggisstigi
Níutíu og fimm prósent þeirra öryggisbila sem reiknuð eru á þennan hátt myndu innihalda hið sanna þýðishlutfall allra fullorðinna íbúa þessarar borgar sem eiga farsíma.
Notkun TI-83, 83+, 84 og 84+ reiknivél
Ýtið á STAT og færið ykkur yfir á TESTS. Færið ykkur niður á A:1-PropZInt og ýtið á ENTER. Færið ykkur niður á x og sláið inn 421. Færið ykkur niður á n og sláið inn 500. Færið ykkur niður á C-Level og sláið inn 0,95. Færið ykkur niður á Calculate og ýtið á ENTER. Öryggisbilið er (0,81003, 0,87397).
Dæmi 8.11
Fyrir bekkjarverkefni vill stjórnmálafræðinemi við stóran háskóla meta hlutfall nemenda sem eru skráðir kjósendur. Hann spyr 500 nemendur og kemst að því að 300 eru skráðir kjósendur. Reiknið 90 prósenta öryggisbil fyrir raunverulegt hlutfall nemenda sem eru skráðir kjósendur og túlkið öryggisbilið.
Fyrri lausnin er skref-fyrir-skref (Lausn A).
Seinni lausnin notar aðgerð í TI-83, 83+ eða 84 reiknivélum (Lausn B).
Lausn A
x = 300 og n = 500
p′ = x/n = 300/500 = 0,600
q′ = 1 – p′ = 1 – 0,600 = 0,400
Þar sem CL = 0,90 er α = 1 – CL = 1 – 0,90 = 0,10 og α/2 = 0,05.
z_(α/2) = z_0,05 = 1,645
Notið TI-83, 83+ eða 84+ reiknivél og skipunina invNorm(0,95, 0, 1) til að finna z_0,05. Munið að flatarmálið hægra megin við z_0,05 er 0,05 og flatarmálið vinstra megin við z_0,05 er 0,95. Þetta er einnig hægt að finna með viðeigandi skipunum á öðrum reiknivélum, með tölvu eða með staðlaðri normaldreifingartöflu.
EBP = (z_(α/2))√(p′q′/n) = (1,645)√((0,600)(0,400)/500) = 0,036.
p′ – EBP = 0,60 − 0,036 = 0,564
p′ + EBP = 0,60 + 0,036 = 0,636
Öryggisbilið fyrir raunverulegt tvíkostadreift þýðishlutfall er (p′ – EBP, p′ + EBP) = (0,564, 0,636).
Túlkun
Við metum með 90 prósenta öryggi að raunverulegt hlutfall allra nemenda sem eru skráðir kjósendur sé á milli 56,4 prósents og 63,6 prósenta.
Annað orðalag: Við áætlum með 90 prósenta öryggi að á milli 56,4 prósents og 63,6 prósenta allra nemenda séu skráðir kjósendur.
Útskýring á 90 prósenta öryggisstigi
Níutíu prósent þeirra öryggisbila sem búin eru til á þennan hátt innihalda hið sanna þýðishlutfall nemenda sem eru skráðir kjósendur.
Lausn B
Notkun TI-83, 83+, 84 og 84+ reiknivél
Ýtið á STAT og færið ykkur yfir á TESTS. Færið ykkur niður á A:1-PropZInt og ýtið á ENTER. Færið ykkur niður á x og sláið inn 300. Færið ykkur niður á n og sláið inn 500. Færið ykkur niður á C-Level og sláið inn 0,90. Færið ykkur niður á Calculate og ýtið á ENTER. Öryggisbilið er (0,564, 0,636).
Plús-fjögurra öryggisbil fyrir p
Ákveðin skekkja kemur fram við útreikning á öryggisbili fyrir hlutfall. Þar sem við þekkjum ekki hið sanna hlutfall þýðisins neyðumst við til að nota punktmöt til að reikna viðeigandi staðalfrávik úrtakadreifingarinnar. Rannsóknir hafa sýnt að slíkt mat á staðalfráviki getur verið gallað.
Sem betur fer er til einföld leiðrétting sem gerir okkur kleift að búa til nákvæmari öryggisbil: Við látum einfaldlega eins og við höfum fjórar viðbótarathuganir. Tvær þessara athugana eru jákvæðar útkomur og tvær eru neikvæðar útkomur. Nýja úrtaksstærðin er þá n + 4 og nýr fjöldi jákvæðra útkoma er x + 2.
Tölvurannsóknir hafa sýnt fram á ágæti plús-fjögurra aðferðarinnar við gerð öryggisbila fyrir p. Hana ætti að nota þegar óskað öryggisstig er að minnsta kosti 90 prósent og úrtaksstærðin er að minnsta kosti tíu.
Dæmi 8.12
Slembiúrtak 25 tölfræðinema var spurt: „Hefur þú notað vöru í síðustu viku?“ Sex nemendur sögðust hafa notað vöruna innan síðustu viku. Notið plús-fjögurra aðferðina til að finna 95 prósenta öryggisbil fyrir hið sanna hlutfall tölfræðinema sem nota vöruna vikulega.
Lausn A
Sex nemendur af 25 sögðust hafa notað vöru innan síðustu viku, þannig að x = 6 og n = 25. Þar sem við notum plús-fjögurra aðferðina munum við nota x = 6 + 2 = 8, og n = 25 + 4 = 29.
p′ = x/n = 8/29 ≈ 0,276
q′ = 1 – p′ = 1 – 0,276 = 0,724
Þar sem CL = 0,95 er α = 1 – CL = 1 – 0,95 = 0,05 og α/2 = 0,025.
z_0,025 = 1,96
EBP = (z_(α/2))√(p′q′/n) = (1,96)√((0,276)(0,724)/29) ≈ 0,163.
p′ – EBP = 0,276 – 0,163 = 0,113 og p′ + EBP = 0,276 + 0,163 = 0,439.
Við metum með 95 prósenta öryggi að hið sanna hlutfall allra tölfræðinema sem nota vöruna vikulega sé á milli 11,3 prósenta og 43,9 prósenta.
Notkun TI-83, 83+, 84 og 84+ reiknivél
Ýtið á STAT og færið ykkur yfir á TESTS. Færið ykkur niður á A:1-PropZInt og ýtið á ENTER.
Færið ykkur niður á x og sláið inn 8. Færið ykkur niður á n og sláið inn 29. Færið ykkur niður á C-Level og sláið inn 0,95. Færið ykkur niður á Calculate og ýtið á ENTER. Öryggisbilið er (0,113, 0,439).
Áminning
Munið að plús-fjögurra aðferðin gerir ráð fyrir fjórum viðbótarathugunum: tveimur jákvæðum og tveimur neikvæðum útkomum. Ekki þarf að breyta ferlinu við útreikning á öryggisbilinu; uppfærið einfaldlega gildi x og n til að endurspegla þessar viðbótarathuganir.
Dæmi 8.13
Hópur rannsakenda gerði nýlega rannsókn þar sem greindar voru netvenjur unglinga varðandi persónuvernd. Í hópi 50 unglinga sögðust 13 eiga meira en 500 vini á samfélagsmiðli. Notið plús-fjögurra aðferðina til að finna 90 prósenta öryggisbil fyrir hið sanna hlutfall unglinga sem myndu segjast eiga meira en 500 vini á netinu.
Með plús-fjögurra aðferðinni fáum við x = 13 + 2 = 15 og n = 50 + 4 = 54.
p′ = 15/54 ≈ 0,278
q′ = 1 – p′ = 1 – 0,278 = 0,722
Þar sem CL = 0,90 er α = 1 – CL = 1 – 0,90 = 0,10 og α/2 = 0,05.
z_0,05 = 1,645
EBP = (z_(α/2))√(p′q′/n) = (1,645)√((0,278)(0,722)/54) ≈ 0,100.
p′ – EBP = 0,278 – 0,100 = 0,178 og p′ + EBP = 0,278 + 0,100 = 0,378.
Við metum með 90 prósenta öryggi að á milli 17,8 prósenta og 37,8 prósenta allra unglinga myndu segjast eiga meira en 500 vini á samfélagsmiðli.
Notkun TI-83, 83+, 84 og 84+ reiknivél
Ýtið á STAT og færið ykkur yfir á TESTS. Færið ykkur niður á A:1-PropZInt og ýtið á ENTER. Færið ykkur niður á x og sláið inn 15. Færið ykkur niður á n og sláið inn 54. Færið ykkur niður á C-Level og sláið inn 0,90. Færið ykkur niður á Calculate og ýtið á ENTER. Öryggisbilið er (0,178, 0,378).
Útreikningur á úrtaksstærð n
Ef rannsakendur óska eftir ákveðnum skekkjumörkum geta þeir notað formúluna fyrir skekkjumörk til að reikna út nauðsynlega úrtaksstærð.
Formúlan fyrir skekkjumörk þýðishlutfalls er
EBP = z_(α/2)√(p′q′/n), þar sem p′ er úrtakshlutfallið, q′ = 1 – p′ og n er úrtaksstærðin.
Með því að einangra n fæst jafna fyrir úrtaksstærðina.
n = (z_(α/2))²(p′q′)/EBP². Þessi formúla segir okkur að við getum reiknað þá úrtaksstærð n sem þarf fyrir öryggisstig CL = 1 − α með því að hefja gagnrýnigildið z_(α/2) í annað veldi, margfalda með punktmatinu p′ og q′ = 1 – p′ og deila að lokum með skekkjumörkunum í öðru veldi. Munið alltaf að námunda gildi n upp.
Dæmi 8.14
Gerum ráð fyrir að farsímafyrirtæki vilji ákvarða núverandi hlutfall viðskiptavina 50 ára og eldri sem nota smáskilaboð í farsímum sínum. Hversu marga viðskiptavini 50 ára og eldri þarf fyrirtækið að spyrja til að vera með 90 prósenta öryggi um að metið úrtakshlutfall sé innan þriggja prósentustiga frá hinu sanna þýðishlutfalli viðskiptavina 50 ára og eldri sem nota smáskilaboð í farsímum sínum? Gerum ráð fyrir að p′ = 0,5.
Út frá dæminu vitum við að EBP = 0,03 (3 prósent = 0,03) og z_(α/2) = z_0,05 = 1,645, því öryggisstigið er 90 prósent.
Til að reikna úrtaksstærðina n skal nota formúluna og setja inn gildi.
n = z²p′q′/EBP² = (1,645)²(0,5)(0,5)/(0,03)² = 751,7
Námundið svarið upp í næstu heiltölu. Úrtaksstærðin ætti að vera 752 farsímaviðskiptavinir, 50 ára og eldri, til að hægt sé að vera með 90 prósenta öryggi um að metið úrtakshlutfall sé innan þriggja prósentustiga frá hinu sanna þýðishlutfalli allra slíkra viðskiptavina sem nota smáskilaboð í farsímum sínum.