2.3 Measures of the Location of the Data
Algengustu staðsetningarmælikvarðarnir eru fjórðungamörk og prósentumörk.
Fjórðungamörk eru sérstök prósentumörk. Fyrsta fjórðungamarkið, Q₁, er það sama og 25. prósentumarkið og þriðja fjórðungamarkið, Q₃, er það sama og 75. prósentumarkið. Miðgildið, M, er bæði kallað annað fjórðungamarkið og 50. prósentumarkið.
Til að reikna fjórðungamörk og prósentumörk verður að raða gögnunum frá minnsta gildi til stærsta gildis. Fjórðungamörk skipta röðuðum gögnum í fjórðunga. Prósentumörk skipta röðuðum gögnum í hundraðshluta. Mundu að prósent merkir einn hundraðasta. Þess vegna merkja prósentumörk að gögnunum sé skipt í 100 hluta. Að vera við 90. prósentumarkið á prófi þýðir ekki endilega að þú hafir fengið 90 prósent á prófinu. Það þýðir að 90 prósent prófeinkunna eru jafnháar eða lægri en einkunnin þín og að 10 prósent prófeinkunna eru jafnháar eða hærri en einkunnin þín.
Prósentumörk eru gagnleg til að bera saman gildi. Af þeirri ástæðu nota háskólar prósentumörk mikið. Eitt dæmi er þegar SAT-niðurstöður eru notaðar til að ákvarða lágmarkseinkunn sem gildir sem inntökuskilyrði. Gerum til dæmis ráð fyrir að Duke-háskóli taki við SAT-einkunnum við eða yfir 75. prósentumarkinu. Það jafngildir einkunn sem er að minnsta kosti 1220.
Hundraðshlutamörk eru aðallega notuð með mjög stórum þýðum. Þess vegna, ef þú myndir segja að 90 prósent prófeinkunna væru lægri, og ekki jafnháar eða lægri, en þín einkunn, væri það ásættanlegt vegna þess að það hefur ekki veruleg áhrif að fjarlægja eitt tiltekið gagnagildi.
Miðgildið er tala sem mælir miðju gagnanna. Líta má á miðgildið sem miðjugildi, en það þarf ekki sjálft að vera eitt af mældu gildunum. Það skiptir röðuðum gögnum í tvo helminga. Helmingur gildanna er jafnhár eða lægri en miðgildið og helmingur gildanna er jafnhár eða hærri. Skoðum til dæmis eftirfarandi gögn: 1, 11,5, 6, 7,2, 4, 8, 9, 10, 6,8, 8,3, 2, 2, 10, 1. Röðuð frá minnsta til stærsta: 1, 1, 2, 2, 4, 6, 6,8, 7,2, 8, 8,3, 9, 10, 10, 11,5.
Þegar gagnasafn hefur sléttan fjölda gilda er miðgildið jafnt meðaltali tveggja miðjugildanna þegar gögnunum er raðað í vaxandi röð (frá því minnsta til þess stærsta). Þegar gagnasafn hefur oddatölu fjölda gilda er miðgildið jafnt miðjugildinu þegar gögnunum er raðað í vaxandi röð.
Þar sem athuganirnar eru 14, jafn fjöldi gilda, er miðgildið á milli sjöunda gildisins, 6,8, og áttunda gildisins, 7,2. Til að finna miðgildið leggjum við gildin tvö saman og deilum með tveimur.
Miðgildið er sjö. Helmingur gildanna er minni en sjö og helmingur gildanna er stærri en sjö.
Fjórðungamörk eru tölur sem skipta gögnunum í fjórðunga. Þau geta verið hluti af gögnunum eða ekki. Til að finna fjórðungamörkin finnum við fyrst miðgildið, eða annað fjórðungamarkið. Fyrsta fjórðungamarkið, Q₁, er miðjugildi neðri helmings gagnanna og þriðja fjórðungamarkið, Q₃, er miðjugildi, eða miðgildi, efri helmings gagnanna. Til að sjá hugmyndina skulum við skoða sama gagnasafn: 1, 1, 2, 2, 4, 6, 6,8, 7,2, 8, 8,3, 9, 10, 10, 11,5.
Gagnasafnið hefur jafnan fjölda gilda, 14 gildi, þannig að miðgildið er meðaltal tveggja miðjugildanna, 6,8 og 7,2, eða (6,8 + 7,2)/2 = 7.
Þannig er miðgildið, eða annað fjórðungamarkið (Q₂), 7.
Fyrsta fjórðungamarkið er miðgildi neðri helmings gagnanna. Ef við skiptum gögnunum í sjö gildi í neðri helmingnum og sjö gildi í efri helmingnum sjáum við að neðri helmingurinn hefur oddafjölda gilda. Þess vegna er miðgildi neðri helmingsins, eða fyrsta fjórðungamarkið (Q₁), miðjugildið 2. Með sömu aðferð sjáum við að miðgildi efri helmingsins, eða þriðja fjórðungamarkið (Q₃), er miðjugildi efri helmingsins, 9.
Fjórðungamörkin eru sýnd hér að neðan:

Fjórðungaspönn er tala sem sýnir dreifingu miðhelmingsins, eða miðju 50 prósenta gagnanna. Hún er mismunurinn á þriðja fjórðungamarkinu (Q₃) og fyrsta fjórðungamarkinu (Q₁).
IQR = Q₃ - Q₁. Fjórðungaspönn (IQR) fyrir þetta gagnasafn er 9 - 2 = 7.
Fjórðungaspönn (IQR) getur hjálpað til við að ákvarða möguleg fráviksgildi. Gildi telst mögulegt fráviksgildi ef það er meira en 1,5 x IQR fyrir neðan fyrsta fjórðungamarkið eða meira en 1,5 x IQR fyrir ofan þriðja fjórðungamarkið. Möguleg fráviksgildi þarf alltaf að skoða nánar.
Dæmi 2.15
Fyrir eftirfarandi 13 fasteignaverð, reiknaðu fjórðungaspönn (IQR) og ákvarðaðu hvort einhver verð séu möguleg fráviksgildi. Verð eru í dollurum. 389.950; 230.500; 158.000; 479.000; 639.000; 114.950; 5.500.000; 387.000; 659.000; 529.000; 575.000; 488.800; 1.095.000
Lausn
Raðaðu eftirfarandi gögnum frá því minnsta til þess stærsta: 114.950; 158.000; 230.500; 387.000; 389.950; 479.000; 488.800; 529.000; 575.000; 639.000; 659.000; 1.095.000; 5.500.000
Q₁ = (230.500 + 387.000)/2 = 308.750
Q₃ = (639.000 + 659.000)/2 = 649.000
IQR = 649.000 – 308.750 = 340.250
(1,5)( IQR ) = (1,5)(340.250) = 510.375
Q₁ – (1,5)( IQR ) = 308.750 – 510.375 = –201.625
Q₃ + (1,5)( IQR ) = 649.000 + 510.375 = 1.159.375
Ekkert húsverð er lægra en –201.625. Hins vegar er 5.500.000 meira en 1.159.375. Þess vegna er 5.500.000 mögulegt fráviksgildi.
Í sýnidæminu hér að ofan sástu útreikning á miðgildi, fyrsta fjórðungi og þriðja fjórðungi. Þessi þrjú gildi eru hluti af fimm talna samantektinni. Hin tvö gildin eru lágmarksgildi (eða lágm.) og hámarksgildi (eða hám.). Fimm talna samantektin er notuð til að búa til kassarit.
Dæmi 2.16
Fimmtíu nemendur í tölfræði voru spurðir hversu mikið þeir svæfu á skólanóttum (námundað að næstu klukkustund). Niðurstöðurnar voru eftirfarandi:
| Svefntími á skólanótt (klukkustundir) | Tíðni | Hlutfallstíðni | Uppsöfnuð hlutfallstíðni |
|---|---|---|---|
| 4 | 2 | 0,04 | 0,04 |
| 5 | 5 | 0,10 | 0,14 |
| 6 | 7 | 0,14 | 0,28 |
| 7 | 12 | 0,24 | 0,52 |
| 8 | 14 | 0,28 | 0,80 |
| 9 | 7 | 0,14 | 0,94 |
| 10 | 3 | 0,06 | 1,00 |
Finndu 28. prósentumarkið. Taktu eftir 0,28 í dálkinum fyrir uppsafnaða hlutfallstíðni. Tuttugu og átta prósent af 50 gagnagildum eru 14 gildi. Það eru 14 gildi undir 28. prósentumarkinu: tvær fjórur, fimm fimmur og sjö sexur. 28. prósentumarkið er á milli síðustu sexunnar og fyrstu sjöunnar. Það er 6,5.
Finndu miðgildið. Skoðaðu aftur dálkinn fyrir uppsafnaða hlutfallstíðni og finndu 0,52. Miðgildið er 50. prósentumarkið, eða annað fjórðungamarkið. Fimmtíu prósent af 50 eru 25. Það eru 25 gildi undir miðgildinu: tvær fjórur, fimm fimmur, sjö sexur og 11 af sjöunum. Miðgildið, eða 50. prósentumarkið, er á milli 25. gildisins, sem er sjö, og 26. gildisins, sem er einnig sjö. Miðgildið er sjö.
Finndu þriðja fjórðungamarkið. Þriðja fjórðungamarkið er það sama og 75. prósentumarkið. Þetta má meta með auganu. Í dálkinum fyrir uppsafnaða hlutfallstíðni sjást 0,52 og 0,80. Þegar allar fjórurnar, fimmurnar, sexurnar og sjöurnar eru taldar með eru 52 prósent gagnanna komin með. Þegar allar átturnar eru taldar með eru 80 prósent gagnanna komin með. Þess vegna hlýtur 75. prósentumarkið að vera átta. Önnur leið er að finna 75 prósent af 50, sem er 37,5, og námunda upp í 38. Þriðja fjórðungamarkið, Q₃, er 38. gildið, sem er átta. Þetta má staðfesta með því að telja gildin: 37 gildi eru undir þriðja fjórðungamarkinu og 12 gildi yfir því.
Dæmi 2.17
Notaðu töflu 2.24:
- Finndu 80. prósentumarkið.
- Finndu 90. prósentumarkið.
- Finndu fyrsta fjórðungamarkið. Hvað heitir það líka?
Lausn
Með því að nota gögnin úr tíðnitöflunni fáum við eftirfarandi:
- 80. prósentumarkið er á milli síðustu áttunnar og fyrstu níunnar í töflunni, það er á milli 40. og 41. gildisins. Þess vegna tökum við meðaltal 40. og 41. gildisins: (8 + 9)/2 = 8,5.
- 90. prósentumarkið er 45. gagnagildið, því staðsetningin er 0,90(50) = 45. Gagnagildið í 45. sæti er níu.
- Q₁ er einnig 25. prósentumarkið. Staðsetning 25. prósentumarksins er P₂₅ = 0,25(50) = 12,5, sem námundast upp í 13. Þrettánda gagnagildið er sex, þannig að 25. prósentumarkið er sex.
Ef þú kynnir þér málið nánar finnurðu nokkrar jöfnur til að reikna k-ta prósentumarkið. Hér er ein þeirra.
k = k-ta prósentumarkið. Það getur verið hluti af gögnunum eða ekki.
i = staðsetning gagnagildisins í röðuðu gagnasafninu
n = heildarfjöldi gagnagilda
- Raðaðu gögnunum frá því minnsta til þess stærsta.
- Reiknaðu i = k/100 ( n + 1 ) .
- Ef i er heiltala, þá er k-ta prósentumarkið gagnagildið í i-ta sæti í röðuðu gagnasafni.
- Ef i er ekki heiltala skal slétta i upp og niður að næstu heiltölum. Taktu meðaltal gagnagildanna tveggja í þessum tveimur sætum í raðaða gagnasafninu. Auðveldara er að skilja jöfnuna og útreikninginn með dæmi.
Dæmi 2.18
Hér eru taldir upp aldur 29 leikara sem unnið hafa Óskarsverðlaun sem bestu leikarar í aðalhlutverki, í röð frá þeim yngsta til þess elsta: 18, 21, 22, 25, 26, 27, 29, 30, 31, 33, 36, 37, 41, 42, 47, 52, 55, 57, 58, 62, 64, 67, 69, 71, 72, 73, 74, 76, 77
- Finndu 70. prósentumarkið.
- Finndu 83. prósentumarkið.
Lausn
- k = 70, n = 29 og i = (k/100)(n + 1) = (70/100)(29 + 1) = 21. Jafnan segir að staðsetning gagnagildisins sé 21. Því teljum við að 21. sætinu, þar sem gagnagildið er 64.
- k = 83, n = 29 og i = (k/100)(n + 1) = (83/100)(29 + 1) = 24,9, sem er ekki heiltala. Námundum niður í 24 og upp í 25. Aldurinn í 24. sæti er 71 og aldurinn í 25. sæti er 72. Meðaltal 71 og 72 er 71,5. Því er 83. prósentumarkið 71,5 ár.
- Raðaðu gögnunum frá því minnsta til þess stærsta.
- x = fjöldi gagnagilda frá neðsta hluta listans upp að, en ekki með, gagnagildinu sem á að finna prósentumark fyrir.
- y = fjöldi gagnagilda sem eru jöfn gagnagildinu sem á að finna prósentumark fyrir.
- n = heildarfjöldi gagna.
- Reiknaðu ((x + 0,5y)/n)(100). Námundaðu síðan að næstu heiltölu.
Dæmi 2.19
Hér eru taldir upp aldur 29 leikara sem unnið hafa Óskarsverðlaun sem bestu leikarar í aðalhlutverki, í röð frá þeim yngsta til þess elsta: 18, 21, 22, 25, 26, 27, 29, 30, 31, 33, 36, 37, 41, 42, 47, 52, 55, 57, 58, 62, 64, 67, 69, 71, 72, 73, 74, 76, 77
- Finnið prósentumarkið fyrir 58.
- Finnið prósentumarkið fyrir 25.
Lausn
- Ef talið er frá neðsta hluta listans eru 18 gagnagildi minni en 58. Eitt gildi er 58. x = 18 og y = 1, þannig að ((x + 0,5y)/n)(100) = ((18 + 0,5(1))/29)(100) = 63,80. Gildið 58 er því við 64. prósentumarkið.
- Ef talið er frá neðsta hluta listans eru þrjú gagnagildi minni en 25. Eitt gildi er 25. x = 3 og y = 1, þannig að ((x + 0,5y)/n)(100) = ((3 + 0,5(1))/29)(100) = 12,07. Gildið 25 er því við 12. prósentumarkið.
Prósentumark gefur til kynna afstæða stöðu gagnagildis þegar gögnum er raðað í talnaröð frá minnsta gildi til stærsta gildis. Tiltekið hlutfall gagnagilda er lægra en eða jafnt p-ta prósentumarkinu. Til dæmis eru 15 prósent gagnagilda lægri en eða jöfn 15. prósentumarkinu.
- Lág prósentumörk samsvara alltaf lægri gagnagildum.
- Há prósentumörk samsvara alltaf hærri gagnagildum.
Hundraðshlutamark getur svarað til gildismats um hvort það sé gott eða slæmt, en þarf ekki að gera það. Túlkun á því hvort ákveðið prósentumark sé gott eða slæmt fer eftir samhengi aðstæðna sem gögnin eiga við um. Í sumum aðstæðum þætti lágt prósentumark gott; í öðru samhengi gæti hátt prósentumark þótt gott. Í mörgum aðstæðum á ekkert gildismat við. Hátt prósentumark á samræmdu prófi þykir gott, en lægra prósentumark á líkamsþyngdarstuðli gæti þótt gott. Hundraðshlutamark sem tengist hæð manneskju ber ekki með sér neitt gildismat.
Að skilja hvernig á að túlka prósentumörk rétt er mikilvægt, ekki aðeins þegar gögnum er lýst, heldur einnig þegar líkur eru reiknaðar í síðari köflum þessarar bókar.
Dæmi 2.20
Á tímasettu stærðfræðiprófi var fyrsti fjórðungur tímans sem það tók að ljúka prófinu 35 mínútur. Túlkaðu fyrsta fjórðung í samhengi við þessar aðstæður.
Lausn
Tuttugu og fimm prósent nemenda luku prófinu á 35 mínútum eða skemmri tíma. Sjötíu og fimm prósent nemenda luku prófinu á 35 mínútum eða lengri tíma. Lágt prósentumark gæti talist gott, þar sem æskilegt er að ljúka tímasettu prófi fljótt. Ef prófið tekur of langan tíma gæti nemandi ekki náð að ljúka því.
Dæmi 2.21
Á stærðfræðiprófi með 20 spurningum var 70. prósentumarkið fyrir fjölda réttra svara 16. Túlkaðu 70. prósentumarkið í samhengi við þessar aðstæður.
Lausn
Sjötíu prósent nemenda svöruðu 16 eða færri spurningum rétt. Þrjátíu prósent nemenda svöruðu 16 eða fleiri spurningum rétt. Hærra prósentumark gæti talist gott, þar sem æskilegt er að svara fleiri spurningum rétt.
Dæmi 2.22
Í framhaldsskóla kom í ljós að 30. prósentumarkið fyrir fjölda klukkustunda sem nemendur verja í nám á viku er sjö klukkustundir. Túlkaðu 30. prósentumarkið í samhengi við þessar aðstæður.
Lausn
Þrjátíu prósent nemenda læra í sjö klukkustundir eða skemur á viku. Sjötíu prósent nemenda læra í sjö klukkustundir eða lengur á viku. Í þessu dæmi er ekki endilega hægt að leggja jákvætt eða neikvætt gildismat á hærra eða lægra prósentumark, þar sem sá tími sem nemandi ver í nám á viku fer eftir þörfum hans eða hennar.
Dæmi 2.23
Grunnskóli sækir um styrk sem verður notaður til að bæta við líkamsræktartækjum í íþróttasalinn. Skólastjórinn lagði könnun fyrir 15 nafnlausa nemendur til að ákvarða hversu mörgum mínútum á dag nemendurnir verja í hreyfingu. Niðurstöðurnar frá þessum 15 nafnlausu nemendum eru sýndar hér að neðan:
0 mínútur, 40 mínútur, 60 mínútur, 30 mínútur, 60 mínútur,
10 mínútur, 45 mínútur, 30 mínútur, 300 mínútur, 90 mínútur,
30 mínútur, 120 mínútur, 60 mínútur, 0 mínútur, 20 mínútur
Finndu gildin fimm sem mynda fimm talna samantektina.
Lágmark = 0
Q₁ = 20
Miðgildi = 40
Q₃ = 60
Hámark = 300
Ef gögnunum er raðað í vaxandi röð fæst eftirfarandi:

Lágmarksgildið er 0.
Hámarksgildið er 300.
Þar sem fjöldi gagnagilda er oddatala er miðgildið miðjugildi þessa gagnasafns þegar því er raðað í vaxandi röð, eða 40.
Fyrsti fjórðungur er miðgildi neðri helmings gagnanna og inniheldur ekki miðgildið. Neðri helmingurinn hefur sjö gagnagildi; miðgildi neðri helmingsins verður jafnt miðjugildi neðri helmingsins, eða 20.
Þriðji fjórðungur er miðgildi efri helmings gagnanna og inniheldur ekki miðgildið. Efri helmingurinn hefur einnig sjö gagnagildi; því verður miðgildi efri helmingsins jafnt miðjugildi efri helmingsins, eða 60.
Ef þú værir skólastjórinn, væri réttlætanlegt fyrir þig að kaupa ný líkamsræktartæki? Þar sem 75 prósent nemenda hreyfa sig í 60 mínútur eða minna daglega, og þar sem fjórðungaspönnin (IQR) er 40 mínútur (60 – 20 = 40), vitum við að helmingur nemendanna sem tóku þátt í könnuninni hreyfir sig á milli 20 og 60 mínútur daglega. Þetta virðist vera hæfilegur tími sem varið er í hreyfingu, þannig að það væri réttlætanlegt fyrir skólastjórann að kaupa nýju tækin.
Hins vegar þarf skólastjórinn að fara varlega. Gildið 300 virðist vera mögulegt fráviksgildi.
Q₃ + 1,5(IQR) = 60 + (1,5)(40) = 120.
Gildið 300 er stærra en 120 og er því mögulegt fráviksgildi. Ef við fjarlægjum það og reiknum gildin fimm fæst eftirfarandi:
Enn eru 75 prósent nemenda sem hreyfa sig í 60 mínútur eða minna daglega og helmingur nemenda hreyfir sig á milli 20 og 60 mínútur á dag. Hins vegar er úrtak 15 nemenda lítið og skólastjórinn ætti að leggja könnunina fyrir fleiri nemendur til að geta verið viss um niðurstöðurnar.