2.2 Histograms, Frequency Polygons, and Time Series Graphs
Í stærstum hluta þeirrar vinnu sem þú munt inna af hendi í þessari bók muntu nota stuðlarit til að birta gögnin. Einn kostur við stuðlarit er að það getur auðveldlega sýnt stór gagnasöfn.
Stuðlarit samanstendur af samliggjandi (tengdum) kössum. Það hefur bæði láréttan ás og lóðréttan ás. Lárétti ásinn er meira eða minna talnalína, merkt með því sem gögnin tákna, til dæmis fjarlægð frá heimili þínu í skólann. Lóðrétti ásinn er merktur annaðhvort tíðni eða hlutfallstíðni (eða prósentutíðni eða líkindum). Ritið mun hafa sömu lögun með hvorri merkingunni sem er. Stuðlaritið (líkt og stofn- og laufritið) getur gefið þér lögun gagnanna, miðju og dreifingu gagnanna. Lögun gagnanna vísar til lögunar dreifingarinnar, hvort hún sé normaldreifð eða um það bil normaldreifð eða skekkt í einhverja átt, en miðjan er talin vera miðja gagnasafnsins og dreifingin gefur til kynna hversu langt gildin dreifast umhverfis miðjuna. Í skekktri dreifingu dregst meðaltalið í átt að hala dreifingarinnar.
Hlutfallstíðnin er jöfn tíðni mælds gildis gagnanna deilt með heildarfjölda gagnagilda í úrtakinu. Mundu að tíðni er skilgreind sem sá fjöldi skipta sem svar kemur fyrir. Ef f er tíðni mælds gildis og n er heildarfjöldi gagnagilda,
- f = tíðni,
- n = heildarfjöldi gagnagilda (eða summa einstakra tíðna), og
- RF = hlutfallstíðni,
þá er
Til dæmis, ef þrír nemendur í 40 nemenda enskutíma herra Ahabs fengu 90 til 100 prósent, þá er f = 3, n = 40 og RF = f/n = 3/40 = 0,075. Þannig fengu 7,5 prósent nemendanna 90 til 100 prósent. Bilið 90 til 100 prósent er megindleg mæling.
Til að búa til stuðlarit þarf fyrst að ákveða hversu margar súlur eða bil, einnig kölluð flokkar, eiga að tákna gögnin. Mörg stuðlarit samanstanda af fimm til 15 súlum eða flokkum til skýrleika. Breidd hverrar súlu er einnig kölluð flokksbreidd, sem hægt er að reikna með því að deila spönn gagnagildanna með æskilegum fjölda flokka (eða súlna). Það er engin föst aðferð til að ákvarða fjölda súlna eða stærð súlu-/flokksbreidd; hins vegar er samræmi lykilatriði þegar ákvarðað er hvaða gagnagildi eiga að fara í hvert bil.
Dæmi 2.9
Eftirfarandi gögn sýna hæð (í tommum, námundað að næsta hálfa tommu) 100 karlkyns hálfatvinnuknattspyrnumanna. Hæðirnar eru samfelld gögn þar sem hæð er mæld stærð. 60, 60,5, 61, 61, 61,5, 63,5, 63,5, 63,5, 64, 64, 64, 64, 64, 64, 64, 64,5, 64,5, 64,5, 64,5, 64,5, 64,5, 64,5, 64,5, 66, 66, 66, 66, 66, 66, 66, 66, 66, 66, 66,5, 66,5, 66,5, 66,5, 66,5, 66,5, 66,5, 66,5, 66,5, 66,5, 66,5, 67, 67, 67, 67, 67, 67, 67, 67, 67, 67, 67, 67, 67,5, 67,5, 67,5, 67,5, 67,5, 67,5, 67,5, 68, 68, 69, 69, 69, 69, 69, 69, 69, 69, 69, 69, 69,5, 69,5, 69,5, 69,5, 69,5, 70, 70, 70, 70, 70, 70, 70,5, 70,5, 70,5, 71, 71, 71, 72, 72, 72, 72,5, 72,5, 73, 73,5, 74
Minnsta gagnagildið er 60 og stærsta gagnagildið er 74. Til að tryggja að hvort tveggja sé innifalið í bili getum við notað 59,95 sem minnsta gildi og 74,05 sem stærsta gildi, með því að draga 0,05 frá og bæta 0,05 við þessi gildi, í sömu röð. Við höfum litla spönn hér, eða 14,1 (74,05 – 59,95), þannig að við viljum færri flokka; segjum átta. Þannig að 14,1 deilt með átta flokkum gefur flokksbreidd (eða stærð bils) sem er um það bil 1,76.
ATHUGIÐ
Við munum námunda upp í tvo og gera hverja súlu eða flokksbil tveggja eininga breitt. Að námunda upp í tvo er leið til að koma í veg fyrir að gildi lendi á mörkum. Að námunda að næstu tölu er oft nauðsynlegt jafnvel þótt það gangi gegn hefðbundnum reglum um námundun. Fyrir þetta dæmi myndi einnig virka að nota 1,76 sem breidd. Viðmiðunarregla sem sumir fylgja fyrir breidd súlu eða flokksbils er að taka kvaðratrótina af fjölda gagnagilda og námunda síðan að næstu heilu tölu, ef þörf krefur. Til dæmis, ef það eru 150 gagnagildi, taktu þá kvaðratrótina af 150 og námundaðu í 12 súlur eða bil.
Mörkin eru eftirfarandi:
Hæðirnar 60 til 61,5 tommur eru á bilinu 59,95–61,95. Hæðirnar sem eru 63,5 eru á bilinu 61,95–63,95. Hæðirnar sem eru 64 til 64,5 eru á bilinu 63,95–65,95. Hæðirnar 66 til 67,5 eru á bilinu 65,95–67,95. Hæðirnar 68 til 69,5 eru á bilinu 67,95–69,95. Hæðirnar 70 til 71 eru á bilinu 69,95–71,95. Hæðirnar 72 til 73,5 eru á bilinu 71,95–73,95. Hæðin 74 er á bilinu 73,95–75,95.
Eftirfarandi stuðlarit sýnir hæðirnar á x-ásnum og hlutfallstíðni á y-ásnum.

| Bil | ||
|---|---|---|
| Tíðni | ||
| Hlutfallstíðni | ||
| 59,95–61,95 | 5 | 5/100 = 0,05 |
| 61,95–63,95 | 3 | 3/100 = 0,03 |
| 63,95–65,95 | 15 | 15/100 = 0,15 |
| 65,95–67,95 | 40 | 40/100 = 0,40 |
| 67,95–69,95 | 17 | 17/100 = 0,17 |
| 69,95–71,95 | 12 | 12/100 = 0,12 |
| 71,95–73,95 | 7 | 7/100 = 0,07 |
| 73,95–75,95 | 1 | 1/100 = 0,01 |
Dæmi 2.10
Eftirfarandi gögn sýna fjölda bóka sem 50 hlutastarfandi háskólanemar við ABC-háskóla keyptu. Fjöldi bóka er strjált gagnasafn þar sem bækur eru taldar. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6
Ellefu nemendur kaupa eina bók. Tíu nemendur kaupa tvær bækur. Sextán nemendur kaupa þrjár bækur. Sex nemendur kaupa fjórar bækur. Fimm nemendur kaupa fimm bækur. Tveir nemendur kaupa sex bækur.
Reiknaðu breidd hverrar súlu, flokksbreidd eða bilsbreidd.
Taktu eftir að við getum valið mismunandi hentugar tölur til að bæta við hæsta gildið og draga frá lægsta gildinu þegar flokksbreidd er reiknuð. Í fyrra sýnidæminu bættum við 0,05 við og drógum 0,05 frá, en að þessu sinni bættum við 0,5 við og drógum 0,5 frá. Þegar þú færð gagnasafn geturðu ákvarðað hvað er viðeigandi og skynsamlegt.
Eftirfarandi stuðlarit sýnir fjölda bóka á x-ásnum og tíðnina á y-ásnum.

Lausn
Minnsta gildi gagnanna er 1 og stærsta gildið er 6. Til að tryggja að bæði gildin lendi innan bils getum við notað 0,5 sem minnsta gildi og 6,5 sem stærsta gildi með því að draga 0,5 frá og bæta því við þessi gildi. Hér er spönnin lítil, eða 6 (6,5 - 0,5), þannig að við viljum færri flokka; segjum sex að þessu sinni. Sex deilt með sex flokkum gefur því flokksbreidd (eða bilsbreidd) sem er einn.
Dæmi 2.11
Búðu til stuðlarit með því að nota þetta gagnasafn.
| Fjöldi klukkustunda sem bekkjarsystkin mín eyddu í tölvuleiki um helgar | ||||
| 9,95 | 10 | 2,25 | 16,75 | 0 |
| 19,5 | 22,5 | 7,5 | 15 | 12,75 |
| 5,5 | 11 | 10 | 20,75 | 17,5 |
| 23 | 21,9 | 24 | 23,75 | 18 |
| 20 | 15 | 22,9 | 18,8 | 20,5 |
Lausn

Sum gildi í þessu gagnasafni lenda á mörkum flokksbila. Gildi er talið með í flokksbili ef það lendir á vinstri mörkum en ekki ef það lendir á hægri mörkum. Mismunandi rannsakendur geta sett upp stuðlarit fyrir sömu gögn á mismunandi hátt. Það er til fleiri en ein rétt leið til að setja upp stuðlarit.
Tíðnimarghyrningar eru hliðstæðir línuritum og rétt eins og línurit gera samfelld gögn auðveld í sjónrænni túlkun, gera tíðnimarghyrningar það líka.
Til að teikna tíðnimarghyrning þarf fyrst að skoða gögnin og ákveða fjölda bila og stærð þeirra, bæði fyrir x-ás og y-ás. X-ásinn sýnir neðri og efri mörk hvers bils sem inniheldur gagnagildin, en y-ásinn sýnir tíðni gildanna. Hver punktur táknar tíðni hvers bils. Til dæmis, ef bil inniheldur þrjú gagnagildi, mun tíðnimarghyrningurinn sýna 3 við efri endapunkt þess bils. Eftir að viðeigandi bil hafa verið valin er byrjað að merkja inn punktana. Þegar allir punktar hafa verið merktir inn eru dregin línustrik til að tengja þá.
Dæmi 2.12
Tíðnimarghyrningur var teiknaður út frá tíðnitöflunni hér að neðan.
| Tíðnidreifing fyrir einkunnir á lokaprófi í stærðfræðigreiningu | |||
| Lower Bound | Upper Bound | Tíðni | Uppsöfnuð tíðni |
| 49,5 | 59,5 | 5 | 5 |
| 59,5 | 69,5 | 10 | 15 |
| 69,5 | 79,5 | 30 | 45 |
| 79,5 | 89,5 | 40 | 85 |
| 89,5 | 99,5 | 15 | 100 |
Taktu eftir að hver punktur táknar tíðni fyrir tiltekið bil. Þessir punktar eru staðsettir mitt á milli neðri og efri marka. Reyndar sýnir lárétti ásinn, eða x-ásinn, aðeins þessi miðjugildi. Fyrir bilið 49,5–59,5 er gildið 54,5 táknað með punkti sem sýnir rétta tíðni, 5. Fyrir bilið sem kemur á undan 49,5–59,5 (sem og 39,5–49,5) er gildi miðpunktsins, eða 44,5, táknað með punkti sem sýnir tíðnina 0, þar sem engin gildi eru á því bili. Sama gildir um síðasta bilið, 99,5–109,5, sem hefur miðpunktinn 104,5 og sýnir réttilega punkt sem táknar tíðnina 0. Þegar litið er á línuritið segjum við að þessi dreifing sé skekkt vegna þess að annar helmingur línuritsins er ekki spegilmynd hins.
Tíðnimarghyrningar eru gagnlegir til að bera saman dreifingar. Þessi samanburður er gerður með því að leggja tíðnimarghyrninga fyrir mismunandi gagnasöfn hvern yfir annan.
Dæmi 2.13
Við munum teikna yfirlagðan tíðnimarghyrning til að bera saman einkunnirnar úr sýnidæmi 2.12 við lokaeinkunnir nemendanna í tölum.
| Tíðnidreifing fyrir einkunnir á lokaprófi í stærðfræðigreiningu | |||
| Lower Bound | Upper Bound | Tíðni | Uppsöfnuð tíðni |
| 49,5 | 59,5 | 5 | 5 |
| 59,5 | 69,5 | 10 | 15 |
| 69,5 | 79,5 | 30 | 45 |
| 79,5 | 89,5 | 40 | 85 |
| 89,5 | 99,5 | 15 | 100 |
| Tíðnidreifing fyrir lokaeinkunnir í stærðfræðigreiningu | |||
| Lower Bound | Upper Bound | Tíðni | Uppsöfnuð tíðni |
| 49,5 | 59,5 | 10 | 10 |
| 59,5 | 69,5 | 10 | 20 |
| 69,5 | 79,5 | 30 | 50 |
| 79,5 | 89,5 | 45 | 95 |
| 89,5 | 99,5 | 5 | 100 |

Gerum ráð fyrir að við viljum rannsaka hitasvið á tilteknu svæði í heilan mánuð. Á hverjum degi á hádegi skráum við hitastigið í dagbók. Hægt væri að gera margvíslegar tölfræðilegar rannsóknir á þessum gögnum. Við gætum fundið meðal- eða miðgildi hitastigs fyrir mánuðinn. Við gætum teiknað stuðlarit sem sýnir fjölda daga þar sem hitastigið nær ákveðnu bili. Hins vegar hunsa allar þessar aðferðir hluta af þeim gögnum sem við höfum safnað.
Einn eiginleiki gagnanna sem við gætum viljað taka tillit til er tíminn. Þar sem hver dagsetning er pöruð við hitamælingu dagsins þurfum við ekki að líta á gögnin sem slembigögn. Við getum þess í stað notað tímasetningarnar til að raða gögnunum í tímaröð. Línurit sem tekur mið af þessari röðun og sýnir breytingar á hitastigi eftir því sem líður á mánuðinn kallast tímaraðargraf.
Til að teikna tímaraðargraf verðum við að skoða báða hluta paraða gagnasafnsins okkar. Við byrjum á hefðbundnu Descartes-hnitakerfi. Lárétti ásinn er notaður til að merkja inn dagsetningar eða tímaskref, og lóðrétti ásinn er notaður til að merkja inn gildi breytunnar sem við erum að mæla. Með því að nota ásana á þennan hátt látum við hvern punkt á línuritinu svara til dagsetningar og mældrar stærðar. Punktarnir á línuritinu eru venjulega tengdir saman með beinum línum í þeirri röð sem þeir eiga sér stað.
Dæmi 2.14
Eftirfarandi gögn sýna árlega vísitölu neysluverðs hvern mánuð í 10 ár. Teiknaðu tímaraðargraf eingöngu fyrir gögnin um árlega vísitölu neysluverðs.
| Ár | |||||||
| Jan | |||||||
| Feb | |||||||
| Mar | |||||||
| Apr | |||||||
| Maí | |||||||
| Jún | |||||||
| Júl | |||||||
| 2003 | 181,7 | 183,1 | 184,2 | 183,8 | 183,5 | 183,7 | 183,9 |
| 2004 | 185,2 | 186,2 | 187,4 | 188,0 | 189,1 | 189,7 | 189,4 |
| 2005 | 190,7 | 191,8 | 193,3 | 194,6 | 194,4 | 194,5 | 195,4 |
| 2006 | 198,3 | 198,7 | 199,8 | 201,5 | 202,5 | 202,9 | 203,5 |
| 2007 | 202,416 | 203,499 | 205,352 | 206,686 | 207,949 | 208,352 | 208,299 |
| 2008 | 211,080 | 211,693 | 213,528 | 214,823 | 216,632 | 218,815 | 219,964 |
| 2009 | 211,143 | 212,193 | 212,709 | 213,240 | 213,856 | 215,693 | 215,351 |
| 2010 | 216,687 | 216,741 | 217,631 | 218,009 | 218,178 | 217,965 | 218,011 |
| 2011 | 220,223 | 221,309 | 223,467 | 224,906 | 225,964 | 225,722 | 225,922 |
| 2012 | 226,665 | 227,663 | 229,392 | 230,085 | 229,815 | 229,478 | 229,104 |
| Ár | ||||||
| Ágú | ||||||
| Sep | ||||||
| Okt | ||||||
| Nóv | ||||||
| Des | ||||||
| Árlegt | ||||||
| 2003 | 184,6 | 185,2 | 185,0 | 184,5 | 184,3 | 184,0 |
| 2004 | 189,5 | 189,9 | 190,9 | 191,0 | 190,3 | 188,9 |
| 2005 | 196,4 | 198,8 | 199,2 | 197,6 | 196,8 | 195,3 |
| 2006 | 203,9 | 202,9 | 201,8 | 201,5 | 201,8 | 201,6 |
| 2007 | 207,917 | 208,490 | 208,936 | 210,177 | 210,036 | 207,342 |
| 2008 | 219,086 | 218,783 | 216,573 | 212,425 | 210,228 | 215,303 |
| 2009 | 215,834 | 215,969 | 216,177 | 216,330 | 215,949 | 214,537 |
| 2010 | 218,312 | 218,439 | 218,711 | 218,803 | 219,179 | 218,056 |
| 2011 | 226,545 | 226,889 | 226,421 | 226,230 | 225,672 | 224,939 |
| 2012 | 230,379 | 231,407 | 231,317 | 230,221 | 229,601 | 229,594 |
Lausn

Tímaraðagröf eru mikilvæg verkfæri í ýmsum hagnýtum verkefnum tölfræðinnar. Þegar rannsakandi skráir gildi sömu breytu yfir langan tíma getur verið erfitt að greina leitni eða mynstur. Þegar sömu gagnapunktar eru hins vegar sýndir myndrænt verða ákveðnir eiginleikar augljósir. Tímaraðagröf auðvelda að koma auga á leitni.