1.3 Tíðni, tíðnitöflur og mælistig
Þegar þú ert með gagnasafn þarftu að skipuleggja það til að geta greint hversu oft hvert gildi kemur fyrir í safninu. Þegar tíðni er reiknuð gætirðu þó þurft að námunda svörin svo þau séu eins nákvæm og mögulegt er.
Svör og námundun
Einföld leið til að námunda svör er að hafa lokasvarið með einum aukastaf meira en var í upprunalegu gögnunum. Námundaðu aðeins lokasvarið. Ekki námunda milliniðurstöður, ef mögulegt er. Ef nauðsynlegt reynist að námunda milliniðurstöður skaltu hafa þær með að minnsta kosti tvöfalt fleiri aukastöfum en lokasvarið. Búast má við að sum svör þín verði frábrugðin textanum vegna námundunarskekkju.
Ekki er nauðsynlegt að stytta flest brot í þessum áfanga. Sérstaklega í kaflanum um líkindafræði er gagnlegra að skilja svar eftir sem óstytt brot.
Mælistig
Aðferðin sem notuð er til að mæla gagnasafn kallast mælistig þess. Réttar tölfræðilegar aðferðir ráðast af því að rannsakandi þekki mælistigin. Ekki er hægt að beita öllum tölfræðilegum aðgerðum á öll gagnasöfn. Gögn má flokka á fjögur mælistig. Þau eru eftirfarandi, frá lægsta til hæsta mælistigs:
- Nafnkvarði
- Raðkvarði
- Jafnbilakvarði
- Hlutfallskvarði
Gögn sem mæld eru á nafnkvarða eru eigindleg, eða flokkuð. Flokkar, litir, nöfn, merkingar og uppáhaldsmatur ásamt já- eða nei-svörum eru dæmi um gögn á nafnkvarða. Gögn á nafnkvarða eru ekki röðuð. Til dæmis er ekki merkingarbært að raða fólki eftir uppáhaldsmat þess; að setja pizzu í fyrsta sæti og sushi í annað hefur enga tölfræðilega merkingu.
Snjallsímafyrirtæki eru annað dæmi um gögn á nafnkvarða. Gögnin eru nöfn fyrirtækjanna sem framleiða snjallsíma, en það er engin samþykkt röð á þessum vörumerkjum, þótt fólk kunni að hafa persónulegar óskir. Ekki er hægt að nota gögn á nafnkvarða í útreikningum.
Gögn sem mæld eru á raðkvarða líkjast gögnum á nafnkvarða, en þar er mikilvægur munur: hægt er að raða gögnum á raðkvarða. Dæmi um gögn á raðkvarða er listi yfir fimm efstu þjóðgarða í Bandaríkjunum. Hægt er að raða þeim frá einum til fimm, en við getum ekki mælt muninn á milli gagnagildanna.
Annað dæmi um notkun raðkvarða er könnun í skemmtisiglingu þar sem svörin við spurningum um siglinguna eru framúrskarandi, góð, viðunandi og óviðunandi. Þessum svörum er raðað frá eftirsóknarverðasta svari til þess sísta. Hins vegar er ekki hægt að mæla muninn á milli tveggja gagnagilda. Líkt og gögn á nafnkvarða er ekki hægt að nota gögn á raðkvarða í útreikningum.
Líkt og gögn mæld á raðkvarða hafa gögn sem mæld eru á jafnbilakvarða ákveðna röðun. Þótt gögn á raðkvarða séu flokkuð, eða eigindleg, eru gögn á jafnbilakvarða töluleg, eða megindleg. Hægt er að reikna út mun á gildum sem mæld eru á jafnbilakvarða. Hins vegar er ekkert raunverulegt lágmarks- eða núllgildi.
Hitakvarðar eins og Celsíus (C) og Fahrenheit (F) eru mældir með jafnbilakvarða. Í báðum hitamælingum er 40° jafnt og 100° mínus 60°. Munur hefur merkingu. En 0 gráður tákna ekki lágmarksgildi. Í báðum kvörðum er 0 ekki algjörlega lægsti hitinn. Hitastig eins og –10 °F og –15 °C eru til og eru kaldari en 0.
Gögn sem mæld eru á hlutfallskvarða gefa mestar upplýsingar. Gögn á hlutfallskvarða eru eins og gögn á jafnbilakvarða, en þar er raunverulegt lágmarksgildi og hægt er að reikna hlutföll. Til dæmis eru fjórar einkunnir úr fjölvals-lokaprófi í tölfræði 80, 68, 20 og 92 af 100 mögulegum stigum. Prófin eru yfirfarin af vél.
Gögnunum má raða frá lægsta gildi til hæsta: 20, 68, 80, 92.
Munurinn á milli gagnanna hefur merkingu. Einkunnin 92 er meiri en einkunnin 68 um 24 stig. Hægt er að reikna hlutföll. Lægsta einkunnin er 0. Þannig að 80 er fjórum sinnum 20. Einkunnin 80 er fjórföld einkunnin 20.
Tíðni
Tuttugu nemendur voru spurðir hversu margar klukkustundir þeir ynnu á dag. Svör þeirra, í klukkustundum, eru eftirfarandi: 5, 6, 3, 3, 2, 4, 7, 5, 2, 3, 5, 6, 5, 4, 4, 3, 5, 2, 5, 3.
Tafla 1.12 sýnir mismunandi gagnagildi í vaxandi röð og tíðni þeirra.
| GAGNAGILDI | TÍÐNI |
|---|---|
| 2 | 3 |
| 3 | 5 |
| 4 | 3 |
| 5 | 6 |
| 6 | 2 |
| 7 | 1 |
Tíðni er fjöldi skipta sem gildi gagnanna kemur fyrir. Samkvæmt töflu 1.12 eru þrír nemendur sem vinna tvær klukkustundir, fimm nemendur sem vinna þrjár klukkustundir, og svo framvegis. Summa gildanna í tíðnidálkinum, 20, táknar heildarfjölda nemenda sem eru í úrtakinu.
Hlutfallstíðni er hlutfallið (brot eða hlutfall) af fjölda skipta sem gildi gagnanna kemur fyrir í mengi allra útkoma miðað við heildarfjölda útkoma. Til að finna hlutfallstíðni skal deila hverri tíðni með heildarfjölda nemenda í úrtakinu, í þessu tilfelli, 20. Hlutfallstíðni má skrifa sem brot, prósentur eða tugabrot.
| GAGNAGILDI | TÍÐNI | HLUTFALLSTÍÐNI |
|---|---|---|
| 2 | 3 | 3/20 eða 0,15 |
| 3 | 5 | 5/20 eða 0,25 |
| 4 | 3 | 3/20 eða 0,15 |
| 5 | 6 | 6/20 eða 0,30 |
| 6 | 2 | 2/20 eða 0,10 |
| 7 | 1 | 1/20 eða 0,05 |
Summa gildanna í dálkinum fyrir hlutfallstíðni í töflu 1.13 er 20/20, eða 1.
Uppsöfnuð hlutfallstíðni er uppsöfnun fyrri hlutfallstíðna. Til að finna uppsafnaða hlutfallstíðni skal leggja allar fyrri hlutfallstíðnir við hlutfallstíðni fyrir núverandi röð, eins og sýnt er í töflu 1.14.
Í fyrstu röðinni er uppsöfnuð hlutfallstíðni einfaldlega 0,15 vegna þess að þar er aðeins ein hlutfallstíðni. Í annarri röðinni er hlutfallstíðnin 0,25; þegar henni er bætt við 0,15 fæst uppsöfnuð hlutfallstíðni 0,40. Haltu áfram að leggja saman hlutfallstíðnirnar í hverri röð til að fylla út afganginn af dálkinum.
| GAGNAGILDI | TÍÐNI | HLUTFALLSTÍÐNI TÍÐNI | UPPSÖFNUÐ HLUTFALLSTÍÐNI TÍÐNI |
|---|---|---|---|
| 2 | 3 | 3/20 eða 0,15 | 0,15 |
| 3 | 5 | 5/20 eða 0,25 | 0,15 + 0,25 = 0,40 |
| 4 | 3 | 3/20 eða 0,15 | 0,40 + 0,15 = 0,55 |
| 5 | 6 | 6/20 eða 0,30 | 0,55 + 0,30 = 0,85 |
| 6 | 2 | 2/20 eða 0,10 | 0,85 + 0,10 = 0,95 |
| 7 | 1 | 1/20 eða 0,05 | 0,95 + 0,05 = 1,00 |
Síðasta færslan í dálkinum fyrir uppsafnaða hlutfallstíðni er 1, sem sýnir að 100 prósent gagnanna hafa verið tekin með.
Eftirfarandi gögn sýna hæð (í tommum, námundað að næstu hálfu tommu) 100 karlkyns hálfatvinnuknattspyrnumanna. Hæðirnar eru samfelld gögn þar sem hæð er mæld stærð. 60, 60,5, 61, 61, 61,5, 63,5, 63,5, 63,5, 64, 64, 64, 64, 64, 64, 64, 64,5, 64,5, 64,5, 64,5, 64,5, 64,5, 64,5, 64,5, 66, 66, 66, 66, 66, 66, 66, 66, 66, 66, 66,5, 66,5, 66,5, 66,5, 66,5, 66,5, 66,5, 66,5, 66,5, 66,5, 66,5, 67, 67, 67, 67, 67, 67, 67, 67, 67, 67, 67, 67, 67,5, 67,5, 67,5, 67,5, 67,5, 67,5, 67,5, 68, 68, 69, 69, 69, 69, 69, 69, 69, 69, 69, 69, 69,5, 69,5, 69,5, 69,5, 69,5, 70, 70, 70, 70, 70, 70, 70,5, 70,5, 70,5, 71, 71, 71, 72, 72, 72, 72,5, 72,5, 73, 73,5, 74
Tafla 1.15 tekur saman hæðirnar í þessu úrtaki. Þar sem hæðirnar eru gefnar upp í tíundu hlutum mun tíðnitaflan nota merkingar í hundruðustu hlutum. Þetta tryggir að ekkert gagnagildi lendi nákvæmlega á efri eða neðri mörkum bils.
| HÆÐIR (TOMMUR) | TÍÐNI | HLUTFALLSTÍÐNI TÍÐNI | UPPSÖFNUÐ HLUTFALLSTÍÐNI HLUTFALLSTÍÐNI TÍÐNI |
|---|---|---|---|
| 59,95–61,95 | 5 | 5/100 = 0,05 | 0,05 |
| 61,95–63,95 | 3 | 3/100 = 0,03 | 0,05 + 0,03 = 0,08 |
| 63,95–65,95 | 15 | 15/100 = 0,15 | 0,08 + 0,15 = 0,23 |
| 65,95–67,95 | 40 | 40/100 = 0,40 | 0,23 + 0,40 = 0,63 |
| 67,95–69,95 | 17 | 17/100 = 0,17 | 0,63 + 0,17 = 0,80 |
| 69,95–71,95 | 12 | 12/100 = 0,12 | 0,80 + 0,12 = 0,92 |
| 71,95–73,95 | 7 | 7/100 = 0,07 | 0,92 + 0,07 = 0,99 |
| 73,95–75,95 | 1 | 1/100 = 0,01 | 0,99 + 0,01 = 1,00 |
| Samtals = 100 | Samtals = 1,00 |
Gögnunum í þessari töflu hefur verið skipt í eftirfarandi bil:
- 59,95–61,95 tommur
- 61,95–63,95 tommur
- 63,95–65,95 tommur
- 65,95–67,95 tommur
- 67,95–69,95 tommur
- 69,95–71,95 tommur
- 71,95–73,95 tommur
- 73,95–75,95 tommur
Í þessu úrtaki eru fimm leikmenn sem eru á bilinu 59,95–61,95 tommur á hæð, þrír leikmenn á bilinu 61,95–63,95 tommur, 15 leikmenn á bilinu 63,95–65,95 tommur, 40 leikmenn á bilinu 65,95–67,95 tommur, 17 leikmenn á bilinu 67,95–69,95 tommur, 12 leikmenn á bilinu 69,95–71,95, sjö leikmenn á bilinu 71,95–73,95 og einn leikmaður á bilinu 73,95–75,95. Allar hæðir lenda á milli endapunkta bilsins en ekki á sjálfum endapunktunum.
Dæmi 1.15
Notið töflu 1.15 til að finna hlutfall hæða sem eru undir 65,95 tommum.
Lausn
Ef litið er á fyrstu, aðra og þriðju röð eru allar hæðirnar undir 65,95 tommum. Alls eru 5 + 3 + 15 = 23 leikmenn sem eru lægri en 65,95 tommur. Hlutfall hæða undir 65,95 tommum er þá 23/100 eða 23 prósent. Þetta hlutfall er uppsöfnuð hlutfallstíðni í þriðju röð.
Dæmi 1.16
Notið töflu 1.15 til að finna hlutfall hæða sem eru á milli 61,95 og 65,95 tomma.
Lausn
Leggið saman hlutfallstíðnina í annarri og þriðju röð: 0,03 + 0,15 = 0,18 eða 18 prósent.
Dæmi 1.17
Notið hæðir 100 karlkyns hálfatvinnuknattspyrnumanna í töflu 1.15. Fyllið í eyðurnar og farið yfir svörin.
- Hlutfall hæða frá 67,95 til 71,95 tommum er ________.
- Hlutfall hæða frá 67,95 til 73,95 tommum er ________.
- Hlutfall hæða sem eru yfir 65,95 tommum er ________.
- Fjöldi leikmanna í úrtakinu sem eru á milli 61,95 og 71,95 tommur á hæð er ________.
- Hvers konar gögn eru hæðirnar?
- Lýsið því hvernig hægt væri að safna þessum gögnum, hæðunum, þannig að þau væru dæmigerð fyrir alla karlkyns hálfatvinnuknattspyrnumenn.
Munið að tíðni er talin. Til að finna hlutfallstíðni er tíðninni deilt með heildarfjölda gagnagilda. Til að finna uppsafnaða hlutfallstíðni er öllum fyrri hlutfallstíðnum bætt við hlutfallstíðni núverandi raðar.
Lausn
- 29 prósent
- 36 prósent
- 77 prósent
- 87
- samfelld megindleg gögn
- fá leikmannalista frá hverju liði og velja einfalt slembiúrtak úr hverjum lista
Dæmi 1.18
Nítján manns voru spurðir hversu margar mílur, námundað að næstu mílu, þeir ferðast til vinnu á hverjum degi. Gögnin eru eftirfarandi: 2; 5; 7; 3; 2; 10; 18; 15; 20; 7; 10; 18; 5; 12; 13; 12; 4; 5; 10. Tafla 1.17 var búin til.
| GÖGN | TÍÐNI | HLUTFALLSTÍÐNI | UPPSÖFNUÐ HLUTFALLSTÍÐNI |
|---|---|---|---|
| 3 | 3 | 3/19 | 0,1579 |
| 4 | 1 | 1/19 | 0,2105 |
| 5 | 3 | 3/19 | 0,1579 |
| 7 | 2 | 2/19 | 0,2632 |
| 10 | 3 | 4/19 | 0,4737 |
| 12 | 2 | 2/19 | 0,7895 |
| 13 | 1 | 1/19 | 0,8421 |
| 15 | 1 | 1/19 | 0,8948 |
| 18 | 1 | 1/19 | 0,9474 |
| 20 | 1 | 1/19 | 1,0000 |
- Er taflan rétt? Ef hún er ekki rétt, hvað er að?
- Satt eða ósatt: Þrjú prósent þeirra sem könnunin náði til ferðast þrjár mílur til vinnu. Ef fullyrðingin er ekki rétt, hver ætti hún að vera? Ef taflan er röng, gerðu þá leiðréttingar.
- Hvaða hlutfall þeirra sem könnunin náði til ferðast fimm eða sjö mílur til vinnu?
- Hvaða hlutfall þeirra sem könnunin náði til ferðast 12 mílur eða meira til vinnu? Minna en 12 mílur? Milli fimm og 13 mílur (að fimm og 13 mílum undanskildum)?
Lausn
- Nei. Summa tíðnidálksins er 18, ekki 19. Ekki eru allar uppsafnaðar hlutfallstíðnir réttar. Færslur í töflunni fyrir gagnagildin 2, 3, 10 og 18 eru rangar. Þetta hefur áhrif á uppsafnaða hlutfallstíðni fyrir flest gildi.
- Ósatt. Tíðnin fyrir þrjár mílur ætti að vera einn; fyrir tvær mílur (sem var sleppt), tveir. Dálkurinn fyrir uppsafnaða hlutfallstíðni ætti að vera 0,1052, 0,1579, 0,2105, 0,3684, 0,4737, 0,6316, 0,7368, 0,7895, 0,8421, 0,9474, 1,0000.
- 7/19, 12/19, 7/19
Dæmi 1.19
Tafla 1.18 inniheldur heildarfjölda dauðsfalla á heimsvísu af völdum jarðskjálfta á tímabilinu frá 2000 til 2012.
| Ár | Heildarfjöldi dauðsfalla |
|---|---|
| 2000 | 231 |
| 2001 | 21.357 |
| 2002 | 11.685 |
| 2003 | 33.819 |
| 2004 | 228.802 |
| 2005 | 88.003 |
| 2006 | 6.605 |
| 2007 | 712 |
| 2008 | 88.011 |
| 2009 | 1.790 |
| 2010 | 320.120 |
| 2011 | 21.953 |
| 2012 | 768 |
| Samtals | 823.856 |
Svaraðu eftirfarandi spurningum:
- Hver er tíðni dauðsfalla mæld frá 2006 til og með 2009?
- Hvaða hlutfall dauðsfalla átti sér stað eftir 2009?
- Hver er hlutfallstíðni dauðsfalla sem áttu sér stað árið 2003 eða fyrr?
- Hvert er hlutfall dauðsfalla sem áttu sér stað árið 2004?
- Hvers konar gögn eru fjöldi dauðsfalla?
- Richter-kvarðinn er notaður til að mæla orkuna sem losnar í jarðskjálfta. Dæmi um tölur á Richter-kvarða eru 2,3, 4,0, 6,1 og 7,0. Hvers konar gögn eru þessar tölur?
Lausn
- 97.118 (11,8 prósent)
- 41,6 prósent
- 67.092/823.856 eða 0,081 eða 8,1 prósent
- 27,8 prósent
- strjál megindleg gögn
- samfelld megindleg gögn