2.4 Box Plots
Kassarit, einnig kölluð kassarit með skeggjum, sýna á skýran myndrænan hátt hvernig gögnin dreifast. Þau sýna einnig hversu langt ystu gildi liggja frá meginþorra gagnanna. Eins og áður hefur komið fram er kassarit byggt á fimm gildum: lágmarksgildi, fyrsta fjórðungamarki, miðgildi, þriðja fjórðungamarki og hámarksgildi. Þessi gildi eru notuð til að bera önnur gagnagildi saman við þau.
Til að teikna kassarit er notuð lárétt eða lóðrétt talnalína og rétthyrndur kassi. Minnsta og stærsta gagnagildið marka endapunkta ássins. Fyrsta fjórðungamarkið markar annan enda kassans og þriðja fjórðungamarkið hinn endann. Um það bil miðju 50 prósent gagnanna liggja innan kassans. Skeggin ná frá endum kassans að minnsta og stærsta gagnagildinu. Kassarit sýnir á einfaldan hátt spönn gagnasafns, það er mismuninn á stærsta og minnsta gagnagildinu (eða mismuninn á hámarki og lágmarki). Nema miðgildið, fyrsta fjórðungamarkið og þriðja fjórðungamarkið séu sama gildið liggur miðgildið innan kassans, milli fyrsta og þriðja fjórðungamarks. Kassarit gefur góða og fljótlega yfirsýn yfir gögnin.
Skoðum aftur þetta gagnasafn:
1, 1, 2, 2, 4, 6, 6,8, 7,2, 8, 8,3, 9, 10, 10, 11,5
Fyrsta fjórðungamarkið er tveir, miðgildið er sjö og þriðja fjórðungamarkið er níu. Minnsta gildið er einn og stærsta gildið er 11,5. Eftirfarandi mynd sýnir kassaritið sem var teiknað.

Skeggin tvö ná frá fyrsta fjórðungamarki að minnsta gildi og frá þriðja fjórðungamarki að stærsta gildi. Miðgildið er sýnt með strikalínu.
Dæmi 2.24
Eftirfarandi gögn sýna hæð 40 nemenda í tölfræðiáfanga:
59, 60, 61, 62, 62, 63, 63, 64, 64, 64, 65, 65, 65, 65, 65, 65, 65, 65, 65, 66, 66, 67, 67, 68, 68, 69, 70, 70, 70, 70, 70, 71, 71, 72, 72, 73, 74, 74, 75, 77.
Teiknaðu kassarit með eftirfarandi eiginleikum. Leiðbeiningar fyrir reiknivél til að finna fimm talna samantekt fylgja á eftir þessu dæmi:
Lágmarksgildi = 59
Hámarksgildi = 77
Q₁: fyrsta fjórðungamark = 64,5
Q₂: annað fjórðungamark, eða miðgildi = 66
Q₃: þriðja fjórðungamark = 70
Hver fjórðungur inniheldur um það bil 25 prósent gagnanna.
Spönn fjórðunganna fjögurra er 64,5 - 59 = 5,5 (fyrsti fjórðungur), 66 - 64,5 = 1,5 (annar fjórðungur), 70 - 66 = 4 (þriðji fjórðungur) og 77 - 70 = 7 (fjórði fjórðungur). Því hefur annar fjórðungur minnstu spönnina og fjórði fjórðungur þá stærstu.
Spönn = hámarksgildi - lágmarksgildi = 77 - 59 = 18.
Fjórðungaspönn: IQR = Q₃ - Q₁ = 70 - 64,5 = 5,5.
Bilið 59-65 inniheldur meira en 25 prósent gagnanna og hefur því fleiri gagnagildi en bilið 66-70, sem inniheldur 25 prósent gagnanna.
Miðju 50 prósent gagnanna, eða miðhelmingurinn, hafa spönnina 5,5 tommur.
Í sumum gagnasöfnum geta stærsta gildi, minnsta gildi, fyrsta fjórðungamark, miðgildi og þriðja fjórðungamark fallið saman að einhverju leyti. Til dæmis getur miðgildið og þriðja fjórðungamarkið verið sama gildi. Þá væri engin strikalína inni í kassanum til að sýna miðgildið sérstaklega. Hægri hlið kassans myndi sýna bæði þriðja fjórðungamarkið og miðgildið. Ef minnsta gildið og fyrsta fjórðungamarkið væru bæði einn, miðgildið og þriðja fjórðungamarkið væru bæði fimm og stærsta gildið væri sjö, liti kassaritið svona út:

Í þessu tilviki eru að minnsta kosti 25 prósent gildanna jöfn einum. Tuttugu og fimm prósent gildanna eru á bilinu frá einum til fimm, að báðum meðtöldum. Að minnsta kosti 25 prósent gildanna eru jöfn fimm. Efstu 25 prósent gildanna liggja á bilinu frá fimm til sjö, að báðum meðtöldum.
Dæmi 2.25
Prófeinkunnir í dagbekk herra Ramirez eru eftirfarandi:
99, 56, 78, 55,5, 32, 90, 80, 81, 56, 59, 45, 77, 84,5, 84, 70, 72, 68, 32, 79, 90.
Prófeinkunnir í kvöldbekk frú Park eru eftirfarandi:
98, 78, 68, 83, 81, 89, 88, 76, 65, 45, 98, 90, 80, 84,5, 85, 79, 78, 98, 90, 79, 81, 25,5.
- Finndu minnsta gildið, stærsta gildið, miðgildið og fyrsta og þriðja fjórðungamark fyrir bekk herra Ramirez.
- Finndu minnsta gildið, stærsta gildið, miðgildið og fyrsta og þriðja fjórðungamark fyrir bekk frú Park.
- Fyrir hvort gagnasafn, hversu stórt hlutfall gagnanna er á milli minnsta gildis og fyrsta fjórðungamarks? Milli fyrsta fjórðungamarks og miðgildis? Milli miðgildis og þriðja fjórðungamarks? Milli þriðja fjórðungamarks og stærsta gildis? Hversu stórt hlutfall gagnanna er á milli fyrsta fjórðungamarks og stærsta gildis?
- Búðu til kassarit fyrir hvort gagnasafn. Notaðu eina talnalínu fyrir bæði kassarit.
- Hvort kassaritið hefur meiri spönn fyrir miðju 50 prósent gagnanna, það er gögnin milli fyrsta og þriðja fjórðungamarks? Hvað þýðir það fyrir það gagnasafn í samanburði við hitt gagnasafnið?
Lausn
Dæmi 2.26
Teiknaðu kassarit með skeggjum fyrir eftirfarandi gagnagildi:
10, 10, 10, 15, 35, 75, 90, 95, 100, 175, 420, 490, 515, 515, 790
Tölurnar fimm sem notaðar eru til að búa til kassarit með skeggjum eru eftirfarandi:
Lágmark: 10
Q₁: 15
Miðgildi: 95
Q₃: 490
Hámark: 790
Eftirfarandi graf sýnir kassaritið með skeggjum.
