2.5 Lýsistærðir fyrir miðju gagna
Miðja gagnasafns er einnig leið til að lýsa staðsetningu. Tveir algengustu mælikvarðarnir á miðju gagna eru meðaltal og miðgildi. Til að reikna meðalþyngd 50 manns skal leggja saman þyngdirnar 50 og deila með 50. Til að finna miðgildi þyngdar 50 manns skal raða gögnunum og finna gildið sem skiptir gögnunum í tvo jafna hluta. Miðgildið er almennt betri mælikvarði á miðju þegar um er að ræða jaðargildi eða fráviksgildi, vegna þess að það verður ekki fyrir áhrifum af nákvæmum tölugildum fráviksgildanna. Meðaltalið er algengasti mælikvarðinn á miðju.
Þegar ekki eru öll gildi í gagnasafninu ólík er hægt að reikna meðaltalið með því að margfalda hvert aðskilið gildi með tíðni þess og deila síðan summunni með heildarfjölda gagnagilda. Stafurinn sem notaður er til að tákna úrtaksmeðaltal er x með striki yfir, borið fram „x-strik“: x̄. Úrtaksmeðaltalið er lýsistærð.
Gríski stafurinn μ (borinn fram „mí“) táknar þýðismeðaltal. Þýðismeðaltalið er stiki. Ein af kröfunum fyrir því að úrtaksmeðaltalið sé gott mat á þýðismeðaltalinu er að úrtakið sem tekið er sé raunverulega slembiúrtak.
Til að sjá að báðar leiðirnar til að reikna meðaltalið eru þær sömu skaltu skoða eftirfarandi úrtak: 1, 1, 1, 2, 2, 3, 4, 4, 4, 4, 4
Í seinna dæminu eru tíðnirnar 3(1) + 2(2) + 1(3) + 5(4).
Þú getur fljótt fundið staðsetningu miðgildisins með því að nota segðina (n + 1)/2 .
Bókstafurinn n táknar heildarfjölda gagnagilda í úrtakinu. Eins og áður hefur komið fram er miðgildið miðjugildi röðuðu gagnanna ef n er oddatala, þar sem gögnunum er raðað frá minnsta til stærsta gildis. Ef n er slétt tala er miðgildið jafnt summu tveggja miðjugildanna deilt með tveimur eftir að gögnunum hefur verið raðað. Til dæmis, ef heildarfjöldi gagnagilda er 97, þá er (n + 1)/2 = (97 + 1)/2 = 49. Miðgildið er 49. gildið í röðuðu gögnunum. Ef heildarfjöldi gagnagilda er 100, þá er (n + 1)/2 = (100 + 1)/2 = 50,5. Miðgildið er þá nákvæmlega á milli 50. og 51. gildisins. Staðsetning miðgildisins og gildi miðgildisins eru ekki það sama. Hástafurinn M er oft notaður til að tákna miðgildið. Næsta dæmi sýnir bæði staðsetningu miðgildisins og gildi þess.
Dæmi 2.27
Gögn sem sýna fjölda mánaða sem sjúklingur með tiltekinn sjúkdóm lifir eftir að hafa tekið nýtt mótefnalyf eru eftirfarandi (frá því minnsta til þess stærsta): 3, 4, 8, 8, 10, 11, 12, 13, 14, 15, 15, 16, 16, 17, 17, 18, 21, 22, 22, 24, 24, 25, 26, 26, 27, 27, 29, 29, 31, 32, 33, 33, 34, 34, 35, 37, 40, 44, 44, 47 Reiknið meðaltal og miðgildi.
Lausn
Útreikningur fyrir meðaltalið er
x̄ = [3 + 4 + (8)(2) + 10 + 11 + 12 + 13 + 14 + (15)(2) + (16)(2) + (17)(2) + 18 + 21 + (22)(2) + (24)(2) + 25 + (26)(2) + (27)(2) + (29)(2) + 31 + 32 + (33)(2) + (34)(2) + 35 + 37 + 40 + (44)(2) + 47] / 40 = 23,6. Til að finna miðgildið, M, skal fyrst nota formúluna fyrir staðsetninguna. Staðsetningin er (n + 1)/2 = (40 + 1)/2 = 20,5. Byrjið á minnsta gildinu og teljið upp; miðgildið er á milli 20. og 21. gildisins, það er milli tveggja 24 gilda: 3, 4, 8, 8, 10, 11, 12, 13, 14, 15, 15, 16, 16, 17, 17, 18, 21, 22, 22, 24, 24, 25, 26, 26, 27, 27, 29, 29, 31, 32, 33, 33, 34, 34, 35, 37, 40, 44, 44, 47
M = (24 + 24)/2 = 24
Dæmi 2.28
Gerum ráð fyrir að í litlum bæ með 50 íbúum þéni ein manneskja $5,000,000 á ári og hin 49 þéni hvert um sig $30,000. Hvor er betri mælikvarði á miðju: meðaltalið eða miðgildið?
Lausn
x̄ = 5 , 000 , 000 + 49 ( 30 , 000 )/50 = 129,400
M = 30,000
Það eru 49 manns sem þéna $30,000 og einn sem þénar $5,000,000.
Miðgildið er betri mælikvarði á miðju en meðaltalið vegna þess að 49 af gildunum eru 30,000 og eitt er 5,000,000. Gildið 5,000,000 er fráviksgildi. 30,000 gefur okkur betri hugmynd um miðju gagnanna.
Annar mælikvarði á miðju er tíðasta gildi. Tíðasta gildið er það gildi sem kemur oftast fyrir. Það geta verið fleiri en eitt tíðasta gildi í gagnasafni, svo framarlega sem þau gildi hafa sömu tíðni og sú tíðni er sú hæsta. Gagnasafn með tvö tíðustu gildi er kallað tvítoppa.
Dæmi 2.29
Einkunnir 20 nemenda á prófi í tölfræði eru eftirfarandi:
50, 53, 59, 59, 63, 63, 72, 72, 72, 72, 72, 76, 78, 81, 83, 84, 84, 84, 90, 93
Finndu tíðasta gildið.
Lausn
Tíðasta einkunnin er 72, sem kemur fyrir fimm sinnum. Tíðasta gildi = 72.
Dæmi 2.30
Fimm einkunnir úr fasteignasöluprófi eru 430, 430, 480, 480, 495. Gagnasafnið er tvítoppa vegna þess að einkunnirnar 430 og 480 koma hvor um sig fyrir tvisvar.
Hvenær er tíðasta gildið besti mælikvarðinn á miðju? Hugleiddu megrunarkúr sem auglýsir sex punda meðalþyngdartap fyrstu vikuna. Tíðasta gildið gæti gefið til kynna að flestir léttist um tvö pund fyrstu vikuna, sem gerir kúrinn minna aðlaðandi.
ATHUGIÐ
Hægt er að finna tíðasta gildi fyrir eigindleg gögn jafnt sem megindleg gögn. Til dæmis, ef gagnasafnið er rautt, rautt, rautt, grænt, grænt, gult, fjólublátt, svart, blátt, þá er tíðasta gildið rautt.
Tölfræðihugbúnaður reiknar auðveldlega meðaltal, miðgildi og tíðasta gildi. Sumar grafískar reiknivélar geta einnig framkvæmt þessa útreikninga. Í raunveruleikanum notar fólk hugbúnað til að gera þessa útreikninga.
Lögmál stórra talna og meðaltalið
Lögmál stórra talna segir að ef tekin eru sífellt stærri úrtök úr hvaða þýði sem er, þá sé mjög líklegt að úrtaksmeðaltalið x̄ færist nær og nær þýðismeðaltalinu μ. Þetta lögmál er rætt nánar síðar í textanum.
Úrtakadreifingar og lýsistærð úrtakadreifingar
Líta má á úrtakadreifingu sem hlutfallslega tíðnidreifingu með mjög mörgum úrtökum. Sjá kafla 1: Úrtök og gögn til upprifjunar á hlutfallstíðni. Gerum ráð fyrir að 30 nemendur, valdir af handahófi, hafi verið spurðir um fjölda kvikmynda sem þeir horfðu á í síðustu viku. Niðurstöðurnar eru í hlutfallstíðnitöflunni hér að neðan.
| Fjöldi kvikmynda | Hlutfallsleg tíðni |
|---|---|
| 0 | 5/30 |
| 1 | 15/30 |
| 2 | 6/30 |
| 3 | 3/30 |
| 4 | 1/30 |
Hlutfallsleg tíðnidreifing inniheldur hlutfallstíðni fyrir fjölda úrtaka.
Munum að lýsistærð er tala sem reiknuð er út frá úrtaki. Dæmi um lýsistærðir eru meðaltal, miðgildi og tíðasta gildi, auk annarra. Úrtaksmeðaltalið x̄ er dæmi um lýsistærð sem metur þýðismeðaltalið μ.
Útreikningur meðaltals úr flokkuðum tíðnitöflum
Þegar aðeins flokkuð gögn eru tiltæk eru einstök gagnagildi ekki þekkt; við þekkjum aðeins bil og tíðni bila. Þess vegna er ekki hægt að reikna nákvæmt meðaltal fyrir gagnasafnið. Þess í stað metum við raunverulegt meðaltal með því að reikna meðaltal tíðnitöflu. Tíðnitafla er framsetning gagna þar sem flokkuð gögn eru sýnd ásamt samsvarandi tíðni. Til að reikna meðaltal úr flokkaðri tíðnitöflu getum við beitt grunnskilgreiningu meðaltals: meðaltal = summa gagna / fjöldi gagnagilda. Við þurfum einfaldlega að laga skilgreininguna að takmörkunum tíðnitöflu.
Þar sem við þekkjum ekki einstök gagnagildi getum við þess í stað fundið miðpunkt hvers bils. Miðpunkturinn er (neðri mörk + efri mörk)/2. Við getum nú lagað skilgreininguna að tíðnitöflu: meðaltal tíðnitöflu = ∑fm/∑f, þar sem f er tíðni bilsins, m er miðpunktur bilsins og sigma (∑) er lesið „sigma“ og merkir að leggja saman. Þessi jafna segir okkur því að leggja skuli saman margfeldi hvers miðpunkts og samsvarandi tíðni og deila með summu allrar tíðni.
Dæmi 2.31
Sýnd er tíðnitafla fyrir síðasta tölfræðipróf hjá prófessor Blount. Finndu besta mat á meðaltali bekkjarins.
| Einkunnabil | Fjöldi nemenda |
| 50–56,5 | 1 |
| 56,5–62,5 | 0 |
| 62,5–68,5 | 4 |
| 68,5–74,5 | 4 |
| 74,5–80,5 | 2 |
| 80,5–86,5 | 3 |
| 86,5–92,5 | 4 |
| 92,5–98,5 | 1 |
Lausn
Miðpunktar bilanna eru:; 50–56,5 -> 53,25; 56,5–62,5 -> 59,5; 62,5–68,5 -> 65,5; 68,5–74,5 -> 71,5; 74,5–80,5 -> 77,5; 80,5–86,5 -> 83,5; 86,5–92,5 -> 89,5; 92,5–98,5 -> 95,5.