11.2 Próf á mátgæðum
Í þessari gerð tilgátuprófs ákvarðið þið hvort gögn passi við tiltekna dreifingu. Til dæmis gæti ykkur grunað að óþekkt gögn fylgi tvíkostadreifingu. Þið notið kí-kvaðrat próf, það er að dreifing tilgátuprófsins er kí-kvaðrat dreifing, til að ákvarða hvort gögnin passi. Núlltilgáta og gagntilgáta fyrir þetta próf má skrifa í setningum eða setja fram sem jöfnur eða ójöfnur.
Prófstærð mátgæðaprófs er:
- O = mæld gildi eða mæld tíðni (gögnin).
- E = vænt gildi eða væntanleg tíðni samkvæmt kenningu eða núlltilgátu.
- k = fjöldi ólíkra reita eða flokka í gögnunum.
Mældu gildin eru gagnagildin og væntu gildin eru þau gildi sem þið mynduð búast við ef núlltilgátan væri sönn. Það eru n liðir af gerðinni (O − E)²/E.
Fjöldi frígráða er df = fjöldi flokka − 1.
Mátgæðaprófið er næstum alltaf hægrihliða. Ef mæld gildi og samsvarandi vænt gildi eru ekki nálægt hvort öðru getur prófstærðin orðið mjög stór og lent langt út í hægri hala kí-kvaðrat ferilsins.
Athugið: Vænt gildi í hverjum reit þarf að vera að minnsta kosti fimm til að nota þetta próf.
Dæmi 11.1
Fjarvistir háskólanema úr stærðfræðitímum eru mikið áhyggjuefni fyrir stærðfræðikennara, því að fjarvera virðist auka líkur á brottfalli. Gerum ráð fyrir að rannsókn sé gerð til að kanna hvort raunverulegt fjarvistarhlutfall nemenda fylgi mati kennara. Kennarar bjuggust við að hópur 100 nemenda myndi missa af tímum samkvæmt töflu 11.1.
| Fjarvistir á önn | Væntur fjöldi nemenda |
|---|---|
| 0–2 | 50 |
| 3–5 | 30 |
| 6–8 | 12 |
| 9–11 | 6 |
| 12+ | 2 |
Síðan var gerð slembikönnun í öllum stærðfræðiáföngum til að ákvarða mældan fjölda fjarvista í áfanga. Tafla 11.2 sýnir niðurstöður könnunarinnar.
| Fjarvistir á önn | Raunverulegur fjöldi nemenda |
|---|---|
| 0–2 | 35 |
| 3–5 | 40 |
| 6–8 | 20 |
| 9–11 | 1 |
| 12+ | 4 |
Ákvarðið núlltilgátu og gagntilgátu sem þarf til að framkvæma mátgæðapróf. H₀: Fjarvistir nemenda passa við mat kennara. Gagntilgátan er andstæða núlltilgátunnar. Hₐ: Fjarvistir nemenda passa ekki við mat kennara.
- a. Er hægt að nota upplýsingarnar eins og þær birtast í töflunum til að framkvæma mátgæðaprófið?
- b. Hver er fjöldi frígráða (df)?
a. Nei. Takið eftir að vænti fjöldinn fyrir flokkinn 12+ er minni en fimm; hann er tveir. Sameinið þann flokk við flokkinn 9–11 til að búa til nýjar töflur þar sem fjöldi nemenda í hverjum flokki er að minnsta kosti fimm. Nýju niðurstöðurnar eru í töflum 11.3 og 11.4.
| Fjarvistir á önn | Væntur fjöldi nemenda |
|---|---|
| 0–2 | 50 |
| 3–5 | 30 |
| 6–8 | 12 |
| 9+ | 8 |
| Fjarvistir á önn | Raunverulegur fjöldi nemenda |
|---|---|
| 0–2 | 35 |
| 3–5 | 40 |
| 6–8 | 20 |
| 9+ | 5 |
b. Það eru fjórir reitir eða flokkar í hvorri nýju töflu. Því er df = fjöldi reita − 1 = 4 − 1 = 3.
Dæmi 11.2
Atvinnurekendur vilja vita hvaða vikudaga starfsfólk er fjarverandi í fimm daga vinnuviku. Flestir atvinnurekendur vilja trúa því að fjarvistir dreifist jafnt yfir vikuna. Gerum ráð fyrir að slembiúrtak 60 stjórnenda hafi verið spurt hvaða vikudag þeir hefðu mestan fjölda fjarvista starfsfólks. Niðurstöðurnar voru eins og í töflu 11.7. Í þýði starfsfólks, koma dagarnir með hæsta fjölda fjarvista fyrir með jafnri tíðni á fimm daga vinnuviku? Prófið við 5% marktektarstig.
| Mánudagur | Þriðjudagur | Miðvikudagur | Fimmtudagur | Föstudagur |
|---|---|---|---|---|
| 15 | 12 | 9 | 9 | 15 |
Núlltilgátan og gagntilgátan eru: H₀: Fjarvistardagar koma fyrir með jafnri tíðni; það er, þeir passa við jafna dreifingu. Hₐ: Fjarvistardagar koma fyrir með ójafnri tíðni; það er, þeir passa ekki við jafna dreifingu.
Ef fjarvistardagar koma fyrir með jafnri tíðni, þá væru af 60 fjarvistardögum 12 fjarvistir á mánudegi, 12 á þriðjudegi, 12 á miðvikudegi, 12 á fimmtudegi og 12 á föstudegi. Þessar tölur eru væntu gildin, E. Gildin í töflunni eru mældu gildin, O, eða gögnin.
Reiknið nú χ²-prófstærðina í höndunum. Búið til töflu með dálkunum vænt gildi E (12, 12, 12, 12, 12), mæld gildi O (15, 12, 9, 9, 15), O − E, (O − E)² og (O − E)²/E. Leggið síðan saman síðasta dálkinn. Summan er þrír. Þetta er χ²-prófstærðin.
Til að finna p-gildið reiknið P(χ² > 3). Þetta próf er hægrihliða. Notið tölvu eða reiknivél til að finna p-gildið. Þið ættuð að fá p-gildi = 0,5578. Frígráðurnar eru fjöldi reita − 1 = 5 − 1 = 4.
TI-83/83+/84/84+: Ýtið á 2nd DISTR, farið niður í χ²cdf og ýtið á ENTER. Sláið inn (3,10^99,4). Námundað að fjórum aukastöfum ætti að birtast 0,5578, sem er p-gildið.
Ljúkið næst við graf með réttri merkingu og skyggingu. Skyggið hægri halann.

Ákvörðunin er að hafna ekki núlltilgátunni. Niðurstaða: Við 5% marktektarstig eru ekki næg gögn úr úrtakinu til að álykta að fjarvistardagar komi ekki fyrir með jafnri tíðni.
TI-83+ og sumar TI-84 reiknivélar hafa ekki sérstakt forrit fyrir prófstærð mátgæðaprófs. Næsta dæmi sýnir reiknivélaleiðbeiningar. Nýrri TI-84 reiknivélar hafa prófið Chi2 GOF í STAT TESTS. Til að keyra prófið setjið þið mældu gildin í fyrsta lista og væntu gildin í annan lista. Ýtið á STAT TESTS og Chi2 GOF, sláið inn listaheitin fyrir Observed list og Expected list, sláið inn frígráður og ýtið á Calculate eða Draw. Gætið þess að hreinsa lista áður en byrjað er. Til að hreinsa lista farið þið í STAT EDIT, upp á listaheitið, ýtið á CLEAR og síðan niður. Einnig má ýta á STAT og 4 fyrir ClrList, slá inn listaheitið og ýta á ENTER.
Dæmi 11.3
Ein rannsókn bendir til þess að fjöldi sjónvarpstækja sem bandarískar fjölskyldur eiga dreifist eins og í töflu 11.9. Þetta er gefna dreifingin fyrir bandaríska þýðið og taflan sýnir væntar prósentur. Slembiúrtak 600 fjölskyldna í vesturhluta Bandaríkjanna gaf gögnin í töflu 11.10, sem sýnir mælda tíðni.
| Fjöldi sjónvarpstækja | Vænt prósenta |
|---|---|
| 0 | 10 |
| 1 | 16 |
| 2 | 55 |
| 3 | 11 |
| 4+ | 8 |
| Fjöldi sjónvarpstækja | Mæld tíðni |
|---|---|
| 0 | 66 |
| 1 | 119 |
| 2 | 340 |
| 3 | 60 |
| 4+ | 15 |
| Samtals | 600 |
Við 1% marktektarstig, virðist dreifing fjölda sjónvarpstækja hjá fjölskyldum í vesturhluta Bandaríkjanna vera ólík dreifingunni fyrir bandaríska þýðið í heild?
Verkefnið biður ykkur að prófa hvort dreifing fjölskyldna í vesturhluta Bandaríkjanna passi við dreifingu bandarískra fjölskyldna. Þetta próf er alltaf hægrihliða. Fyrsta taflan inniheldur væntar prósentur. Til að fá vænta tíðni margfaldið þið prósentuna með 600. Væntu tíðnirnar eru sýndar í töflu 11.11.
| Fjöldi sjónvarpstækja | Vænt prósenta | Vænt tíðni |
|---|---|---|
| 0 | 10 | (0,10)(600) = 60 |
| 1 | 16 | (0,16)(600) = 96 |
| 2 | 55 | (0,55)(600) = 330 |
| 3 | 11 | (0,11)(600) = 66 |
| Fleiri en 3 | 8 | (0,08)(600) = 48 |
Væntu tíðnirnar eru því 60, 96, 330, 66 og 48. Í TI-reiknivélum má láta reiknivélina framkvæma margföldunina; til dæmis má slá inn 0.10*600 í stað 60.
H₀: Dreifing fjölda sjónvarpstækja hjá fjölskyldum í vesturhluta Bandaríkjanna er sú sama og dreifingin hjá bandaríska þýðinu. Hₐ: Dreifingin hjá fjölskyldum í vesturhluta Bandaríkjanna er ólík dreifingunni hjá bandaríska þýðinu.
Dreifing prófsins er χ²_4, þar sem df = fjöldi reita − 1 = 5 − 1 = 4. Athugið: df ≠ 600 − 1. Prófstærðin er χ² = 29,65.

Líkindasetning: p-gildi = P(χ² > 29,65) = 0,000006. Berið saman α og p-gildið: α = 0,01 og p-gildi = 0,000006. Því er α > p-gildi. Þar sem α > p-gildi er H₀ hafnað. Það merkir að þið hafnið tilgátunni um að dreifingin í vesturríkjunum sé sú sama og í bandaríska þýðinu í heild.
Niðurstaða: Við 1% marktektarstig eru næg gögn til að álykta að dreifing fjölda sjónvarpstækja í vesturhluta Bandaríkjanna sé ólík dreifingunni hjá bandaríska þýðinu í heild.
TI-83/83+/84/84+: Ýtið á STAT og ENTER. Hreinsið lista L1, L2 og L3 ef gögn eru í þeim. Setjið mældu tíðnirnar 66, 119, 340, 60, 15 í L1. Setjið væntu tíðnirnar 0.10*600, 0.16*600, 0.55*600, 0.11*600, 0.08*600 í L2. Færið ykkur að L3 og sláið inn (L1-L2)^2/L2. Ýtið á 2nd QUIT, 2nd LIST, farið í MATH og veljið 5. Þá ætti að sjást sum(Enter L3). Námundað að tveimur aukastöfum ætti að sjást 29,65. Ýtið á 2nd DISTR, veljið χ2cdf og sláið inn (29.65,1E99,4). Námundað að fjórum stöfum sést 5,77E-6 = 0,000006, p-gildið. Nýrri TI-84 reiknivélar geta einnig notað Chi2 GOF í STAT TESTS með mældum og væntum listum og df = 4.
Dæmi 11.4
Gerum ráð fyrir að þið kastið tveimur myntum 100 sinnum. Niðurstöðurnar eru 20 HH, 27 HT, 30 TH og 23 TT. Eru myntirnar óhlutdrægar? Prófið við 5% marktektarstig.
Þetta verkefni má setja upp sem mátgæðapróf. Útkomurúmið þegar tveimur óhlutdrægum myntum er kastað er {HH, HT, TH, TT}. Af 100 köstum væru vænt gildi 25 HH, 25 HT, 25 TH og 25 TT. Þetta er vænta dreifingin. Spurningin „Eru myntirnar óhlutdrægar?“ jafngildir því að spyrja hvort dreifing kastanna, 20 HH, 27 HT, 30 TH og 23 TT, passi við væntu dreifinguna.
Slembibreyta: Látum X vera fjölda króna í einu kasti tveggja mynta. X tekur gildin 0, 1 og 2. Það eru 0, 1 eða 2 krónur í kasti tveggja mynta. Fjöldi reita er því þrír. Þar sem X er fjöldi króna eru mældu tíðnirnar 20 fyrir tvær krónur, 57 fyrir eina krónu og 23 fyrir enga krónu, það er báðar skildir. Væntu tíðnirnar eru 25 fyrir tvær krónur, 50 fyrir eina krónu og 25 fyrir enga krónu. Þetta próf er hægrihliða.
H₀: Myntirnar eru óhlutdrægar. Hₐ: Myntirnar eru ekki óhlutdrægar. Dreifing prófsins er χ²_2, þar sem df = 3 − 1 = 2. Prófstærðin er χ² = 2,14.

Líkindasetning: p-gildi = P(χ² > 2,14) = 0,3430. Berið saman α og p-gildið: α = 0,05 og p-gildi = 0,3430. Þar sem α < p-gildi er H₀ ekki hafnað. Niðurstaða: Ekki eru næg gögn til að álykta að myntirnar séu ekki óhlutdrægar.
TI-83/83+/84/84+: Ýtið á STAT og ENTER. Hreinsið L1, L2 og L3 ef gögn eru í þeim. Setjið mældu tíðnirnar 20, 57, 23 í L1 og væntu tíðnirnar 25, 50, 25 í L2. Setjið (L1-L2)^2/L2 í L3. Ýtið á 2nd QUIT, 2nd LIST, farið í MATH og veljið 5, síðan sum(L3). Námundað að tveimur aukastöfum ætti að sjást 2,14. Ýtið á 2nd DISTR og veljið χ2cdf, eða ýtið á 7. Sláið inn (2.14,1E99,2). Námundað að fjórum aukastöfum ætti að sjást 0,3430, sem er p-gildið. Nýrri TI-84 reiknivélar geta einnig notað Chi2 GOF í STAT TESTS með mældum og væntum listum.