2.7 Mælikvarðar á dreifingu gagna
Mikilvægur eiginleiki hvers gagnasafns er breytileiki gagnanna. Í sumum gagnasöfnum eru gildin þjöppuð þétt saman nálægt meðaltalinu; í öðrum gagnasöfnum dreifast gildin meira út frá meðaltalinu. Algengasti mælikvarðinn á breytileika, eða dreifingu, er staðalfrávikið. Staðalfrávikið er tala sem mælir hversu langt gildi gagnanna eru frá meðaltali þeirra.
Staðalfrávikið
- gefur tölulegan mælikvarða á heildarbreytileika í gagnasafni og
- hægt er að nota það til að ákvarða hvort tiltekið gildi sé nálægt eða langt frá meðaltalinu.
Staðalfrávikið gefur mælikvarða á heildarbreytileika í gagnasafni.
Staðalfrávikið er alltaf jákvætt eða núll. Staðalfrávikið er lítið þegar öll gögnin eru þjöppuð nálægt meðaltalinu, sem sýnir lítinn breytileika eða dreifingu. Staðalfrávikið er stærra þegar gildin dreifast meira út frá meðaltalinu, sem sýnir meiri breytileika.
Gerum ráð fyrir að við séum að rannsaka hversu lengi viðskiptavinir bíða í röð á kassanum í stórmarkaði A og stórmarkaði B. Meðalbiðtíminn í báðum stórmörkuðum er fimm mínútur. Í stórmarkaði A er staðalfrávik biðtímans tvær mínútur; í stórmarkaði B er staðalfrávik biðtímans fjórar mínútur.
Vegna þess að stórmarkaður B hefur hærra staðalfrávik vitum við að það er meiri breytileiki í biðtímanum í stórmarkaði B. Á heildina litið dreifist biðtíminn í stórmarkaði B meira út frá meðaltalinu, en biðtíminn í stórmarkaði A er meira þjappaður nálægt meðaltalinu.
Hægt er að nota staðalfrávikið til að ákvarða hvort gildi sé nálægt eða langt frá meðaltalinu.
Gerum ráð fyrir að bæði Rósa og Binh versli í stórmarkaði A. Rósa bíður á kassanum í sjö mínútur og Binh bíður í eina mínútu. Í stórmarkaði A er meðalbiðtíminn fimm mínútur og staðalfrávikið er tvær mínútur. Hægt er að nota staðalfrávikið til að ákvarða hvort gildi sé nálægt eða langt frá meðaltalinu. z-gildi er staðlað gildi sem gerir okkur kleift að bera saman gagnasöfn. Það segir okkur hversu mörgum staðalfrávikum gildi er frá meðaltalinu og er reiknað sem hlutfallið á milli mismunarins á tilteknu gildi og þýðismeðaltalinu, og staðalfráviks þýðisins.
Við getum notað gefnar upplýsingar til að búa til töfluna hér að neðan.
| Stórmarkaður | Staðalfrávik þýðis, σ | Einstakt gildi, x | Þýðismeðaltal, μ |
|---|---|---|---|
| Stórmarkaður A | 2 mínútur | 7, 1 | 5 |
| Stórmarkaður B | 4 mínútur | 5 |
Þar sem Rósa og Binh versla aðeins í stórmarkaði A getum við hunsað röðina fyrir stórmarkað B.
Við þurfum gildin úr fyrstu röðinni til að ákvarða fjölda staðalfrávika yfir eða undir meðaltalinu sem hver einstakur biðtími er; við getum gert það með því að reikna út tvö mismunandi z-gildi.
Rósa beið í sjö mínútur, þannig að z-gildið sem táknar þetta frávik frá þýðismeðaltalinu má reikna sem
z-gildið einn segir okkur að biðtími Rósu er einu staðalfráviki yfir meðalbiðtímanum sem er fimm mínútur.
Binh beið í eina mínútu, þannig að z-gildið sem táknar þetta frávik frá þýðismeðaltalinu má reikna sem
z-gildið -2 segir okkur að biðtími Binhs sé tveimur staðalfrávikum undir meðalbiðtímanum sem er fimm mínútur.
Gildi sem er tveimur staðalfrávikum frá meðaltalinu er á mörkum þess sem margir tölfræðingar myndu telja vera langt frá meðaltalinu. Að telja gögn vera langt frá meðaltalinu ef þau eru meira en tvö staðalfrávik í burtu er frekar gróf þumalputtaregla en ströng regla. Almennt hefur lögun dreifingar gagnanna áhrif á hversu mikið af gögnunum er lengra í burtu en tvö staðalfrávik. Þú munt læra meira um þetta í síðari köflum.
Talnalínan getur hjálpað þér að skilja staðalfrávik. Ef við myndum setja fimm og sjö á talnalínu er sjö hægra megin við fimm. Við segjum þá að sjö sé eitt staðalfrávik til hægri við fimm vegna þess að 5 + (1)(2) = 7.
Ef einn væri einnig hluti af gagnasafninu, þá er einn tvö staðalfrávik til vinstri við fimm vegna þess að 5 + (–2)(2) = 1.
- Almennt gildir: gildi = meðaltal + (# staðalfrávika)(staðalfrávik)
- þar sem # staðalfrávika er fjöldi staðalfrávika
- Fjöldi staðalfrávika þarf ekki að vera heiltala.
- Einn er tveimur staðalfrávikum minna en meðaltalið fimm vegna þess að 1 = 5 + (–2)(2).
Jöfnuna gildi = meðaltal + (# staðalfrávika)(staðalfrávik) má setja fram fyrir úrtak og þýði á eftirfarandi hátt:
- Úrtak: x = x̄ + (# staðalfrávika) ( s )
- Þýði: x = μ + (# staðalfrávika) ( σ ) .
Lágstafurinn s táknar staðalfrávik úrtaks og gríski stafurinn σ (lágstafur) táknar staðalfrávik þýðis. Táknið x̄ er meðaltal úrtaks og gríska táknið μ er meðaltal þýðis.
Útreikningur á staðalfráviki
Ef x er tala, þá er mismunurinn x - meðaltal kallaður frávik hennar. Í gagnasafni eru jafn mörg frávik og stök í gagnasafninu. Frávikin eru notuð til að reikna út staðalfrávikið. Ef tölurnar tilheyra þýði er frávik táknað með x - μ. Fyrir úrtaksgögn er frávik táknað með x - x̄.
Aðferðin við að reikna staðalfrávikið fer eftir því hvort tölurnar eru allt þýðið eða gögn úr úrtaki. Útreikningarnir eru svipaðir en ekki nákvæmlega eins. Þess vegna fer táknið sem notað er fyrir staðalfrávikið eftir því hvort það er reiknað út frá þýði eða úrtaki. Lágstafurinn s táknar staðalfrávik úrtaks og gríski stafurinn σ (lágstafur sigma) táknar staðalfrávik þýðis. Ef úrtakið hefur sömu eiginleika og þýðið ætti s að vera gott mat á σ.
Til að reikna staðalfrávik þurfum við fyrst að reikna dreifni. Dreifni er meðaltal af ferningum frávikanna (x - x̄ gildin fyrir úrtak eða x - μ gildin fyrir þýði). Táknið σ 2 stendur fyrir dreifni þýðis; staðalfrávik þýðis σ er kvaðratrótin af dreifni þýðis. Táknið s 2 stendur fyrir dreifni úrtaks; staðalfrávik úrtaks s er kvaðratrótin af dreifni úrtaks. Þú getur hugsað um staðalfrávik sem sérstakt meðaltal frávikanna.
Ef tölurnar koma úr manntali af öllu þýðinu en ekki úrtaki, þegar við reiknum meðaltal af ferningum frávikanna til að finna dreifni, deilum við með N, fjölda staka í þýðinu. Ef gögnin eru úr úrtaki frekar en þýði, þegar við reiknum meðaltal af ferningum frávikanna, deilum við með n - 1, einum færra en fjöldi staka í úrtakinu.
Jöfnur fyrir staðalfrávik úrtaks
- s = Σ ( x - x̄ ) 2/n - 1 eða s = Σ f ( x - x̄ ) 2/n - 1
- Fyrir staðalfrávik úrtaks er nefnarinn n - ; það er, stærð úrtaksins að frádregnu 1.
Jöfnur fyrir staðalfrávik þýðis
- σ = Σ ( x - μ ) 2/N eða σ = Σ f ( x - μ ) 2/N
- Fyrir staðalfrávik þýðis er nefnarinn N, fjöldi staka í þýðinu.
Í þessum jöfnum stendur f fyrir tíðni þess sem gildi birtist. Til dæmis, ef gildi birtist einu sinni, er f einn. Ef gildi birtist þrisvar sinnum í gagnasafninu eða þýðinu, er f þrír.
Tegundir breytileika í úrtökum
Þegar rannsakendur rannsaka þýði nota þeir oft úrtak, annað hvort til þæginda eða vegna þess að ekki er hægt að nálgast allt þýðið. Breytileiki er hugtakið sem notað er til að lýsa þeim mun sem getur komið fram í þessum niðurstöðum. Algengar tegundir breytileika eru eftirfarandi:
- Athugunar- eða mælingarbreytileiki
- Náttúrulegur breytileiki
- Framkallaður breytileiki
- Úrtaksbreytileiki
Hér eru nokkur dæmi til að lýsa hverri tegund breytileika:
Dæmi 1: Mælingarbreytileiki
Mælingarbreytileiki á sér stað þegar munur er á tækjunum sem notuð eru til að mæla eða á fólkinu sem notar þessi tæki. Ef við erum að safna gögnum um hversu langan tíma það tekur fyrir bolta að falla úr hæð með því að láta nemendur mæla tímann á fallinu með skeiðklukku, gætum við upplifað mælingarbreytileika ef skeiðklukkurnar tvær sem notaðar voru voru framleiddar af mismunandi framleiðendum. Til dæmis mælir ein skeiðklukka upp á næstu sekúndu, en hin mælir upp á næsta tíunda hluta úr sekúndu. Við gætum líka upplifað mælingarbreytileika vegna þess að tveir mismunandi aðilar eru að safna gögnunum. Viðbragðstími þeirra við að ýta á hnappinn á skeiðklukkunni gæti verið mismunandi; þannig munu niðurstöðurnar vera breytilegar í samræmi við það. Munurinn á niðurstöðum gæti verið undir áhrifum frá mælingarbreytileika.
Dæmi 2: Náttúrulegur breytileiki
Náttúrulegur breytileiki stafar af þeim mun sem á sér stað náttúrulega vegna þess að einstaklingar í þýði eru ólíkir hver öðrum. Til dæmis, ef við höfum tvær eins maísplöntur og við gefum báðum plöntunum jafn mikið vatn og sólarljós, gætu þær samt vaxið á mismunandi hraða einfaldlega vegna þess að þær eru tvær mismunandi maísplöntur. Muninn á útkomunni má skýra með náttúrulegum breytileika.
Dæmi 3: Framkallaður breytileiki
Framkallaður breytileiki er andstæðan við náttúrulegan breytileika. Þetta gerist vegna þess að við höfum framkallað breytileika á tilbúinn hátt sem, samkvæmt skilgreiningu, var ekki til staðar náttúrulega. Til dæmis skiptum við fólki í tvo mismunandi hópa til að rannsaka minni og við framköllum breytu í öðrum hópnum með því að takmarka svefn þeirra. Munurinn á útkomunni gæti verið undir áhrifum frá framkölluðum breytileika.
Dæmi 4: Úrtaksbreytileiki
Úrtaksbreytileiki á sér stað þegar mörg slembiúrtök eru tekin úr sama þýði. Til dæmis, ef ég geri fjórar kannanir á 50 manns sem eru valdir af handahófi úr tilteknu þýði, gæti munurinn á útkomunni verið undir áhrifum frá úrtaksbreytileika.
Úrtaksbreytileiki lýsistærðar
Lýsistærð úrtakadreifingar var rædd í Lýsandi tölfræði: Mælikvarðar á miðju gagna. Hversu mikið lýsistærðin er breytileg frá einu úrtaki til annars er þekkt sem úrtaksbreytileiki lýsistærðar. Þú mælir venjulega úrtaksbreytileika lýsistærðar með staðalskekkju hennar. Staðalskekkja meðaltalsins er dæmi um staðalskekkju. Staðalskekkjan er staðalfrávik úrtakadreifingarinnar. Með öðrum orðum, það er meðalstaðalfrávikið sem hlýst af endurtekinni úrtöku. Þú munt fjalla um staðalskekkju meðaltalsins í kaflanum Höfuðsetning tölfræðinnar (ekki núna). Rithátturinn fyrir staðalskekkju meðaltalsins er σ/n, þar sem σ er staðalfrávik þýðisins og n er stærð úrtaksins.
Dæmi 2.33
Í fimmta bekk hafði kennarinn áhuga á meðalaldri og staðalfráviki úrtaks á aldri nemenda sinna. Eftirfarandi gögn eru aldur fyrir ÚRTAK af n = 20 nemendum í fimmta bekk. Aldurinn er námundaður að næsta hálfa ári.
9, 9,5, 9,5, 10, 10, 10, 10, 10,5, 10,5, 10,5, 10,5, 11, 11, 11, 11, 11, 11, 11,5, 11,5, 11,5
Meðalaldurinn er 10,53 ár, námundað að tveimur aukastöfum.
Hægt er að reikna dreifnina með því að nota töflu. Síðan er staðalfrávikið reiknað með því að taka kvaðratrótina af dreifninni. Við munum útskýra hluta töflunnar eftir að hafa reiknað s.
| Gögn | Tíðni | Frávik | Frávik 2 | (Tíðni)( Frávik 2 ) |
|---|---|---|---|---|
| x | f | ( x - x̄ ) | ( x - x̄ ) 2 | ( f )( x - x̄ ) 2 |
| 9 | 1 | 9 - 10,525 = –1,525 | (–1,525) 2 = 2,325625 | 1 × 2,325625 = 2,325625 |
| 9,5 | 2 | 9,5 - 10,525 = –1,025 | (–1,025) 2 = 1,050625 | 2 × 1,050625 = 2,101250 |
| 10 | 4 | 10 - 10,525 = –0,525 | (–0,525) 2 = 0,275625 | 4 × 0,275625 = 1,1025 |
| 10,5 | 4 | 10,5 - 10,525 = –0,025 | (–0,025) 2 = 0,000625 | 4 × 0,000625 = 0,0025 |
| 11 | 6 | 11 - 10,525 = 0,475 | (0,475) 2 = 0,225625 | 6 × 0,225625 = 1,35375 |
| 11,5 | 3 | 11,5 - 10,525 = 0,975 | (0,975) 2 = 0,950625 | 3 × 0,950625 = 2,851875 |
| Samtals er 9,7375. |
Í síðasta dálkinum er einfaldlega margfaldað hvert ferningsfrávik með tíðni viðkomandi gagnagildis.
Úrtaksdreifnin, s2 , er jöfn summu síðasta dálksins (9,7375) deilt með heildarfjölda gagnagilda að frádregnum einum (20 - 1):
Staðalfrávik úrtaksins s er jafnt og kvaðratrótin af úrtaksdreifninni:
s = 0,5125 = 0,715891 , sem er námundað að tveimur aukastöfum, s = 0,72.
Venjulega reiknarðu staðalfrávikið í reiknivél eða tölvu. Milliniðurstöður eru ekki námundaðar. Þetta er gert til að tryggja nákvæmni.
- Fyrir eftirfarandi dæmi, mundu að gildi = meðaltal + (# staðalfrávika)(staðalfrávik) . Staðfestu meðaltal og staðalfrávik í reiknivél eða tölvu. Athugaðu að þessar jöfnur eru leiddar út með því að umraða z-gildisjöfnunum algebrulega, hvort sem gefnar eru stikar eða lýsistærðir.
- Fyrir úrtak: x = x̄ + (# staðalfrávika)( s )
- Fyrir þýði: x = μ + (# staðalfrávika)( σ )
- Í þessu dæmi, notaðu x = x̄ + (# staðalfrávika)( s ) vegna þess að gögnin eru úr úrtaki
- Staðfestu meðaltal og staðalfrávik í reiknivél eða tölvu.
- Finndu gildið sem er einu staðalfráviki ofan við meðaltalið. Finndu ( x̄ + 1 s ).
- Finndu gildið sem er tveimur staðalfrávikum neðan við meðaltalið. Finndu ( x̄ - 2 s ).
- Finndu gildin sem eru 1,5 staðalfrávikum frá (neðan og ofan við) meðaltalinu.
Lausn
- Notkun TI-83, 83+, 84 eða 84+ reiknivélar. Hreinsaðu listana L1 og L2. Ýttu á STAT 4:ClrList. Sláðu inn 2nd 1 fyrir L1, kommu (,) og 2nd 2 fyrir L2. Sláðu gögnin inn í listaritilinn. Ýttu á STAT 1:EDIT. Ef þarf skaltu hreinsa listana með því að færa bendilinn upp í heitið. Ýttu á CLEAR og færðu bendilinn niður. Settu gagnagildin (9; 9,5; 10; 10,5; 11; 11,5) í lista L1 og tíðnirnar (1, 2, 4, 4, 6, 3) í lista L2. Notaðu örvatakkana til að færa þig. Ýttu á STAT og færðu þig að CALC. Ýttu á 1:1-VarStats og sláðu inn L1 (2nd 1), L2 (2nd 2). Ekki gleyma kommunni. Ýttu á ENTER. x̄ = 10,525. Notaðu Sx vegna þess að þetta eru úrtaksgögn (ekki þýði): Sx = 0,715891.
- ( x̄ + 1 s ) = 10,53 + (1)(0,72) = 11,25
- ( x̄ - 2 s ) = 10,53 - (2)(0,72) = 9,09
- ( x̄ - 1,5 s ) = 10,53 - (1,5)(0,72) = 9,45 ( x̄ + 1,5 s ) = 10,53 + (1,5)(0,72) = 11,61
Útskýring á útreikningi staðalfráviks sem sýndur er í töflunni
Frávikin sýna hversu dreifð gögnin eru umhverfis meðaltalið. Gagnagildið 11,5 er lengra frá meðaltalinu en gagnagildið 11, sem sést á frávikunum 0,97 og 0,47. Jákvætt frávik verður þegar gagnagildið er stærra en meðaltalið, en neikvætt frávik verður þegar gagnagildið er minna en meðaltalið. Frávikið er –1,525 fyrir gagnagildið níu. Ef þú leggur saman frávikin er summan alltaf núll. Við getum lagt saman margfeldi tíðni og frávika til að sýna að summa frávikanna er alltaf núll. 1 ( - 1,525 ) + 2 ( - 1,025 ) + 4 ( - 0,525 ) + 4 ( - 0,025 ) + 6 ( 0,475 ) + 3 ( 0,975 ) = 0 Í sýnidæmi 2,33 eru n = 20 frávik. Því er ekki hægt að leggja frávikin einfaldlega saman til að fá dreifingu gagnanna. Með því að hefja frávikin í annað veldi gerir þú þau að jákvæðum tölum og summan verður einnig jákvæð. Dreifnin er þá meðaltal frávikanna í öðru veldi.
Dreifnin er mælikvarði í öðru veldi og hefur ekki sömu mælieiningar og gögnin. Að taka kvaðratrótina leysir þetta vandamál. Staðalfrávikið mælir dreifinguna í sömu mælieiningum og gögnin.
Taktu eftir að í stað þess að deila með n = 20, var deilt með n - 1 = 20 - 1 = 19 í útreikningnum vegna þess að gögnin eru úrtak. Fyrir úrtaksdreifni deilum við með úrtaksstærðinni að frádregnum einum ( n - 1). Hvers vegna ekki að deila með n? Svarið tengist þýðisdreifninni. Úrtaksdreifnin er mat á þýðisdreifninni. Byggt á fræðilegri stærðfræði sem liggur að baki þessum útreikningum, gefur það betra mat á þýðisdreifninni að deila með ( n - 1).
Staðalfrávikið, s eða σ, er annaðhvort núll eða stærra en núll. Að lýsa gögnunum með tilliti til dreifingar kallast breytileiki. Breytileiki í gögnum fer eftir þeirri aðferð sem notuð er til að fá niðurstöðurnar, til dæmis með mælingum eða slembiúrtaki. Þegar staðalfrávikið er núll er engin dreifing; það er að segja, öll gagnagildin eru jöfn. Staðalfrávikið er lítið þegar öll gögnin eru samþjöppuð nálægt meðaltalinu og stærra þegar gagnagildin sýna meiri breytileika frá meðaltalinu. Þegar staðalfrávikið er mun stærra en núll eru gagnagildin mjög dreifð umhverfis meðaltalið; útlagar geta gert s eða σ mjög stórt.
Staðalfrávikið getur virst óljóst þegar það er fyrst kynnt. Með því að setja gögnin upp í línurit geturðu fengið betri tilfinningu fyrir frávikunum og staðalfrávikinu. Þú munt komast að því að í samhverfum dreifingum getur staðalfrávikið verið mjög gagnlegt, en í skekktum dreifingum gæti staðalfrávikið ekki komið að miklu gagni. Ástæðan er sú að báðar hliðar skekkts dreifingar hafa mismunandi dreifingu. Í skekktri dreifingu er betra að skoða fyrsta fjórðungamark, miðgildi, þriðja fjórðungamark, minnsta gildi og stærsta gildi. Vegna þess að tölur geta verið ruglandi skaltu alltaf setja gögnin þín upp í línurit. Sýndu gögnin þín í stuðlariti eða kassarit.
Dæmi 2.34 ,34
Notaðu eftirfarandi gögn (einkunnir úr fyrsta prófi) úr vorönn í stærðfræðigreiningu hjá Susan Dean:
33, 42, 49, 49, 53, 55, 55, 61, 63, 67, 68, 68, 69, 69, 72, 73, 74, 78, 80, 83, 88, 88, 88, 90, 92, 94, 94, 94, 94, 96, 100
Langi vinstri armurinn í kassaritinu sést einnig vinstra megin í stuðlaritinu. Dreifing prófskoranna í neðri 50 prósentunum er meiri (73 - 33 = 40) en dreifingin í efri 50 prósentunum (100 - 73 = 27). Stuðlaritið, kassarit og grafið sýna öll að gögnin eru skekkt til vinstri.
Lausn
| Gögn | Tíðni | Hlutfallsleg tíðni | Uppsöfnuð hlutfallsleg tíðni |
|---|---|---|---|
| 33 | 1 | 0,032 | 0,032 |
| 42 | 1 | 0,032 | 0,064 |
| 49 | 2 | 0,065 | 0,129 |
| 53 | 1 | 0,032 | 0,161 |
| 55 | 2 | 0,065 | 0,226 |
| 61 | 1 | 0,032 | 0,258 |
| 63 | 1 | 0,032 | 0,290 |
| 67 | 1 | 0,032 | 0,322 |
| 68 | 2 | 0,065 | 0,387 |
| 69 | 2 | 0,065 | 0,452 |
| 72 | 1 | 0,032 | 0,484 |
| 73 | 1 | 0,032 | 0,516 |
| 74 | 1 | 0,032 | 0,548 |
| 78 | 1 | 0,032 | 0,580 |
| 80 | 1 | 0,032 | 0,612 |
| 83 | 1 | 0,032 | 0,644 |
| 88 | 3 | 0,097 | 0,741 |
| 90 | 1 | 0,032 | 0,773 |
| 92 | 1 | 0,032 | 0,805 |
| 94 | 4 | 0,129 | 0,934 |
| 96 | 1 | 0,032 | 0,966 |
| 100 | 1 | 0,032 | 0,998 (Af hverju er þetta gildi ekki 1?) |
Staðalfrávik flokkaðra tíðnitaflna
Mundu að fyrir flokkuð gögn þekkjum við ekki einstök gagnagildi, þannig að við getum ekki lýst dæmigerðu gildi gagnanna af nákvæmni. Með öðrum orðum getum við ekki fundið nákvæmt meðaltal, miðgildi eða tíðasta gildi. Við getum hins vegar ákvarðað besta mat á miðsækni með því að finna meðaltal flokkuðu gagnanna með formúlunni M e a n o f F r e q u e n c y T a b l e = ∑ f m/∑ f , þar sem f = eru tíðnir bila og m = interval eru miðpunktar.
Rétt eins og við gátum ekki fundið nákvæmt meðaltal, getum við ekki heldur fundið nákvæmt staðalfrávik. Mundu að staðalfrávik lýsir með tölulegum hætti því fráviki sem búast má við að gagnagildi hafi frá meðaltalinu. Á mannamáli gerir staðalfrávikið okkur kleift að bera saman hversu óvenjuleg einstök gögn eru í samanburði við meðaltalið.
Dæmi 2.35 ,35
Finndu staðalfrávikið fyrir gögnin í töflu 2.34.
| Flokkur | Tíðni, f | Miðpunktur, m | m 2 | x̄ 2 | fm 2 | Staðalfrávik |
|---|---|---|---|---|---|---|
| 0–2 | 1 | 1 | 1 | 7,58 | 1 | 3,5 |
| 3–5 | 6 | 4 | 16 | 7,58 | 96 | 3,5 |
| 6–8 | 10 | 7 | 49 | 7,58 | 490 | 3,5 |
| 9–11 | 7 | 10 | 100 | 7,58 | 700 | 3,5 |
| 12–14 | 0 | 13 | 169 | 7,58 | 0 | 3,5 |
| 15–17 | 2 | 16 | 256 | 7,58 | 512 | 3,5 |
Fyrir þetta gagnasafn höfum við meðaltalið, x̄ = 7,58, og staðalfrávikið, s x = 3,5. Þetta þýðir að búast mætti við að slembiúrtakið gagnagildi væri 3,5 einingum frá meðaltalinu. Ef við skoðum fyrsta flokkinn sjáum við að miðpunktur flokksins er jafn einum. Þetta er næstum tvö heil staðalfrávik frá meðaltalinu þar sem 7,58 - 3,5 - 3,5 = 0,58. Þó að jafnan til að reikna út staðalfrávikið sé ekki flókin, s x = f ( m - x̄ ) 2/n - 1 , þar sem s x = staðalfrávik úrtaks, x̄ = meðaltal úrtaks; eru útreikningarnir þreytandi. Oftast er best að nota tækni við útreikningana.
Samanburður á gildum úr mismunandi gagnasöfnum
Eins og útskýrt var áður gerir z-gildi okkur kleift að bera saman tölfræði úr mismunandi gagnasöfnum. Ef gagnasöfnin hafa mismunandi meðaltöl og staðalfrávik getur verið villandi að bera gagnagildin beint saman.
- Fyrir hvert gagnagildi skaltu reikna út hversu mörgum staðalfrávikum frá meðaltali þess gildið er.
- Með táknum verða jöfnurnar til að reikna Z-gildi eftirfarandi.
Úrtak z = (x - x̄)/s Þýði z = (x - μ)/σ
Eins og sýnt er í töflunni er efri jafnan notuð þegar aðeins meðaltal og staðalfrávik úrtaks eru gefin. Þegar meðaltal og staðalfrávik þýðis eru gefin er neðri jafnan notuð.
Dæmi 2.36 ,36
Tveir nemendur, John og Ali, úr mismunandi framhaldsskólum, vildu komast að því hvor væri með hærri meðaleinkunn (GPA) í samanburði við sinn skóla. Hvor nemandinn var með hærri meðaleinkunn í samanburði við sinn skóla?
| Nemandi | Meðaleinkunn (GPA) | Meðaleinkunn skóla | Staðalfrávik skóla |
|---|---|---|---|
| John | 2,85 | 3,0 | 0,7 |
| Ali | 77 | 80 | 10 |
Lausn
Fyrir hvorn nemanda skal ákvarða hversu mörgum staðalfrávikum (# staðalfrávika) meðaleinkunn hans er frá meðaltali skólans. Gætið vel að formerkjum þegar svarið er borið saman og túlkað.
z = fjöldi staðalfrávika = (gildi - meðaltal)/(staðalfrávik) = (x - μ)/σ
Fyrir John er z = (2,85 - 3,0)/0,7 = -0,21.
Fyrir Ali er z = (77 - 80)/10 = -0,3.
John er með betri meðaleinkunn í samanburði við sinn skóla vegna þess að meðaleinkunn hans er 0,21 staðalfrávikum undir meðaltali skólans, en meðaleinkunn Ali er 0,3 staðalfrávikum undir meðaltali síns skóla.
z-gildi Johns, –0,21, er hærra en z-gildi Ali, –0,3. Fyrir meðaleinkunn eru hærri gildi betri, þannig að við ályktum að John sé með betri meðaleinkunn í samanburði við sinn skóla. z-gildið sem táknar einkunn Johns er ekki jafn langt undir meðaltalinu og z-gildið sem táknar einkunn Ali.
Eftirfarandi listar gefa upp nokkrar staðreyndir sem veita aðeins meiri innsýn í hvað staðalfrávikið segir okkur um dreifingu gagnanna.
Fyrir
hvaða
gagnasafn sem er, óháð því hver dreifing gagnanna er, gildir eftirfarandi:
- Að minnsta kosti 75 prósent gagnanna eru innan tveggja staðalfrávika frá meðaltalinu.
- Að minnsta kosti 89 prósent gagnanna eru innan þriggja staðalfrávika frá meðaltalinu.
- Að minnsta kosti 95 prósent gagnanna eru innan 4,5 staðalfrávika frá meðaltalinu.
- Þetta er þekkt sem regla Chebyshevs.
Bjöllulaga dreifing er normaldreifing og samhverf, sem þýðir að hægt er að brjóta ferilinn saman um samhverfuás sem dreginn er í gegnum miðgildið, og vinstri og hægri hliðar ferilsins myndu falla nákvæmlega hvor á aðra. Í bjöllulaga dreifingu eru meðaltal, miðgildi og tíðasta gildi öll á sama stað.
Fyrir gögn sem hafa dreifingu sem er
bjöllulaga
og
samhverf
, gildir eftirfarandi:
- Um það bil 68 prósent gagnanna eru innan eins staðalfráviks frá meðaltalinu.
- Um það bil 95 prósent gagnanna eru innan tveggja staðalfrávika frá meðaltalinu.
- Meira en 99 prósent gagnanna eru innan þriggja staðalfrávika frá meðaltalinu.
- Þetta er þekkt sem reynslureglan (e. Empirical Rule).
- Mikilvægt er að hafa í huga að þessi regla gildir aðeins þegar lögun gagnadreifingarinnar er bjöllulaga og samhverf; við munum læra meira um þetta þegar við rannsökum normal- eða Gauss-líkindadreifingu í síðari köflum.