8.2 Meðaltal eins þýðis reiknað með t-dreifingu Students
Í reynd þekkjum við sjaldnast staðalfrávik þýðis. Áður fyrr, þegar úrtaksstærðin var mikil, olli þessi óþekkta stærð tölfræðingum ekki vandræðum. Þeir notuðu staðalfrávik úrtaksins s sem mat á σ og héldu áfram sem fyrr til að reikna öryggisbil með nægilega nákvæmum niðurstöðum. Hins vegar lentu tölfræðingar í vandræðum þegar úrtaksstærðin var lítil. Lítil úrtaksstærð olli ónákvæmni í öryggisbilinu.
William S. Gosset (1876–1937) hjá Guinness-brugghúsinu í Dyflinni á Írlandi lenti í þessu vandamáli. Tilraunir hans með humla og bygg gáfu af sér mjög fá úrtök. Að skipta einfaldlega út σ fyrir s gaf ekki nákvæmar niðurstöður þegar hann reyndi að reikna öryggisbil. Hann áttaði sig á því að hann gæti ekki notað normaldreifingu við útreikninginn; hann komst að því að raunveruleg dreifing er háð úrtaksstærðinni. Þetta vandamál leiddi hann til að uppgötva það sem kallast t-dreifing Students. Nafnið kemur til af því að Gosset skrifaði undir dulnefninu Student.
Fram undir miðjan áttunda áratuginn notuðu sumir tölfræðingar normalnálgun fyrir stór úrtök og t-dreifingu Students aðeins þegar úrtaksstærðin var 30 eða minni. Með grafískum reiknivélum og tölvum er nú venjan að nota t-dreifingu Students alltaf þegar s er notað sem mat á σ.
Ef tekið er einfalt slembiúrtak af stærð n úr þýði sem hefur um það bil normaldreifingu með meðaltali μ og óþekktu staðalfráviki þýðis σ, og t-gildið t = (x̄ – μ)/(s/√n) er reiknað, þá fylgja t-gildin t-dreifingu Students með n – 1 frígráðum. t-gildið hefur sömu túlkun og z-gildið: Það mælir hversu langt x̄ er frá meðaltali sínu μ. Fyrir hverja úrtaksstærð n er til mismunandi t-dreifing Students.
Frígráðurnar (df), n – 1, eru úrtaksstærðin að frádregnu 1.
Eiginleikar t-dreifingar Students
Línuritið fyrir t-dreifingu Students er svipað og staðlaða normalferlið.
Meðaltalið fyrir t-dreifingu Students er núll og dreifingin er samhverf um núll.
Nákvæm lögun t-dreifingar Students fer eftir frígráðum. Eftir því sem frígráðum fjölgar verður línurit t-dreifingar Students líkara línuriti staðlaðrar normaldreifingar.
Gert er ráð fyrir að undirliggjandi þýði einstakra athugana sé normaldreift með óþekktu meðaltali þýðis μ og óþekktu staðalfráviki þýðis σ. Stærð undirliggjandi þýðis skiptir almennt ekki máli nema hún sé mjög lítil. Ef hún er bjöllulaga (normal) er forsendan uppfyllt og þarfnast ekki umræðu. Gert er ráð fyrir slembiúrtaki, en það er algjörlega aðskilin forsenda frá normaldreifingu.
Reiknivélar og tölvur geta auðveldlega reiknað t-líkur. TI-83, 83+ og 84+ hafa tcdf fall til að finna líkur fyrir gefin gildi á t. Skipunin er tcdf(neðri mörk, efri mörk, frígráður). Fyrir öryggisbil þurfum við hins vegar andhverfar líkur til að finna t-gildið þegar líkurnar eru þekktar.
Á TI-84+ má nota invT skipunina í DISTRibution valmyndinni. invT virkar svipað og invNorm og tekur tvö inntök: invT(flatarmál vinstra megin, frígráður). Úttakið er t-gildið sem samsvarar tilgreinda flatarmálinu. TI-83 og 83+ hafa ekki invT skipunina. TI-89 hefur andhverfa T skipun.
Einnig er hægt að nota líkindatöflu fyrir t-dreifingu Students. Taflan gefur gagnrýnin t-gildi sem samsvara öryggisstigi (dálkur) og frígráðum (röð). TI-86 hefur ekki invT forrit eða skipun, þannig að ef sú reiknivél er notuð þarf að nota líkindatöflu fyrir t-dreifingu Students. Þegar t-tafla er notuð skal athuga að sumar töflur sýna öryggisstig í dálkafyrirsögnum, en aðrar sýna aðeins samsvarandi flatarmál í öðrum eða báðum hölum. t-tafla Students (sjá Viðauka H: Töflur) gefur t-gildi miðað við frígráður og líkur í hægri hala. Taflan er mjög takmörkuð; reiknivélar og tölvur geta reiknað t-líkur nákvæmlega.
Ef staðalfrávik þýðis er ekki þekkt eru skekkjumörk þýðismeðaltalsins:
EBM = (t_(α/2))(s/√n), þar sem t_(α/2) er t-gildið með flatarmálið α/2 hægra megin, df = n – 1 eru frígráður og s er staðalfrávik úrtaks.
Snið öryggisbilsins er
(x̄ − EBM, x̄ + EBM).
Notkun TI-83, 83+, 84 og 84+ reiknivél
Til að reikna öryggisbilið beint skuluð þið ýta á STAT, færa ykkur yfir á TESTS, færa ykkur niður á 8:TInterval og ýta á ENTER (eða ýta beint á 8).
Dæmi 8.8
Gerið ráð fyrir að þið rannsakið nálastungumeðferð til að meta hversu áhrifarík hún er við að lina sársauka. Þið mælið skynjunarhraða hjá 15 þátttakendum með niðurstöðunum sem gefnar eru. Notið úrtaksgögnin til að smíða 95 prósenta öryggisbil fyrir meðalskynjunarhraða þýðisins, sem gert er ráð fyrir að sé normaldreift. Lausnin er sýnd skref fyrir skref og með TI-83, 83+ eða 84+ reiknivél.
Fyrsta lausnin er skref fyrir skref (Lausn A).
Önnur lausnin notar TI-83+ og TI-84 reiknivélar (Lausn B).
Til að finna öryggisbilið þarf úrtaksmeðaltalið, x̄, og EBM.
x̄ = (8,6 + 9,4 + 7,9 + 6,8 + 8,3 + 7,3 + 9,2 + 9,6 + 8,7 + 11,4 + 10,3 + 5,4 + 8,1 + 5,5 + 6,9)/15 = 8,2267; s = √[((8,6 − x̄)² + (9,4 − x̄)² + ⋯ + (5,5 − x̄)² + (6,9 − x̄)²)/14] = 1,6722; n = 15.
df = 15 – 1 = 14. Þar sem CL = 0,95 er α = 1 – CL = 1 – 0,95 = 0,05.
α/2 = 0,025; t_(α/2) = t_0,025
Flatarmálið til hægri við t_0,025 er 0,025 og flatarmálið til vinstri við t_0,025 er 1 – 0,025 = 0,975.
t_(α/2) = t_0,025 = 2,14 með því að nota invT(0,975, 14) á TI-84+ reiknivél.
EBM = (t_(α/2))(s/√n).
EBM = (2,14)(1,6722/√15) = 0,924.
x̄ – EBM = 8,2267 – 0,9240 = 7,30.
x̄ + EBM = 8,2267 + 0,9240 = 9,15.
95 prósenta öryggisbilið er (7,30, 9,15).
Við metum með 95 prósenta öryggi að raunverulegur meðalskynjunarhraði þýðisins sé á milli 7,30 og 9,15.
Notkun TI-83, 83+, 84 og 84+ reiknivél
Ýttu á STAT og færðu þig yfir á TESTS. Færðu þig niður á 8:TInterval og ýttu á ENTER (eða ýttu beint á 8). Færðu þig á Data og ýttu á ENTER. Færðu þig niður á List og sláðu inn nafn listans þar sem gögnin eru geymd. Það ætti að vera 1 á eftir Freq. Færðu þig niður á C-level og sláðu inn 0,95. Færðu þig niður á Calculate og ýttu á ENTER. 95 prósenta öryggisbilið er (7,3006, 9,1527).
Athugasemd
Þegar skekkjumörk eru reiknuð er einnig hægt að nota líkindatöflu fyrir t-dreifingu Students til að finna gildið á t. Taflan gefur t-gildi sem svara til öryggisstigs (dálkur) og frígráða (röð); t-gildið finnst þar sem röð og dálkur skerast í töflunni.
Dæmi 8.9
Hópur rannsakenda vinnur að því að skilja umfang iðnaðarmengunar í mannslíkamanum. Iðnaðarefni geta borist í líkamann með mengun eða sem innihaldsefni í neysluvörum. Í október 2008 prófuðu vísindamennirnir naflastrengsblóðsýni úr 20 nýburum í Bandaríkjunum. Naflastrengsblóðið var prófað fyrir 430 iðnaðarefnasamböndum, mengunarvöldum og öðrum efnum, þar á meðal efnum sem tengjast eituráhrifum á heila og taugakerfi, ónæmiskerfi, æxlunarfæri og frjósemi. Áhyggjur eru uppi um heilsufarsleg áhrif sumra efnanna á heila og taugakerfi. Tafla 8.3 sýnir hversu mörg af tilteknu efnunum fundust í naflastrengsblóði hvers ungbarns.
| 79 | 145 | 147 | 160 | 116 | 100 | 159 | 151 | 156 | 126 |
| 137 | 83 | 156 | 94 | 121 | 144 | 123 | 114 | 139 | 99 |
Notið þessi úrtaksgögn til að búa til 90 prósenta öryggisbil fyrir meðalfjölda tiltekinna iðnaðarefna sem finnast í blóði ungbarna.
Lausn A
Reikna á 90 prósenta öryggisbil: CL = 0,90, þannig að α = 1 – CL = 1 – 0,90 = 0,10. Þá er α/2 = 0,05 og t_(α/2) = t_0,05.
Samkvæmt skilgreiningu er flatarmálið hægra megin við t_0,05 jafnt og 0,05 og flatarmálið vinstra megin við t_0,05 er 1 – 0,05 = 0,95.
Notið töflu, reiknivél eða tölvu til að finna að t_0,05 = 1,729.
EBM = t_(α/2)(s/√n) = 1,729(25,965/√20) ≈ 10,038. Þá er x̄ – EBM = 127,45 – 10,038 = 117,412 og x̄ + EBM = 127,45 + 10,038 = 137,488.
Við metum með 90 prósenta öryggi að meðalfjöldi tiltekinna iðnaðarefna sem finnast í naflastrengsblóði í Bandaríkjunum sé á milli 117,412 og 137,488.
Lausn B
Notkun TI-83, 83+, 84 og 84+ reiknivél
Sláðu gögnin inn sem lista. Ýttu á STAT og færðu þig yfir á TESTS. Færðu þig niður á 8:TInterval og ýttu á ENTER (eða ýttu beint á 8). Færðu þig á Data og ýttu á ENTER. Færðu þig niður á List og sláðu inn nafn listans þar sem gögnin eru geymd. Færðu þig niður á Freq og sláðu inn 1. Færðu þig niður á C-level og sláðu inn 0,90. Færðu þig niður á Calculate og ýttu á ENTER. 90 prósenta öryggisbilið er (117,41, 137,49).