Námsgögn
Innskrá
Hleð efnisyfirliti...
Leita í bók...
Tölfræði (IS)
  • Formáli
  • Introduction
  • 1.1 Definitions of Statistics, Probability, and Key Terms
  • 1.2 Data, Sampling, and Variation in Data and Sampling
  • 1.3 Tíðni, tíðnitöflur og mælistig
  • 1.4 Tilraunahögun og siðfræði
  • 1.5 Tilraun með gagnasöfnun
  • 1.6 Úrtakstilraun
  • Lykilhugtök
  • Kaflarifjun
  • Æfing
  • Homework
  • Tengjum efnið saman: heimaverkefni
  • Heimildir
  • Lausnir
  • Introduction
  • 2.1 Stem-and-Leaf Graphs (Stemplots), Line Graphs, and Bar Graphs
  • 2.2 Histograms, Frequency Polygons, and Time Series Graphs
  • 2.3 Measures of the Location of the Data
  • 2.4 Box Plots
  • 2.5 Lýsistærðir fyrir miðju gagna
  • 2.6 Skewness and the Mean, Median, and Mode
  • 2.7 Mælikvarðar á dreifingu gagna
  • 2.8 Lýsandi tölfræði
  • Lykilhugtök
  • Kaflayfirlit
  • Formúluyfirlit
  • Æfingar
  • Heimaverkefni
  • Tengjum efnið saman: heimaverkefni
  • Heimildir
  • Lausnir
  • Inngangur
  • 3.1 Hugtök
  • 3.2 Óháðir og ósamrýmanlegir atburðir
  • 3.3 Tvær grunnreglur líkindafræðinnar
  • 3.4 Krosstöflur
  • 3.5 Líkindatré og Vennmyndir
  • 3.6 Efni í líkindafræði
  • Lykilhugtök
  • Kaflarifjun
  • Formúluyfirlit
  • Æfingar
  • Tökum þetta saman: Æfingar
  • Heimadæmi
  • Tökum þetta saman: Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 4.1 Líkindafall (PDF) fyrir strjála slembibreytu
  • 4.2 Meðaltal eða væntigildi og staðalfrávik
  • 4.3 Tvíkostadreifing (valfrjálst)
  • 4.4 Rúmfræðileg dreifing (valfrjálst)
  • 4.5 Happdrættisdreifing (valfrjálst)
  • 4.6 Poisson dreifing (valfrjálst)
  • 4.7 Strjál dreifing (spilastokkatilraun)
  • 4.8 Strjál dreifing (lukkuteningatilraun)
  • Lykilhugtök
  • Kaflarifjun
  • Formúluyfirlit
  • Æfingar
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 5.1 Þéttiföll samfelldra líkindadreifinga
  • 5.2 Jöfn dreifing
  • 5.3 Veldisdreifing (valfrjálst)
  • 5.4 Samfelld dreifing
  • Lykilhugtök
  • Upprifjun kafla
  • Formúluyfirlit
  • Æfingar
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 6.1 Staðlaða normaldreifingin
  • 6.2 Notkun normaldreifingar
  • 6.3 Normaldreifing—Hringtímar
  • 6.4 Normaldreifing—Lengd litlafingurs
  • Lykilhugtök
  • Upprifjun kafla
  • Formúluyfirlit
  • Æfingar
  • Heimaverkefni
  • Heimildir
  • Lausnir
  • Inngangur
  • 7.1 Höfuðsetning tölfræðinnar fyrir úrtaksmeðaltöl
  • 7.2 Höfuðsetning tölfræðinnar fyrir summur (valfrjálst)
  • 7.3 Notkun höfuðsetningar tölfræðinnar
  • 7.4 Höfuðsetning tölfræðinnar (smámynt)
  • 7.5 Höfuðsetning tölfræðinnar (smákökuuppskriftir)
  • Lykilhugtök
  • Upprifjun kafla
  • Formúluyfirlit
  • Æfingar
  • Heimaverkefni
  • Heimildir
  • Lausnir
  • Inngangur
  • 8.1 Meðaltal eins þýðis reiknað með normaldreifingu
  • 8.2 Meðaltal eins þýðis reiknað með t-dreifingu Students
  • 8.3 Þýðishlutfall
  • 8.4 Öryggisbil (húsnæðisverð)
  • 8.5 Öryggisbil (fæðingarstaður)
  • 8.6 Öryggisbil (hæðir kvenna)
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfing
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 9.1 Núlltilgátur og gagntilgátur
  • 9.2 Útkomur og villur af gerð I og II
  • 9.3 Dreifing sem þarf fyrir tilgátuprófun
  • 9.4 Sjaldgæfir atburðir, úrtakið og ákvörðun og niðurstaða
  • 9.5 Viðbótarupplýsingar og heildstæð dæmi um tilgátupróf
  • 9.6 Tilgátupróf fyrir eitt meðaltal og eitt hlutfall
  • Lykilhugtök
  • Kaflayfirlit
  • Formúluyfirlit
  • Æfingar
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 10.1 Tvö þýðismeðaltöl með óþekktum staðalfrávikum
  • 10.2 Tvö þýðismeðaltöl með þekktum staðalfrávikum
  • 10.3 Samanburður á tveimur óháðum þýðishlutföllum
  • 10.4 Pöruð úrtök (valfrjálst)
  • 10.5 Tilgátuprófun fyrir tvö meðaltöl og tvö hlutföll
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfing
  • Heimadæmi
  • Tekið saman: Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 11.1 Staðreyndir um kí-kvaðrat dreifinguna
  • 11.2 Próf á mátgæðum
  • 11.3 Próf á óhæði
  • 11.4 Próf á einsleitni
  • 11.5 Samanburður á kí-kvaðrat prófum
  • 11.6 Próf á dreifni í einu þýði
  • 11.7 Tölfræðiverkefni 1: Kí-kvaðrat mátgæðapróf
  • 11.8 Tölfræðiverkefni 2: Kí-kvaðrat próf á óhæði
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfingar
  • Heimadæmi
  • Tekið saman: Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 12.1 Línulegar jöfnur
  • 12.2 Aðhvarfsjafnan
  • 12.3 Prófun á marktækni fylgnistuðulsins (valfrjálst)
  • 12.4 Spá (valfrjálst)
  • 12.5 Fráviksgildi
  • 12.6 Aðhvarfsgreining (fjarlægð frá skóla) (valfrjálst)
  • 12.7 Aðhvarfsgreining (kostnaður við kennslubækur) (valfrjálst)
  • 12.8 Aðhvarfsgreining (eldsneytisnýting) (valfrjálst)
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfingar
  • Heimadæmi
  • Tekið saman: Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 13.1 Einþátta fervikagreining
  • 13.2 F-dreifingin og F-hlutfallið
  • 13.3 Staðreyndir um F-dreifinguna
  • 13.4 Tilgátupróf fyrir tvær dreifnir
  • 13.5 Tölfræðiverkefni: Einþátta fervikagreining
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfingar
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Viðauki A: Yfirlitsæfingar (kaflar 3–13)
  • Viðauki B: Æfingapróf 1–4 og lokapróf
  • Viðauki C: Gagnasöfn
  • Viðauki D: Hóp- og paraverkefni
  • Viðauki E: Lausnablöð
  • Viðauki F: Stærðfræðileg orðasambönd, tákn og formúlur
  • Viðauki G: Athugasemdir fyrir TI-83, 83+, 84 og 84+ reiknivélar
  • Viðauki H: Töflur
  • Atriðaskrá
Tölfræði (IS)Kafli 1212.2 Aðhvarfsjafnan
1212 Línuleg aðhvarfsgreining og fylgni

12.2 Aðhvarfsjafnan

FYRRI KAFLI

12.1 Línulegar jöfnur

NÆSTI KAFLI

12.3 Prófun á marktækni fylgnistuðulsins (valfrjálst)

Gögn falla sjaldan nákvæmlega á beina línu. Yfirleitt þarf að sætta sig við nálgunarspár. Algengt er að gagnasafn hafi punktarit sem virðist falla að beinni línu. Slík lína kallast besta lína eða aðhvarfslína minnstu ferninga.

Samvinnuverkefni

Ef þú veist lengd litlafingurs hjá einstaklingi, telur þú að þú getir spáð fyrir um hæð hans? Safnið gögnum úr bekknum ykkar, litlafingurslengd í tommum. Skýribreytan, x, er litlafingurslengd og svarbreytan, y, er hæð. Fyrir hvert gagnasafn skulið þið teikna punktana á grafpappír. Hafið grafið nógu stórt og notið reglustiku. Teiknið síðan með auganu línu sem virðist falla að gögnunum. Veljið tvo hentuga punkta á línunni og notið þá til að finna hallatölu línunnar. Finnið skurðpunkt línunnar við y-ás með því að framlengja línuna þar til hún sker y-ásinn. Notið hallatölurnar og skurðpunktana við y-ás til að skrifa jöfnu bestu línu. Teljið þið að allir fái sömu jöfnu? Hvers vegna eða hvers vegna ekki? Samkvæmt jöfnunni ykkar, hver er spáð hæð fyrir litlafingurslengd 2,5 tommur?

Dæmi 12.5

Slembiúrtak 11 tölfræðinema gaf gögnin í töflu 12.1, þar sem x er einkunn á þriðja prófi af 80 og y er lokaprófseinkunn af 200. Er hægt að spá fyrir um lokaprófseinkunn slembivalins nemanda ef þriðja prófseinkunnin er þekkt?

Lausn
x (einkunn á þriðja prófi)y (lokaprófseinkunn)
65175
67133
71185
71163
66126
75198
67153
70163
71159
69151
69159
This is a scatter plot of the data provided. The third exam score is plotted on the x-axis, and the final exam score is plotted on the y-axis. The points form a strong, positive, linear pattern.

Prófið sjálf 12.5

Kafarar hafa hámarks köfunartíma sem þeir mega ekki fara yfir á mismunandi dýpi. Gögnin í töflu 12.2 sýna mismunandi dýpi í fetum og hámarks köfunartíma í mínútum. Notið reiknivél til að finna aðhvarfslínu minnstu ferninga og spá fyrir um hámarks köfunartíma á 110 feta dýpi.

Lausn
x (dýpi)y (hámarks köfunartími)
5080
6055
7045
8035
9025
10022

Einkunnin á þriðja prófi, x, er skýribreytan og lokaprófseinkunnin, y, er svarbreytan. Við munum teikna aðhvarfslínu sem fellur sem best að gögnunum. Ef hvert ykkar myndi laga línu að gögnunum með auganu mynduð þið teikna ólíkar línur. Við getum fengið bestu línu annaðhvort með miðgildis-miðgildis aðferðinni eða með því að reikna aðhvarfslínu minnstu ferninga.

  • Finnum fyrst bestu línu fyrir sambandið milli einkunnar á þriðja prófi og lokaprófseinkunnar með miðgildis-miðgildis aðferðinni. Þetta eru gögnin úr dæmi 12.5 eftir að raðað hefur verið eftir x-gildum. Ef fleiri en einn gagnapunktur hefur sama x-gildi eru punktarnir skráðir í röð frá minnsta til stærsta y-gildis. Við skiptum fyrst einkunnunum í þrjá hópa með um það bil jafn mörgum x-gildum í hverjum hópi. Fyrsti og þriðji hópurinn hafa sama fjölda x-gilda.

    x (einkunn á þriðja prófi)y (lokaprófseinkunn)
    65175
    66126
    67133
    67153
    69151
    69159
    70163
    71159
    71163
    71185
    75198
  • Í þessu gagnasafni hafa fyrsti og síðasti hópurinn hvor um sig fjögur x-gildi og fjögur samsvarandi y-gildi. Annar hópurinn hefur þrjú x-gildi og þrjú samsvarandi y-gildi. Við þurfum að skipuleggja x- og y-gildin í hverjum hópi og finna miðgildi x og y fyrir hvern hóp. Tafla 12.4 sýnir þessa framsetningu; takið eftir að röðuðu pörin hafa þá verið rofin, þannig að (65, 126) er ekki gagnapunktur í upphaflega safninu.

    Hópurx (einkunn á þriðja prófi)y (lokaprófseinkunn)Miðgildi xMiðgildi y
    165 66 67 67126 133 153 17566,5143
    269 69 70151 159 16369159
    371 71 71 75159 163 185 19871174
  • Röðuðu pörin fyrir miðgildin eru (66,5; 143), (69; 159) og (71; 174). Hallatalan fæst með formúlunni

    m=y2−y1x2−x1
    m=174−14371−66,5≈6,9

Skurðpunktinn við y-ás má finna með formúlunni

b=Σy−mΣx3
b=476−6,9(206,5)3≈−316,3

Besta línan er rituð sem y = mx + b. Því má skrifa jöfnuna sem

y=6,9x−316,3

Miðgildis-miðgildis línuna má einnig finna með grafískri reiknivél. Reiknivélin getur sýnt örlítið frávik frá handreikningnum vegna námundunar. Námundað að næsta tíunda gefur reiknivélin miðgildis-miðgildis línuna y = 6,9x − 315,5. Hver gagnapunktur hefur formið (x, y), en hver punktur á bestu línu með línulegri aðhvarfsgreiningu minnstu ferninga hefur formið (x, ŷ).

y=6,9x−315,5

Táknið ŷ er lesið „y-hattur“ og er metið gildi y. Það er það gildi á y sem fæst með aðhvarfslínunni. Það er almennt ekki jafnt gagnagildinu y, en er mikilvægt vegna þess að það getur hjálpað til við spár fyrir önnur gildi.

The scatter plot of exam scores with a line of best fit. One data point is highlighted along with the corresponding point on the line of best fit. Both points have the same x-coordinate. The distance between these two points illustrates how to compute the sum of squared errors.
Mynd 12.6. Mynd 12.6

Stærðin y₀ − ŷ₀ = ε₀ kallast skekkja eða leif. Hún er ekki villa í merkingunni mistök. Algildi leifar mælir lóðrétta fjarlægð milli raunverulegs gildis y og metins gildis y. Með öðrum orðum mælir hún lóðrétta fjarlægð milli raunverulegs gagnapunkts og spáðra punkts á línunni, eða hversu langt matið er frá raunverulega gagnagildinu.

y0−y^0=ε0

Ef mældi gagnapunkturinn liggur fyrir ofan línuna er leifin jákvæð og línan vanmetur raunverulegt y-gildi. Ef mældi gagnapunkturinn liggur fyrir neðan línuna er leifin neikvæð og línan ofmetur raunverulegt y-gildi. Í mynd 12.6 er y₀ − ŷ₀ = ε₀ leifin fyrir punktinn sem sýndur er. Þar liggur punkturinn fyrir ofan línuna og leifin er jákvæð.

ε er gríski bókstafurinn epsilon. Fyrir hvern gagnapunkt má reikna leifar eða skekkjur, yᵢ − ŷᵢ = εᵢ fyrir i = 1, 2, 3, ..., 11. Hvert |ε| er lóðrétt fjarlægð.

yi−y^i=εi,i=1,2,3,…,11

Í dæminu um þriðja próf og lokapróf 11 tölfræðinema eru 11 gagnapunktar. Þess vegna eru 11 ε-gildi. Ef hvert ε er sett í annað veldi og þau lögð saman fæst summa kvaðraðra skekkja, SSE.

(ε1)2+(ε2)2+…+(ε11)2=Σi=111εi2

Með örsmæðareikningi má ákvarða gildi a og b sem gera SSE sem minnsta. Þá hafa punktarnir á bestu línu verið ákvarðaðir. Besta línan hefur jöfnuna

y^=a+bx
a=y¯−bx¯
b=Σ(x−x¯)(y−y¯)Σ(x−x¯)2

Úrtaksmeðaltöl x-gildanna og y-gildanna eru x̄ og ȳ. Besta línan fer alltaf í gegnum punktinn (x̄, ȳ). Hallatalan b má einnig skrifa sem b = r(s_y/s_x), þar sem s_y er staðalfrávik y-gilda og s_x er staðalfrávik x-gilda. r er fylgnistuðullinn, sem sýnir sambandið milli x- og y-gilda.

b=r(sysx)

Viðmið minnstu ferninga fyrir bestu línu

Ferlið við að laga bestu línu að gögnum kallast línuleg aðhvarfsgreining. Við gerum ráð fyrir að gögnin dreifist um beina línu. Til að finna þá línu lágmörkum við summu kvaðraðra skekkja, SSE. Önnur lína sem þú gætir valið hefði hærra SSE en besta línan. Þessi besta lína kallast aðhvarfslína minnstu ferninga.

Töflureiknar, tölfræðihugbúnaður og margar reiknivélar geta fljótt reiknað bestu línu og búið til gröf. Útreikningarnir eru oft tímafrekir ef þeir eru gerðir í höndunum.

Dæmi: þriðja próf og lokapróf

Graf bestu línunnar fyrir dæmið um þriðja próf og lokapróf er eftirfarandi.

The scatter plot of exam scores with a line of best fit. One data point is highlighted along with the corresponding point on the line of best fit.
Mynd 12.7. Mynd 12.7

Aðhvarfslína minnstu ferninga, eða besta línan, fyrir dæmið um þriðja próf og lokapróf hefur jöfnuna

y^=−173,51+4,83x

Að skilja og túlka skurðpunkt við y-ás

Skurðpunktur línunnar við y-ás, a, lýsir því hvar línan sker y-ásinn. Skurðpunktur bestu línu við y-ás segir okkur besta gildi sambandsins þegar x er núll. Í sumum tilvikum er ekki merkingarbært að reikna hvað y er þegar x = 0. Í dæminu um þriðja próf og lokapróf verður skurðpunkturinn við y-ás þegar einkunn á þriðja prófi, x, er núll. Þar sem allar einkunnirnar eru í kringum staðist/eða hærra er engin þörf á að reikna hver lokaprófseinkunnin, y, væri þegar þriðja prófseinkunnin væri núll.

Skurðpunkturinn við y-ás er þó mjög gagnlegur í mörgum tilvikum. Í mörgum vísindadæmum gefur hann grunnmælingu þegar tilraunaskilyrði eru ekki lögð á tilraunakerfið. Þessi grunnlína sýnir hversu mikil áhrif tilraunaskilyrðið hefur á kerfið og má einnig nota til að tryggja að búnaður og mælingar séu rétt stillt áður en tilraunin hefst.

Í líffræði má mæla styrk próteina í sýni með efnagreiningu sem breytir lit eftir því hversu mikið prótein er til staðar. Því meira prótein sem er til staðar, þeim mun dekkri verður liturinn. Litmagnið má mæla með gleypnimælingu. Tafla 12.5 sýnir vænt gleypnigildi við mismunandi próteinstyrk. Þetta kallast staðalkúrfa fyrir greininguna.

Styrkur (mM)Gleypni (mAU)
1250,021
2500,023
5000,068
7500,086
1.0000,105
1.5000,124
2.0000,146

Punktaritið á mynd 12.8 inniheldur bestu línu.

This shows a scatter plot with a line of best fit. The scatter plot has points plotted at (0.021, 125), (0.023, 250), (0.068, 500), (0.086, 750), (0.105, 1000), (0.124, 1500), and (0.146, 2000), and is labeled y = 7E-05x + 0.0226.
Mynd 12.8. Mynd 12.8

Skurðpunktur þessarar línu við y-ás er 0,0226 mAU. Það þýðir að greiningin gefur mælinguna 0,0226 mAU þegar ekkert prótein er til staðar. Þetta er grunnmæling sem má rekja til einhvers annars, í þessu tilviki annarra efna en próteina sem gleypa ljós. Við sjáum að þessi besta lína er skynsamleg vegna þess að skurðpunkturinn við y-ás er lítill og nálægt núlli. Þegar ekkert prótein er í sýninu væntum við þess líka að gleypnin sé mjög lítil eða nálægt núlli.

Að skilja hallatölu

  • Hallatala línunnar, b, lýsir því hvernig breytingar í breytunum tengjast. Mikilvægt er að túlka hallatölu línunnar í samhengi við aðstæðurnar sem gögnin lýsa. Þú ættir að geta skrifað setningu sem túlkar hallatöluna á venjulegu máli.

  • Túlkun hallatölu: Hallatala bestu línu segir okkur hvernig svarbreytan (y) breytist að meðaltali fyrir hverja einnar einingar aukningu í skýribreytunni (x).

  • Dæmi um þriðja próf og lokapróf: Hallatala línunnar er b = 4,83. Túlkun: Fyrir hverja eins stigs hækkun á einkunn á þriðja prófi hækkar lokaprófseinkunn að meðaltali um 4,83 stig.

Notkun TI-83, 83+, 84 og 84+ reiknivélar

Notkun línulegs aðhvarfs t-prófs: LinRegTTest.

  • Í STAT listaritlinum skulið þið slá x-gögnin inn í lista L1 og y-gögnin inn í lista L2, pöruð þannig að samsvarandi (x, y)-gildi séu hlið við hlið í listunum. Ef tiltekið gildiapar endurtekur sig skal slá það inn eins oft og það kemur fyrir í gögnunum.
  • Í STAT TESTS valmyndinni skulið þið fara niður og velja LinRegTTest. Gætið þess að velja LinRegTTest; sumar reiknivélar geta einnig haft annað atriði sem heitir LinRegTInt.
  • Á inntaksskjá LinRegTTest skulið þið slá inn Xlist: L1, Ylist: L2 og Freq: 1.
  • Í næstu línu, við kvaðninguna β or ρ, skulið þið velja ≠ 0 og ýta á ENTER.
  • Látið línuna RegEQ vera auða.
  • Veljið Calculate og ýtið á ENTER.
1. Image of calculator input screen for LinRegTTest with input matching the instructions above. 2.Image of corresponding output calculator output screen for LinRegTTest: Output screen shows: Line 1. LinRegTTest; Line 2. y = a + bx; Line 3. beta does not equal 0 and rho does not equal 0; Line 4. t = 2.657560155; Line 5. df = 9; Line 6. a = 173.513363; Line 7. b = 4.827394209; Line 8. s = 16.41237711; Line 9. r squared = .4396931104; Line 10. r = .663093591
Mynd 12.9. Mynd 12.9

Úttaksskjárinn inniheldur miklar upplýsingar. Í bili beinum við athyglinni að nokkrum atriðum og komum aftur að hinum síðar. Önnur línan segir y = a + bx. Skrunið niður til að finna gildin a = −173,513 og b = 4,8273.

Jafna bestu línu er ŷ = −173,51 + 4,83x. Neðstu tvö atriðin eru r² = 0,43969 og r = 0,663. Í bili skulið þið aðeins taka eftir hvar þessi gildi eru; við skoðum þau í næstu tveimur köflum.

Að teikna punktarit og aðhvarfslínu

  • Við gerum ráð fyrir að x-gögnin séu þegar í lista L1 og y-gögnin í lista L2.
  • Ýtið á 2nd STATPLOT ENTER til að nota Plot 1.
  • Á inntaksskjánum fyrir PLOT 1 skulið þið velja On og ýta á ENTER.
  • Fyrir TYPE skulið þið velja fyrsta táknið, sem er punktarit, og ýta á ENTER.
  • Tilgreinið Xlist: L1 og Ylist: L2.
  • Fyrir Mark skiptir ekki máli hvaða tákn er valið.
  • Ýtið á ZOOM og síðan töluna 9 fyrir valmyndaratriðið ZoomStat; reiknivélin aðlagar gluggann að gögnunum.
  • Til að teikna bestu línu skulið þið ýta á Y= og slá jöfnuna −173,5 + 4,83X inn í jöfnu Y1. Ýtið aftur á ZOOM 9 til að teikna hana.
  • Valfrjálst: Ef þið viljið breyta sýniglugganum skulið þið ýta á WINDOW og slá inn æskileg gildi fyrir Xmin, Xmax, Ymin og Ymax.

Athugasemd

Önnur leið til að teikna línuna eftir að punktarit hefur verið búið til er að nota LinRegTTest: gangið úr skugga um að punktaritið sé til, farið í LinRegTTest og sláið inn listana. Við RegEq skulið þið ýta á VARS, fara yfir í Y-VARS, velja 1:Function og síðan 1:Y1. Farið svo niður í Calculate og reiknið bestu línu. Ýtið á Y= til að sjá aðhvarfsjöfnuna og GRAPH til að teikna línuna.

Fylgnistuðullinn r

Auk þess að skoða punktaritið og sjá að lína virðist skynsamleg, hvernig er hægt að ákvarða hvort línan sé góður spár? Notið fylgnistuðulinn sem annan mælikvarða, auk punktaritsins, á styrk sambandsins milli x og y.

Fylgnistuðullinn, r, sem Karl Pearson þróaði í byrjun 20. aldar, er tölulegur mælikvarði á styrk og stefnu línulegs sambands milli skýribreytunnar x og svarbreytunnar y. Ef grunur er um línulegt samband milli x og y getur r mælt styrk þess línulega sambands.

Hvað gildi r segir okkur

  • Gildi r er alltaf á bilinu −1 til +1. Með öðrum orðum: −1 ≤ r ≤ 1.
  • Stærð fylgninnar r gefur til kynna styrk línulega sambandsins milli x og y. Gildi r nálægt −1 eða +1 gefa til kynna sterkara línulegt samband milli x og y.
  • Ef r = 0 er ekkert línulegt samband milli x og y, það er engin línuleg fylgni.
  • Ef r = 1 er fullkomin jákvæð fylgni. Ef r = −1 er fullkomin neikvæð fylgni. Í báðum tilvikum liggja allir upphaflegu gagnapunktarnir á beinni línu. Í raunheimum gerist þetta auðvitað yfirleitt ekki.

Hvað formerki r segir okkur

  • Jákvætt gildi á r þýðir að þegar x eykst hefur y tilhneigingu til að aukast, og þegar x minnkar hefur y tilhneigingu til að minnka. Þetta er jákvæð fylgni.
  • Neikvætt gildi á r þýðir að þegar x eykst hefur y tilhneigingu til að minnka, og þegar x minnkar hefur y tilhneigingu til að aukast. Þetta er neikvæð fylgni.
  • Formerki r er það sama og formerki hallatölunnar b á bestu línu.

Athugasemd

Sterk fylgni bendir ekki til þess að x valdi y eða að y valdi x. Við segjum að fylgni feli ekki í sér orsakasamband.

Fylgnistuðullinn er reiknaður með eftirfarandi formúlu, þar sem n er fjöldi gagnapunkta:

r=nΣ(xy)−(Σx)(Σy)[nΣx2−(Σx)2][nΣy2−(Σy)2]
Three scatter plots with lines of best fit. The first scatterplot shows points ascending from the lower left to the upper right. The line of best fit has positive slope. The second scatter plot shows points descending from the upper left to the lower right. The line of best fit has negative slope. The third scatter plot of points form a horizontal pattern. The line of best fit is a horizontal line.
Mynd 12.10. Mynd 12.10 (a) Punktarit með jákvæðri fylgni: 0 < r < 1. (b) Punktarit með neikvæðri fylgni: −1 < r < 0. (c) Punktarit með engri fylgni: r = 0.

Formúlan fyrir r virðist erfið. Töflureiknar, tölfræðihugbúnaður og margar reiknivélar geta þó reiknað r hratt. Fylgnistuðullinn r er neðsta atriðið í úttaksskjám LinRegTTest á TI-83, TI-83+ eða TI-84+ reiknivél.

Skýringarhlutfallið

Breytan r² kallast skýringarhlutfall og er fylgnistuðullinn í öðru veldi, en hún er venjulega sett fram sem prósenta fremur en tugabrot. Hún hefur túlkun í samhengi gagnanna.

  • r², þegar það er sett fram sem prósenta, táknar það hlutfall breytileika í svarbreytunni y sem má skýra með breytileika í skýribreytunni x með aðhvarfslínunni, eða bestu línu.
  • 1 − r², þegar það er sett fram sem prósenta, táknar það hlutfall breytileika í y sem ekki er skýrt með breytileika í x með aðhvarfslínunni. Þetta má sjá sem dreifingu mældu gagnapunktanna um aðhvarfslínuna.

Skoðum aftur dæmið um þriðja próf og lokapróf.

  • Besta línan er ŷ = −173,51 + 4,83x.
  • Fylgnistuðullinn er r = 0,6631.
  • Skýringarhlutfallið er r² = 0,6631² = 0,4397.

Túlkið r² í samhengi þessa dæmis.

  • Um það bil 44 prósent af breytileika lokaprófseinkunna, þar sem 0,4397 er um það bil 0,44, má skýra með breytileika í einkunnum á þriðja prófi með bestu aðhvarfslínunni.
  • Þess vegna er afgangurinn af breytileikanum, 1 − 0,44 = 0,56 eða 56 prósent, í lokaprófseinkunnum ekki skýrður með breytileika í einkunnum á þriðja prófi með bestu aðhvarfslínunni. Þetta er breytileiki punktanna sem eru ekki eins nálægt aðhvarfslínunni og aðrir.

FYRRI KAFLI

12.1 Línulegar jöfnur

NÆSTI KAFLI

12.3 Prófun á marktækni fylgnistuðulsins (valfrjálst)