Námsgögn
Innskrá
Hleð efnisyfirliti...
Leita í bók...
Tölfræði (IS)
  • Formáli
  • Introduction
  • 1.1 Definitions of Statistics, Probability, and Key Terms
  • 1.2 Data, Sampling, and Variation in Data and Sampling
  • 1.3 Tíðni, tíðnitöflur og mælistig
  • 1.4 Tilraunahögun og siðfræði
  • 1.5 Tilraun með gagnasöfnun
  • 1.6 Úrtakstilraun
  • Lykilhugtök
  • Kaflarifjun
  • Æfing
  • Homework
  • Tengjum efnið saman: heimaverkefni
  • Heimildir
  • Lausnir
  • Introduction
  • 2.1 Stem-and-Leaf Graphs (Stemplots), Line Graphs, and Bar Graphs
  • 2.2 Histograms, Frequency Polygons, and Time Series Graphs
  • 2.3 Measures of the Location of the Data
  • 2.4 Box Plots
  • 2.5 Lýsistærðir fyrir miðju gagna
  • 2.6 Skewness and the Mean, Median, and Mode
  • 2.7 Mælikvarðar á dreifingu gagna
  • 2.8 Lýsandi tölfræði
  • Lykilhugtök
  • Kaflayfirlit
  • Formúluyfirlit
  • Æfingar
  • Heimaverkefni
  • Tengjum efnið saman: heimaverkefni
  • Heimildir
  • Lausnir
  • Inngangur
  • 3.1 Hugtök
  • 3.2 Óháðir og ósamrýmanlegir atburðir
  • 3.3 Tvær grunnreglur líkindafræðinnar
  • 3.4 Krosstöflur
  • 3.5 Líkindatré og Vennmyndir
  • 3.6 Efni í líkindafræði
  • Lykilhugtök
  • Kaflarifjun
  • Formúluyfirlit
  • Æfingar
  • Tökum þetta saman: Æfingar
  • Heimadæmi
  • Tökum þetta saman: Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 4.1 Líkindafall (PDF) fyrir strjála slembibreytu
  • 4.2 Meðaltal eða væntigildi og staðalfrávik
  • 4.3 Tvíkostadreifing (valfrjálst)
  • 4.4 Rúmfræðileg dreifing (valfrjálst)
  • 4.5 Happdrættisdreifing (valfrjálst)
  • 4.6 Poisson dreifing (valfrjálst)
  • 4.7 Strjál dreifing (spilastokkatilraun)
  • 4.8 Strjál dreifing (lukkuteningatilraun)
  • Lykilhugtök
  • Kaflarifjun
  • Formúluyfirlit
  • Æfingar
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 5.1 Þéttiföll samfelldra líkindadreifinga
  • 5.2 Jöfn dreifing
  • 5.3 Veldisdreifing (valfrjálst)
  • 5.4 Samfelld dreifing
  • Lykilhugtök
  • Upprifjun kafla
  • Formúluyfirlit
  • Æfingar
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 6.1 Staðlaða normaldreifingin
  • 6.2 Notkun normaldreifingar
  • 6.3 Normaldreifing—Hringtímar
  • 6.4 Normaldreifing—Lengd litlafingurs
  • Lykilhugtök
  • Upprifjun kafla
  • Formúluyfirlit
  • Æfingar
  • Heimaverkefni
  • Heimildir
  • Lausnir
  • Inngangur
  • 7.1 Höfuðsetning tölfræðinnar fyrir úrtaksmeðaltöl
  • 7.2 Höfuðsetning tölfræðinnar fyrir summur (valfrjálst)
  • 7.3 Notkun höfuðsetningar tölfræðinnar
  • 7.4 Höfuðsetning tölfræðinnar (smámynt)
  • 7.5 Höfuðsetning tölfræðinnar (smákökuuppskriftir)
  • Lykilhugtök
  • Upprifjun kafla
  • Formúluyfirlit
  • Æfingar
  • Heimaverkefni
  • Heimildir
  • Lausnir
  • Inngangur
  • 8.1 Meðaltal eins þýðis reiknað með normaldreifingu
  • 8.2 Meðaltal eins þýðis reiknað með t-dreifingu Students
  • 8.3 Þýðishlutfall
  • 8.4 Öryggisbil (húsnæðisverð)
  • 8.5 Öryggisbil (fæðingarstaður)
  • 8.6 Öryggisbil (hæðir kvenna)
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfing
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 9.1 Núlltilgátur og gagntilgátur
  • 9.2 Útkomur og villur af gerð I og II
  • 9.3 Dreifing sem þarf fyrir tilgátuprófun
  • 9.4 Sjaldgæfir atburðir, úrtakið og ákvörðun og niðurstaða
  • 9.5 Viðbótarupplýsingar og heildstæð dæmi um tilgátupróf
  • 9.6 Tilgátupróf fyrir eitt meðaltal og eitt hlutfall
  • Lykilhugtök
  • Kaflayfirlit
  • Formúluyfirlit
  • Æfingar
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 10.1 Tvö þýðismeðaltöl með óþekktum staðalfrávikum
  • 10.2 Tvö þýðismeðaltöl með þekktum staðalfrávikum
  • 10.3 Samanburður á tveimur óháðum þýðishlutföllum
  • 10.4 Pöruð úrtök (valfrjálst)
  • 10.5 Tilgátuprófun fyrir tvö meðaltöl og tvö hlutföll
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfing
  • Heimadæmi
  • Tekið saman: Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 11.1 Staðreyndir um kí-kvaðrat dreifinguna
  • 11.2 Próf á mátgæðum
  • 11.3 Próf á óhæði
  • 11.4 Próf á einsleitni
  • 11.5 Samanburður á kí-kvaðrat prófum
  • 11.6 Próf á dreifni í einu þýði
  • 11.7 Tölfræðiverkefni 1: Kí-kvaðrat mátgæðapróf
  • 11.8 Tölfræðiverkefni 2: Kí-kvaðrat próf á óhæði
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfingar
  • Heimadæmi
  • Tekið saman: Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 12.1 Línulegar jöfnur
  • 12.2 Aðhvarfsjafnan
  • 12.3 Prófun á marktækni fylgnistuðulsins (valfrjálst)
  • 12.4 Spá (valfrjálst)
  • 12.5 Fráviksgildi
  • 12.6 Aðhvarfsgreining (fjarlægð frá skóla) (valfrjálst)
  • 12.7 Aðhvarfsgreining (kostnaður við kennslubækur) (valfrjálst)
  • 12.8 Aðhvarfsgreining (eldsneytisnýting) (valfrjálst)
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfingar
  • Heimadæmi
  • Tekið saman: Heimadæmi
  • Heimildir
  • Lausnir
  • Inngangur
  • 13.1 Einþátta fervikagreining
  • 13.2 F-dreifingin og F-hlutfallið
  • 13.3 Staðreyndir um F-dreifinguna
  • 13.4 Tilgátupróf fyrir tvær dreifnir
  • 13.5 Tölfræðiverkefni: Einþátta fervikagreining
  • Lykilhugtök
  • Upprifjun kafla
  • Upprifjun formúla
  • Æfingar
  • Heimadæmi
  • Heimildir
  • Lausnir
  • Viðauki A: Yfirlitsæfingar (kaflar 3–13)
  • Viðauki B: Æfingapróf 1–4 og lokapróf
  • Viðauki C: Gagnasöfn
  • Viðauki D: Hóp- og paraverkefni
  • Viðauki E: Lausnablöð
  • Viðauki F: Stærðfræðileg orðasambönd, tákn og formúlur
  • Viðauki G: Athugasemdir fyrir TI-83, 83+, 84 og 84+ reiknivélar
  • Viðauki H: Töflur
  • Atriðaskrá
Tölfræði (IS)Kafli 1212.5 Fráviksgildi
1212 Línuleg aðhvarfsgreining og fylgni

12.5 Fráviksgildi

FYRRI KAFLI

12.4 Spá (valfrjálst)

NÆSTI KAFLI

12.6 Aðhvarfsgreining (fjarlægð frá skóla) (valfrjálst)

Í sumum gagnasöfnum eru gildi, það er mældir gagnapunktar, sem kallast fráviksgildi. Fráviksgildi eru mældir gagnapunktar sem liggja langt frá aðhvarfslínu minnstu ferninga. Þau hafa stórar skekkjur, þar sem skekkjan eða leifin er ekki nálægt bestu línu.

Fráviksgildi þarf að skoða vandlega. Stundum ætti ekki að hafa þau með í gagnagreiningunni, til dæmis ef mögulegt er að fráviksgildið stafi af röngum gögnum. Í öðrum tilvikum getur fráviksgildi geymt mikilvægar upplýsingar um þýðið sem verið er að rannsaka og ætti þá að vera áfram í gögnunum. Lykilatriðið er að skoða vandlega hvað veldur því að gagnapunktur verður fráviksgildi.

Auk fráviksgilda getur úrtak innihaldið einn eða fáa punkta sem kallast áhrifapunktar. Áhrifapunktar eru mældir gagnapunktar sem liggja langt frá hinum mældu gagnapunktunum í lárétta stefnu. Slíkir punktar geta haft mikil áhrif á hallatölu aðhvarfslínunnar. Til að byrja að bera kennsl á áhrifapunkt má fjarlægja hann úr gagnasafninu og kanna hvort hallatala aðhvarfslínunnar breytist verulega.

Einnig þarf að skoða hvernig fylgnistuðullinn r hefur breyst. Stundum er erfitt að greina verulega breytingu á hallatölu og þá þarf að skoða hvernig styrkur línulega sambandsins hefur breyst. Tölvur og margar reiknivélar má nota til að finna fráviksgildi og áhrifapunkta. Aðhvarfsgreining getur skorið úr um hvort fráviksgildi sé í raun áhrifapunktur. Nýja aðhvarfsgreiningin sýnir hvernig það að sleppa fráviksgildinu hefur áhrif á fylgni breytanna og á það hversu vel línan fellur að gögnunum. Graf sem sýnir báðar aðhvarfslínurnar hjálpar til við að meta hvernig fjarlæging fráviksgildis hefur áhrif á líkanið.

Að bera kennsl á fráviksgildi

Við gætum giskað á fráviksgildi með því að skoða graf af punktariti og bestu línu. Samt er gagnlegt að hafa viðmið um hversu langt frá línunni punktur þarf að vera til að teljast fráviksgildi. Sem grófa þumalputtareglu má merkja sem fráviksgildi hvern punkt sem er meira en tvö staðalfrávik fyrir ofan eða neðan bestu línu. Staðalfrávikið sem er notað er staðalfrávik leifanna, eða skekkjanna.

Þetta má gera sjónrænt í punktaritinu með því að teikna aukapar lína sem liggja tveimur staðalfrávikum fyrir ofan og neðan bestu línu. Allir gagnapunktar utan þessa aukapars lína eru merktir sem möguleg fráviksgildi. Einnig má gera þetta tölulega með því að reikna hverja leif og bera hana saman við tvöfalt staðalfrávikið. Fyrir TI-83, 83+ eða 84+ reiknivélar er myndræna aðferðin auðveldari. Hún er sýnd fyrst og tölulegir útreikningar á eftir. Yfirleitt þarf aðeins að nota aðra hvora aðferðina.

Dæmi 12.11

Verkefni

Í dæminu með þriðja próf og lokapróf má ákvarða hvort fráviksgildi sé til staðar. Ef fráviksgildi er til staðar skaltu, sem æfingu, eyða því og laga nýja línu að gagnapunktunum sem eftir standa. Í þessu dæmi ætti nýja línan að falla betur að gögnunum sem eftir eru. Það þýðir að SSE, summa kvaðraðra skekkja, ætti að vera minni og fylgnistuðullinn ætti að vera nær 1 eða −1.

Lausn

Myndræn greining fráviksgilda

  • Með TI-83, 83+ eða 84+ grafískum reiknivélum er auðvelt að bera kennsl á fráviksgildi myndrænt. Ef lóðrétt fjarlægð frá einhverjum gagnapunkti að samsvarandi punkti á bestu línu er jöfn 2s eða meiri teljum við gagnapunktinn vera of langt frá bestu línu. Við þurfum að finna og teikna línurnar sem eru tveimur staðalfrávikum fyrir neðan og ofan aðhvarfslínuna. Allir punktar utan þessara tveggja lína eru fráviksgildi. Köllum þessar línur Y₂ og Y₃.

  • Eins og við gerðum með jöfnu aðhvarfslínunnar og fylgnistuðulinn notum við tækni til að reikna þetta staðalfrávik. Þegar LinRegTTest er notað með þessum gögnum má fletta niður í úttakinu og finna s = 16,412.

    y^=−173,5+4,83x
    Y2=−173,5+4,83x−2(16,4)Y3=−173,5+4,83x+2(16,4)
  • Línurnar Y₂ og Y₃ hafa sömu hallatölu og besta línan. Teiknaðu punktaritið með bestu línu í jöfnunni Y₁ og settu síðan aukalínurnar tvær inn sem Y₂ og Y₃ í Y= jöfnuritlinum. Ýttu á ZOOM-9 til að fá góða yfirsýn. Þá sést að eini punkturinn sem er ekki á milli Y₂ og Y₃ er punkturinn (65, 175). Á reiknivélarskjánum er hann aðeins rétt utan við línurnar, en hann telst fráviksgildi því hann er meira en tvö staðalfrávik frá bestu línu. Fráviksgildið er nemandinn sem fékk 65 á þriðja prófinu og 175 á lokaprófinu.

  • Stundum er punktur svo nálægt línunum sem merkja fráviksgildi á grafinu að erfitt er að sjá hvort hann er milli línanna eða utan þeirra. Í tölvu getur hjálpað að stækka grafið; á litlum reiknivélarskjá getur aðdráttur gert myndina skýrari. Þegar grafið gefur ekki nógu skýra mynd má nota tölulegan samanburð til að finna fráviksgildi.

    The scatter plot of exam scores with a line of best fit.Two yellow dashed lines run parallel to the line of best fit. The dashed lines run above and below the best fit line at equal distances. One data point falls outside the boundary created by the dashed lines—it is an outlier.
    Mynd 12.15. Mynd 12.15

Reyndu sjálf(ur) 12.11

Finndu mögulega fráviksgildið í punktaritinu. Staðalfrávik leifanna, eða skekkjanna, er um það bil 8,6.

Figure 2 shows a graph that is labeled 0 through 100 on the Y axis going up by 20, and 0 though 14 on the X axis going up by 2. The plotted spots on the graph show (y0,x66)
Mynd 12.16. Mynd 12.16

Töluleg greining fráviksgilda

  • Í töflu 12.6 eru í fyrstu tveimur dálkunum gögn um þriðja próf og lokapróf. Þriðji dálkurinn sýnir spáð ŷ-gildi sem reiknað er út frá bestu línu:

    y^=−173,5+4,83x
  • Leifarnar, eða skekkjurnar, sem nefndar voru í kafla 12.3, hafa verið reiknaðar í fjórða dálki töflunnar:

    y−y^=ε
  • s er staðalfrávik allra y − ŷ = ε gildanna, þar sem n er heildarfjöldi gagnapunkta. Ef hver leif er reiknuð, sett í annað veldi og niðurstöðurnar lagðar saman fáum við SSE. Staðalfrávik leifanna er reiknað út frá SSE svona:

    s=SSEn−2

Athugasemd

Við deilum með n − 2 vegna þess að aðhvarfslíkanið felur í sér tvö möt.

Í stað þess að reikna s sjálf getum við fundið s með tölvu eða reiknivél. Í þessu dæmi finnur LinRegTTest s = 16,4 sem staðalfrávik leifanna 35; −17; 16; −6; −19; 9; 3; −1; −10; −9; −1.

xyŷy − ŷ
65175140175 − 140 = 35
67133150133 − 150 = −17
71185169185 − 169 = 16
71163169163 − 169 = −6
66126145126 − 145 = −19
75198189198 − 189 = 9
67153150153 − 150 = 3
70163164163 − 164 = −1
71159169159 − 169 = −10
69151160151 − 160 = −9
69159160159 − 160 = −1

Við leitum að öllum gagnapunktum þar sem leifin er stærri en 2s eða minni en −2s.

2s=2(16,4)=32,8

Berðu þessi gildi saman við leifarnar í fjórða dálki töflunnar. Eini slíki gagnapunkturinn er nemandinn sem fékk 65 á þriðja prófinu og 175 á lokaprófinu; leif þessa nemanda er 35.

Hvernig hefur fráviksgildið áhrif á bestu línu?

  • Tölulega og myndrænt höfum við greint punktinn (65, 175) sem fráviksgildi. Mundu að endurreikningur á aðhvarfslínu minnstu ferninga og samantektartölum, eftir að fráviksgildi hefur verið fjarlægt, getur hjálpað til við að ákvarða hvort fráviksgildið sé einnig áhrifapunktur. Ferlið gerir þér einnig kleift að bera saman styrk fylgni breytanna og mögulegar breytingar á hallatölu fyrir og eftir að fráviksgildum er sleppt.

  • Reiknaðu nýja bestu línu og fylgnistuðul með þeim 10 punktum sem eftir standa. Á TI-83, TI-83+ eða TI-84+ reiknivélum skaltu eyða fráviksgildinu úr L1 og L2. Með LinRegTTest undir Stat og Tests fæst eftirfarandi ný besta lína og fylgnistuðull:

    y^=−355,19+7,39xogr=0,9121
  • Hallatalan er nú 7,39, samanborið við fyrri hallatölu 4,83. Þetta virðist vera veruleg breyting, en við þurfum einnig að skoða breytinguna á r-gildunum. Nýja línan sýnir r = 0,9121, sem gefur til kynna sterkari fylgni en upprunalega línan, þar sem r = 0,6631, því r = 0,9121 er nær 1. Þetta þýðir að nýja línan fellur betur að gagnagildunum. Línan getur betur spáð fyrir um lokaprófseinkunn út frá einkunn á þriðja prófi. Það þýðir einnig að fráviksgildið (65, 175) var áhrifapunktur, því talsverður munur er á r-gildunum.

  • Nú þarf að ákveða hvort fráviksgildinu skuli eytt. Ef fráviksgildið var skráð rangt ætti vissulega að eyða því. Þar sem það hefur svo mikil áhrif á fylgnina leyfir nýja besta línan betri spágerð og almennt sterkara líkan.

  • Þú getur notað Excel til að teikna báðar aðhvarfslínur minnstu ferninga og bera saman hallatölur og hversu vel línurnar falla að gögnunum, eins og sýnt er á mynd 12.17.

    This shows two scatter plots, each with a line of best fit. Each is labeled final exam score on the y-axis and third exam score on the x-axis. The part (a) scatter plot includes the complete data set and has points plotted at (65, 175), (66, 126), (67, 133), (67, 153), (69, 151), (69, 159), (70, 163), (71, 159), (71, 163), (71, 185), and (75, 198). The part (a) scatter plot is labeled y = 4.8274x – 173.51 and R2 = 0.43969. The part (b) scatter plot is missing the student 1 data point and has points plotted at (66, 126), (67, 133), (67, 153), (69, 151), (69, 159), (70, 163), (71, 159), (71, 163), (71, 185), and (75, 198). The part (b) scatter plot is labeled y = 7.3878x – 355.19 and R2 = 0.8319.
    Mynd 12.17. Mynd 12.17
  • Sjá má að seinna grafið sýnir minni frávik frá bestu línu. Ljóst er að þegar áhrifapunktinum var sleppt varð til besta lína sem líkanar gögnin betur.

Töluleg greining fráviksgilda: s reiknað og fráviksgildi fundin handvirkt

  • Ef reiknivélin þín hefur ekki LinRegTTest þarftu að reikna fráviksgildið í fyrsta dæminu með eftirfarandi hætti. Fyrst skaltu setja hvert |y − ŷ| í annað veldi.

    352;172;162;62;192;92;32;12;102;92;12
  • Síðan leggurðu saman öll |y − ŷ|² gildin með formúlunni:

    ∑i=111|yi−y^i|2=∑i=111εi2
  • Mundu að yᵢ − ŷᵢ = εᵢ.

    352+172+162+62+192+92+32+12+102+92+12=2440=SSE
  • Niðurstaðan, SSE, er summa kvaðraðra skekkja. Næst reiknum við s, staðalfrávik allra y − ŷ = ε gildanna, þar sem n er heildarfjöldi gagnapunkta.

    s=244011−2=16,47
  • Næst margföldum við s með 2. Gildið 32,94 er tvö staðalfrávik frá meðaltali y − ŷ gildanna.

    2s=2(16,47)=32,94
  • Ef lóðrétt fjarlægð frá gagnapunkti að samsvarandi punkti á bestu línu er að minnsta kosti 2s teljum við gagnapunktinn vera of langt frá bestu línu. Við köllum slíkan punkt mögulegt fráviksgildi.

    |y−y^|≥2s
  • Í dæminu er samsvarandi (x, y) gagnapunktur mögulegt fráviksgildi ef eitthvert |y − ŷ| gildi er að minnsta kosti 32,94. Öll |y − ŷ| gildin eru minni en 32,94 nema það fyrsta, sem er 35.

    35>32,94,|y−y^|≥2s
  • Punkturinn sem samsvarar |y − ŷ| = 35 er (65, 175). Þess vegna er gagnapunkturinn (65, 175) mögulegt fráviksgildi. Í þessu dæmi eyðum við honum. Mundu þó að fráviksgildum er ekki alltaf eytt.

Athugasemd

Þegar fráviksgildum er eytt ætti rannsakandinn annaðhvort að skrá að gögnum hafi verið eytt og hvers vegna, eða birta niðurstöður bæði með og án gagnanna sem var eytt. Ef gögnin eru röng og réttu gildin eru þekkt, til dæmis ef nemandi 1 fékk í raun 70 en ekki 65, má leiðrétta gögnin.

Næsta skref er að reikna nýja bestu línu með þeim 10 punktum sem eftir standa. Nýja besta línan og fylgnistuðullinn eru:

y^=−355,19+7,39xogr=0,9121

Dæmi 12.12

Verkefni

Með þessari nýju bestu línu, sem byggist á þeim 10 gagnapunktum sem eftir standa í dæminu með þriðja próf og lokapróf, hverju mætti nemandi sem fær 73 á þriðja prófinu búast við að fá á lokaprófinu? Er þetta sama spá og fæst með upprunalegu línunni?

Lausn

y^=−355,19+7,39(73)=184,28y^=−173,51+4,83(73)=179,08

Með nýju bestu línunni má nemandi sem fékk 73 stig á þriðja prófinu búast við að fá um 184 stig á lokaprófinu. Upprunalega línan spáði ŷ = 179,08, þannig að spáin með nýju línunni, þar sem fráviksgildinu hefur verið sleppt, er frábrugðin upprunalegu spánni.

Reyndu sjálf(ur) 12.12

Gagnapunktarnir fyrir grafið úr dæminu með þriðja próf og lokapróf eru: (1, 5), (2, 7), (2, 6), (3, 9), (4, 12), (4, 13), (5, 18), (6, 19), (7, 12) og (7, 21). Fjarlægðu fráviksgildið og endurreiknaðu bestu línu. Finndu gildi ŷ þegar x = 10.

Dæmi 12.13

Vísitala neysluverðs, CPI, mælir meðalbreytingu yfir tíma á verði sem neytendur í þéttbýli greiða fyrir neysluvörur og þjónustu. CPI hefur áhrif á næstum alla Bandaríkjamenn vegna þess hve víða hún er notuð. Ein stærsta notkun hennar er sem mælikvarði á verðbólgu. Með því að veita stjórnvöldum, fyrirtækjum og launafólki upplýsingar um verðbreytingar í þjóðarbúskapnum hjálpar CPI þeim að taka efnahagslegar ákvarðanir. Forseti Bandaríkjanna, Bandaríkjaþing og seðlabanki Bandaríkjanna nota þróun CPI til að móta peninga- og ríkisfjármálastefnu. Í eftirfarandi töflu er x árið og y er CPI.

xyxy
191510,1196936,7
192617,7197549,3
193513,7197972,6
194014,7198082,4
194724,11986109,6
195226,51991130,7
196431,01999166,6

Verkefni

  • Teiknaðu punktarit af gögnunum.
  • Reiknaðu línu minnstu ferninga. Skrifaðu jöfnuna á forminu ŷ = a + bx.
  • Teiknaðu línuna á punktarit.
  • Finndu fylgnistuðulinn. Er hann marktækur?
  • Hver er meðal-CPI fyrir árið 1990?

Lausn

  • Sjá mynd 12.18.
  • Með reiknivélinni fæst eftirfarandi jafna bestu línu:
y^=−3204+1,662x
  • Sjá mynd 12.18.
  • r = 0,8694. Fjöldi gagnapunkta er n = 14. Notaðu töfluna yfir 95 prósent markgildi úrtaksfylgnistuðuls aftast í 12. kafla. Hér eru frígráðurnar df = 12 og samsvarandi markgildi úr töflunni eru ±0,532. Þar sem 0,8694 > 0,532 er r marktækt. Við getum notað spáðu aðhvarfslínuna sem við fundum til að spá fyrir um x = 1990.
df=12,0,8694>0,532
y^=−3204+1,662(1990)=103,4

Spáð vísitala neysluverðs fyrir árið 1990 er 103,4.

Scatter plot and line of best fit of the consumer price index data, on the y-axis, and year data, on the x-axis.
Mynd 12.18. Mynd 12.18

Athugasemd

Í dæminu skaltu taka eftir mynstri punktanna miðað við línuna. Þótt fylgnistuðullinn sé marktækur bendir mynstrið í punktaritinu til þess að ferill væri viðeigandi líkan frekar en lína. Í þessu dæmi myndi tölfræðingur frekar nota aðrar aðferðir til að laga feril að þessum gögnum en að líkana gögnin með línunni sem við fundum. Auk útreikninganna er alltaf mikilvægt að skoða punktaritið þegar ákveðið er hvort línulegt líkan sé viðeigandi.

Ef þú vilt sjá gögn fyrir fleiri ár geturðu heimsótt CPI-vef Bureau of Labor Statistics (ftp://ftp.bls.gov/pub/special.requests/cpi/cpiai.txt). Gögnin okkar eru tekin úr dálkinum Annual Avg. (þriðja dálki frá hægri). Þú gætir til dæmis bætt við nýrri árum: 2004, CPI = 188,9; 2008, CPI = 215,3; og 2011, CPI = 224,9. Skoðaðu hvernig það hefur áhrif á líkanið.

y^=−4436+2,295x;r=0,9018

Athugaðu: Er r marktækt? Fellur líkanið betur að gögnunum þegar nýju punktunum er bætt við?

Reyndu sjálf(ur) 12.13

Eftirfarandi tafla sýnir efnahagsþróun mælda sem tekjur á mann, PCINC.

ÁrPCINCÁrPCINC
187034019201.050
188049919301.170
189059219401.364
190075719501.836
191092719602.132
  • Hverjar eru skýribreytan og svarbreytan?
  • Teiknaðu punktarit.
  • Notaðu aðhvarfsgreiningu til að finna bestu línu og fylgnistuðul.
  • Túlkaðu marktækni fylgnistuðulsins.
  • Er línulegt samband milli breytanna?
  • Finndu skýringarhlutfallið og túlkaðu það.
  • Hver er hallatala aðhvarfsjöfnunnar? Hvað merkir hún?
  • Notaðu bestu línu til að meta PCINC fyrir 1900 og 2000.
  • Ákvarðaðu hvort einhver fráviksgildi séu til staðar.

Tafla yfir 95 prósent markgildi úrtaksfylgnistuðuls

Frígráður: n − 2Markgildi: + og −
10,997
20,950
30,878
40,811
50,754
60,707
70,666
80,632
90,602
100,576
110,555
120,532
130,514
140,497
150,482
160,468
170,456
180,444
190,433
200,423
210,413
220,404
230,396
240,388
250,381
260,374
270,367
280,361
290,355
300,349
400,304
500,273
600,250
700,232
800,217
900,205
1000,195

FYRRI KAFLI

12.4 Spá (valfrjálst)

NÆSTI KAFLI

12.6 Aðhvarfsgreining (fjarlægð frá skóla) (valfrjálst)