Bereken Covariance

Covariance is `n statistiese berekening om die verhouding tussen twee data-versamelings deursigtig te maak. Veronderstel byvoorbeeld dat antropoloë die hoogte en gewig van `n bevolking binne `n bepaalde kultuur bestudeer. Vir elke persoon in die studie kan die lengte en gewig met `n datapaar (x, y) voorgestel word. Hierdie waardes kan gebruik word in `n standaardformule vir die berekening van die kovariansieverhouding. Hierdie artikel verduidelik eers die berekeninge vir die bepaling van die kovariansie van `n datastel. Vervolgens word twee ander outomatiese maniere om die uitslag te bepaal, bespreek.

stappe

Metode 1
Bereken die kovariansie met die hand deur die standaardformule te gebruik

Prent getiteld Bereken Covariance Stap 1
1
Leer die standaard kovariansieformule en die komponente daarvan. Die standaard formule vir die berekening van die kovariansie is Σ(xi-xavg)(yi-yavg)/(n-1){ Displaystyle Sigma (x_ {i} -x _ { text {avg}}) (Y_ {i} -y _ { text {avg}}) / (n-1)}.Om hierdie formule te gebruik, moet u die betekenis van die veranderlikes en simbole ken:
  • Σ{ displaystyle Sigma} -Hierdie simbool is die Griekse letter `sigma`. In wiskundige funksies beteken dit om `n reeks van wat volg op te tel. In hierdie formule beteken dit Σ-teken dat jy die waardes in die teller van die breuk bereken, en hulle daarna almal bytel, waarna jy dit totaal deel deur die noemer.
  • xi{ displaystyle x_ {i}} -U kan hierdie veranderlike as `x sub I` lees. Die subskripsie ek verteenwoordig `n toonbank. Dit beteken dat jy `n berekening vir elke waarde van x in jou datastel gaan doen.
  • xavg{ displaystyle x_ {avg}} -Die `avg` dui aan dat x (avg) die gemiddelde waarde van alle x data punte is. Die gemiddelde word ook soms as `n x geskryf met `n kort horisontale lyn bokant dit. In die styl lees jy die veranderlike as `x-bar`, maar dit beteken steeds die gemiddelde van die data-insameling.
  • yi{ displaystyle y_ {i}} -U kan hierdie veranderlike as `y sub I` lees. Die subskripsie I is die teller. Dit beteken dat jy `n berekening vir elke waarde van y in jou datastel gaan doen.
  • yavg{ displaystyle y_ {avg}} -Die `avg` dui aan dat y (avg) die gemiddelde waarde van alle x data punte is. Die gemiddelde word ook soms as `n y geskryf met `n kort horisontale lyn bokant dit. In die styl lees jy die veranderlike as `y-bar`, maar dit beteken steeds die gemiddelde van die data-insameling.
  • n{ displaystyle n} -Hierdie veranderlike is die aantal elemente in u datastel. Onthou dat in `n kovariansie probleem, `n enkele `element` bestaan ​​uit beide `n x waarde en `n y waarde. Die waarde `n `is die aantal pare data punte, nie individuele getalle nie.
  • Prent getiteld Bereken Covariance Stap 2
    2
    Konstrueer jou data tabel. Voordat jy begin, is dit nuttig om jou data te versamel. Skep `n tabel wat uit vyf kolomme bestaan. U moet elke kolom soos volg aandui:
  • x{ displaystyle x} -Vul hierdie kolom in met die waardes van die punte van die x-data.
  • y{ displaystyle y} -Vul hierdie kolom in met die waardes van die y-data. Maak seker dat die y-waardes ooreenstem met die ooreenstemmende x-waardes. In `n kovariansie probleem is die volgorde van die data punte en die koppeling van x en y belangrik.
  • (xi-xavg){ displaystyle (x_ {i} -x _ { text {avg}})} -Laat hierdie kolom leeg aan die begin. U sal dit met data invul nadat u die gemiddelde van die x data bereken het.
  • (yi-yavg){ displaystyle (y_ {i} -y _ { text {avg}})} -Laat hierdie kolom leeg aan die begin. U sal dit met data invul nadat u die gemiddelde van die y-data bereken het.
  • produk{ displaystyle { text {Product}}} -Laat die laaste kolom leeg. Dit word gevul tydens die opstel van die opdrag.
  • Prent getiteld Bereken Covariance Stap 3
    3
    Bereken die gemiddelde van die x data punte. Hierdie versameling van steekproefdata bevat 9 nommers. Om die gemiddelde te bepaal, tel jy hulle by mekaar op en deel jy die som deur 9. Dit gee die resultaat 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Wanneer jy dit deur 9 deel , jy kry die gemiddelde 4,89. Dit is die waarde wat u as x (avg) sal gebruik vir die komende berekeninge.
  • Prent getiteld Bereken Covariance Stap 4
    4
    Bereken die gemiddelde van die y data punte. Hierdie y-kolom moet ook bestaan ​​uit 9 data punte wat saamval met die x data punte. Bepaal die gemiddelde van hierdie. Vir hierdie stel voorbeelddata word dit 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Verdeel hierdie totaal met 9 tot `n gemiddeld van 5,44. U sal 5,44 as die waarde van y (avg) gebruik vir die komende berekeninge.
  • Prent getiteld Bereken Covariance Stap 5
    5
    Bereken die waardes (xi-xavg){ displaystyle (x_ {i} -x _ { text {avg}})}. Vir elke element in die x-kolom bereken jy die verskil tussen die getal en die gemiddelde waarde. Vir hierdie voorbeeld probleem beteken dit dat dit 4,89 van elke x-waarde aftrek. As die oorspronklike data punt kleiner is as die gemiddelde, sal jou resultaat negatief wees. As die oorspronklike data punt groter is as die gemiddelde, sal die resultaat positief wees. Maak seker jy hou by watter waardes negatief is.
  • Byvoorbeeld, die eerste data punt in die x-kolom is 1. Die waarde om in die eerste reël van die kolom in te voer (xi-xavg){ displaystyle (x_ {i} -x _ { text {avg}})}is: 1 - 4.89 = -3.89.
  • Herhaal hierdie proses vir elke data punt. Die tweede lyn word dus: 3 - 4.89 = -1.89. Die derde lyn word: 2 - 4.89 = -2.89. Gaan voort met hierdie proses vir alle data punte. Die nege getalle in hierdie kolom word: -3,89, -1,89, -2,89, 0,11, 3,11, 2,11, 7,11, -2,89, -0,89.
  • Prent getiteld Bereken Covariance Stap 6
    6
    Bereken die waardes (yi-yavg){ displaystyle (y_ {i} -y _ { text {avg}})}. In hierdie kolom sal jy soortgelyke aftrekkings maak, met die y-data punte en die y-gemiddelde. As die oorspronklike data punt kleiner is as die gemiddelde, sal die resultaat negatief wees. As die oorspronklike data punt groter is as die gemiddelde, sal u resultaat positief wees. Maak seker jy hou by watter waardes negatief is.
  • Vir die eerste reël sal u berekening wees: 8 -5.44, = 2.56.
  • Die tweede lyn word: 6 - 5.44 = 0.56.
  • Gaan voort om die waardes van mekaar af te trek tot aan die einde van die data lys. As jy klaar is, het jy die volgende nege waardes in hierdie kolom: 2.56, 0.56, 3.56, -1.44, -2.44, -2.44, -3.44, 1.56, 1 , 56.
  • Prent getiteld Bereken Covariance Stap 7
    7
    Bereken die produkte vir elke data ry. Jy vul die rye van die laaste kolom in deur die getalle wat jy bereken het in die twee vorige kolomme van (xi-xavg){ displaystyle (x_ {i} -x _ { text {avg}})}en (yi-yavg){ displaystyle (y_ {i} -y _ { text {avg}})}.Maak seker dat jy ry vir ry werk en vermenigvuldig die twee getalle met die ooreenstemmende data punte. Gee aandag aan enige negatiewe waardes onderweg.
  • In die eerste ry van hierdie steekproefdata, die (xi-xavg){ displaystyle (x_ {i} -x _ { text {avg}})}wat jy bereken het -3,89, en die (yi-yavg){ displaystyle (y_ {i} -y _ { text {avg}})}waarde 2.56. Die produk van hierdie twee getalle is: -3,89 x 2,56 = -9,96.
  • Vir die tweede ry vermenigvuldig jy die twee getalle: -1.88 x 0.56 = -1.06.
  • Gaan voort om ry vir ry te vermenigvuldig tot die einde van data-insameling. As jy klaar is, moet die nege waardes in hierdie kolom soos volg lees: -9.96, -1.06, -10.29, -0.16, -7.59, -5.15, -24.46 , -4,51, -1,39.
  • Prent getiteld Bereken Covariance Stap 8
    8
    Bepaal die som van die waardes in die laaste kolom. Dit is waar die Σ simbool sy voorkoms laat lyk. Nadat jy al die berekeninge voltooi het, voeg jy die resultate by. Vir hierdie versameling van steekproefdata moet jy nou nege waardes in die laaste kolom hê. Voeg die nege getalle saam. Maak seker dat `n nommer positief of negatief is.
  • Die som van hierdie stel steekproefdata moet uitkom by -64.57. Skryf hierdie totaal in die spasie onderaan die kolom. Dit is die waarde van die toonbank van die standaard kovariansieformule.
  • Prent getiteld Bereken Covariance Stap 9
    9
    Bereken die noemer van die kovariansieformule. Die toonbank van die standaard kovariansieformule is die waarde wat jy pas bereken het. Die noemer word verteenwoordig deur (n-1), en is een minder as die aantal pare data in u datastel.
  • In hierdie voorbeeld probleem is daar nege data pare, dus n is 9. Daarom is die waarde van (n-1) gelyk aan 8.
  • Prent getiteld Bereken Covariance Stap 10
    10
    Verdeel die teller deur die noemer. Die laaste stap in die berekening van die kovariansie is om die toonbank te verdeel, Σ(xi-xavg)(yi-yavg){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}deur die noemer, (n-1){ displaystyle (n-1)}.Die kwosiënt is die kovariansie van u data.
  • Vir hierdie versameling van steekproef data is hierdie berekening: -64.57 / 8 = -8.07.
  • Metode 2
    Bereken kovariansie met behulp van `n Excel-werkblad

    Prent getiteld Bereken Covariance Stap 11
    1
    Let op die herhalende berekeninge. Covariance is `n berekening wat jy `n paar keer met die hand moet doen, sodat jy die betekenis van die resultaat verstaan. As jy egter covariantie gereeld gaan gebruik vir die interpretasie van data, dan het jy `n vinniger en outomatiese manier om nodig om die resultate te verkry. Dit is jy nou inmiddels dalk opgelet dat by ons relatief klein data-insameling van slegs nege gegevensparen, die berekeninge bestaan ​​uit twee gemiddeldes, agttien afsonderlike aftrekking, nege vermenigvuldigingen, `n opsomming, en uiteindelik nog `n deling. Dit is 31 relatief klein berekeninge om die oplossing te vind. Op die manier waarop u die risiko loop om negatiewe tekens te ontbreek of die resultate verkeerd te gebruik, is die antwoord nie meer korrek nie.
  • Prent getiteld Bereken Covariance Stap 12
    2
    Skep `n werkblad vir die berekening van die kovariansie. As jy vertroud is met Excel (of enige ander berekeningsprogram), kan jy maklik `n tabel skep om die kovariansie te bepaal. Benoem die hoofde van die vyf kolomme, net soos die berekeninge met die hand: x, y, (x (i) -x (avg)), (y (i) -y (avg)) en Produk.
  • Om die benaming te vereenvoudig, noem jy die derde kolom, soos `x verskil` en die vierde kolom `y verskil`, solank jy die betekenis van die data onthou.
  • As die tabel bo links van die werkblad begin, kry sel A1 die etiket x, terwyl die ander byskrifte na sel E1 gaan.
  • Prent getiteld Bereken Covariance Stap 13
    3
    Voer die data punte in. Tik die datawaardes in die twee kolomme x en y. Onthou dat die volgorde van die datapunte belangrik is, dus moet u elke y koppel aan die ooreenstemmende waarde van x.
  • Die x-waardes begin in sel A2 en gaan voort met die aantal data punte wat u benodig.
  • Die y-waardes begin in sel B2 en gaan voort met die aantal data punte wat u benodig.
  • Prent getiteld Bereken Covariance Stap 14
    4


    Bepaal die gemiddeldes van die x- en y-waardes. Excel bereken die gemiddeldes baie vinnig vir jou. Tik die formule = AVERAGE (A2: A ___) in die eerste leë sel onder elke kolom data. Vul die leë spasie met die nommer van die sel wat ooreenstem met jou laaste data punt.
  • As u byvoorbeeld 100 data punte het, word die selle A2 tot A101 gevul, tik so in die sel: = AVERAGE (A2: A101).
  • Vir die y-data, tik die formule = AVERAGE (B2: B101).
  • Onthou dat `n formule in Excel begin met `n `=` teken.
  • Prent getiteld Bereken Covariance Stap 15
    5
    Tik die formule vir die kolom (x (i) -x (avg)). In sel C2 voer jy die formule in vir die berekening van die eerste aftrekking. Hierdie formule word: = A2 -___. Voer die leë spasie in met die seladres wat die gemiddelde van die x data bevat.
  • Byvoorbeeld, uit die 100 data punte, is die gemiddelde in sel A103, sodat jou formule gelyk is aan: = A2-A103.
  • Prent getiteld Bereken Covariance Stap 16
    6
    Herhaal die formule vir die data punte (y (i) -y (avg)). Na dieselfde voorbeeld kom dit in sel D2. Die formule word: = B2-B103.
  • Prent getiteld Bereken Covariance Stap 17
    7
    Tik die formule vir die "Produk" kolom. In die vyfde kolom moet jy sel E2 die formule vir die berekening van die produk van die twee voorafgaande selle tik. Dit word dan: = C2 * D2.
  • Prent getiteld Bereken Covariance Stap 18
    8
    Kopieer die formules om die tabel te vul. Tot dusver het u eers die eerste paar data punte in ry 2 geprogrammeer. Met die hulp van jou muis merk jy die selle C2, D2 en E2. Plaas jou wyser op die klein boks in die onderste regterkantste hoek totdat `n plusteken verskyn. Klik en hou die muis knoppie in en sleep die muis om die keuse uit te brei en vul die hele data tabel. Hierdie stap sal outomaties die drie formules van selle C2, D2 en E2 na die hele tabel kopieer. Die tabel word outomaties gevul met al die berekeninge as dit korrek is.
  • Prent getiteld Bereken Covariance Stap 19
    9
    Program die som van die laaste kolom. Jy benodig die som van die items in die `Produk`-kolom. Tik die formule: = SUM (E2: E ___) in die leë sel direk onder die laaste data punt in die kolom. Vul die leë spasie in met die seladres van die laaste data punt.
  • In die voorbeeld met 100 data punte, gaan hierdie formule in sel E103. Tipe: = SUM (E2: E102).
  • Prent getiteld Bereken Covariance Stap 20
    10
    Bepaal die kovariansie. U kan ook Excel die finale berekening vir u uitvoer. Die laaste berekening in sel E103 in ons voorbeeld verteenwoordig die toonbank van die kovariansieformule. Tik die formule direk onder die sel: = E103 / ___. Vul die leë spasie in met die aantal data punte wat u het. In ons voorbeeld is dit 100. Die resultaat is die kovariansie van u data.
  • Metode 3
    Gebruik aanlyn kovariansie sakrekenaars

    Prent getiteld Bereken Covariance Stap 21
    1
    Soek aanlyn vir kovariansie sakrekenaars. Verskeie skole, maatskappye of ander bronne het webwerwe wat die kovariansiewaardes baie maklik vir u bereken. Gebruik die soekterme `kovariansie sakrekenaar` in `n soekenjin.
  • Prent getiteld Bereken Covariance Stap 22
    2
    Vul jou besonderhede in. Lees die instruksies op die webwerf sorgvuldig deur om seker te maak dat u die inligting korrek invoer. Dit is belangrik dat u data pare in orde gehou word, anders is die gegenereerde resultaat `n verkeerde kovariansie. Webwerwe het verskillende style vir die invoer van data.
  • Op die webwerf https://rcalculators.com/statistics/covariance-calculator.htm, Daar is byvoorbeeld `n horisontale blokkie vir die invoer van die x-waardes en `n tweede horisontale blokkie om die y-waardes in te voer. U moet u data insleutel met kommas. Dus moet die x-datastel wat voorheen in hierdie artikel bereken is, dan as 1,3,2,5,8,7,12,2,4 ingeskryf word. Die y-data as 8,6,9,4,3,3,2,7,7.
  • Op `n ander webwerf, https://thecalculator.co/math/Covariance-Calculator-705.html, U sal gevra word om die x-data in die eerste blokkie in te voer. Data word vertikaal ingevoer, met een item per reël. Daarom lyk die inskrywing op hierdie webwerf soos volg:
  • 1
  • 3
  • 2
  • 5
  • 8
  • 7
  • 12
  • 2
  • 4
  • Prent getiteld Bereken Covariance Stap 23
    3
    Bereken jou resultate. Die aantreklike ding van hierdie aanlyn berekeninge is dat jy na die invoer van die data gewoonlik net die `Bereken` -knoppie moet klik, waarna die resultate outomaties verskyn. Die meeste webwerwe sal u voorsien van die intermediêre berekeninge van x (avg), y (avg) en n.
  • Metode 4
    Interpretasie van die resultate van die kovariansie

    Prent getiteld Bereken Covariance Stap 24
    1
    Soek vir `n positiewe of negatiewe verhouding. Die kovariansie is `n enkele statistiese figuur wat die verband tussen een datastel en die ander aandui. In die voorbeeld wat in die inleiding genoem word, word die lengte en die gewig gemeet. Jy sal verwag dat as mense groei, sal hul gewig ook toeneem, wat lei tot `n positiewe kovariansie-aansig. Nog `n voorbeeld: Gestel dat data versamel word wat die aantal ure aandui wat `n persoon gholf oefen en die telling wat hy of sy bereik. In hierdie geval verwag jy `n negatiewe kovariansie, wat beteken dat as die aantal opleidingstye toeneem, die golf telling sal afneem. (In gholf is `n laer telling beter).
    • Oorweeg die versameling van monster data hierbo bereken. Die gevolglike kovariansie is -8.07. Die minusteken beteken dat deur die x-waardes te verhoog, die y-waardes neig om te val. Jy kan sien dat dit waar is deur na sommige van die waardes te kyk. Byvoorbeeld, die x-waardes van 1 en 2 stem ooreen met die y-waardes van 7, 8 en 9. Die x-waardes van 8 en 12 word onderskeidelik aan die y-waardes van 3 en 2 gekoppel.
  • Prent getiteld Bereken Covariance Stap 25
    2
    Interpreteer die grootte van die kovariansie. As die getal van die kovariansietelling groot is, óf `n groot positiewe getal of `n groot negatiewe getal, kan u dit interpreteer as twee data-elemente sterk verbind is, óf op `n positiewe of negatiewe manier.
  • Die kovariansie -8.07 van die versameling data is redelik groot. Let daarop dat die data van 1 tot 12 verskil. 8 is `n redelike groot getal. Dit dui op `n redelike sterk verhouding tussen die datastelle x en y.
  • Prent getiteld Bereken Covariance Stap 26
    3
    Verstaan ​​die gebrek aan `n verhouding. As u resultaat `n kovariansie is, gelyk aan of baie naby aan 0, dan kan u aflei dat die datapunte geen verband het nie. Dit is `n toename in een waarde kan, maar lei nie noodwendig tot `n toename in die ander nie. Die twee terme word amper lukraak gekoppel.
  • Veronderstel jy stel skoengroottes in verband met eksamenpunte. Omdat daar soveel faktore is wat die eksamengraad van `n student beïnvloed, kan `n kovariansie telling in die omgewing van 0 verwag word. Dit dui daarop dat daar byna geen verband bestaan ​​tussen die twee waardes nie.
  • Prent getiteld Bereken Covariance Stap 27
    4
    Kyk na die verhouding grafies. Om kovariansie te verstaan, kan jy jou data punte in `n x, y-grafiek plot. As jy dit doen, moet jy redelik maklik sien dat die punte, hoewel nie presies in `n reguit lyn, geneig is om `n cluster in `n diagonale lyn van links bo na regs te benader nie. Dit is die beskrywing van `n negatiewe kovariansie. U sien ook dat die waarde van die kovariansie -8.07 is. Dit is `n redelike groot getal in vergelyking met die data punte. Die hoë getal dui daarop dat die kovariansie redelik sterk is, wat u uit die lineêre vorm van die datapunte kan aflei.
  • Lees wikiHou artikels oor tekenpunte in `n koördinaatstelsel, om dit weer oor te gaan.
  • waarskuwings

    • Covariance het `n beperkte toepassing in statistiek. Dit is dikwels `n stap in die berekening van korrelasiekoëffisiënte of ander konsepte. Wees versigtig met te vet interpretasies gebaseer op `n kovariansie telling.
    Deel op sosiale netwerke:

    Verwante