Korreláció
A korreláció bizonyos mennyiségek közötti kapcsolat szorosságát, a függőség fokát jelenti. Ennek mérésére a korrelációs együttható a szokásos mérőszám, amelynek sok szemléletes tulajdonsága hasonló a szórás tulajdonságaihoz. A korrelációs együttható egy statisztika, azaz egy minta korreláltsága leirására szolgál, miközben a populáció változói közötti kapcsolat erősségét a korrelációs együttható mint paraméter határozza meg.
Az összetartozó értékpárok halmazának mindegyik tagját (a pontok x és y koordinátáit) külön-külön átlagolhatjuk és az egyes (x, vagy y) értékeknek a saját átlaguktól (x, y) való eltérését vizsgálhatjuk. Az x, vagy az y szórásának számitásakor ezeket a különbségek négyzeteit átlagoltuk (majd négyzetgyököt vontunk belõle), a korrelációs együttható számitásakor az összetartozó különbségeket összeszorozzuk és a szorzatok összegét (ezt másnéven kovarianciának is nevezik) elosztjuk a négyzetes különbségek szorzatával. A két változó szerepe a korreláció vizsgálatában felcserélhetõ, nincs kitüntetett szerepe egyiknek sem.
A korrelációs együttható két fontos tulajdonsága:
- Független változók esetében a korrelációs együttható értéke 0,
- Lineáris függvénykapcsolatban lévő (nem sztochasztikus) változók esetében a korrelációs együttható értéke 1.
Minél szorosabb összefüggés van két, véletlentől is függõ változó között, annál közelebb áll a korrelációs együttható értéke az 1-hez. Forditva, minél lazább az összefüggés két változó között, annál közelebb van a korrelációs együttható értéke a 0-hoz.
Fontos, hogy a korrelációs együttható az egyszerű, közel lineáris sztochasztikus kapcsolat esetében használható statisztika, egy bonyolultabb függvénygörbe mentén elhelyezkedõ értékek kapcsolatának leirására a korrelációs együttható nem alkalmas.
Ha két változó korrelációjának vizsgálata során az együttható értéke 0, akkor még nem biztos, hogy ezek függetlenek is! Ezért ilyenkor csak annyit mondhatunk: a két változó korrelálatlan.
A két valószínűségi változó korrelációját egy elméleti (rho-val jelölt) korrelációs együttható irja le. Ennek értékét a gyakorlatban becsléssel közelitjük meg. A becsléshez az adathalmazból mintát veszünk, majd a minta korrelációs együtthatóját kiszámoljuk, és meghatározzuk a becslés hibáját. A becslés hibájának ismeretében megmondhatjuk, hogy mekkora annak a valószinûsége, hogy a mintából számolt korrelációs együttható nem =0.
A korreláció kiszámítása
A korreláció a következő képlettel számítható:
ahol E a várható érték, σ a szórás, μX az X, μY az Y valószínűségi változó várható értéke.
A statisztikában nem állnak rendelkezésre az elméleti értékek, így a tapasztalati korrelációt a következőképpen számítják:
,ahol a felülvonásos betűk a tapasztalati várható értéket, sx, sy a tapasztalati korrigált szórásnégyzetet jelölik.
A korreláció -1 és +1 közé esik, és egyenlőség akkor és csak akkor áll fenn, ha a két változó lineáris kapcsolatban áll egymással. Skálafüggetlen, azaz invariáns X és Y marginális eloszlásainak monoton transzformációjára.
A korrelációs együttható előjele jelzi, hogy az összefüggést jellemző egyenes emelkedő, vagy süllyedő jellegű-e.
Érzékenység
A korreláció nem függ az adatok nagyságától, de érzékeny a mintavételezésre. Egy szűkebb mintából számított korreláció rendszerint kisebb, mint a bővebb mintából számolt. Például, ha az apák és fiaik magasságának korrelációját számítjuk, akkor a teljes mintán erősebb összefüggést észlelünk, mintha csak azokon az adatokkal dolgoznánk, amik szerint az apák magassága 165cm és 170cm közé esik. A korreláció érzékeny a kivételes adatokra (outlierek). Egy kivételes adat nagyon lecsökkentheti, vagy megnövelheti.
Önnek mi a véleménye?
You must be logged in to post a comment.