» »

Kovarianca

Kovarianca

messi ::

Pozdravljeni,
zanima mi bi kdo znal naslednje razložiti na bolj razumljiv način, predvsem muči me naslednje besedne zveze ali gre za iste ali gre za različne itd: korelirano/nekorelirano in neodvisno/odvisno vse to uprabljamo pri kovarianci. Vendar ne vem kdaj in zakaj.

(Vzeto z: A.Juršić-fri vsš)
In kako vedeti da je nek vzorec porazdeljen normalno.


Mogoče kaka pomoč.
  • spremenilo: messi ()

simpatija ::

Ne spomnim se čist vsega, nekaj sem šla na hitro na wiki preverit, ampak mogoče je kaj narobe/površno. Pa čimbolj po domače bom poskusila povedati.

Kovarianca ti pove, kako sta dve spremenljivki povezani - a se spreminjata na podoben način, ali je kak vzorec v tem kako se spreminjata ipd. Predvsem ponavadi gledaš, ali sta dve spremenljivki v linearni povezavi (korelirani), ali ne, oziroma kako blizu ali daleč od linearne povezave sta. Pozitiven predznak ti pove, da se podobno obnašata, negativen pa da obratno-sorazmerno. Velikost številke ti pove, koliko sta res linearni, večja kot je številka (absolutno), bolj sta spremenljivki linearno povezani.


Recimo primer, ljudje ti povejo svojo težo in višino. To sta dve spremenljivki, X in Y. Ampak za enega človeka imaš njegove vrednosti, par (x, y). Če to narišeš kot točke, pa vidiš, da se da neko premico narisat (seveda so odstopanja), potem to pomeni, da sta X in Y (teža in višina) korelirani. Če iz podatkov izračunaš K, dobiš cifro, ki ti nakaže strmino premice. Če so podatki raztreseni vse naokoli po koordinatnem sistemu, potem nista korelirani - sta nekorelirani. V tem primeru računsko dobiš K=0.

Odvisno/neodvisno... spremenljivki sta odvisni, če s tem, ko poznaš eno, lahko določiš/uganeš/izračunaš drugo, oziroma če ena vpliva na drugo. Neodvisni sta pa če poznaš eno, nimaš pojma kakšna bi bila lahko tadruga.

Če sta spremenljivki neodvisni, potem sta tudi nekorelirani. (Če bi bili neodvisni in korelirani je to protislovno, ker neodvisnost ti pravi, da ni nobene povezave med njima, koreliranost ti pa pravi, da je linearna povezava). Če sta spremenljivki nekorelirani, pa sta lahko odvisni, al pa ne (lahko sta v neki povezavi, samo ni linearna, al pa nimata nobene povezave).


Zato da določiš ali je nek vzorec porazdeljen normalno obstaja precej testov. So različno natančni. Ena varianta je, da kar narišeš vrednosti na graf in vidiš ali dobiš "zvončasto" krivuljo ali ne. Potem je ena bolj enostavnih še, da izračunaš, koliko vrednosti pade znotraj 1, 2 in 3 standardne deviacije in pogledaš če je isto kot po teoriji (znotraj 1 je okol 70% podatkov, v 3 pa skoraj vsi).

jernejl ::

Tako na hitro, tukaj je ena slika, ki prikazuje razliko med korelacijo in (ne)odvisnostjo.
 odvisnost in korelacija

odvisnost in korelacija


Imamo dve slučajni spremenljivki: X in Y. Grafi na sliki prikazujejo ti dve spremenljivki.

Y je definiran kot: Y = e^(aX)
a je konstanta.

Pri levem grafu je a=0,2 , pri sredinskem a=1 in pri desnem a=10.
Spremenljivki X in Y sta torej definirani tako, da sta med sabo odvisni.

Pod vsakim grafom je izračunan korelacijski koeficient. Kljub temu, da sta spremenljivki v vseh treh primerih odvisni, ima korelacijski koeficient različne vrednosti.
Pri levem grafu, ko je odvisnost skoraj linearna, je korel. koeficient blizu 1, pri desnem pa blizu nič.

simpatija ::

Še eno vprašanje je prišlo na ZS, pa je mogoče zanimivo še za koga:

messi je izjavil:

oi, veš kaj me še zanima zakaj je kul CLI centralni limitni izrek oz kaj je pojnt tega


Odgovor bo zelo približen, razložen na par načinov, ampak hopefully razloži bistvo. So pa potem vseeno še razni taki in drugačni pogoji v samem izreku ipd.

Torej: Kadar raziskuješ nek pojav v populaciji, kjer imaš ogromno število ljudi/stvari, ne moreš izmerit ali vprašat vseh, da dobiš neko povprečje. Zato moraš izbrat nek majhen vzorec iz tega in na podlagi tega sklepat za vse. Da dobiš ok rezultate moraš pa vzorec dobro izbrat.
Če veš, kako so stvari, ki jih raziskuješ, porazdeljene, potem je to dost easy - veš kakšen vzorec moraš izbrat. Primer: recimo da te zanima, kaj mislijo ljudje o merkatorju in bi rad zadevo raziskal na podlagi dohodka ljudi. Ker veš da je revnih več, bogatih pa malo, veš, da moraš vprašat več revnih in manj bogatih - ker je to reprezentativen vzorec za celo populacijo.
Ampak če pa ne veš kako so stvari porazdeljene, potem pa ne veš kakšen vzorec izbrat. Ampak potem so nekoč dokazali CLI:

Centralni limitni izrek zelo od daleč pogledano pravi, da tudi če nimaš pojma kakšna je porazdelitev, lahko vzameš kar en vzorec in boš dobil iz podatkov povprečje, ki je ok. Zdej to je ekstra zelo približno, bom razložila še malo bolj točno:

Ideja je, da namesto da vzameš en večji vzorec, vzameš veliko majhnih vzorcev, in pogledaš povprečje vsakega vzorca. In ta povprečja bodo normalno porazdeljena. Če narišeš graf, zgleda kot normalna porazdelitev. Iz tega potem dobiš povprečje - povprečje je sredina tega grafa - to je ubistvu povprečje povprečij. In to povprečje je enako povprečju cele populacije, se pravi to, kar iščeš.

Oziroma izrek še bolj natančno (ker je le limita notr). Recimo da vzameš najprej vzorec velik 1, ampak ga ponoviš 500x. Vzameš povprečje vsakega vzorca in narišeš graf. Potem vzameš vzorec veli 2 in ga ponoviš 500x, za vsakega izračunaš povprečje in narišeš graf. In to ponavljaš, večaš vzorec (v praksi do neke dosti majhne številke, nekaj deset). In če narediš zaporedje teh grafov, zgledajo vedno bolj kot normalna porazdelitev. In v limiti (se pravi v neskončnosti) je točno normalna porazdelitev. Link s slikco

V praksi je pa dovolj že veliko manjša številka od neskončno. Za občutek (kakšne točno so številke ne vem), da namesto 1 skupine (dobro izbrane) velike 1000 kjer pogledaš kakšno povprečje dobiš, vzameš 100 skupin velikih 10 (random izbranih), in izračunaš povprečje vsake, in potem izračunaš povprečje od teh povprečij. In dobiš ok cifro.

AnubisOfDoom ::

Centralni limitni izrek ti pove, da je konvolucija razlicnih porazdelitev porazdeljena po normalni oziroma Gaussovi porazdelitvi... Drugace pa ti ze wikipedia nudi veliko na to temo:

Central limit theorem @ Wikipedia

Ali pa Khan academy:
https://www.khanacademy.org/math/probab...

Zgodovina sprememb…

simpatija ::

Pogledala sem Khan academy (za vsak slučaj, če sem kaj narobe povedala :) ), ful dobr razloži, priporočam pogledat.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Matematika - pomoč (strani: 1 2 3 )

Oddelek: Šola
10426887 (23462) daisy22
»

Statistika

Oddelek: Šola
152165 (1477) Hardstyle
»

Odvodi - preprosta razlaga

Oddelek: Šola
69109 (8845) Invictus
»

Verjetnostne uganke (strani: 1 2 )

Oddelek: Znanost in tehnologija
816388 (4819) SavoKovac
»

Potek raziskave o odnosu do spletnega oglaševanja na Slo-Techu (strani: 1 2 )

Oddelek: Novice / Obvestila
618531 (7105) poweroff

Več podobnih tem