» »

Matematicna zagonetka

Matematicna zagonetka

antonija ::

Imam en matematicni problem pa ga z mojim znanjem ne znam resit. Ce mi zna kdo napisat resitev bom zelo vesel. Gre pa takole:

Imamo set podatkov, dolg od 4 pa do 10 stevilk. Vse stevilke imajo vrednosti med 85 in 115 (+/- 15 od 100). Za ta set moramo ovrednotiti zadnjo vpisano vrednost, in sicer: Zadnja vpisana vrednost ne sme pasti ven iz intedrvala +/- 3*standardni odmik od povprecja, pri cemer moramo v izracun SDja in izracun povprecja upostevati tudi zadnjo vrednost. Se pravi da povprecje in SD racunamo na celotnem setu, potem pa glede na to ocenjujejo kje lezi zadnja vpisana vrednost.

Ali lahko obstaja kombinacija stevilk, pri kateri bi zadnja vrednost padla ven iz intervala?

Jaz je "na roke" ne najdem (worst case se mi zdi da so vse stevilke enake, ena je pa combolj razlicna. Vse do 10 stevilk pade znotraj intervala), ne znam pa matematicno pokazat, da bi morala vsaka kombinacija stevilk vedno pasti znotraj intervala.

Ima kdo dovolj znanja da zna matematicno pokazat da vrednosti vedno padejo znotraj intervala?
Statistically 3 out of 4 involved usually enjoy gang-bang experience.

stapler rump ::

Najprej je potrebno malo boljše definirati vprašanje: Imaš zaporedje x = [x1, ... xn] dolžine n, kjer so elementi vzeti iz nekega intervala [a,b]. Vprašanje je, ali lahko obstaja element xj v tem zaporedju, za katerega drži |xj - mu| > k*sigma?

mu je povprečna vrednost, sigma je standardna deviacija. Pri tebi konkretno n = 4...10, a = 85, b = 115, k = 3

Celoten dokaz za to je predolg, da bi ga napisal tukaj. Gre nekako takole: pogoj |xj - mu| > k*sigma vstaviš v definicijo standardne deviacije in dobiš spodnjo mejo za standardno deviacijo takega zaporedja. Potem izračunaš zgornjo mejo standardne deviacije za splošno zaporedje z n elementi iz intervala [a,b]. Sedaj poiščeš razpon vrednosti a, b, n in k, kjer je zgornja meja višja od spodnje.

technolog ::

Očitno je najslabša možna situacija 9 podatkov 85 in zadnji potem 115. Če za to zaporedje poračunaš povprečje in standardno deviacijo vidiš, da pade v range glih za glih.

Torej velja za vsa zaporedja dolžine 10.

Unilseptij ::

Obstaja kombinacija, ko je 9 številk enakih 100 in ena enaka 115. To da povprečje (9*100 + 115)/10 = 101,5. Standardni odmik je SQRT(1/10*(9*(100 - 101,5)^2 + (115 - 101,5)^2))) = 4,5. Trikratni odmik znese 13,5, kar pomeni, da je vrednost 115 izven intervala 3*sigma. Torej vsaj ena taka kombinacija obstaja, kar je že rešitev naloge brez splošnega dokazovanja, ki zna biti dokaj zamudno.

MaFijec ::

Očitno je najslabša možna situacija 9 podatkov 85 in zadnji potem 115.

Tole očitno ni res.
Recimo.
Zaporedje:
85 115 85 115 85 115 85 115 85 115
ocena za povprečje: 100
ocena za odklon:
po pristranski cenilki: 15 -> 3*15 = 45
po ne pristranski cenilki: 15*sqrt(10/9) \approx 15.8114 -> 3*15.8114 = 47.4342

Glej recimo:
Variance @ Wikipedia

jernejl ::

Trikratni odmik znese 13,5, kar pomeni, da je vrednost 115 izven intervala 3*sigma.

101,5 + 13,5 je ravno 115, kar je na meji intervala 3*sigma.

Tole očitno ni res.

Zanj je slabša situacija tista, ki ima manjši standardni odklon.

Unilseptij ::

jernejl je izjavil:

Trikratni odmik znese 13,5, kar pomeni, da je vrednost 115 izven intervala 3*sigma.

101,5 + 13,5 je ravno 115, kar je na meji intervala 3*sigma.



Res je, jaz sem pomotoma računal odmik od vrednosti 100. Tako, da 115 v tem primeru ni izven intervala 3*sigma.

antonija ::

Unilseptij je izjavil:

Standardni odmik je ...
Gre za vzorec iz populacije, ne za celotno populacijo. Jaz sem racunal stdev z "n-1", lahko mi pa kdo razlozi zakaj bi racunanje samo z "n" bilo ustrezno na tako majhnem setu podatkov.

Drugace pa empiricno preizkusanje (v r-ju) vseh kombinacij xj in n ni dalo enega samega ustreznega rezultata, vse je bilo false. Sicer ni v matematicni obliki, ampak ce preizkusis vse mozne kombinacije bi tudi moralo nekaj veljati :)
Statistically 3 out of 4 involved usually enjoy gang-bang experience.

MaFijec ::

Gre za vzorec iz populacije, ne za celotno populacijo. Jaz sem racunal stdev z "n-1", lahko mi pa kdo razlozi zakaj bi racunanje samo z "n" bilo ustrezno na tako majhnem setu podatkov.

Seveda je pravilno tako in nič drugače.

Moj protiprimer pa je napačen in plod prepozne ure :)

jernejl ::

Gre za vzorec iz populacije, ne za celotno populacijo. Jaz sem racunal stdev z "n-1", lahko mi pa kdo razlozi zakaj bi racunanje samo z "n" bilo ustrezno na tako majhnem setu podatkov.

Če gre za vzorec iz populacije, potem si pravilno računal z n-1, ker je to malo bolj nepristranska cenilka za standardni odklon kot pa, če bi delil z n.

Ampak iz prvega posta ni bilo čisto jasno razvidno, ali gre za vzorčenje iz populacije ali ne (če ne bi bilo, bi uporabil deljenje z n).

Unilseptij ::

V vsakem primeru je "un-biased" standardni odklon (n-1) vedno večji od običajnega (n), zato, če ni rešitve za n, je ni niti za n-1.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Statistika interval zaupanja confidence level 95% komentar

Oddelek: Šola
51150 (518) bajsibajsi
»

Delo-ve ankete so posmeha vredne!

Oddelek: Loža
192485 (1507) Gandalfar
»

Genetski algoritem

Oddelek: Programiranje
142725 (2301) rasta
»

Python - problem

Oddelek: Programiranje
132700 (2430) slevin
»

program za statistiko???

Oddelek: Programska oprema
53265 (3196) kamperr

Več podobnih tem