Forum » Strojna oprema » flops/wat
flops/wat
pegasus ::
Senitel ::
Problem je prekladanje podatkov sem in tja. Lahko vržemo par stvari skozi okno (recimo koherenco čez L1/L2/L3/... cache,...) in bodo splošno programabilni čipi precej bolj učinkoviti glede porabe.
In japončki niso prišli do 6.5G flops/W s FPGA-ji. Naredili so logiko čipa, jo preverili na FPGA, in potem naredili skoraj klasičen ASIC. To je praktično isto kot delajo proizvajalci GPU-jev (in verjetno tudi CPU-jev), samo da v teh primerih nimaš dovolj velikih FPGA-jav, da bi lahko poganjali cel GPU.
Če tvoj problem recimo vse skoz počenja samo: a + b * c + d * e * f + g potem je energetsko in performančno veliko bolj učinkovito, če imaš čip z nekim vezjem, ki naredi: r = f(a, b, c, d, e, f, g), kot pa če imaš splošno namenski čip, ki naredi nekaj ala: t1 = b * c, t2 = a + t1, t3 = d * e, t4 = t3 * f, t5 = t2 + t4, r = t5 + g.
In japončki niso prišli do 6.5G flops/W s FPGA-ji. Naredili so logiko čipa, jo preverili na FPGA, in potem naredili skoraj klasičen ASIC. To je praktično isto kot delajo proizvajalci GPU-jev (in verjetno tudi CPU-jev), samo da v teh primerih nimaš dovolj velikih FPGA-jav, da bi lahko poganjali cel GPU.
Če tvoj problem recimo vse skoz počenja samo: a + b * c + d * e * f + g potem je energetsko in performančno veliko bolj učinkovito, če imaš čip z nekim vezjem, ki naredi: r = f(a, b, c, d, e, f, g), kot pa če imaš splošno namenski čip, ki naredi nekaj ala: t1 = b * c, t2 = a + t1, t3 = d * e, t4 = t3 * f, t5 = t2 + t4, r = t5 + g.
pegasus ::
Kul, sogovornik :)
Prekladanje podatkov ... lahko iz tega sledi, da bi na dolgi rok cisc/vliw pristop bil energetsko učinkovitejši?
Malo me rajcajo vse te exaflop debate, pa še ni nekih jasnih smernic, kako se sploh lotit problema ...
Prekladanje podatkov ... lahko iz tega sledi, da bi na dolgi rok cisc/vliw pristop bil energetsko učinkovitejši?
Malo me rajcajo vse te exaflop debate, pa še ni nekih jasnih smernic, kako se sploh lotit problema ...
Pyr0Beast ::
Na kratko - kar narediš za zvečanje izkoristka zabiješ pri večnamenskosti.
Some nanoparticles are more equal than others
Good work: Any notion of sanity and critical thought is off-topic in this place
Good work: Any notion of sanity and critical thought is off-topic in this place
mirancar ::
Če tvoj problem recimo vse skoz počenja samo: a + b * c + d * e * f + g potem je energetsko in performančno veliko bolj učinkovito, če imaš čip z nekim vezjem, ki naredi: r = f(a, b, c, d, e, f, g), kot pa če imaš splošno namenski čip, ki naredi nekaj ala: t1 = b * c, t2 = a + t1, t3 = d * e, t4 = t3 * f, t5 = t2 + t4, r = t5 + g.
temu bi se reklo strojno pospeševanje?
Senitel ::
Če tvoj problem recimo vse skoz počenja samo: a + b * c + d * e * f + g potem je energetsko in performančno veliko bolj učinkovito, če imaš čip z nekim vezjem, ki naredi: r = f(a, b, c, d, e, f, g), kot pa če imaš splošno namenski čip, ki naredi nekaj ala: t1 = b * c, t2 = a + t1, t3 = d * e, t4 = t3 * f, t5 = t2 + t4, r = t5 + g.
temu bi se reklo strojno pospeševanje?
Tako je. GPU-ji so tipičen primer tega. Teksturirne enote so recimo narejene na točno tak način. Shader core ja pa programabilen. Isto je tale GRAPE-8, ki ga je pegasus linkal v uvodu. Namembnost je seveda druga.
Prekladanje podatkov ... lahko iz tega sledi, da bi na dolgi rok cisc/vliw pristop bil energetsko učinkovitejši?
CISC/RISC se mi zdi malo outdated, ker se gre bolj za porabo prostora za izvršno kodo.
Tule, slide 37 recimo.
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | Podatkovne baze - NormalizacijaOddelek: Pomoč in nasveti | 6309 (5015) | petzup |
» | izpelji g?Oddelek: Šola | 885 (806) | crush |
» | 7 segmentni LCD prikazovalnik...Oddelek: Šola | 5429 (4609) | mte |
» | [Java] razlaga kodeOddelek: Programiranje | 1999 (1585) | Sergio |
» | noteOddelek: Sedem umetnosti | 7331 (7264) | drevo |