» »

Intel: prihodnost so počasnejši in varčnejši čipi

1
2
»

pegasus ::

Odgovor je FPGA.

Blazz ::

krneki0001 je izjavil:

Pa sej ni problem. 1.6GHZ procesor s 100 jedri naredijo in bo za nekaj časa dovolj.


pri 100 jedrih, se pojavijo drugi resnejši problemi...

pegasus ::

So izzivi, a se jih da krotit. Velikega števila jeder ne moreš imeti cache coherent, ker ti cache sync traffic pokuri preveč memory bandwidtha. Zato razdeliš jedra v manjše cache coherent skupine na istem čipu (remember amd?) in ustvariš numa arhitekturo. Zato mora softver poskrbet, da se zaveda lokalnosti podatkov (kateri skupini jeder pripada kater ram) in ustrezno razporediti niti izvajanja med njimi. Za to danes že obstajajo knjižnice, s katerimi linkaš svojo kodo in stvar deluje precej dobro out-of-the box. Tako da nič nerešljivega, take zadeve se danes že dogajajo v zanimivih velikih sistemih, znanje in izkušnje so že na trgu in čas je, da se razširijo med splošno publiko.

Senitel ::

pegasus je izjavil:

Odgovor je FPGA.

Odgovor je depends... FPGA-ji niso noben silver bullet. Največji FPGA-ji imajo danes okrog 288M vrat, kar je zelo malo v primerjavi z ogromnimi CPU-ji in GPU-ji. That said, če imaš problem, ki dost sucks na bolj splošnih *PU-jih, so FPGA-ji idealna rešitev. Če ima pa še dovolj drugih ljudi isti problem se ti pa FPGA splača "pretopit" v ASIC, ker bo zadeva hitrejša in bolj energijsko učinkovita.

Invictus ::

pegasus je izjavil:

Tako da če se kdo od vas mota po FRIjih in podobnih ustanovah ter se znajde pred zaporedno kodo, jo najprej zabrišite v smeti in prepišite problem tako, da ga bo moč izvajati vzporedno. Svet vam bo hvaležen :)

Večina problemov ni paralelnih ...
"Life is hard; it's even harder when you're stupid."

http://goo.gl/2YuS2x

pegasus ::

Naučiti se jih moraš gledati iz taprave dimenzije, npr. časovne, prostorske in ugotoviti, iz katerega pogleda nimaš odvisnosti med "prej" in "pol", da lahko problem rešiš vzporedno. Včasih to zahteva tudi korak nazaj, ampak prej ko se tega izziva lotiš, bolje boš shajal v bodočnosti.

Invictus ::

c-lox je izjavil:

Invictus je izjavil:

Bo pač za vsak task čip preprogramiran.


Je že. Ampak zdaj se to reprogramira v design-time (za ENO aplikacijo). Želimo pa run-time (za MNOŽICO aplikacij). Nekakšen kompromis med generičnimi in specifičnimi enotami.

Saj to trenutno delata IBM in Xilinx. Ne najdem novice, ampak očitno je to prihodnost.

Ali pa večnitni procesorji kot SPARC s 128 nitmi. ZA procesiranje web zahtevkov se baje kar dobro obnesejo.
"Life is hard; it's even harder when you're stupid."

http://goo.gl/2YuS2x

7982884e ::

Saj to trenutno delata IBM in Xilinx. Ne najdem novice, ampak očitno je to prihodnost.


taka stvari bi lahko vlekla moorov zakon naprej. itak se computing seli v datacentre, uporabniki pa dobivajo samo še naprave za interface. tako da imo tudi če se tranzistorjev ne da več zmanjševat, se ni za bat, da nam bo zmanjkalo placa/štroma/denarja za nadaljevanje trendov v computingu

c-lox ::

Priznam, zapeljal me je tale poljuden članek: Hot Chips: Managing Moore's Law in sicer odlomek z naslovom: Shorter Commutes.

Nisem hardveraš in mi to sliči na obični FPGA. Sigurno pa so znotraj razni pristopi za čim večji izkoritek.
Ko sem preletaval po člankih omenjenega profesorja Darek Chiou-ja, sem našel sestavek v zvezi s tematiko:

Automatic compilation from a stylized C language and templates that define the hardware structure coupled with the intrinsic flexibility of FPGAs provide high performance, low power, and programmability.


Prav pa si imel, da je to stara zadeva (zame je vseeno sveže znanje :) - in vidim, da sem brcnil v temo s tisto idejo o JustInTime C->HDL prevajanju).
!not my imagination.

Invictus ::

Sam sem te Xilinxe programiral že na faksu pred 23 leti. ćal samo pri enem predmetu zaradi takratnega omejenega FRIjevskega pogleda na učni proces.

Problem teh čipov je bilo majhno število programabilnih vrat in cena. Zato so jih večinoma uporabljali za strogo namenske in drage zadeve ali za razvoj. Software je tud koštal precej denarja.

To se je spremenilo. Saj večina specializiranih zadev niti ne rabi toliko prostora na čipu.
"Life is hard; it's even harder when you're stupid."

http://goo.gl/2YuS2x

noraguta ::

Specifičen task se da pohitrit na hw nivojuza par razredov, arhitekture pa obstajajo za longlife zdeve. Polja so uporabna niso pa učinkovita na dolgi rok. Sicer nebi več obstajala ne intel, ne arm. Sicer pa niti vnparalelizmu so kot predizdelani elementi pri vodovodu, async sonpa coustom made elementi kibse konstruirajo po potrebi.
Prihodnost in sedanjost je fuzija obeh konceptov. Oz kaj se bolj izplača. Ni dovolj postavit zgolj nek koncept treba je potegnit tud razvijlce.

Konec koncev so že danes x86 in arm zgolj del procesorjev zraven pa podobna količina specializirane "navalake".
Pust' ot pobyedy k pobyedye vyedyot!

Zgodovina sprememb…

  • spremenilo: noraguta ()

pegasus ::

Naj to pustim še tu, ker je zelo on topic:

Če se prezentacije števil lotimo pravilno, pride paralelnost zraven sama for free.

Jst ::

Ta video sem že pred časom pogledal in je res zanimiv koncept.
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|

zee ::

pegasus je izjavil:

Naj to pustim še tu, ker je zelo on topic:

Če se prezentacije števil lotimo pravilno, pride paralelnost zraven sama for free.


Tale model je o Unumu predaval lani pri nas! 8-)
zee
Linux: Be Root, Windows: Re Boot
Giant Amazon and Google Compute Cloud in the Sky.

pegasus ::

Ja, in kolikor mi je znano, se tam v vaših krajih nekje razvija tudi prototipni hardver :)

          ::

Če se vrnem na novico (debata je sicer nadvse zanimiva) mi je odločitev, da se gre v varčenjše a počasnejše čipe, precej logična.

Dr_M ::

Po eni strani je politika ARMa precej uredu, nekaj visokozmogljivih jeder, za stvari, ki jih ni mogoce paralelizirati in vec sibkejsih jeder za ostalo.
Ampak ja, ko bo sofware sposoben zaznavat kaj kam pase.

Ampak trenutno so zmogljiva jedra v manjsem stevilu se vedno bog in batina. Jebiga, programerji so leni.
The reason why most of society hates conservatives and
loves liberals is because conservatives hurt you with
the truth and liberals comfort you with lies.

krneki0001 ::

Dr_M je izjavil:

Po eni strani je politika ARMa precej uredu, nekaj visokozmogljivih jeder, za stvari, ki jih ni mogoce paralelizirati in vec sibkejsih jeder za ostalo.
Ampak ja, ko bo sofware sposoben zaznavat kaj kam pase.

Ampak trenutno so zmogljiva jedra v manjsem stevilu se vedno bog in batina. Jebiga, programerji so leni.


Nope, programerji nismo leni. Zahteve so take, da je treba tako narest. Čimceneje in čimhitreje do cenenega izdelka, ki se bo drago prodajal.

Zgodovina sprememb…

pegasus ::

Ja, včeraj sem gledal xeon D talk iz hotchips 27 in zadeva je nekje na optimumu perf/watt, ki ga omogoča današnja tehnologija. Seveda ob željeni latenci, memory bandwidthu in količini rama, ki jo pogojujejo workloadi kot so distributed web apps in vse, kar to vključuje. Zanimiv proc ...

Dr_M: zato je smiselno podpirat AMD in njihvo HSA :) Da bodo programerji malo lažje zadihali ... Recimo java 9 bo znala to native izkoriščat, upam da bodo prednosti očitne in da bo to zapopadel tudi enterprise. Potem se bo stvar premaknila naprej ...

Napajalc ::

To sploh ni slabo kar imamo. Število jeder in frekvenca data jaso sliko kaj potrebujemo ob nakupu. Raje naj intel/AMD/microsoft izjavi da so ti pa ti CPU dovolj močni za naslednjih 10 let za dnevna opravila.
Za ostale pa zbolšat varčevalne funkcije tako za idle kot določen task, narest desktop plate za CPU iz laptopa če negre drugače.
011011100111010101100010

m0LN4r ::

Zanimivo je pogledati dva procesorja z 10 let razlike:
Pentium 4 - 670:
2MB cache,
3.8GHz,
1 Core,
1.2-1.4V,
no iGPU,
115W TDP,
HT support
-
i7 - 5775C :
6MB cache,
3.7GHz @1.22V (4.0GHz@1.225V)
4 Core
(4.0GHz@1.225V)
Iris Pro 6200 a.k.a. R7 250X
65W TDP
+4 Threads

- oz. brez iGPU pri podobnem TDP, kot ga ima pentium pa se -
i7 - 4930K (sicer razlika med njima samo 8 let)
12MB cache
3.9GHz
6 Core
1.26V
no iGPu
130W TDP
+6 Threads

- In nenazadnje -
X5 - Z8300
2MB Cache
1.5 -1.8GHz
4 Core
iGPU Cherry Trail
2-4W TDP

Tale atomcek je predvsem zanimiv.

Ima polovico nizje frekvence od pentiuma, graficno, 4 Jedra, 110W manjsi TDP a hkrati izracuna sliko v cinebenchu 2x hitreje.
Prebavi vecino multimedijske in spletne vsebine z levo roko in brez dodatne graficne, ter je za potrebe vecine gospodinjstev povsem dovolj.
Ter: 3840×2160 up to 30 Hz / 4096×2160 up to 24Hz, and HEVC/H.265 hardware support.

Se mal pa bomo igre igral na 2GHz 8 jedrnikih z integrirano GT4e in 100W TDP, enako kot z kakim 200W 8 jedrnim FXom na 5GHz in dodatno graficno R7 360.
https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

Napajalc ::

Sej to, imamo i3 z 15W TDP, je razlika med 100w in 15w, ampak med 15w in 5w je že skoraj zanemarljivo če se futramo z utičnice.
011011100111010101100010

m0LN4r ::

Zanemarljivo ni, ker < 5W lahko das v telefon in se hladi pasivno, kokr pac odda toplote skozi stranico ohisja.
15W pa je ze krepko prevec. Se pa da ohladit z enim heatpipom in eno aluminijasto plosco.

Med hladilnimi telesi za < 5W in 15W bo kr razlika. Telefon vs. alu blok.
https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

Napajalc ::

Govorim za home PC in relacijo 10 let, torej i3 bo kvečjemu prepočasen, porabo ima dost dobro že sedaj.
011011100111010101100010

m0LN4r ::

10 let je itak brezveeze gledat, ker taka jajca od atomov dobis pr kitajcih za 150$ tuto kompleto z diskom, ekranom, ramom in windowsi.

Problem so razne HW pospesene komponente, ki se razvijajo socasno. Danes h.264, jutri h.265, pa ze delajo na novejsem standardu. HTML5 je tut velik gamechanger napram flashu.
https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

Zgodovina sprememb…

  • spremenil: m0LN4r ()

Napajalc ::

Taki smo ljudje, zakaj 150$ za up to date zadevo če lahko daš 300$ OP zadevo za 3x dalšo uporabo. Prihranek 150$
011011100111010101100010

m0LN4r ::

Stos je v tem, da nebos dobil 3x dalso zaradi vedno novejsih standardov. Poglej kok dragih cpujev je romalo pred davnimi casi v kos, ko so prisli prvi FHD mpeg4 filmi.
Za 2 Titanika si potrosu 1KW, dans pa 1000x manj za isto stvar.

Pa da ne omenjamo novih instrukcij znotraj samega cpuja.
https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

Zgodovina sprememb…

  • spremenil: m0LN4r ()

Mr.B ::

Napajalc je izjavil:

Taki smo ljudje, zakaj 150$ za up to date zadevo če lahko daš 300$ OP zadevo za 3x dalšo uporabo. Prihranek 150$

V bistvu če ne rabiš računati štroma in hlajenja pa amortizacije, se vse izide. PAč tako ot nekateri še vedno furajo virtualizacijo na kakem HP G5 infrastrukturi, ki se ne prodajajo rečmo ene deset let. Ampak sej dela.
France Rejects Genocide Accusations Against Israel in Gaza,
To accuse the Jewish state of genocide is to cross a moral threshold

m0LN4r ::

Oni so bolj jaki ko rabijo 200W+ za en FHD film in se ventilatorji sucejo na polno vkljucno z napajalnikom.
Saj dela.
https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

Napajalc ::

m0LN4r je izjavil:

Stos je v tem, da nebos dobil 3x dalso zaradi vedno novejsih standardov. Poglej kok dragih cpujev je romalo pred davnimi casi v kos, ko so prisli prvi FHD mpeg4 filmi.
Za 2 Titanika si potrosu 1KW, dans pa 1000x manj za isto stvar.

Pa da ne omenjamo novih instrukcij znotraj samega cpuja.


Morš met mal občutka kaj je dovolj in koliko je 15w, te razumem da je zate 150w idle normalno, naslov teme je smernica za take kot si ti.
011011100111010101100010

m0LN4r ::

150W za sest pravih jeder, high end grafo in prizganim TVjem med predvajanjem filma, se mi zdi kr lepa stevilka.
https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

Napajalc ::

Je rekla zlata ribca. Navad se osnov owerclocka pa ti ne bo treba lagat.
011011100111010101100010

D3m0r4l1z3d ::

Napajalc je izjavil:

Je rekla zlata ribca. Navad se osnov owerclocka pa ti ne bo treba lagat.

angleščina ti dela probleme, to je očitno izvor tvoje slabe razgledanosti
ETN Wallet addr.: etnkGuvhDzR7Dh8us4e69VStubGbmQHrh5pe2fnpNDhEhX5
A1nCWrFBMK2NmkycgVN4sAwhvY8YyNNbF6KUSJyFZ99QKU8phCn
Cryptopia ref. link: https://www.cryptopia.co.nz/Register?referrer=Anymalus

Mr.B ::

Napajalc je izjavil:

Je rekla zlata ribca. Navad se osnov owerclocka pa ti ne bo treba lagat.


Sej vem, se je izkazalo da je navijanje full uspešno in cenovno sprejemljivo, vključujoč z vso dodatno porabo...
France Rejects Genocide Accusations Against Israel in Gaza,
To accuse the Jewish state of genocide is to cross a moral threshold

Napajalc ::

Vsi trije ponajdte i3 z 15W tdp, in preberte v angleščini.
011011100111010101100010

m0LN4r ::

Kaj ti bo i3 z 15W, ce mas lahko 200W FXa za 10 let ??
https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

Zgodovina sprememb…

  • spremenil: m0LN4r ()

D3m0r4l1z3d ::

m0LN4r je izjavil:

Kaj ti bo i3 z 15W, ce mas lahko 200W FXa za 10 let ??

amen!
ETN Wallet addr.: etnkGuvhDzR7Dh8us4e69VStubGbmQHrh5pe2fnpNDhEhX5
A1nCWrFBMK2NmkycgVN4sAwhvY8YyNNbF6KUSJyFZ99QKU8phCn
Cryptopia ref. link: https://www.cryptopia.co.nz/Register?referrer=Anymalus

Napajalc ::

FX je milina z 200w, si predstavljaš 2x i5 skupi zleplen na 4.8ghz in 450w?
011011100111010101100010

D3m0r4l1z3d ::

Napajalc je izjavil:

FX je milina z 200w, si predstavljaš 2x i5 skupi zleplen na 4.8ghz in 450w?

link za enega na 4,8 z 450/2W
ETN Wallet addr.: etnkGuvhDzR7Dh8us4e69VStubGbmQHrh5pe2fnpNDhEhX5
A1nCWrFBMK2NmkycgVN4sAwhvY8YyNNbF6KUSJyFZ99QKU8phCn
Cryptopia ref. link: https://www.cryptopia.co.nz/Register?referrer=Anymalus

m0LN4r ::

Napajalc je izjavil:

FX je milina z 200w, si predstavljaš 2x i5 skupi zleplen na 4.8ghz in 450w?

Bol tezko. Si pa predstavlam 5960X (2xi7) na 5GHz z 200W in 16th
https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

Zgodovina sprememb…

  • spremenil: m0LN4r ()

krneki0001 ::

Že z X5650 (6c/12th) na 4.6GHz je zanimivo, pa je to prastar procesor.

pegasus ::

Ker smo v tej temi že omenjali unum in prihodnost, poskusimo s tem nadaljevati.

Dejstvo je, da so računske operacije v procesorjih postale "poceni" s stališča porabe energije in da je "futranje" teh podatkov procesorjem nekje do tri velikostne razrede bolj potratno in zato dražje. Mnogo sredstev se zato vlaga v raziskave, kako zmanjšati premetavanje bitov sem in tja. Eden od aktualnih predlogov je posit, izpeljanka Gustafsonove unum ideje. Nekaj se šušlja, da je prototipni hardver že v testiranju. Gotovo bomo več izvedeli na prihajajoči konferenci.

Te dni je začel Intel odkrivati več informacij o produktu Nervana, ki izhaja iz nakupa tega startupa avgusta lani. Ena izmed ključnih novosti v tej arhitekturi je predstavitev števil flexpoint, ki naj bi bila prilagojena za tipične scenarije matematike v procesu treniranja nevronskih mrež. Članek še berem, a zaenkrat izgleda, kot da je isto razmišljanje pripeljalo do drugačnega rezultata, zaradi drugačnih motivacij (unum - general arithemtic, flexpoint - ML tensors). Kakorkoli, izgleda kot da smo na pragu nove revolucije v računalništvu in da bodo tranzistorji aktualni še nekaj časa.
1
2
»


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Intel: prihodnost so počasnejši in varčnejši čipi (strani: 1 2 )

Oddelek: Novice / Procesorji
9118673 (11560) pegasus
»

Moorov zakon pol stoletja pozneje

Oddelek: Novice / Znanost in tehnologija
4315255 (9936) Jst
»

IBM razvil najmanjši in najhitrejši grafenski procesor

Oddelek: Novice / Znanost in tehnologija
3211210 (9667) Xserces
»

Virus uploadan

Oddelek: Znanost in tehnologija
362752 (2085) zee

Več podobnih tem