12th Gen Intel Core - Alder Lake @ Slo-Tech

Forum » Strojna oprema »
12th Gen Intel Core - Alder Lake

12th Gen Intel Core - Alder Lake

25 / 35

FlyingBee :: 15. jan 2022, 23:09

Še dobro, da je Alder Lake tema, x86 client CPUji.

P200 MMX, 32mb ram, 2gb HDD, s3 virge 2mb, 14" CRT 640x480
New Sphincter Kvartet:
Roko Spestner, Namaž Zlevčar, Daje Heading, Maraje Spetan

Zgodovina sprememb…

spremenil: FlyingBee (15. jan 2022 ob 23:17)

Wrop :: 15. jan 2022, 23:09

Če bi bilo to tako uporabno, bi že naredili. To so nišne zadeve. Že en usran FPGA čip na 28 nm tehnologiji te stane 100+ $. Na 16 nm - o cutting edge čipih pa raje ne bi. Govorimo od 10k$ in pa večkratnik tega. Tisti, ki ga kupi, prekleto dobro ve zakaj ga je kupil.

korenje3 :: 15. jan 2022, 23:12

Wrop je 15. jan 2022 ob 23:09 izjavil:

Če bi bilo to tako uporabno, bi že naredili. To so nišne zadeve. Že en usran FPGA čip na 28 nm tehnologiji te stane 100+ $. Na 16 nm - o cutting edge čipih pa raje ne bi. Govorimo od 10k$ in pa večkratnik tega. Tisti, ki ga kupi, prekleto dobro ve zakaj ga je kupil.

FPGA procesorji lahko stanejo po 10kEUR ali več. S tem pa lahko sprogramiraš za par milijonov tranzistorskih vrat.

Sem že pred 15 leti vidu PCBje velike 1x1m, ki so imeli po kakih 100 xilinx procesorjev gor. Očitno narejeno za neke posebne zadeve. Vprašanje če bi to danes uporabil za rudarjenje kripto. Kaj se lahko ven izlušči :)

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

Zgodovina sprememb…

spremenil: korenje3 (15. jan 2022 ob 23:14)

Wrop :: 16. jan 2022, 00:50

Par milijonov vrat ni nič v primerjavi z 10.000 milijoni transistorjev, ki jih ima en APU. Tudi če potrebuješ povprečno 10 transistorjev za ena vrata, je to 1.000x več. Ob tem, da so ponavadi ti poceni FPGA 10x počasnejši, če si izredno pazljiv pri načrtovanju. Da ti vezje deluje na 100 MHz se moraš že kar potruditi. Imajo sicer enote za celoštevilsko 24-48 bitno seštevanje/odštevanje/množenje, ki so precej hitri, če jih potrebuješ in da ne tratiš ostalih delov v FPGA. Za neke splošno računanje, dvomim, da je FPGA primeren.
Če pa zajemaš in obdeluješ kakšne signale, ga pa ni CPUja za PC, ki bi to vse zmogel. FPGA je res dober za izdelavo kakšnih prototipov in nizkoserijskih specifičnih izdelkov.

korenje3 :: 16. jan 2022, 01:00

Wrop je 16. jan 2022 ob 00:50 izjavil:

Par milijonov vrat ni nič v primerjavi z 10.000 milijoni transistorjev, ki jih ima en APU. Tudi če potrebuješ povprečno 10 transistorjev za ena vrata, je to 1.000x več. Ob tem, da so ponavadi ti poceni FPGA 10x počasnejši, če si izredno pazljiv pri načrtovanju. Da ti vezje deluje na 100 MHz se moraš že kar potruditi. Imajo sicer enote za celoštevilsko 24-48 bitno seštevanje/odštevanje/množenje, ki so precej hitri, če jih potrebuješ in da ne tratiš ostalih delov v FPGA. Za neke splošno računanje, dvomim, da je FPGA primeren.
Če pa zajemaš in obdeluješ kakšne signale, ga pa ni CPUja za PC, ki bi to vse zmogel. FPGA je res dober za izdelavo kakšnih prototipov in nizkoserijskih specifičnih izdelkov.

kaj ti bo 10 milijard tranzistorjev, če lahko samo 8 jedr računa aritmetične funkcije vzporedno? 10 milijard tranzistorjev za 8 kalkulatorjev?
Z FPGA lahko sprogramiraš 8000 kalkulatorjev, ki računajo vzporedno.

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

Zgodovina sprememb…

spremenil: korenje3 (16. jan 2022 ob 01:00)

FlyingBee :: 16. jan 2022, 09:44

Kaj ti bo torba, če imaš kolo?
Client Alder Lake tema.

P200 MMX, 32mb ram, 2gb HDD, s3 virge 2mb, 14" CRT 640x480
New Sphincter Kvartet:
Roko Spestner, Namaž Zlevčar, Daje Heading, Maraje Spetan

Wrop :: 16. jan 2022, 10:55

korenje3 je 16. jan 2022 ob 01:00 izjavil:

kaj ti bo 10 milijard tranzistorjev, če lahko samo 8 jedr računa aritmetične funkcije vzporedno? 10 milijard tranzistorjev za 8 kalkulatorjev?
Z FPGA lahko sprogramiraš 8000 kalkulatorjev, ki računajo vzporedno.

11 milijard tranzistorjev pri NAVI 23 sestavlja 32 CU enot, katera je vsaka sposobna 128 INT32 operacij na cikel. Pri 2,5 GHz je to 10 T Int32 operacij/s. Stane pa 400 €. 8000 kalkuratorjev, ki niso niti 32 bitni, so v najboljšem primeru zmožna četrtino tega, s tem, da tak čip stane 100 kratnik. Ob tem, da CU v GPU podpirajo precej več različnih operacij kot DPS enote v FPGA. Kar pa GPU in CPU ne znata oz. nista namenjena temu, da bi zajemal več signalov na vhodu in jih procesiral po svojih potrebah.

hujsk1999 :: 16. jan 2022, 10:58

Jaz pa uporabljam samo en kalkulator za računanje. In še to vgrajenega v operacijski sistem. Ampak se mi zdi vseeno fino imeti 12900k ker 500€ ni nek denar v teh časih.

korenje3 :: 16. jan 2022, 12:57

Wrop je 16. jan 2022 ob 10:55 izjavil:

korenje3 je 16. jan 2022 ob 01:00 izjavil:

kaj ti bo 10 milijard tranzistorjev, če lahko samo 8 jedr računa aritmetične funkcije vzporedno? 10 milijard tranzistorjev za 8 kalkulatorjev?
Z FPGA lahko sprogramiraš 8000 kalkulatorjev, ki računajo vzporedno.

11 milijard tranzistorjev pri NAVI 23 sestavlja 32 CU enot, katera je vsaka sposobna 128 INT32 operacij na cikel. Pri 2,5 GHz je to 10 T Int32 operacij/s. Stane pa 400 €. 8000 kalkuratorjev, ki niso niti 32 bitni, so v najboljšem primeru zmožna četrtino tega, s tem, da tak čip stane 100 kratnik. Ob tem, da CU v GPU podpirajo precej več različnih operacij kot DPS enote v FPGA. Kar pa GPU in CPU ne znata oz. nista namenjena temu, da bi zajemal več signalov na vhodu in jih procesiral po svojih potrebah.

z fpga lahko narediš 512 bitne kalkulatorje oz. čisto poljubno število bitov.

hujsk1999 je 16. jan 2022 ob 10:58 izjavil:

Jaz pa uporabljam samo en kalkulator za računanje. In še to vgrajenega v operacijski sistem. Ampak se mi zdi vseeno fino imeti 12900k ker 500€ ni nek denar v teh časih.

da cel sistem sestaviš za 12900k te pride 2500€ (če že sestavljaš normalnega). praktično celo plačo porabiš za pc.

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

Zgodovina sprememb…

spremenil: korenje3 (16. jan 2022 ob 12:58)

DarwiN :: 16. jan 2022, 13:23

Ha! 12400F navit na 5.2Ghz.. To bi po dolgem času pomenilo, da ima OC ponovno nek smisel (+20-30%). Ampak zaenkrat potrebuješ 600€ plato, tko da... ;((

P.s.: Mi je der8auer odgovoril na YT: "Just needs some work from the mainboard manufacturers :) I'm doing my best to influence on this"
Ampak še vedno dvomim, da bo iz te moke kaj kruha.

You don't see faith healers working in hospitals
for the same reason you don't see psychics winning the lottery!

Zgodovina sprememb…

spremenil: DarwiN (16. jan 2022 ob 13:26)

gddr85 :: 16. jan 2022, 13:26

no ja, če daš 2k za spodoben gpu, daš pa še 600 bucks za eno platko :P

DarwiN :: 16. jan 2022, 13:27

Ja, 2k za GPU, 600 za plato, potem pa zategneš pri CPUju, da bi prišparal 50€.

You don't see faith healers working in hospitals
for the same reason you don't see psychics winning the lottery!

Meizu :: 16. jan 2022, 13:35

Ja, je treba dejansko kupit tudi kaj za jest, ne... :)

korenje3 :: 16. jan 2022, 13:38

bitcoin kolapsira proti 28k€, takrat zna pridet do večjih selloff grafičnih kartic.

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

scipascapa :: 16. jan 2022, 13:41

korenček: 2500€ plača? HAHA si me nasmejal.

korenje3 je 16. jan 2022 ob 13:38 izjavil:

bitcoin kolapsira proti 28k€, takrat zna pridet do večjih selloff grafičnih kartic.

že čas, da propadejo.

Zgodovina sprememb…

spremenil: scipascapa (16. jan 2022 ob 13:41)

Wrop :: 16. jan 2022, 13:50

korenje3 je 16. jan 2022 ob 12:57 izjavil:

z fpga lahko narediš 512 bitne kalkulatorje oz. čisto poljubno število bitov.

To lahko narediš na kateremkoli CPU.

korenje3 :: 16. jan 2022, 13:55

Wrop je 16. jan 2022 ob 13:50 izjavil:

korenje3 je 16. jan 2022 ob 12:57 izjavil:

z fpga lahko narediš 512 bitne kalkulatorje oz. čisto poljubno število bitov.

To lahko narediš na kateremkoli CPU.

Ne na nivoju strojne opreme ampak emulirano. Ne razumeš te stvari. x86 so 64 bitni sistemi.

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

Zimonem :: 16. jan 2022, 14:03

Ascii kot so avx niso že davno nobena posebnost. Softwersko pa lahko rešuješ arbitrary precision aritmetiko. Predvsem je pa razvoj cenejši.

hujsk1999 :: 16. jan 2022, 14:54

korenje3 je 16. jan 2022 ob 12:57 izjavil:

da cel sistem sestaviš za 12900k te pride 2500€ (če že sestavljaš normalnega). praktično celo plačo porabiš za pc.

Tvojo celo plačo. Ker je to sorazmerno nizka plača za nekoga ki je ekspert in ima 5+ let delovne dobe. Potrudi se za napredovanje.

Zgodovina sprememb…

predlagalo izbris: FireSnake (16. jan 2022 ob 16:44)

Wrop :: 16. jan 2022, 15:24

korenje3 je 16. jan 2022 ob 13:55 izjavil:

Wrop je 16. jan 2022 ob 13:50 izjavil:
korenje3 je 16. jan 2022 ob 12:57 izjavil:

z fpga lahko narediš 512 bitne kalkulatorje oz. čisto poljubno število bitov.

To lahko narediš na kateremkoli CPU.

Ne na nivoju strojne opreme ampak emulirano. Ne razumeš te stvari. x86 so 64 bitni sistemi.

Pa saj je vseeno, če je emulirano. Za seštevanje 512 bitne operande rabiš 8x izvesti ukaz ADC pri x64 CPU. To pomeni, da efektivno računaš s cca 500 MHz. Na FPGA pa tudi ne bo delalo s maksimalno frekvenco, ampak bo tudi precej nižja. Na pamet bi rekel, da med 4-8x nižjo. Kar znese pod 100 MHz, pri najhitrejših FPGAjih.
x86 so 32 bitni, ne 64 bitni, kot si zapisal.

Meizu :: 16. jan 2022, 15:39

Tvojo celo plačo. Ker je to sorazmerno nizka plača za nekoga ki je ekspert in ima 5+ let delovne dobe. Potrudi se za napredovanje.

Se strinjam. Zame, ki služim 50k€/mesec je to miškin dim.

korenje3 :: 16. jan 2022, 15:56

hujsk1999 je 16. jan 2022 ob 14:54 izjavil:

korenje3 je 16. jan 2022 ob 12:57 izjavil:
da cel sistem sestaviš za 12900k te pride 2500€ (če že sestavljaš normalnega). praktično celo plačo porabiš za pc.

Tvojo celo plačo. Ker je to sorazmerno nizka plača za nekoga ki je ekspert in ima 5+ let delovne dobe. Potrudi se za napredovanje.

sem pisal na splošno.

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

korenje3 :: 16. jan 2022, 16:05

Wrop je 16. jan 2022 ob 15:24 izjavil:

korenje3 je 16. jan 2022 ob 13:55 izjavil:
Wrop je 16. jan 2022 ob 13:50 izjavil:
korenje3 je 16. jan 2022 ob 12:57 izjavil:

z fpga lahko narediš 512 bitne kalkulatorje oz. čisto poljubno število bitov.

To lahko narediš na kateremkoli CPU.

Ne na nivoju strojne opreme ampak emulirano. Ne razumeš te stvari. x86 so 64 bitni sistemi.

Pa saj je vseeno, če je emulirano. Za seštevanje 512 bitne operande rabiš 8x izvesti ukaz ADC pri x64 CPU. To pomeni, da efektivno računaš s cca 500 MHz. Na FPGA pa tudi ne bo delalo s maksimalno frekvenco, ampak bo tudi precej nižja. Na pamet bi rekel, da med 4-8x nižjo. Kar znese pod 100 MHz, pri najhitrejših FPGAjih.
x86 so 32 bitni, ne 64 bitni, kot si zapisal.

fpgaji niso 32 bitni. sploh ne veš kaj je fpga.

Delajo pa z nizko frekvenco, ker lahko aktiviraš bistveno več tranzistorjev/cikel kot v x86 procesorjih. To je podobno kot pri xeon procesorjih ravno zaradi enakega problema. Pač večji izkupiček procesne moči je pri nižjih frekvencah, edini problem zaradi tega je da pridobiš na vzporednem procesiranju, medtem ko zaporedno začne trpet. Pri x86 sistemih je pa pomembno zaporedno procesiranje. In zaporedno procesiranje rešujejo s kompleksnimi ukazi, kjer lahko sprocesiraš več podatkov večkrat v enem ciklu. Recimo avx-512 je dober primer. Ravno zaradi tega ima avx-512 cappano frekvenco, ker aktivira preveč tranzistorjev naenkrat in bi lahko skurilo procesor.

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

Zimonem :: 16. jan 2022, 16:28

Pri x86 sistemih je pa pomembno zaporedno procesiranje. In zaporedno procesiranje rešujejo s kompleksnimi ukazi, kjer lahko sprocesiraš več podatkov večkrat v enem ciklu. Recimo avx-512 je dober primer.

Stopnjo do katere se da problem reševat vzporedno je opisano bi amdalovem pravilu. Še da relativno preproste stvari delat s FPGA. Ampak rinese to s seboj cel kup problemov kateri so rešeni na splošno namenskih procesorjih ali gpgujih.

scipascapa :: 16. jan 2022, 16:43

https://www.mindfactory.de/Highlights/M...

Vuli :: 16. jan 2022, 16:54

Non-K se da spet fajn OCjat preko BCLK. Mari, da ne podpirajo pa vse plate tega, podobna zgodba kot pri Z170 chipsetu, če se ne motim, samo še boljš.

Wrop :: 16. jan 2022, 18:05

korenje3 je 16. jan 2022 ob 16:05 izjavil:

fpgaji niso 32 bitni. sploh ne veš kaj je fpga.

Delajo pa z nizko frekvenco, ker lahko aktiviraš bistveno več tranzistorjev/cikel kot v x86 procesorjih. To je podobno kot pri xeon procesorjih ravno zaradi enakega problema. Pač večji izkupiček procesne moči je pri nižjih frekvencah, edini problem zaradi tega je da pridobiš na vzporednem procesiranju, medtem ko zaporedno začne trpet. Pri x86 sistemih je pa pomembno zaporedno procesiranje. In zaporedno procesiranje rešujejo s kompleksnimi ukazi, kjer lahko sprocesiraš več podatkov večkrat v enem ciklu. Recimo avx-512 je dober primer. Ravno zaradi tega ima avx-512 cappano frekvenco, ker aktivira preveč tranzistorjev naenkrat in bi lahko skurilo procesor.

Nikjer nisem napisal, da so FPGA 32 bitni.

Ne, ne delajo zaradi tega na nizkih frekvencah, ker bi lahko aktiviral bistveno več tranzistorjev na cikel. Razdalje so enostavno prevelike, da bi vezje teklo na visokih frekvencah. Večji izkupiček procesne moči je pri višjih frekvencah. Če si pa mislil energijski izkupiček, se pa strinjam. Bolje je nič računati, če je energija problem. Pri x86 in x64 sistemih je hitrost zaporednega procesiranja pomembna, se strinjam. In tega načeloma ne rešujejo s kompleksnimi ukazi. Rešujejo ga z uvedbo različnih principov, npr. špekulativno izvrševanje ukazov, uvedbo hyperthreadinga, cel kup zadev, da se eliminira ali združuje ukaze, pohitritev trenutnih ukazov, večjimi predpomnilniki in dodatno logiko, da je zgrešitev pri dostopih do predpomnilnikov čim manjša, da so pri skokih zastoji v CPU čim krajši, itd. Večjo zmogljivost procesiranja procesiranja, pa lahko tudi rešuješ z siršimi računskimi enotami in temu prilagojenimi ukazi, ampak to ti pomaga samo če imaš take vrste probleme, ki to omogočajo. Pri računanju odvisnih podatkov, ti AVX512 prav nič ne pomaga.

korenje3 :: 16. jan 2022, 18:22

Sej pravim da ne veš kaj pišeš. Razdalje nimajo nobene vloge, ker imaš na vsakih nekaj tranzistorjev "poživitveno napajanje" - tudi programabilno.
Sicer pa prvo moraš sprogramirat fpga čip preden začneš pametovati.

"In tega načeloma ne rešujejo s kompleksnimi ukazi" - narobe. rešujejo s kompleksnimi ukazi, tako da se čim večje zaporedje podatkov reši v čim manj ciklih. včasih so bile funkcije a+b=c, danes lahko računa a+b*c/d^e=f v enem ciklu. Če razumeš kaj ti hočem povedat.

"npr. špekulativno izvrševanje ukazov" - ok spet neko nepoznavanje. Te stvari se uporablja za loop ukaze, kjer se išče smer iz nabora podatkov v pozitivno ali negativno stran, da se najde specifični element.

"uvedbo hyperthreadinga" - izvajanje dupliranih funkcij na jedru (to je vzporedno 2 enaka ukaza). Torej kako je dupliciranje ukazov 2x(a+b)=c boljše kot multipliciranje nx(a+b)=c ?

"dodatno logiko, da je zgrešitev pri dostopih do predpomnilnikov čim manjša" - kakšne zgrešitve? kaj sanjaš? pri zaporednem procesiranju se vedno ve na katero mesto dostopat če ne crkne program.

intel je že pred leti analiziral tipe ukazov, ki se izvajajo na procesorju in jih spravil v posebne funkcije, ki so danes del sse, avx ipd.

Če program teh ukazov ne uporabablja potem ni pohitritve, če jih pa pa je. Vse to je delo prevajalnika programske kode.

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

Wrop :: 16. jan 2022, 21:26

korenje3 je 16. jan 2022 ob 18:22 izjavil:

Sej pravim da ne veš kaj pišeš. Razdalje nimajo nobene vloge, ker imaš na vsakih nekaj tranzistorjev "poživitveno napajanje" - tudi programabilno.
Sicer pa prvo moraš sprogramirat fpga čip preden začneš pametovati.

Jao...

korenje3 je 16. jan 2022 ob 18:22 izjavil:

"In tega načeloma ne rešujejo s kompleksnimi ukazi" - narobe. rešujejo s kompleksnimi ukazi, tako da se čim večje zaporedje podatkov reši v čim manj ciklih. včasih so bile funkcije a+b=c, danes lahko računa a+b*c/d^e=f v enem ciklu. Če razumeš kaj ti hočem povedat.

Tako si mimo vsekal, da še sam ve veš kako. Množenje, deljenje, pa še na potenco bi ti računal v enem ciklu? :))

Osnovni koncepti načrtovanja aritmetične logične enote ti niso jasne. Hipotetično lahko to izračunaš v enem ciklu, ampak ta cikel bo tako dolg, da ti frekvenca v najboljšem primeru pade za 100x. Posledično ti pade hitrost izvajanja vseh operacij, ki se izvajajo v ALE. Tudi enostavnih, kot je npr. primerjava dveh operandov. Večino enostavnih ukazov, ki se lahko izvedejo v eni periodi pri 5 GHz, bi ti upočasnil na nekaj MHz. Le zakaj se kompleksnejše ukaze razbija na enostavnejše. Ob tem, da so nekatere pogosto uporabljene kompleksnejše aritmetične enote narejene cevovodno. Celoštevilsko množenje ima v današnjih desktop CPU latenco 3 cikle. Lahko jo skrajšaš na 1 ciklel s tem, da vse ostale operacije umetno upočaniš z nižanjem frekvence CPU. Le zakaj tega ne vidiš?
Če lahko komplekne ukaze izvedeš v eni urini periodi, lahko manj kompleksne in pogosto bolj uporabljene ukaze izvedeš še hitreje. Le kaj izbirajo inženirji pri AMD in Intelu.

korenje3 je 16. jan 2022 ob 18:22 izjavil:

"npr. špekulativno izvrševanje ukazov" - ok spet neko nepoznavanje. Te stvari se uporablja za loop ukaze, kjer se išče smer iz nabora podatkov v pozitivno ali negativno stran, da se najde specifični element.

Uporablja se pri (pogojnih) skočnih ukazih. Nabor podatkov, pozitivno, negativno in specifični element? :))

Nabor besed je na nivoju naora ukazov 4004.

korenje3 je 16. jan 2022 ob 18:22 izjavil:

"uvedbo hyperthreadinga" - izvajanje dupliranih funkcij na jedru (to je vzporedno 2 enaka ukaza). Torej kako je dupliciranje ukazov 2x(a+b)=c boljše kot multipliciranje nx(a+b)=c ?

Ufff. Spet si ga pihnil povsem mimo. Niti ne bom razlagal.

korenje3 je 16. jan 2022 ob 18:22 izjavil:

"dodatno logiko, da je zgrešitev pri dostopih do predpomnilnikov čim manjša" - kakšne zgrešitve? kaj sanjaš? pri zaporednem procesiranju se vedno ve na katero mesto dostopat če ne crkne program.

Tvoje že osnovno nepoznavanje delovanje procesorjev je res že povsem razgaljeno. Dostopi do predpomnilnika se končajo z zadetkom ali z zgrešitvijo. Torej ali se dostopan podatek na izbranem naslovu sploh nahaja v predpomnilniku ali ne. Če se, odlično. Če ne, mora logika prinesti naslovljen blok iz višje pomnilniške hierarhije. Kam in kako se bodo prenašali bloki podatkov iz in v predpomnilnik je odvisna tudi verjetnost zgrešitve, ki mora biti čim manjša. Direktni (preslikani) predpomnilnik ni tako smiselen, ker ga lahko zjebe že kopiranje iz dveh naslovov, ki dostopata do istega bloka v predpomnilniku. Očitno je set asociativen predpomnilnik L1 z asociativnostjo 8 trenutno najbolj zaželjen pri desktop CPU. Tudi nima smisla pri zgrešitvi vreči ven iz nekega nivoja predpomnilnika tisti blok, ki je bil dostopan nazadnje. Bolje, da zamenjaš blok v dostopanem setu naključno ali ceno najdlje neuporabljenega.

korenje3 je 16. jan 2022 ob 18:22 izjavil:

intel je že pred leti analiziral tipe ukazov, ki se izvajajo na procesorju in jih spravil v posebne funkcije, ki so danes del sse, avx ipd.
Če program teh ukazov ne uporabablja potem ni pohitritve, če jih pa pa je. Vse to je delo prevajalnika programske kode.

Večinoma že znane ukaze je vektoriziral, tako, da se izvajajo nad vektorskimi podatki. Seveda je dodal še kake posebne funkcije za bolj specifične/neračunske namene za kako dodatno pohitritev. Za večino teh operacij velja, da, če programer ni slišal zanje, jih verjetno tudi direktno ne potrebuje.

korenje3 :: 16. jan 2022, 21:47

"Osnovni koncepti načrtovanja aritmetične logične enote ti niso jasne" - Jaz sem pred 20 leti z verilogom ravno to programiral. Vse se da rešit v 1-2 ciklih. Včasih je imel 1 instruction cycle 4 oz 2 frekvenčna cikla v katerem si moral izvesti sprocesiran output. Frekvenca nič ne pade, ker je stalna in ni variabilna. Edini problem pri velikih blok funkcijah je izguba toka na tranzistorju, zato so vmes ojačevalci toka, tako da 1 funkcija (black box) lahko zavzame cel fpga čip.

"Nabor besed je na nivoju naora ukazov 4004" - nabor besed ne igra vloge pri dejstvih. lahko poveš drugače, samo ne spremeni dejstva.

"Tvoje že osnovno nepoznavanje delovanje procesorjev je res že povsem razgaljeno" - sej pravim, ti si google profesor, jaz sem pa dejansko programiral z FPGA in assemblerjem (PIC čipe). Kaj si ti delal? www.google.com ?

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

Wrop :: 16. jan 2022, 22:40

Ko te že zanima.
Diplomiral z 10 na FRI UNI smer Strojna oprema prav na Xilinx špartanski 3E razvojni ploščici. Veliko VHDL kode in neprespanih noči.
Razvojno orodje Vivado ti lepo izračuna kakšne so kombinatorične zakasnitve v načrtovanem vezju na izbranem FPGA čipu. Pove ti tudi maksimalno frekvenco, ki jo lahko vezje doseže. Če je večja lepo, če ne dosega, greš v optimizacijo ali pa zmanjšaš frekvenco delovanja vezja.
Specializirane DPS enote imajo npr. več možnosti konfiguracije. Pri računanju lahko uporabljaš vmesne cevovodne registre in bo lahko vezje delalo na višji frekvenci (nad 700 MHz), lahko pa vmesnih registrov ne uporabljaš, pa bo frekvenca padla več kot za polovico (pod 300 MHz), v idealnem primeru. Maksimalne frekvence so odvisne od hitrostnega razreda čipa in serije čipa.
Pri operacijah nad 512 bitnimi operandi pa pozabi na hitrost. Zapletene funkcije v eni urini periodi pri visokih frekvencah tudi.

Saj, če si že delal, potem ti ne bo težko tega preverit. Samo 3 512 bitne registre rabiš in sešteješ dva operanda ter shraniš. Pa poročaj kakšen je faktor zakasnitve glede na 32 bitne operande. Poglej še razliko, če vezje implementiraš samo v CLB ter če še uporabiš DSP enote.

FlyingBee :: 16. jan 2022, 23:14

Kaj pa če bi se po ZS pomenila?

P200 MMX, 32mb ram, 2gb HDD, s3 virge 2mb, 14" CRT 640x480
New Sphincter Kvartet:
Roko Spestner, Namaž Zlevčar, Daje Heading, Maraje Spetan

Meizu :: 16. jan 2022, 23:31

Ne! To je good read :)

FlyingBee :: 16. jan 2022, 23:33

Že res, ampak potem pa nova tema.

P200 MMX, 32mb ram, 2gb HDD, s3 virge 2mb, 14" CRT 640x480
New Sphincter Kvartet:
Roko Spestner, Namaž Zlevčar, Daje Heading, Maraje Spetan

korenje3 :: 17. jan 2022, 00:13

Wrop je 16. jan 2022 ob 22:40 izjavil:

Ko te že zanima.
Diplomiral z 10 na FRI UNI smer Strojna oprema prav na Xilinx špartanski 3E razvojni ploščici. Veliko VHDL kode in neprespanih noči.
Razvojno orodje Vivado ti lepo izračuna kakšne so kombinatorične zakasnitve v načrtovanem vezju na izbranem FPGA čipu. Pove ti tudi maksimalno frekvenco, ki jo lahko vezje doseže. Če je večja lepo, če ne dosega, greš v optimizacijo ali pa zmanjšaš frekvenco delovanja vezja.
Specializirane DPS enote imajo npr. več možnosti konfiguracije. Pri računanju lahko uporabljaš vmesne cevovodne registre in bo lahko vezje delalo na višji frekvenci (nad 700 MHz), lahko pa vmesnih registrov ne uporabljaš, pa bo frekvenca padla več kot za polovico (pod 300 MHz), v idealnem primeru. Maksimalne frekvence so odvisne od hitrostnega razreda čipa in serije čipa.
Pri operacijah nad 512 bitnimi operandi pa pozabi na hitrost. Zapletene funkcije v eni urini periodi pri visokih frekvencah tudi.

Saj, če si že delal, potem ti ne bo težko tega preverit. Samo 3 512 bitne registre rabiš in sešteješ dva operanda ter shraniš. Pa poročaj kakšen je faktor zakasnitve glede na 32 bitne operande. Poglej še razliko, če vezje implementiraš samo v CLB ter če še uporabiš DSP enote.

tukaj je samo en, ki je delal diplomsko delo s tem čipom - Milan Pulko. da vidimo...

izgleda kot tutorial, prepis iz knjige. Si nisem predstavljal da so faksi prišli tako nizko, da lahko delaš diplomsko delo brez aktualnega problema oz. naloge za katero rešitev ni potrebna.

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

Zgodovina sprememb…

spremenil: korenje3 (17. jan 2022 ob 00:16)

korenje3 :: 17. jan 2022, 00:28

Sicer se že 15 let ne ukvarjam s FPGA. Lahko komot narediš 512 bitni blokec. Rabiš 1024 vhodov in 512 izhodov. To je to. Mislim da si imel v verilog že shranjene primere ravno s temi delayi. Večji kot si imel delay, manj celic je kuril blokec. Torej je čisto odvisno od vsebine blokca (black box) in aligoritma znotraj tega.

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

Wrop :: 17. jan 2022, 01:17

Imaš resne probleme s selektivnim branjem. Že na prvi strani diplomske naloge ti piše Univerza v Mariboru. FRI ni FERI. Sem prepričan da gospod še danes zadeve obvlada. Namreč takih diplomskih tem se ravno ne da slepo prepisovati, spoh pa ne leta 2008, ko so bile informacije bistveno bolj skope. Velja tudi za kasneje. Sicer so bile informacije bolj dostopne, ampak če nimaš pameti, zadeve enostavno ne delujejo, brez da veš kaj delaš. Ni to burek diploma.

Drugače pa ja. Komot narediš 512 bitni blokec - enostavni seštevalnik. Večje zakasnitve lahko pri načrtovanju zamenjaš za manjšo prostorsko porabo in obratno. Sicer pa današnji Xilinx FPGA imajo CLB enote prilagojene tudi seštevalnikom/odštevalnikom. Če se prav spomnim je 32 bitni seštevalnik na spartan3 porabil 8 SLICE enot ali 4 CLB. Maksimalna frekvenca neke dokaj enostavne ALE pa je bila nekaj čez 100 MHz. Največjo zakasnitev v vezju je bila zaradi barrel shifta. Celoštevilsko množenje implementirano V CLB enotah pri 100 MHz, kar pozabi. Tudi na današnjih FPGA. Ne dajajo na FPGA posebne DPS enote, ki ti omogočajo množenje/seštevanje/določene logične operacije, zaradi lepšega. To je zaradi nuje po hitrosti in prostorskih prihrankih.

Je pa tako, če imaš neko zakasnitev pri eno-bitnem seštevalniku imaš pri 512 bitnem 512x daljšo. Kot pri računanju na roko, ko prenasaš carry bit v naslednji seštevalnik. Carry bit se da sicer računati tudi v naprej, ampak ti zaradi tega predhodnega računanja hitro raste prostorska zahtevnost. Včasih so CPU računali po 8 bitov naekrat z enako zakasnitvijo (8 bitov v rezultatu + carry flag, ki je šel naprej v naslednji 8 bitni seštevalnik, je bil enako hitro na voljo). Torej so imeli 32 bitni seštevalniki skupaj samo 4x zakasnitev kot enobitni seštevalniki.
Ne vem, če je to danes pri 5 GHz+ dovolj.

FireSnake :: 17. jan 2022, 07:52

korenje3 in Wrop: kaj, če bi vidva šla meriti tiče kam drugam?
Oba nimata pojma! Mestoma se sploh ne pogovarjata o isti zadevi.

Primer: vidva enačita "branch prediction" in "speculative execution".
Pa tega nihče od vaju ne opazi???!!!???
No, če bi jaz zaposloval, ne bi vzel nobenega od vaju :))

Malo pozabljata, da so tukaj tudi drugi, ki se na zadevo spoznajo.
In tudi mi smo že kaj sprogramirali, pa ne samo PIC-e.

Poglej in se nasmej: vicmaher.si

Zgodovina sprememb…

spremenilo: FireSnake (17. jan 2022 ob 07:53)

mirancar :: 17. jan 2022, 09:36

kar naj tukaj ostaneta, vsaj lahko nekej pametnega preberemo. upam da se še ti vključiš

FireSnake :: 17. jan 2022, 09:41

Lahko mi strokovno debato vsekamo, sploh ni problema.
Samo v tem primeru moramo ego pustiti ob strani.

Tako, kot sta pa onadva zstavila, se pa jaz vzdržim debate :)

Poglej in se nasmej: vicmaher.si

Wrop :: 17. jan 2022, 09:41

@FireSnake,
Sem vedel, da se boš pridružil debati.

Kaj ti pomaga, da se na zadeve spoznaš, če pa ne slediš in ne bereš podrobno:

Rešujejo ga z uvedbo različnih principov, npr. špekulativno izvrševanje ukazov, uvedbo hyperthreadinga, cel kup zadev, da se eliminira ali združuje ukaze, pohitritev trenutnih ukazov, večjimi predpomnilniki in dodatno logiko, da je zgrešitev pri dostopih do predpomnilnikov čim manjša, da so pri skokih zastoji v CPU čim krajši, itd

Le kaj bi lahko ta dodatna logika tudi vsebovala in kako bi jo imenovali?

korenje3 :: 17. jan 2022, 10:56

ta wrop po moje špekulira, da bomo nasedli, da je diplomiral na fpgajih brez diplomskega dela.

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

Zgodovina sprememb…

predlagalo izbris: FireSnake (17. jan 2022 ob 11:01)

FireSnake :: 17. jan 2022, 11:02

Ni potrebe po takih izjavah.
Nihče od nas ni dolžen dajati informacij o svoji izobrazbi.

Poglej in se nasmej: vicmaher.si

korenje3 :: 17. jan 2022, 11:25

hm. Na mindfactory sem naročil komponente v soboto in jih danes zjutraj plačal. Ko grem na spletno stran sem imel v nabiralniku iste komponente kot so v ponudbi z višjimi cenami. Za ponudbo mi tole piše in je še zmeraj odprta:

Details zu Bearbeitungsnummer: xxxxxx (offen )
Online-Bestellung vom 14.01.2022 | Zahlungsweise: Vorkasse
Bearbeitungsnummer: xxxxxx| Bestellstatus: offen

kaj to pomeni? da lahko sproti spreminjajo v procesu plačila?

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

korenje3 :: 17. jan 2022, 12:07

Nevermind. Očitno gre vseeno skozi :)
Dobil po kr dobrih cenah vso to robo.

442 GIGABYTE Z690 AORUS Master Wi-Fi 6E, Sockel 1700, E-ATX-Mainboard, 4x DDR5 max. 128GB, DisplayPort 1.4a, BT
239 1000W be quiet! Dark Power 12 ATX 2.52 Netzteil, 80 PLUS
559 Intel Core i9-12900K, 8C+8c/24T, 3.20-5.30GHz, tray, Sockel 1700 (LGA), Alder Lake-S CPU
449 32GB (2x 16GB) G.Skill Trident Z5 RGB silber DDR5-6000 DIMM CL36-36-36-76 Dual Kit
2x 357 2.0 TB SSD Seagate FireCuda 530 SSD + Rescue, M.2/M-Key (PCIe 4.0 x4), lesen: 7300MB/s, schreiben: 6900MB/s SLC-Cach
139 be quiet! Silent Loop 2 360mm
114 be quiet! Silent Base 601 orange, schallgedämmt

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

Skyman :: 17. jan 2022, 12:19

Potem si dobil po teh cenah kot so bile na spletni strani napisane,lepa.Porocaj ko dobis :) Jaz bom pri njih vzel vrjetno CPU,napajalnik,rami te stvari imajo kar obcutno cenejse kot drugje.Sigurno 100€ vse skupaj mogoče še vec. Firecuda je vredu? sam gledam al firecuda al corsair mp600 pro xt. Pri 1Tb je kar bolsi write pri firecudi kot corsairju 6900 vs 5800mb/s testi pa isti.Tudi kontroler itd vse isto..zanimivo

Wrop :: 17. jan 2022, 12:25

korenje3 je 17. jan 2022 ob 10:56 izjavil:

ta wrop po moje špekulira, da bomo nasedli, da je diplomiral na fpgajih brez diplomskega dela.

Itak, da špekuliram. Vse to si sproti izmišljujem. Po tvoje seveda. Tvojemu "znanju" lahko nasede samo kak, ki računalnika niti od blizu ni videl.

Včeraj se mi ni dalo odpreti virtualke, zato pa ti servisiram danes to lepo slikico.
Lepo se vidi, kako linearno raste zakasnitev seštevalnika z rastjo števila bitov. Levo so podatki. Desno pa delček tehnološke sheme tega seštevalnika.

Sedaj pa še ti lahko podkrepiš kake svoje trditve. Npr. primer kakšnega kompleksnega ukaza, ki se izračuna v enem ciklu, npr. a+b*c/d^e=f, kot si dal sam primer.

korenje3 :: 17. jan 2022, 12:28

Skyman je 17. jan 2022 ob 12:19 izjavil:

Potem si dobil po teh cenah kot so bile na spletni strani napisane,lepa.Porocaj ko dobis :) Jaz bom pri njih vzel vrjetno CPU,napajalnik,rami te stvari imajo kar obcutno cenejse kot drugje.Sigurno 100EUR vse skupaj mogoče še vec. Firecuda je vredu? sam gledam al firecuda al corsair mp600 pro xt. Pri 1Tb je kar bolsi write pri firecudi kot corsairju 6900 vs 5800mb/s testi pa isti.Tudi kontroler itd vse isto..zanimivo

vse je ceneje. V sloveniji bi tole stalo prek 3500EUR.

Wrop je 17. jan 2022 ob 12:25 izjavil:

korenje3 je 17. jan 2022 ob 10:56 izjavil:
ta wrop po moje špekulira, da bomo nasedli, da je diplomiral na fpgajih brez diplomskega dela.

Itak, da špekuliram. Vse to si sproti izmišljujem. Po tvoje seveda. Tvojemu "znanju" lahko nasede samo kak, ki računalnika niti od blizu ni videl.

Včeraj se mi ni dalo odpreti virtualke, zato pa ti servisiram danes to lepo slikico.
Lepo se vidi, kako linearno raste zakasnitev seštevalnika z rastjo števila bitov. Levo so podatki. Desno pa delček tehnološke sheme tega seštevalnika.

Sedaj pa še ti lahko podkrepiš kake svoje trditve. Npr. primer kakšnega kompleksnega ukaza, ki se izračuna v enem ciklu, npr. a+b*c/d^e=f, kot si dal sam primer.

Jaz sem zgolj napisal primer in je splošen. Sploh zato, ker procesorji lahko znotraj "instruction cycle" pokurijo po 2, 4 ali celo 6 frekvenčnih ciklov (1/frekvenca)

i9-12900k; 32GB DDR5-6000 CL36; Nvidia RTX 3080 ti;
Gigabyte Aorus z690 master; Be Quiet Dark Power 12 1000W

Zgodovina sprememb…

spremenil: korenje3 (17. jan 2022 ob 12:32)

Skyman :: 17. jan 2022, 13:15

korenje3 je 17. jan 2022 ob 12:28 izjavil:

vse je ceneje. V sloveniji bi tole stalo prek 3500EUR.

Ne govori,ze ko sem gledal napajalnik je bila razlika 80€ CPu 100€ aja pa milko dobis gratis to neki je :))

plata je cca 70-90€.Rame ne bom gledal skoda casa ker je ze v nemciji po 100€ razlike ali več.

mahone :: 17. jan 2022, 13:54

«« «

25 / 35

»»»

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	14th Gen Intel Core - Meteor Lake (strani: 1 2 3 4 5 6 7 8 9 ) Jarvice Oddelek: Strojna oprema	410	78094 (2679)	Horzen 26. jan 2026 14:53:31
»	AMD najavil procesorje Ryzen 7000 (strani: 1 2 3 ) Aggressor Oddelek: Novice / Procesorji	109	25007 (8413)	D3m 13. mar 2024 14:54:40
»	Procesorji Alder Lake prispejo 4. novembra (strani: 1 2 ) Aggressor Oddelek: Novice / Procesorji	92	21051 (16085)	FireSnack 6. nov 2021 17:43:33
»	11th Gen Intel Core (strani: 1 2 3 4 … 13 14 15 16 ) AapocalypseE Oddelek: Strojna oprema	787	122136 (79315)	mtosev 29. jun 2021 09:23:24

Več podobnih tem

Forum » Strojna oprema » 12th Gen Intel Core - Alder Lake

12th Gen Intel Core - Alder Lake