Napovedan prevajalnik CUDA C za x86 @ Slo-Tech

Novice » Procesorji »
Napovedan prevajalnik CUDA C za x86

Napovedan prevajalnik CUDA C za x86

Matej Huš :: 23. sep 2010 ob 07:34
Procesorji

X-Bit Labs - Nvidia in Portland Group sta objavila, da razvijata prevajalnik CUDA C za platformo x86. Aplikacije, napisane za platformo CUDA, se namreč izredno hitro izvajajo na sistemih z grafičnimi procesorji Nvidia, medtem ko se na tistih brez zelo težko ali pa sploh ne. Nov prevajalnik bo to popravil, saj se bodo v odsotnosti Nvidiinih GPU-jev aplikacije izvajale z AMD-jevimi ali Intelovimi procesorji s podporo SIMD (Single Instruction Multiple Data). Nov prevajalnik bodo predstavili na konferenci SC10 Supercomputing, ki bo med 13. in 15. novembrom v New Orleansu. Takrat bomo tudi dobili prve vtise o hitrosti izvajanja, ki utegne biti problematična, če bodo aplikacije slabo prevedene iz nabora CUDA v x86 ali obratno.

15 komentarjev

zee :: 23. sep 2010, 08:56

Fino. Ravno pred nekaj tedni smo nabavili prevajalnike podjetja Portland Group. 8-)

zee
Linux: Be Root, Windows: Re Boot
Giant Amazon and Google Compute Cloud in the Sky.

Izi :: 23. sep 2010, 10:03

Nvidia in Portland Group skupaj razvijata prevajalnik. In ker ima Nvidia trenutno monopol, ker zadeva deluje samo na njihovih GPU-jih, je nemogoče pričakovati, da bo na CPU-jih zadeva kakorkoli konkurenčna izvajanju na GPU-jih, ker jo bo sedaj mogoče poganjati tudi na AMD-jevih CPU-jih. Ne gre pričakovati, da si bodo pljuvali v lastno skledo.

kixs :: 23. sep 2010, 10:09

Ne vem, ce ima to kaksen smisel. Tako kot pred leti, ko si imel sofverski emulator matematicnega koprocesorja. Program, ki sicer brez matematicnega koprocesorja ni delal, je potem delal. Vendar ni bilo za uporabljat, ker je delal zelo pocasi.

kihc :: 23. sep 2010, 10:15

IMO je to mišljeno za debug, da se bo malo lažje(hitreje) izvajalo na emulatorju, ne vem kaj ima smisel zadevo spravljat na x86, če gre za popolnoma drugačno arhitekturo (SIMT).

Pa kolikor imam izkušenj emulator dela čisto spodobno (tako x86 kot x64), samo počasen je.

Aston_11 :: 23. sep 2010, 11:47

kihc je 23. sep 2010 ob 10:15 izjavil:

IMO je to mišljeno za debug, da se bo malo lažje(hitreje) izvajalo na emulatorju, ne vem kaj ima smisel zadevo spravljat na x86, če gre za popolnoma drugačno arhitekturo (SIMT).

Pa kolikor imam izkušenj emulator dela čisto spodobno (tako x86 kot x64), samo počasen je.

Nimajo že ne vem od kdaj vsi procesorji vgrajen koprocesor, tako da je emulator obsolete? Zlati zaradi x64 mi je padlo v oči.

dr.J :: 23. sep 2010, 13:54

Še vedno je treba imeti CUDA kodo.

PGI pa je že lani jeseni naredil akcelerator, kjer v fortranski program
vstaviš nekaj ukazov, podobnih tistim v OpenMP. Prevajalnik nato naredi
program, kjer nekatere stvari računa na grafični kartici.

Samo problem mora biti dovolj velik, sicer se preveč časa izgubi na sami
komunikaciji z grafično kartico. Moja izkušnja je bila taka; prav veliko
se pa v to zaradi pomanjkanja časa žal nisem več poglabljal.

Poskusil sem en podprogram za faktorizacijo matrik (www.culatools.com); v
enojni floating-point natančnosti dela CUDA podprogram cca 30-krat hitreje
kot z vsemi otimizacijami prevedena serijska koda. (Nvidia 275 GTX in C2Q
2.93 GHz; GTX 470 je še za 10% hitrejša od GTX 275 v single precision).
Seveda je tule delalo eno jedro od štirih in pa cela grafična kartica.

Mitch :: 23. sep 2010, 14:35

Haha... Sem mislil, da bo zadeva v odsotnosti Nvidia GPUja program prevedla v OpenCL ali Ati Stream program in omogočila strojno pospeševanje na AMDjevih GPUjih... Tako bo pa zadeva funkcionirala podobno kot Nvidia Physics, ki fiziko poganja na CPUju, če ni Nvidia čipa notri... Pa še to uporablja x87 matematični koprocesor namesto SIMD inštrukcij...

kihc :: 23. sep 2010, 14:40

Aston_11 je 23. sep 2010 ob 11:47 izjavil:

Nimajo že ne vem od kdaj vsi procesorji vgrajen koprocesor, tako da je emulator obsolete? Zlati zaradi x64 mi je padlo v oči.

V mislih sem imel emulator CUDA kode na x86/x64. Nevem kakšen koprocesor imaš v mislih? x64 sem omenil ker dela počasi tako na 32 kot 64 bit winsih.

dr.J: to 'avtoparaleliziranje' je sicer super, samo IMHO je v večini primerov, če hočeš res iztisnit moč grafe, konkretno spremenit algoritem.

filip007 :: 23. sep 2010, 17:16

Oni mislijo razširiti Cudo da bo pač delala še na CPU, za Radeon se ne bo nič spremenilo.

Zero games, zero talk.

Mitch :: 23. sep 2010, 18:06

Zadeva bi bila lahko zasnovana kot Cg, ki prevaja v OpenGL (GLSL) ali pa v DirectX (HLSL), samo da bi tukaj prevajala v DirectCompute ali pa v OpenCL...

Senitel :: 23. sep 2010, 22:47

Torej... Kot je že kihc omenil: CUDA ima x86/64 compiler že od samega začetka. Ta compiler je relativno dobro optimiziran za x86/64. Sicer zadeva ni multithreaded ampak uporablja pa SSE. Multithreading je v tem primeru treba delat ročno, torej poganjat kernele vzporedno iz večih niti. Tudi je treba kodo eksplicitno prevesti za to emulacijo. Ta koda potem ne bo tekla na GPU-ju, niti nima istih omejitev!

Kar PGI dela je nov compiler za HPC uporabnike. Oziroma bolje rečeno: dodal bodo "C for CUDA" razširitve še za svoje C/C++ compilerje, kar so že naredili za Fortran. Portland ima cel ekosistem za poganjat/debugirat/optimizirat HPC aplikacije. Kar konkretno ta compiler pomeni je, da bodo lahko vsi uporabljal "C for CUDA" razširitve na svojih clustrih, tudi če (še) nimajo GPU-jev v rackih.

Ampak en kup ljudi še vedno ne ve kaj vse zajema CUDA. Kar se NV tiče je CUDA (Compute Unified Device Architecture) in vključuje VSE kar ima veze z izvajanjem "compute" problemov na GPU-ju, nima veze a je DX Compute, C for CUDA, Python, Matlab... Nekako tako kot je danes povsem samoumnevno, da pridejo grafični driverji s podporo za Direct3D 9/Direct3D 10/11/OpenGL 2.x/3.x in obenem še čez par bistveno različnih generacij GPU-jev (trenutno so za NV to: Curie, Tesla in Fermi).
V konkretnem primeru se pogovarjamo o "C for CUDA" razširitvah. Torej, da lahko v C/C++ kodi direkt programiraš za GPU. Da ti ni treba klicat nekega API-ja, ter mu dat neko kodo, ki jo potem on prevede,... ampak lahko vse skup kombiniraš tako kot lahko kombiniraš C in C++. Ala C koda gre čez gcc, C++ gre čez g++, C for CUDA gre pa čez NVCC potem se objektna koda še linka skup in zapakira v en lep executable ali knjižnico. OpenCL tega ne ponuja. DirectCompute je pa za HPC tako ali tako neuporaben.

Zgodovina sprememb…

spremenil: Senitel (23. sep 2010 ob 22:47)

dr.J :: 23. sep 2010, 23:15

Tale članek je zelo zanimiv:
http://www.hpcwire.com/features/Compile...

HPC scena bo v prihodnjih dveh, treh letih pestra!

Bistri007 :: 24. sep 2010, 10:46

Ne pozabiti na Intelov Larrabee!

On May 25, 2010 the Technology@Intel blog announced that Larrabee would not be released as a GPU, but instead would be released as a product for High Performance Computing competing with the Nvidia Tesla.

Larrabee %28microarchitecture%29 @ Wikipedia

V trenutni inkarnaciji Larrabee ne bo v GPUjih, bo pa v prihodnjih izdajah.

Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...

klavdijL :: 24. sep 2010, 11:05

hehe.... na tem sem diplomo delal (ok je bla 32bit očinto sam ajt) :)

noraguta :: 29. sep 2010, 10:43

sam ne vidim kake bistvene razlike od opencl drajverja pri AMDju. kateri avtomatično fallbacka na procesor.

Pust' ot pobyedy k pobyedye vyedyot!

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	AMD z GPUOpen odpira orodja in gonilnike za svoje grafične čipe McHusch Oddelek: Novice / Grafične kartice	48	12699 (10630)	matijadmin 17. dec 2015 17:19:50
»	Napovedan prevajalnik CUDA C za x86 McHusch Oddelek: Novice / Procesorji	15	5181 (4102)	noraguta 29. sep 2010 10:43:11
»	Zla koda v grafičnih procesorjih McHusch Oddelek: Novice / Grafične kartice	6	4442 (3389)	denial 28. sep 2010 22:54:10
»	Prihaja Android 2.2 - Froyo PrimozR Oddelek: Novice / Android	30	10074 (8882)	SLO_Matej 23. maj 2010 17:50:43

Več podobnih tem

Zadnje novice

Zadnji članki

Išči:

Novice » Procesorji »
Napovedan prevajalnik CUDA C za x86

Napovedan prevajalnik CUDA C za x86