Nvdiin direktor: DeepSeek še vedno potrebuje veliko računske moči

Matej Huš :: 22. feb 2025 ob 13:58
Grafične kartice

Slo-Tech - Prvikrat po izidu modelov DeepSeek V3 in R1, ki sta pošteno zatresla borze in spremenila pričakovanja, se je o tem oglasil Nvidiin direktor Jensen Huang. Poudaril je, da vlagatelji in s tem trg niso razumeli, kako poteka izdelava, učenje in izboljševanje modelov umetne inteligence, zato so napačno predvidevali, da je DeepSeek resnično toliko cenejši.

Poudaril je, da je R1 dober model. Njegov prihod je za trg umetne inteligence dober in bo pospešil uvedbo umetne inteligence v različne sektorje. Po njegovem mnenju - kot direktor Nvidii bi težko javno govoril kaj drugega - to pomeni, da se bo povpraševanje po zmogljivih čipih povečalo, ne pa zmanjšalo. To ni zelo iz trte izvito, saj zgodovina uči, da pocenitev in poenostavitev tehnologije poveča njeno rabo, s tem pa tudi kumulativna vlaganja.

Ob tem je pojasnil, da so bile glavne DeepSeekove izboljšave v postopku začetnega urjenja (pre-training) modela. To resnično lahko poteka z manj računske moči, kar je dobrodošlo. Javnost pa je večinoma spregledala drugi korak, ki mu sledi (post-training). Ta je nujen, da model pridobi "inteligenco" in začne dajati koherentne odgovore, zlasti na zahtevnejša vprašanja. Tega dela ni možno izvesti brez zmogljive strojne opreme, ker je še vedno zelo potraten, trdi Huang. DeepSeek V3 je torej začetni model, po dodatnem urjenju pa dobimo R1, ki ga je DeepSeek izdelal z interakcijo med dvema modeloma umetne inteligence. A javno so povedali le, kaj so potrebovali za V3. Za R1 so potrebovali precej več računske moči in dražjo strojno opremo.

9 komentarjev

111111111111 :: 22. feb 2025, 14:51

Zanimivo. Tule na forumu so me pribili na križ, ko sem omenil da morda Kitajci lažejo o številkah. :D

Če prisloniš uho na vroč šporhet, lahko zavohaš kak si fuknjen.
Ales78 je levi fašist.

Zimonem :: 22. feb 2025, 17:59

Nisi rekel morda, ampak kategorično zatrdil. Vmes pa izpustil vse stvari katere so vgradili v model. Ta teden deepseek obljublja serijo člankov , ki opisujejo zadevo.

111111111111 :: 22. feb 2025, 23:14

Zimonem je 22. feb 2025 ob 17:59 izjavil:

Nisi rekel morda, ampak kategorično zatrdil. Vmes pa izpustil vse stvari katere so vgradili v model. Ta teden deepseek obljublja serijo člankov , ki opisujejo zadevo.

In kategorično imel prav. :D

Aaa... Bodo končno napisali članke.

A nisi takrat dal nek PDF od Kitajcev, da si razsul moje dvome? :D Pa še lajal kakšni carji so kitajci ko za 6 miljonov iz nule naredili nov ChatGPT, oz. še boljši model. :D

Če prisloniš uho na vroč šporhet, lahko zavohaš kak si fuknjen.
Ales78 je levi fašist.

DamijanD :: 23. feb 2025, 05:45

A niso deepseek razmeroma odprti? So kar veliko stvari objavili - hecno je, da so verjetno nekatere izboljšave morali narediti ravno zaradi GPU restrikcij.

Kar pa niso zelo javno govorili pa je, da je njihova mama High-Flyer, ki ima pa že sama za svoj core business ogromno GPUjev...

nodes :: 23. feb 2025, 09:22

Tisti, ki bo zbral več GPUjev, bo imel pod pokrovom več pameti. Proces to lahko samo bolje izkoristi, nič več. Računanje na kroglice je passe, tudi Kitajci tega ne počno več. Easy?

111111111111 :: 23. feb 2025, 11:14

Le preberi, da naseldnjič ne boš pisal neumnosti. :D

Če prisloniš uho na vroč šporhet, lahko zavohaš kak si fuknjen.
Ales78 je levi fašist.

fikus_ :: 23. feb 2025, 11:24

Splovitev DeepSeeka je povzrocila precej škode Nvidii, sedaj pa njen direktor poskuša popraviti škodo in nazaj naviti cene delnic.

Bolj boleče za Usa je pa to, da Kitajci kljub Usa sankcijam uspevajo narediti stvari, katere naj bi te sankcije preprečile.

Učite se iz preteklosti, živite v sedanjosti in razmišljajte o prihodnosti.
PS Ne odgovarjam trolom in provokatorjem!

Zgodovina sprememb…

spremenilo: fikus_ (23. feb 2025 ob 11:26)

111111111111 :: 23. feb 2025, 11:53

fikus_ je 23. feb 2025 ob 11:24 izjavil:

Splovitev DeepSeeka je povzrocila precej škode Nvidii, sedaj pa njen direktor poskuša popraviti škodo in nazaj naviti cene delnic.

Bolj boleče za Usa je pa to, da Kitajci kljub Usa sankcijam uspevajo narediti stvari, katere naj bi te sankcije preprečile.

Nerazumevanje trga je povzročilo škodo Nvidi, jaz sem kupil za 1000€ delnic. Pa bi še več, pa nisem imel denarja.

Delnice so že skoraj nazaj in obeti za 2025 so dobri.

Se pa strinjam pretres za trge je odlična zadeva za zaslužit in da gre tehnologija naprej.

Google je pospešil, ChatGPT ne more več spat, Grok 3 je prišel ven, in vsi so bolj ali manj brezplačni, za kar se pa Kitajcem iskreno zahvaljujem. :D

Pričakujem hiter razvoj, tako da kupujem od Microsofta (ChatGPT+kvantni kompi), Google (Gemini) in seveda Nvidia, ki bo zaenkrat glavni igralec. Pričakujem pa v 2026-2027 spremembe, ko bodo začeli ARM, AMD in kitajci dohitevati razvoj čipov. Trump tukaj izredno pomaga.

Če prisloniš uho na vroč šporhet, lahko zavohaš kak si fuknjen.
Ales78 je levi fašist.

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	Kaj nam bodo dragi modeli, če imamo poceni? McHusch Oddelek: Novice / Znanost in tehnologija	21	8855 (3303)	133780 12. jul 2025 09:33:37
»	Kitajska družba DeepSeek razburkala področje umetne inteligence s poceni jezikovnim m (strani: 1 2 3 4 ) Aggressor Oddelek: Novice / Ostala programska oprema	169	34426 (23741)	kanarin 6. feb 2025 18:47:39
»	kaj pravi chat gpt o deepseek r1 (strani: 1 2 ) Zimonem Oddelek: Loža	66	13916 (10767)	delavec44 4. feb 2025 21:55:20

Tema

Sporočila

Ogledi

Zadnje sporočilo

Tema

Sporočila

Ogledi

Zadnje sporočilo

Kaj nam bodo dragi modeli, če imamo poceni?

McHusch

Oddelek: Novice / Znanost in tehnologija

8855 (3303)

133780 12. jul 2025 09:33:37

Kitajska družba DeepSeek razburkala področje umetne inteligence s poceni jezikovnim m (strani: 1 2 3 4 )

Aggressor

Oddelek: Novice / Ostala programska oprema

169

34426 (23741)

kanarin 6. feb 2025 18:47:39

kaj pravi chat gpt o deepseek r1 (strani: 1 2 )

Zimonem

Oddelek: Loža

13916 (10767)

delavec44 4. feb 2025 21:55:20

Zadnje novice

Zadnji članki

Išči:

Novice » Grafične kartice »
Nvdiin direktor: DeepSeek še vedno potrebuje veliko računske moči

Nvdiin direktor: DeepSeek še vedno potrebuje veliko računske moči