» »

Nvdiin direktor: DeepSeek še vedno potrebuje veliko računske moči

Nvdiin direktor: DeepSeek še vedno potrebuje veliko računske moči

Slo-Tech - Prvikrat po izidu modelov DeepSeek V3 in R1, ki sta pošteno zatresla borze in spremenila pričakovanja, se je o tem oglasil Nvidiin direktor Jensen Huang. Poudaril je, da vlagatelji in s tem trg niso razumeli, kako poteka izdelava, učenje in izboljševanje modelov umetne inteligence, zato so napačno predvidevali, da je DeepSeek resnično toliko cenejši.

Poudaril je, da je R1 dober model. Njegov prihod je za trg umetne inteligence dober in bo pospešil uvedbo umetne inteligence v različne sektorje. Po njegovem mnenju - kot direktor Nvidii bi težko javno govoril kaj drugega - to pomeni, da se bo povpraševanje po zmogljivih čipih povečalo, ne pa zmanjšalo. To ni zelo iz trte izvito, saj zgodovina uči, da pocenitev in poenostavitev tehnologije poveča njeno rabo, s tem pa tudi kumulativna vlaganja.

Ob tem je pojasnil, da so bile glavne DeepSeekove izboljšave v postopku začetnega urjenja (pre-training) modela. To resnično lahko poteka z manj računske moči, kar je dobrodošlo. Javnost pa je večinoma spregledala drugi korak, ki mu sledi (post-training). Ta je nujen, da model pridobi "inteligenco" in začne dajati koherentne odgovore, zlasti na zahtevnejša vprašanja. Tega dela ni možno izvesti brez zmogljive strojne opreme, ker je še vedno zelo potraten, trdi Huang. DeepSeek V3 je torej začetni model, po dodatnem urjenju pa dobimo R1, ki ga je DeepSeek izdelal z interakcijo med dvema modeloma umetne inteligence. A javno so povedali le, kaj so potrebovali za V3. Za R1 so potrebovali precej več računske moči in dražjo strojno opremo.

9 komentarjev

111111111111 ::

Zanimivo. Tule na forumu so me pribili na križ, ko sem omenil da morda Kitajci lažejo o številkah. :D
Če prisloniš uho na vroč šporhet, lahko zavohaš kak si fuknjen.

Zimonem ::

Nisi rekel morda, ampak kategorično zatrdil. Vmes pa izpustil vse stvari katere so vgradili v model. Ta teden deepseek obljublja serijo člankov , ki opisujejo zadevo.

111111111111 ::

Zimonem je izjavil:

Nisi rekel morda, ampak kategorično zatrdil. Vmes pa izpustil vse stvari katere so vgradili v model. Ta teden deepseek obljublja serijo člankov , ki opisujejo zadevo.

In kategorično imel prav. :D

Aaa... Bodo končno napisali članke.

A nisi takrat dal nek PDF od Kitajcev, da si razsul moje dvome? :D Pa še lajal kakšni carji so kitajci ko za 6 miljonov iz nule naredili nov ChatGPT, oz. še boljši model. :D
Če prisloniš uho na vroč šporhet, lahko zavohaš kak si fuknjen.

DamijanD ::

A niso deepseek razmeroma odprti? So kar veliko stvari objavili - hecno je, da so verjetno nekatere izboljšave morali narediti ravno zaradi GPU restrikcij.

Kar pa niso zelo javno govorili pa je, da je njihova mama High-Flyer, ki ima pa že sama za svoj core business ogromno GPUjev...

nodes ::

Tisti, ki bo zbral več GPUjev, bo imel pod pokrovom več pameti. Proces to lahko samo bolje izkoristi, nič več. Računanje na kroglice je passe, tudi Kitajci tega ne počno več. Easy?

Zimonem ::

Evo vam , da ne boste preveč ugibal.
https://github.com/deepseek-ai/open-inf...

111111111111 ::

Le preberi, da naseldnjič ne boš pisal neumnosti. :D
Če prisloniš uho na vroč šporhet, lahko zavohaš kak si fuknjen.

fikus_ ::

Splovitev DeepSeeka je povzrocila precej škode Nvidii, sedaj pa njen direktor poskuša popraviti škodo in nazaj naviti cene delnic.

Bolj boleče za Usa je pa to, da Kitajci kljub Usa sankcijam uspevajo narediti stvari, katere naj bi te sankcije preprečile.
Učite se iz preteklosti, živite v sedanjosti in razmišljajte o prihodnosti.
PS Ne odgovarjam trolom in provokatorjem!

Zgodovina sprememb…

  • spremenilo: fikus_ ()

111111111111 ::

fikus_ je izjavil:

Splovitev DeepSeeka je povzrocila precej škode Nvidii, sedaj pa njen direktor poskuša popraviti škodo in nazaj naviti cene delnic.

Bolj boleče za Usa je pa to, da Kitajci kljub Usa sankcijam uspevajo narediti stvari, katere naj bi te sankcije preprečile.

Nerazumevanje trga je povzročilo škodo Nvidi, jaz sem kupil za 1000€ delnic. Pa bi še več, pa nisem imel denarja.

Delnice so že skoraj nazaj in obeti za 2025 so dobri.

Se pa strinjam pretres za trge je odlična zadeva za zaslužit in da gre tehnologija naprej.

Google je pospešil, ChatGPT ne more več spat, Grok 3 je prišel ven, in vsi so bolj ali manj brezplačni, za kar se pa Kitajcem iskreno zahvaljujem. :D

Pričakujem hiter razvoj, tako da kupujem od Microsofta (ChatGPT+kvantni kompi), Google (Gemini) in seveda Nvidia, ki bo zaenkrat glavni igralec. Pričakujem pa v 2026-2027 spremembe, ko bodo začeli ARM, AMD in kitajci dohitevati razvoj čipov. Trump tukaj izredno pomaga.
Če prisloniš uho na vroč šporhet, lahko zavohaš kak si fuknjen.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Kaj nam bodo dragi modeli, če imamo poceni?

Oddelek: Novice / Znanost in tehnologija
204347 (1113) Zimonem
»

Kitajska družba DeepSeek razburkala področje umetne inteligence s poceni jezikovnim m (strani: 1 2 3 4 )

Oddelek: Novice / Ostala programska oprema
16912676 (1991) kanarin
»

kaj pravi chat gpt o deepseek r1 (strani: 1 2 )

Oddelek: Loža
664255 (1106) delavec44

Več podobnih tem