» »

Nvdiin direktor: DeepSeek še vedno potrebuje veliko računske moči

Nvdiin direktor: DeepSeek še vedno potrebuje veliko računske moči

Slo-Tech - Prvikrat po izidu modelov DeepSeek V3 in R1, ki sta pošteno zatresla borze in spremenila pričakovanja, se je o tem oglasil Nvidiin direktor Jensen Huang. Poudaril je, da vlagatelji in s tem trg niso razumeli, kako poteka izdelava, učenje in izboljševanje modelov umetne inteligence, zato so napačno predvidevali, da je DeepSeek resnično toliko cenejši.

Poudaril je, da je R1 dober model. Njegov prihod je za trg umetne inteligence dober in bo pospešil uvedbo umetne inteligence v različne sektorje. Po njegovem mnenju - kot direktor Nvidii bi težko javno govoril kaj drugega - to pomeni, da se bo povpraševanje po zmogljivih čipih povečalo, ne pa zmanjšalo. To ni zelo iz trte izvito, saj zgodovina uči, da pocenitev in poenostavitev tehnologije poveča njeno rabo, s tem pa tudi kumulativna vlaganja.

Ob tem je pojasnil, da so bile glavne DeepSeekove izboljšave v postopku začetnega urjenja (pre-training) modela. To resnično lahko poteka z manj računske moči, kar je dobrodošlo. Javnost pa je večinoma spregledala drugi korak, ki mu sledi (post-training). Ta je nujen, da model pridobi "inteligenco" in začne dajati koherentne odgovore, zlasti na zahtevnejša vprašanja. Tega dela ni možno izvesti brez zmogljive strojne opreme, ker je še vedno zelo potraten, trdi Huang. DeepSeek V3 je torej začetni model, po dodatnem urjenju pa dobimo R1, ki ga je DeepSeek izdelal z interakcijo med dvema modeloma umetne inteligence. A javno so povedali le, kaj so potrebovali za V3. Za R1 so potrebovali precej več računske moči in dražjo strojno opremo.

3 komentarji

111111111111 ::

Zanimivo. Tule na forumu so me pribili na križ, ko sem omenil da morda Kitajci lažejo o številkah. :D
Če prisloniš uho na vroč šporhet, lahko zavohaš kak si fuknjen.

Zimonem ::

Nisi rekel morda, ampak kategorično zatrdil. Vmes pa izpustil vse stvari katere so vgradili v model. Ta teden deepseek obljublja serijo člankov , ki opisujejo zadevo.

111111111111 ::

Zimonem je izjavil:

Nisi rekel morda, ampak kategorično zatrdil. Vmes pa izpustil vse stvari katere so vgradili v model. Ta teden deepseek obljublja serijo člankov , ki opisujejo zadevo.

In kategorično imel prav. :D

Aaa... Bodo končno napisali članke.

A nisi takrat dal nek PDF od Kitajcev, da si razsul moje dvome? :D Pa še lajal kakšni carji so kitajci ko za 6 miljonov iz nule naredili nov ChatGPT, oz. še boljši model. :D
Če prisloniš uho na vroč šporhet, lahko zavohaš kak si fuknjen.