» »

DeepSeek R2 zamuja zaradi slabih Huaweijevih čipov

DeepSeek R2 zamuja zaradi slabih Huaweijevih čipov

Slo-Tech - Konec minulega leta je kitajski DeepSeek izdal svoj veliki jezikovni model R1, ki so ga na Zahodu opazili januarja in je zaradi domnevno bistveno cenejšega treninga za krajši čas povzročil pravo paniko. Njegov naslednik R2 bi bil moral iziti maja letos, a ga še vedno ni. Po podatkih virov blizu DeepSeeka razlog za zamudo tiči v Huaweijevih čipih, ki so jih skušali uporabiti za trening, a so imeli z njimi nemalo težav.

Po neuradnih podatkih so se čipi Ascend izkazali za neprimerne in nezanesljive. Zaradi tehničnih težav so se na koncu odločili, da bodo uporabili Nvidiine čipe, saj so bili Huaweijevi nestabilni, prepočasni in s slabšo programsko podporo. Huawei je DeepSeeku celo poslal strokovnjake, da bi jim pomagali usposobiti čipe za razvoj modela, a na koncu je projekt padel v vodo. Za trening bodo nujni Nvdiini čipi, se pa DeepSeek trudi, da bi bilo model na Huaweijevih čipih moč vsaj poganjati.

2 komentarja

darkotri ::

Nvidiine čipi oz kartice niso TOLIKO boljše/i. Je pa programska oprema edina trenutno primerna za AI (LLM) in to je najpomembnejše.
darko

HotBurek ::

Razvijajo lasten hardware in software. In to je prava pot.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Kaj nam bodo dragi modeli, če imamo poceni?

Oddelek: Novice / Znanost in tehnologija
215750 (198) socialec
»

DeepSeek je na internetu pozabil javno dostopno bazo svojih podatkov

Oddelek: Novice / Zasebnost
438570 (1931) SmeskoSnezak
»

Kitajska družba DeepSeek razburkala področje umetne inteligence s poceni jezikovnim m (strani: 1 2 3 4 )

Oddelek: Novice / Ostala programska oprema
16919379 (8694) kanarin
»

kaj pravi chat gpt o deepseek r1 (strani: 1 2 )

Oddelek: Loža
666947 (3798) delavec44

Več podobnih tem