Slo-Tech - Konec minulega leta je kitajski DeepSeek izdal svoj veliki jezikovni model R1, ki so ga na Zahodu opazili januarja in je zaradi domnevno bistveno cenejšega treninga za krajši čas povzročil pravo paniko. Njegov naslednik R2 bi bil moral iziti maja letos, a ga še vedno ni. Po podatkih virov blizu DeepSeeka razlog za zamudo tiči v Huaweijevih čipih, ki so jih skušali uporabiti za trening, a so imeli z njimi nemalo težav.
Po neuradnih podatkih so se čipi Ascend izkazali za neprimerne in nezanesljive. Zaradi tehničnih težav so se na koncu odločili, da bodo uporabili Nvidiine čipe, saj so bili Huaweijevi nestabilni, prepočasni in s slabšo programsko podporo. Huawei je DeepSeeku celo poslal strokovnjake, da bi jim pomagali usposobiti čipe za razvoj modela, a na koncu je projekt padel v vodo. Za trening bodo nujni Nvdiini čipi, se pa DeepSeek trudi, da bi bilo model na Huaweijevih čipih moč vsaj poganjati.
Novice » Grafične kartice » DeepSeek R2 zamuja zaradi slabih Huaweijevih čipov

darkotri ::
Nvidiine čipi oz kartice niso TOLIKO boljše/i. Je pa programska oprema edina trenutno primerna za AI (LLM) in to je najpomembnejše.
darko

HotBurek ::
Razvijajo lasten hardware in software. In to je prava pot.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Ales ::
Je prava strateška usmeritev, vendar morajo vsaj priti do nekega vmesnega cilja, da je zadeva uporabna. Pred tem DeepSeeku pri delu "prava pot" še ne pomaga nič.

DamijanD ::
Saj so že, če ti navadni uporabniki laufajo lokalni LLM ali počnejo kaj drugega, kjer taki čipi pridejo za prav...

filip007 ::
Kopiraš od sošolca, ki ima boljša orodja od tebe, težka bo Kitajska.
HP prenosnik, Xbox SX in Hisense Qled.

Stane2 ::

borut_p ::

BT52 ::
Razvijajo lasten hardware in software. In to je prava pot.
Kitajci že od leta 2012 pospešeno razvijajo svoje čipe. In kje so sedaj? 5-10 let odzadaj.
Se pravi na nivoju intel?
Niso slabi torej jih jebe arhitektura. TUKAJ PAČ RABIŠ KNOW HOW. No tudi če upoštevamo, da so številke narobne in je dejaske effektivna gostota slaba. Ni to taki zaostanek, kot bi si jaz mislil.
### Foundry Nodes: Aug 2025 Overview
- **SMIC (China)**: 5nm – Limited prod.
DUV-based; high costs (40-50% > TSMC); low yields; no EUV.
*Baseline; trails in scale/efficiency.*
- **TSMC**: 2nm (N2) – Mass prod. H2 2025.
Nanosheet transistors; 65-75% yields; EUV; 25-30% better perf/power.
*Ahead of SMIC; superior density.*
- **Intel**: 1.8nm (18A) – Mass prod. end-2025.
RibbonFET GAA & PowerVia; competitive density; eyeing 1.4nm shift.
*Ahead; closes gap w/ TSMC despite yields.*
- **GlobalFoundries**: 12nm FinFET – High-volume prod.
Specialty (RF/power); mature for auto/IoT; no sub-10nm.
*Behind; focuses reliability over density.*
Zgodovina sprememb…
- spremenilo: BT52 ()

Mr.B ::
Vsaka pot, ki ne bazirana rezultatu naslednjega poročila za delničarje, je prave.
Lik od paywall...
DeepSeek's next AI model delayed by attempt to use Chinese chips
But the Chinese start-up encountered persistent technical issues during its R2 training process using Ascend chips, prompting it to use Nvidia chips for training and Huawei's for inference, said the people.
Članek govori da je problem z Ascend čipom... pa še to za trening...
Its Ascend series has become an increasingly popular option for Chinese AI groups to run inference, a process that applications such as OpenAI's ChatGPT use to generate responses to queries.
Lik od paywall...
DeepSeek's next AI model delayed by attempt to use Chinese chips
But the Chinese start-up encountered persistent technical issues during its R2 training process using Ascend chips, prompting it to use Nvidia chips for training and Huawei's for inference, said the people.
Članek govori da je problem z Ascend čipom... pa še to za trening...
Its Ascend series has become an increasingly popular option for Chinese AI groups to run inference, a process that applications such as OpenAI's ChatGPT use to generate responses to queries.
Lol se Hutiji delajo Facpalm USA:
A Navy fighter jet fell overboard Monday when the USS Harry S. Truman
aircraft carrier veered to avoid fire from the Houthis
A Navy fighter jet fell overboard Monday when the USS Harry S. Truman
aircraft carrier veered to avoid fire from the Houthis
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | Kaj nam bodo dragi modeli, če imamo poceni?Oddelek: Novice / Znanost in tehnologija | 5861 (309) | socialec |
» | DeepSeek je na internetu pozabil javno dostopno bazo svojih podatkovOddelek: Novice / Zasebnost | 8660 (2021) | SmeskoSnezak |
» | Kitajska družba DeepSeek razburkala področje umetne inteligence s poceni jezikovnim m (strani: 1 2 3 4 )Oddelek: Novice / Ostala programska oprema | 19949 (9264) | kanarin |
» | kaj pravi chat gpt o deepseek r1 (strani: 1 2 )Oddelek: Loža | 7092 (3943) | delavec44 |