Slo-Tech - Konec minulega leta je kitajski DeepSeek izdal svoj veliki jezikovni model R1, ki so ga na Zahodu opazili januarja in je zaradi domnevno bistveno cenejšega treninga za krajši čas povzročil pravo paniko. Njegov naslednik R2 bi bil moral iziti maja letos, a ga še vedno ni. Po podatkih virov blizu DeepSeeka razlog za zamudo tiči v Huaweijevih čipih, ki so jih skušali uporabiti za trening, a so imeli z njimi nemalo težav.
Po neuradnih podatkih so se čipi Ascend izkazali za neprimerne in nezanesljive. Zaradi tehničnih težav so se na koncu odločili, da bodo uporabili Nvidiine čipe, saj so bili Huaweijevi nestabilni, prepočasni in s slabšo programsko podporo. Huawei je DeepSeeku celo poslal strokovnjake, da bi jim pomagali usposobiti čipe za razvoj modela, a na koncu je projekt padel v vodo. Za trening bodo nujni Nvdiini čipi, se pa DeepSeek trudi, da bi bilo model na Huaweijevih čipih moč vsaj poganjati.
Novice » Grafične kartice » DeepSeek R2 zamuja zaradi slabih Huaweijevih čipov

darkotri ::
Nvidiine čipi oz kartice niso TOLIKO boljše/i. Je pa programska oprema edina trenutno primerna za AI (LLM) in to je najpomembnejše.
darko

HotBurek ::
Razvijajo lasten hardware in software. In to je prava pot.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Ales ::
Je prava strateška usmeritev, vendar morajo vsaj priti do nekega vmesnega cilja, da je zadeva uporabna. Pred tem DeepSeeku pri delu "prava pot" še ne pomaga nič.

DamijanD ::
Saj so že, če ti navadni uporabniki laufajo lokalni LLM ali počnejo kaj drugega, kjer taki čipi pridejo za prav...

filip007 ::
Kopiraš od sošolca, ki ima boljša orodja od tebe, težka bo Kitajska.
HP prenosnik, Xbox SX in Hisense Qled.

Stane2 ::

borut_p ::

BT52 ::
Razvijajo lasten hardware in software. In to je prava pot.
Kitajci že od leta 2012 pospešeno razvijajo svoje čipe. In kje so sedaj? 5-10 let odzadaj.
Se pravi na nivoju intel?
Niso slabi torej jih jebe arhitektura. TUKAJ PAČ RABIŠ KNOW HOW. No tudi če upoštevamo, da so številke narobne in je dejaske effektivna gostota slaba. Ni to taki zaostanek, kot bi si jaz mislil.
### Foundry Nodes: Aug 2025 Overview
- **SMIC (China)**: 5nm – Limited prod.
DUV-based; high costs (40-50% > TSMC); low yields; no EUV.
*Baseline; trails in scale/efficiency.*
- **TSMC**: 2nm (N2) – Mass prod. H2 2025.
Nanosheet transistors; 65-75% yields; EUV; 25-30% better perf/power.
*Ahead of SMIC; superior density.*
- **Intel**: 1.8nm (18A) – Mass prod. end-2025.
RibbonFET GAA & PowerVia; competitive density; eyeing 1.4nm shift.
*Ahead; closes gap w/ TSMC despite yields.*
- **GlobalFoundries**: 12nm FinFET – High-volume prod.
Specialty (RF/power); mature for auto/IoT; no sub-10nm.
*Behind; focuses reliability over density.*
Zgodovina sprememb…
- spremenilo: BT52 ()
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | Kaj nam bodo dragi modeli, če imamo poceni?Oddelek: Novice / Znanost in tehnologija | 5818 (266) | socialec |
» | DeepSeek je na internetu pozabil javno dostopno bazo svojih podatkovOddelek: Novice / Zasebnost | 8617 (1978) | SmeskoSnezak |
» | Kitajska družba DeepSeek razburkala področje umetne inteligence s poceni jezikovnim m (strani: 1 2 3 4 )Oddelek: Novice / Ostala programska oprema | 19597 (8912) | kanarin |
» | kaj pravi chat gpt o deepseek r1 (strani: 1 2 )Oddelek: Loža | 6986 (3837) | delavec44 |