Slo-Tech - V približno tednu dni je dotlej malo znano kitajsko podjetje DeepSeek z lansiranjem naprednega velikega jezikovnega modela R1 področje generativnih algoritmov na videz postavilo na glavo: za bistveno nižjo ceno so namreč napravili izdelek, ki se lahko kosa z OpenAI o1.
Prejšnji ponedeljek - ravno na dan Trumpove druge prisege - je malo znano kitajsko zagonsko podjetje DeepSeek predstavilo družino jezikovnih modelov DeepSeek R1. Natančneje, gre za modele z določeno zmožnostjo sklepanja (simulated reasoning - SR), ki v fazi izvajanja postopek odgovarjanja strukturirajo v nekakšno zaporedje argumentiranega iskanja delnih odgovorov, zaradi česar so uporabni predvsem na področju znanosti, matematike in tehnologije. Prvi algoritem takšne sorte so pri OpenAI predstavili lanskega septembra v obliki o1 in torej veljajo za čelo napredka.
Posebnost R1 pa ni zgolj to, da naj bi kitajski startup v zgolj nekaj mesecih dohitel OpenAI, saj naj bi bil R1 po izkazu sila blizu o1, temveč še bolj v stroških, ki naj bi pri tem nastali: v DeepSeeku trdijo, da so za trening potrošili manj kot 6 milijonov dolarjev, oziroma za nekako poldrugi razred velikosti manj kot je navada v OpenAI, Googlu, Meti in drugih ameriških velikanih, kjer nastanki takšnih modelov na oko zahtevajo okoli sto milijonov dolarjev. Za nameček naj bi Kitajci pri treningu uporabljali predvsem zavrte Nvidiine čipe H800, kakršne velikan edinole še lahko izvaža v azijsko velesilo po uvedbi širokopoteznih ameriških sankcij na področju čipov za pospeševanje generativnih algoritmov. Oh, in povrhu tega naj bi šlo še za postranski projekt.
Ta štorija o neuglednem pritepencu, ki je ameriškim velikanom pokazal sredinca in se v eni potezi zavihtel na vrh, je v zadnjih dneh domala uročila komentatorje, strokovnjake in vlagatelje širom sveta. Marc Andreessen je R1 označil za enega najbolj navdušujočih prebojev doslej, medtem ko drugi opozarjajo, da ozadja še ne poznamo in da bi lahko šlo za promocijsko akcijo s strani kitajske partije. Yann LeCun opozarja na odprtokodni vidik, saj je R1 odprtoutežni model pod MITjevo odprto licenco. Pogovorni bot je - kljub DDoS napadom - noro oblegan in aplikacija se je pretekli vikend na App Storu zavihtela na vrh lestvice brezplačnic. Danes so tečaji ameriških tehnoloških velikanov zabeležili znatne padce, Nvidijin za okoli 15 odstotkov.
DeepSeek je nastanjen v kraju Hangzhou, kjer ga je pred dvema letoma ustanovil Liang Wenfeng. Izvor in nameni so deklarirano močno idealistični, kajti zagonsko podjetje je neposredno izšlo iz laboratorija Fire-Flyer, ki je bil raziskovalni oddelek kitajskega investicijskega velikana High-Flyer. To se pravi: tamkajšnji procesorji so najprej trli finančne napovedi, preden se je Wenfeng odločil, da se želi ukvarjati z raziskovanjem umetne inteligence. Pri tem je, inovativno, strokovnjake pobiral pretežno med mladimi študenti na univerzah, ne v drugih velikanih. Tako je očitno dobil kritično maso ljudi, ki so se znali z izzivi spopasti na samosvoje načine. DeepSeek dejansko nosi kopico navdušujočih tehničnih zamisli, kot je denimo tista, da se po potrebi prižiga samo določen del nevronske mreže modela, ne pa vsa naenkrat. Poleg osrednjega modela s 671 milijardami parametrov so izdali še šesterico manjših, z od 1,5 do 70 milijardami parametrov, ki jih je mogoče poganjati lokalno.
Tako gre v resnici za zgodbo o tehnični domišljenosti, ki je potolkla uveljavljene paradigme; predvsem dve. Najprej tisto o neobhodnih orjaških stroških za trening in delovanje velikih jezikovnih modelov, s katero ameriški velikani, od OpenAI do Microsofta, argumentirajo gigantsko porabo elektrike, vode in denarja, oziroma s tem povezane nenehne nove finančne injekcije. Kitajci so pokazali, da je to bolj politika teh podjetij kot pa dejanska tehnična nujnost in od tu tudi današnje majanje delniških trgov. In drugič, kaže na luknjo v pristopu ameriške administracije do izvažanja čipov na Kitajsko, saj so se potrdile slutnje, da bodo sankcije Kitajce preprosto prisilile, da se bodo čim prej prilagodili (pa čeprav ne vemo natančno, na čem so pri DeepSeeku modele dejansko trenirali, saj vemo, da so že leta kopičili tudi močnejše čipe).
Novice » Ostala programska oprema » Kitajska družba DeepSeek razburkala področje umetne inteligence s poceni jezikovnim modelom R1
Telbanc ::
Sam še manjka, da činezi nardijo en spodoben čip. To bo čista zmaga.
Interesantno, da so komunisti gnili jajček uvalili Trampu. Par dni po izvolitvi.
Interesantno, da so komunisti gnili jajček uvalili Trampu. Par dni po izvolitvi.
Hvala bogu, nisem cepljen za covid-19.
OutOfTheBox ::
medtem ko drugi opozarjajo, da ozadja še ne poznamo in da bi lahko šlo za promocijsko akcijo s strani kitajske partije.
Mogoče. Ampak na konc dneva, kar opažam folku dol visi. TikTok so američanom ukinili, Trump sanja o osvajalskih pohodih in še mnogo drugih aktualnih novih zadev, ki američane ne kažejo v nič kaj dobri luči na svetovnem odru.
Uživam v drami, kitajci se mi skoz bolj dopadejo. Ne štekam pa ene zadeve - kje smo evropejci?
Zgodovina sprememb…
- spremenilo: OutOfTheBox ()
Grimnir3 ::
Uživam v drami, kitajci se mi skoz bolj dopadejo. Ne štekam pa ene zadeve - kje smo evropejci?
Ni nas.
Smo preveč razdrobljeni.
Še projekt združevanje z imenom EU bi vsi minirali, ker pač parcialni interesi.
StarMafijec ::
OutOfTheBox je izjavil:
Uživam v drami, kitajci se mi skoz bolj dopadejo. Ne štekam pa ene zadeve - kje smo evropejci?
Verjetno bomo uvedli kako regulacijo in DeepSeek prisilili v upoštevanje le-te, v kolikor bodo še želeli tu "poslovati".
Grimnir3 ::
1+ milijarde folka, z močno centralno vlado premika gore.
Nas je pa več kot pol manj, pa vsak gleda samo na lastno rit.
Če boš komurkoli dal na izbiro opciji
1) to je dobro zame ampak zajebem celo EU
2) to je odlično za EU, ni pa posebne koristi zame, ali vsaj ne takoj
Bo vsak izbral opcijo 1.
Nas je pa več kot pol manj, pa vsak gleda samo na lastno rit.
Če boš komurkoli dal na izbiro opciji
1) to je dobro zame ampak zajebem celo EU
2) to je odlično za EU, ni pa posebne koristi zame, ali vsaj ne takoj
Bo vsak izbral opcijo 1.
Spura ::
StarMafijec je izjavil:
OutOfTheBox je izjavil:
Uživam v drami, kitajci se mi skoz bolj dopadejo. Ne štekam pa ene zadeve - kje smo evropejci?
Verjetno bomo uvedli kako regulacijo in DeepSeek prisilili v upoštevanje le-te, v kolikor bodo še želeli tu "poslovati".
Moj evropski prompt bom poslal podjetju v Afriki, oni ga bodo pa kitajcem in dobil bom nazaj odgovor. Vsi bodo imel neke APIje ki bodo klicali druge APIje in bo izvor LLMja ki naredi odgovor povsem zakamufliran.
pangro ::
bomo videli kako se bodo naprej razvijali trendi pa če je kitajska zmožna obrnit trend v svojo prid
FlyingBee ::
pa baje so skrili 50k H100 čipov o katerih ne smejo govoriti, ker se tam ne smejo prodajat/kupovat, skratka, počakajmo še malo, da bo bolj jasno.
P200 MMX, 32mb ram, 2gb HDD, s3 virge 2mb, 14" CRT 640x480
New Sphincter Kvartet:
Roko Spestner, Namaž Zlevčar, Daje Heading, Maraje Spetan
New Sphincter Kvartet:
Roko Spestner, Namaž Zlevčar, Daje Heading, Maraje Spetan
mepako ::
OutOfTheBox ::
Se pa ne preveč navadit, ker to ne bo skoz zastonj. Ne more bit, razen če bodo dilali podatke naprej.
pangro ::
ga bom uporabil ko bom programiral, pa da vidmo
ma zih lažejo glede stroškov
ma zih lažejo glede stroškov
Zgodovina sprememb…
- spremenil: pangro ()
LiquidAI ::
CCP DeepSeek je pošolal Open AI. Ne smemo pozabit, da je na ameriških univerzah ogromno kitajcev, ki imajo znanje da udejanijo prevlado na AI.
65001
Glugy ::
Kitajci so sposobni in imajo znanje, Američani pa veliko znanja uvažajo skozi privabljanje strokovnjakov iz celega sveta.
Telbanc ::
https://x.com/FahrettinAltay_/status/18...
"The largest single-day loss record in U.S. history.
Nvidia's loss due to China exceeded $600 billion. The company broke a loss record by losing 20% of its value due to a single incident."
Evo, kitajci vržejo mal riža in mamo tole.
"The largest single-day loss record in U.S. history.
Nvidia's loss due to China exceeded $600 billion. The company broke a loss record by losing 20% of its value due to a single incident."
Evo, kitajci vržejo mal riža in mamo tole.
Hvala bogu, nisem cepljen za covid-19.
Unilseptij ::
jim bomo že dali vetra, kdo pa mislijo, da so... ziher so zadaj Rusi ali pa S. Korejci :
https://www.businessinsider.com/deepsee...
DeepSeek said only users with a China-based phone number could register for a new account, a measure taken because it had recently faced "large-scale malicious attacks."
EDIT: Še boljši članek je na RT.com, samo to vem, da je pač propaganda:
https://www.rt.com/business/611735-deep...
Chinese AI startup DeepSeek reported a major attack on its servers on Monday, as global tech stocks shed hundreds of billions of dollars on the news of its potentially revolutionary technology.
DeepSeek's AI assistant, released last week, has overtaken the US-based ChatGPT as the most popular program on the Apple App Store. The Chinese startup claims its latest large language model is as powerful as its Western competitors, but at a fraction of the cost to train and operate.
"Due to large-scale malicious attacks on DeepSeek's services, we are temporarily limiting registrations to ensure continued service," said a notice posted on the company's website on Monday. "Existing users can log in as usual."
https://www.businessinsider.com/deepsee...
DeepSeek said only users with a China-based phone number could register for a new account, a measure taken because it had recently faced "large-scale malicious attacks."
EDIT: Še boljši članek je na RT.com, samo to vem, da je pač propaganda:
https://www.rt.com/business/611735-deep...
Chinese AI startup DeepSeek reported a major attack on its servers on Monday, as global tech stocks shed hundreds of billions of dollars on the news of its potentially revolutionary technology.
DeepSeek's AI assistant, released last week, has overtaken the US-based ChatGPT as the most popular program on the Apple App Store. The Chinese startup claims its latest large language model is as powerful as its Western competitors, but at a fraction of the cost to train and operate.
"Due to large-scale malicious attacks on DeepSeek's services, we are temporarily limiting registrations to ensure continued service," said a notice posted on the company's website on Monday. "Existing users can log in as usual."
Zgodovina sprememb…
- spremenilo: Unilseptij ()
Grimnir3 ::
https://x.com/FahrettinAltay_/status/18...
"The largest single-day loss record in U.S. history.
Nvidia's loss due to China exceeded $600 billion. The company broke a loss record by losing 20% of its value due to a single incident."
Evo, kitajci vržejo mal riža in mamo tole.
Seveda ker je bila delnica napihnjena čez vse meje.
Lepo da bo balon spustil mal vročega zraka ven.
gus5 ::
Tako je očitno dobil kritično maso ljudi, ki so se znali z izzivi spopasti na samosvoje načine.Kritična masa: le cca 200 kreativnih glav.
Tako gre v resnici za zgodbo o tehnični domišljenosti, ki je potolkla uveljavljene paradigme.Če prav razumem - izkoristek subvencij v "komunistični" Kitajski je večji kot v turbo kapitalističnih ZDA?
bajsibajsi ::
LeQuack ::
Seveda ker je bila delnica napihnjena čez vse meje.
Lepo da bo balon spustil mal vročega zraka ven.
Tudi nepremičnine pri nas so napihnjene, pričakuješ isto?
Quack !
pangro ::
gre za trditev da zadevo laufajo z bistveno manjšimi stroški in verjetno tukaj lažejo
The reason is not about DeepSeek r1 being inherently superior to American reasoning models.
What everyone is freaking out about is the DeepSeek team's claims over how little compute it took to train what is essentially a near-SOTA model, hence also the claims over it being a Chinese PsyOp.
The reasoning goes that the less accelerators needed for training, the less revenue Nvidia will generate, and hence the upset seen in the market.
Why Nvidia is suffering the worst in particular? Simply because Nvidia, through the CUDA technology, has a de-facto monopoly over the accelerator market.
https://x.com/astraiaintel/status/18839...
The reason is not about DeepSeek r1 being inherently superior to American reasoning models.
What everyone is freaking out about is the DeepSeek team's claims over how little compute it took to train what is essentially a near-SOTA model, hence also the claims over it being a Chinese PsyOp.
The reasoning goes that the less accelerators needed for training, the less revenue Nvidia will generate, and hence the upset seen in the market.
Why Nvidia is suffering the worst in particular? Simply because Nvidia, through the CUDA technology, has a de-facto monopoly over the accelerator market.
https://x.com/astraiaintel/status/18839...
Grimnir3 ::
LiquidAI ::
Ameriške firme so investirale v hardware medtem ko je Deepseek investiral v talent, ki je z boljšim softwerom in algoritmi povozil Open AI.
Astronomski znesek ki ga porabijo Ameriške AI firme se prelije v žepe menadžmentu, članom upravnega odbora in se ne porabi toliko za raziskave.
Astronomski znesek ki ga porabijo Ameriške AI firme se prelije v žepe menadžmentu, članom upravnega odbora in se ne porabi toliko za raziskave.
65001
LiquidAI ::
Slišal sem da je bil Deepseek le stranski projekt nekaterih talentiranih posameznikov. Danes je bil že izdan Deepseek Janus, ki že premaguje najsodobnejše modele za računalniški vid, ki so jih izdelala Ameriška podjetja. Deepseek zagotovo še ne prikazuje svojih najboljših modelov.
65001
Poldi112 ::
OutOfTheBox je izjavil:
Trump sanja o osvajalskih pohodih in še mnogo drugih aktualnih novih zadev, ki američane ne kažejo v nič kaj dobri luči na svetovnem odru.
To je precej nepomembno. Tudi WMD v Iraku in še kup enih nepotrebnih vojn jih ni kazalo v dobri luči, pa to ni vplivalo na praktično nič.
Še projekt združevanje z imenom EU bi vsi minirali, ker pač parcialni interesi.
Kakšno združevanje? Po formuli ena zunanja politika, ena vojska, en vodja, en rajh?
Hvala bogu, da tega ne želimo. Je diametralno nasprotno z idejo suverenosti in demokracije.
Where all think alike, no one thinks very much.
Walter Lippmann, leta 1922, o predpogoju za demokracijo.
Walter Lippmann, leta 1922, o predpogoju za demokracijo.
Zgodovina sprememb…
- spremenil: Poldi112 ()
Poldi112 ::
Ameriške firme so investirale v hardware medtem ko je Deepseek investiral v talent, ki je z boljšim softwerom in algoritmi povozil Open AI.
To kitajci sicer trdijo, vprašanje je pa, koliko je res. Lahko da je, lahko da ni. Če bodo začeli prehitevati zahod po desni še pri AI, verjetno je. Če ne, verjetno ni.
Vsekakor je pa odličen marketing.
Where all think alike, no one thinks very much.
Walter Lippmann, leta 1922, o predpogoju za demokracijo.
Walter Lippmann, leta 1922, o predpogoju za demokracijo.
dronyx ::
OutOfTheBox je izjavil:
Uživam v drami, kitajci se mi skoz bolj dopadejo. Ne štekam pa ene zadeve - kje smo evropejci?
Mi imamo dobre muzeje in stara mestna jedra.
Seljak ::
Američani jih bodo tako ali tako prepovedali v Ameriki, prav tako bodo še poostrili sankcije izvažanja grafikulj oz. čipov.
Navijam za Kitajce...
Navijam za Kitajce...
RedDrake ::
OutOfTheBox je izjavil:
Uživam v drami, kitajci se mi skoz bolj dopadejo. Ne štekam pa ene zadeve - kje smo evropejci?
Evropejci švasamo pokrovčke na plastenke in preprodajamo kitajske smeti s 1000% maržo.
kow ::
OutOfTheBox je izjavil:
Uživam v drami, kitajci se mi skoz bolj dopadejo. Ne štekam pa ene zadeve - kje smo evropejci?
Kaj ti ni jasno? Saj je cela ideologija EU, da zivljenje ni tekma.
"Najprej tisto o neobhodnih orjaških stroških za trening in delovanje velikih jezikovnih modelov, s katero ameriški velikani, od OpenAI do Microsofta, argumentirajo gigantsko porabo elektrike, vode in denarja, oziroma s tem povezane nenehne nove finančne injekcije. Kitajci so pokazali, da je to bolj politika teh podjetij kot pa dejanska tehnična nujnost in od tu tudi današnje majanje delniških trgov."
Ne razumem cisto teh trditev. Vecja ucinkovitost bo samo pomenila se hitrejse iteriranje, se vec novih modelov itd.
Prednost computinga ostaja in zakaj bi to zmanjsalo gigantsko porabo elektrike?
Tako je očitno dobil kritično maso ljudi, ki so se znali z izzivi spopasti na samosvoje načine.Kritična masa: le cca 200 kreativnih glav.
Ce imajo 200 kreativnih ljudi, to definitivno NI "zagonsko podjetje", ampak ornk firma.
Zgodovina sprememb…
- spremenil: kow ()
Gregor P ::
Čudno, da so ravno Nvidii padle delnice, če pa tudi Kitajci uporabljajo ravno njihove čipe , četudi "uradno" zavrte ...
... to da so itak precenjene, je zdaj postransko vprašanje.
Za nameček naj bi Kitajci pri treningu uporabljali predvsem zavrte Nvidiine čipe H800, ... (pa čeprav ne vemo natančno, na čem so pri DeepSeeku modele dejansko trenirali, saj vemo, da so že leta kopičili tudi močnejše čipe).
... to da so itak precenjene, je zdaj postransko vprašanje.
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).
Zgodovina sprememb…
- spremenil: Gregor P ()
dronyx ::
Pride šef do sodelavke in jo vpraša, kje ona vidi pri svojem delu možnost uporabe umetne inteligence. Ona mu pa odgovori - Da bi me računalnik sam opozoril, kdaj je čas za malico.
Zgodovina sprememb…
- spremenil: dronyx ()
Gregor P ::
Me prav zanima, ali bodo kaj znižali naročnino pri OpenAI za ChatGPT, ker 200 dolarjev za Plus, je zdaj kar malo zelo visoka cifra
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).
Miki N ::
Mimogrede... kako bodo pa zdaj AI židi pumpali astronomska Stargate sredstva, ko zdaj vsi vejo, da se da to narediti za desetino ali manj?
c3p0 ::
OutOfTheBox je izjavil:
Uživam v drami, kitajci se mi skoz bolj dopadejo. Ne štekam pa ene zadeve - kje smo evropejci?
AI zahteva enormne količine energije. V EU se pa te umazane igrice ne gremo, buzzword tukaj je odrast, ne pa napredek.
twom ::
kanarin ::
Kitajci ga sekajo na vseh področjih, svaka čast jim. Američani pa panika in v jok. Evropa pa... no comment.
Mato989 ::
1+ milijarde folka, z močno centralno vlado premika gore.
Nas je pa več kot pol manj, pa vsak gleda samo na lastno rit.
Če boš komurkoli dal na izbiro opciji
1) to je dobro zame ampak zajebem celo EU
2) to je odlično za EU, ni pa posebne koristi zame, ali vsaj ne takoj
Bo vsak izbral opcijo 1.
Seveda bo vsak izbral 1, krivda pa je na tem da je pač EU izrazito negativen in aristokratski in ljudje pač nimajo občutka da je Von Leynova opisa naš predsednik da niti ne začnemo o neizvoljenih EKjih itd...
Evropski parlament ne dela v 99% NIČESAR kar bi koristilo VSEM državljanom držav članic EU ampak velikokrat kar ustreza ZDA (podpora Ukrajini) itd...
Če sem pomagal, se priporočam za uporabo linka!
KUCOIN EXCHANGE link: https://www.kucoin.com/#/?r=E3I9Ij
BINANCE EXCHANGE link: https://www.binance.com/?ref=10161115
KUCOIN EXCHANGE link: https://www.kucoin.com/#/?r=E3I9Ij
BINANCE EXCHANGE link: https://www.binance.com/?ref=10161115
bm1973 ::
Mr.B ::
gre za trditev da zadevo laufajo z bistveno manjšimi stroški in verjetno tukaj lažejo
The reason is not about DeepSeek r1 being inherently superior to American reasoning models.
What everyone is freaking out about is the DeepSeek team's claims over how little compute it took to train what is essentially a near-SOTA model, hence also the claims over it being a Chinese PsyOp.
The reasoning goes that the less accelerators needed for training, the less revenue Nvidia will generate, and hence the upset seen in the market.
Why Nvidia is suffering the worst in particular? Simply because Nvidia, through the CUDA technology, has a de-facto monopoly over the accelerator market.
https://x.com/astraiaintel/status/18839...
Je majhen in dovol dober za večino koristnikov... To je bistvo.
Poleg tega imaš tudi...
DeepSeek just dropped ANOTHER open-source AI model, Janus-Pro-7B.
It's multimodal (can generate images) and beats OpenAI's DALL-E 3 and Stable Diffusion across GenEval and DPG-Bench benchmarks.
This comes on top of all the R1 hype.
Pa še OPEN SOURCE JE, ne tisti kapitalistični, tako da ko boš vprašal o famozni kitajski sliki osebka pred takom, ti bo povedal za kaj se gre...
France Rejects Genocide Accusations Against Israel in Gaza,
To accuse the Jewish state of genocide is to cross a moral threshold
To accuse the Jewish state of genocide is to cross a moral threshold
OutOfTheBox ::
Se pa tile večji dosežki ne bi dogajali, če kitajska ne bi vlagala v razvojne programe in ljudi.. nekaj kar so na kitajskem pred časom še sanjali in delali za "pest riža".
Kitajska partija začenja razumet da brez vlaganja ni nič in zgleda da razvija nek unikaten hibridni model ki združuje avtoritatno politično strukturo s kapitalističnim gospodarskim sistemom. Najbolj smešno in po drugi strani fascinantno je da zadeva dejansko deluje.
Nekaj kar v Rusiji in Severni koreji lahk le sanjajo. Rusi so bili blizu ampak raje vlagajo v orožje in nepomembno vojno kot pa v ljudi.
Kitajska partija začenja razumet da brez vlaganja ni nič in zgleda da razvija nek unikaten hibridni model ki združuje avtoritatno politično strukturo s kapitalističnim gospodarskim sistemom. Najbolj smešno in po drugi strani fascinantno je da zadeva dejansko deluje.
Nekaj kar v Rusiji in Severni koreji lahk le sanjajo. Rusi so bili blizu ampak raje vlagajo v orožje in nepomembno vojno kot pa v ljudi.
Zgodovina sprememb…
- spremenilo: OutOfTheBox ()
Cr00k ::
Besedo opensource jemljite z rezervo... še vedno so blackbox. Sploh ne vem, če je kater konkurenčen model zares open source.