»

ByteDance začasno preložil izid svojega modela Seedance 2.0

Slo-Tech - Kitajski Bytedance, ki ga na Zahodu poznamo po platformi TikTok, izdeluje model svoje generacijske umetne inteligence, ki zmore ustvarjati realistične videoposnetke. Seedance 2.0 so želeli izdati že minuli teden, a so po sporu s hollywoodskimi studii glede avtorskih pravic izid nekoliko preložili. Zagotoviti morajo, da uporabniki z njim ne bodo ustvarjali vsebin, ki bi neposredno kršile avtorske pravice studiev. Disney je minuli mesec podjetju že poslal zahtevek za odpravo kršitev (cease-and-desist), saj naj bi za trening Seedancea 2.0 uporabljalo več likov iz Disneyjevih zgodb. Tedaj je na splet pobegnilo nekaj posnetkov, na katerih se ti pojavijo.

Na spletu so se takoj pojavile primerjave Seedancea 2.0 z DeepSeekom, ki je ob izidu zatresel borze in pošteno prestrašil zahodne velikane, ko je kazalo, da lahko vsaj primerljive modele Kitajci zgradijo za več velikostnih razredov ceneje. DeepSeek na koncu ni bil kos najnaprednejšim modelom podjetij OpenAI, Anthropic in Google, prav...

4 komentarji

Kitajska Deepseeku dovolila nakup Nvidijinih čipov H200

Slo-Tech - Kitajska država je vidnim podjetjem vendarle dovolila nakup zmogljivih Nvidijinih čipov H200. DeepSeek, ki razvija umetno inteligenco, ByteDance, Alibaba in Tencent so vsi dobili dovoljenja za uvoz H200. Končne podrobnosti še niso dorečene. Koliko čipov bo smel uvoziti DeepSeek, še ni znano, preostala trojica pa bo dobila do 400.000 čipov. Nvidia uradno s tem dogodkom še ni seznanjena.

Da bo Kitajska dovolila uvoz, je bilo jasno že v začetku leta, ker pametne alternative preprosto nimajo. Čipi H200 stanejo okrog 27.000 dolarjev, Nvidia pa je od kitajskih podjetij zahtevala plačila vnaprej, ker ni bilo jasno, ali bo prodaja mogoča. Skupno so Kitajci naročili več kot milijon čipov, ki jih bodo očitno - vsaj v dobršni meri - dobili.

Tudi kitajska vlada ne daje uradnih informacij, poroča Reuters. Izvoz na Kitajsko so ameriške oblasti odobrile v začetku leta. Nvidia mora ob tem v ameriški proračun plačati dodatno 25-odstotno dajatev, ki se je je domislil ameriški predsednik.

0 komentarjev

DeepSeek R2 zamuja zaradi slabih Huaweijevih čipov

Slo-Tech - Konec minulega leta je kitajski DeepSeek izdal svoj veliki jezikovni model R1, ki so ga na Zahodu opazili januarja in je zaradi domnevno bistveno cenejšega treninga za krajši čas povzročil pravo paniko. Njegov naslednik R2 bi bil moral iziti maja letos, a ga še vedno ni. Po podatkih virov blizu DeepSeeka razlog za zamudo tiči v Huaweijevih čipih, ki so jih skušali uporabiti za trening, a so imeli z njimi nemalo težav.

Po neuradnih podatkih so se čipi Ascend izkazali za neprimerne in nezanesljive. Zaradi tehničnih težav so se na koncu odločili, da bodo uporabili Nvidiine čipe, saj so bili Huaweijevi nestabilni, prepočasni in s slabšo programsko podporo. Huawei je DeepSeeku celo poslal strokovnjake, da bi jim pomagali usposobiti čipe za razvoj modela, a na koncu je projekt padel v vodo. Za trening bodo nujni Nvdiini čipi, se pa DeepSeek trudi, da bi bilo model na Huaweijevih čipih moč vsaj poganjati.

10 komentarjev

Kaj nam bodo dragi modeli, če imamo poceni?

Slo-Tech - DeepSeek je razburkal svet z najavo, da so svoj model DeepSeek R1 izurili za vsega šest milijonov dolarjev, a gre še ceneje. Raziskovalci s Stanforda in washingtonske univerze so pripravili model s1, ki je primerljiv z OpenAI o1 in DeepSeek R1, le da so za njegovo pripravo porabili 50 dolarjev, kodo in vhodne podatke trening pa priobčili javnosti.

Ocena 50 dolarjev ni povsem poštena, saj so porabili toliko denarja za najem računske moči za trening. V to torej niso všteti niti stroški nabave strojne opreme niti stroški dela ljudi. Druga pomembna podrobnost je način učenja, saj je s1 uporablja distilacijo, torej se je učil na modelu Gemini 2.0 Flash Thinking Experimental. Na podoben način so na Berkeleyju že januarja pripravili model za 450 dolarjev.

Kodo za s1 in vse spremljajoče informacije so objavili na Githubu. To pomeni, da ga lahko uporabi ali nadalje razvija vsakdo. Ključno vprašanje pa je, kaj to pomeni za razvoj novih modelov od začetka. Razvoj s1 je bil tako poceni, kar...

21 komentarjev

DeepSeek je na internetu pozabil javno dostopno bazo svojih podatkov

Slo-Tech - DeepSeek je morda res zatresel svet, a pri tem so bili površni in nepazljivi. Na internetu se je znašla baza podatkov, v kateri so tudi vsebine pogovorov, ki so jih imeli z DeepSeekom različni uporabniki. Gre za bazo Clickhouse, ki ima več milijonov vrstic dnevnika pogovorov. Poleg tega je v njej moč najti tudi ključe, podrobnosti delovanja in druge občutljive informacije.

Ranljivost je že zakrpana, saj so jo v podjetju Wiz Research po odkritju takoj odgovorno prijavili DeepSeeku, ki je hitro ukrepal. Baza je bila dostopna na naslovih oauth2callback.deepseek.com:9000 in dev.deepseek.com:9000, uporabljala pa ni niti najosnovnejših zaščit. Brez kakršnekoli avtentikacije je bilo možno izvajati operacije nad bazo. Odkrili so jo med rutinskim pregledovanjem, katere domene ima DeepSeek javno dostopne, in to ne le prek vrat 80 ali 443. Nekaj domen so tako našli, ki so odgovarjale na vratih 8123 in 9000.

Ami Luttwak iz Wiz Research dodaja, da se napake seveda dogajajo, a je šlo v tem...

46 komentarjev

Kitajska družba DeepSeek razburkala področje umetne inteligence s poceni jezikovnim modelom R1

Slo-Tech - V približno tednu dni je dotlej malo znano kitajsko podjetje DeepSeek z lansiranjem naprednega velikega jezikovnega modela R1 področje generativnih algoritmov na videz postavilo na glavo: za bistveno nižjo ceno so namreč napravili izdelek, ki se lahko kosa z OpenAI o1.

Prejšnji ponedeljek - ravno na dan Trumpove druge prisege - je malo znano kitajsko zagonsko podjetje DeepSeek predstavilo družino jezikovnih modelov DeepSeek R1. Natančneje, gre za modele z določeno zmožnostjo sklepanja (simulated reasoning - SR), ki v fazi izvajanja postopek odgovarjanja strukturirajo v nekakšno zaporedje argumentiranega iskanja delnih odgovorov, zaradi česar so uporabni predvsem na področju znanosti, matematike in tehnologije. Prvi algoritem takšne sorte so pri OpenAI predstavili lanskega septembra v obliki o1 in torej veljajo za čelo napredka.

Posebnost R1 pa ni zgolj to, da naj bi kitajski startup v zgolj nekaj mesecih dohitel OpenAI, saj naj bi bil R1 po izkazu sila blizu o1, temveč še bolj v...

169 komentarjev