» »

DeepSeek je na internetu pozabil javno dostopno bazo svojih podatkov

DeepSeek je na internetu pozabil javno dostopno bazo svojih podatkov

Slo-Tech - DeepSeek je morda res zatresel svet, a pri tem so bili površni in nepazljivi. Na internetu se je znašla baza podatkov, v kateri so tudi vsebine pogovorov, ki so jih imeli z DeepSeekom različni uporabniki. Gre za bazo Clickhouse, ki ima več milijonov vrstic dnevnika pogovorov. Poleg tega je v njej moč najti tudi ključe, podrobnosti delovanja in druge občutljive informacije.

Ranljivost je že zakrpana, saj so jo v podjetju Wiz Research po odkritju takoj odgovorno prijavili DeepSeeku, ki je hitro ukrepal. Baza je bila dostopna na naslovih oauth2callback.deepseek.com:9000 in dev.deepseek.com:9000, uporabljala pa ni niti najosnovnejših zaščit. Brez kakršnekoli avtentikacije je bilo možno izvajati operacije nad bazo. Odkrili so jo med rutinskim pregledovanjem, katere domene ima DeepSeek javno dostopne, in to ne le prek vrat 80 ali 443. Nekaj domen so tako našli, ki so odgovarjale na vratih 8123 in 9000.

Ami Luttwak iz Wiz Research dodaja, da se napake seveda dogajajo, a je šlo v tem primeru za katastrofalno napako. Varnostna ranljivost kaže, da DeepSeek še ni pripravljen za resno uporabo z občutljivmi podatki, je še dodal. Ali je še kdo drug odkril odprto bazo in vanjo vstopil, ne vemo.

30 komentarjev

Glugy ::

Se vid da je bil DeepSeek postranski konceptni hobi projekt in da niso računal na tako hipno nenadno povečanje zanimanja da bi bolj resno zastavil zadevo.

Strel455 ::

Glugy je izjavil:

Se vid da je bil DeepSeek postranski konceptni hobi projekt.

Malo manj bi morali lagat, da bi verjetli temu....

111111111111 ::

Glugy je izjavil:

Se vid da je bil DeepSeek postranski konceptni hobi projekt in da niso računal na tako hipno nenadno povečanje zanimanja da bi bolj resno zastavil zadevo.

Seveda je. :D Kitajska jemlje projekte z umetno inteligenco kot postranske.
Če prisloniš uho na vroč šporhet, lahko zavohaš kak si fuknjen.

fikus_ ::

To kaže na to, da so hitro delali, verjetno se bo še kaj pokazalo.
Učite se iz preteklosti, živite v sedanjosti in razmišljajte o prihodnosti.

bm1973 ::

No ja, dvomim, da so to naredili v 2 mesecih samo s 6 milijonov kapitala...

Že tistih 50.000 H100 kartic stane precej... https://smicro.eu/nvidia-h100-80gb-pcie...

Ampak deluje, tako da...

Cifre so vrgli ven zato, da zjebejo malo zahodne kapitaliste :)).

M.B. ::

Niso meli H100 kartic ampak H800. H100 so prepovedane za kitajsko. In pa tudi dosti inovacij nima smisla če imaš H100. Glede na to da so pa hedge fund denar verjetno ni problem. Če so pa shortali Nvidio so pa par miljard tudi zaslužli. :)
Here's the thing: a huge number of the innovations I explained above are about overcoming the lack of memory bandwidth implied in using H800s instead of H100s. Moreover, if you actually did the math on the previous question, you would realize that DeepSeek actually had an excess of computing; that's because DeepSeek actually programmed 20 of the 132 processing units on each H800 specifically to manage cross-chip communications. This is actually impossible to do in CUDA. DeepSeek engineers had to drop down to PTX, a low-level instruction set for Nvidia GPUs that is basically like assembly language. This is an insane level of optimization that only makes sense if you are using H800s.

Again, just to emphasize this point, all of the decisions DeepSeek made in the design of this model only make sense if you are constrained to the H800; if DeepSeek had access to H100s, they probably would have used a larger training cluster with much fewer optimizations specifically focused on overcoming the lack of bandwidth.

https://stratechery.com/2025/deepseek-f...
Everyone started out as a newbie.
Sadly only a handful ever progress past that point.

Bellator ::

Ja pa kaj še, pretihotapijo jih preko Singapurja.


Zgodovina sprememb…

  • spremenilo: Bellator ()

Mr.B ::

Ker bo verjetno kar nekaj zgodb ...."vpiši poljubno na temo Kitajcev"... rad rečem pred pragom potem a s prsti na druge...
No nekaj primerov

Did DeepSeek copy OpenAI's AI technology?
OpenAI prohibits the practice of training a new AI model by repeatedly querying a larger, pre-trained model, a technique commonly referred to as distillation, according to their terms of use. And the company suspects DeepSeek may have tried something similar, which could be a breach of its terms.
Even as ChatGPT creator OpenAI faces a barrage of copyright infringement cases in some countries, the company believes that its upstart Chinese rival DeepSeek may have copied from its artificial intelligence (AI) technology. Not just OpenAI, but one of US President Donald Trump's top advisors has also levelled this claim, without yet presenting much evidence.


Oh Dear, Did Someone Steal Something From OpenAI?
OpenAI is investigating whether DeepSeek used its work to build its model--an ironic twist for a company that's built plenty on, well, other people's work



Authors Seek Meta's Torrent Client Logs and Seeding Data in AI Piracy Probe
Meta is among a long list of companies being sued for allegedly using pirated material to train its AI models. Meta has never denied using copyrighted works but stressed that it would rely on a fair use defense. However, with rightsholders in one case asking for torrent client data and 'seeding lists' for millions of books allegedly shared in public, the case now takes a geeky turn.


Microsoft's LinkedIn sued for disclosing customer information to train AI models
LinkedIn said in a statement: "These are false claims with no merit."
A lawyer for the plaintiffs had no immediate additional comment.
The lawsuit was filed several hours after U.S. President Donald Trump announced a joint venture among Microsoft-backed OpenAI, Oracle (ORCL.N), opens new tab and SoftBank (9984.T), opens new tab, with a potential $500 billion of investment, to build AI infrastructure in the United States.
The case is De La Torre v. LinkedIn Corp, U.S. District Court, Northern District of California, No. 25-00709.
France Rejects Genocide Accusations Against Israel in Gaza,
To accuse the Jewish state of genocide is to cross a moral threshold

Bellator ::

To bi bilo prvič, da so Kitajci nekaj skopirali :))

Vsaka tvoja izjava je nespametna, ampak tega smo že vajeni.

Zgodovina sprememb…

  • spremenilo: Bellator ()

Mr.B ::

Bellator je izjavil:

To bi bilo prvič, da so Kitajci nekaj skopirali :))

Vsaka tvoja izjava je nespametna, ampak tega smo že vajeni.

Še iz ukradenega znajo narediti boljši produkt. Seveda sploh če si imel Kitajce pri razvoju produkta nad katerega si potem prilepil kapitalistične zahodne ideje. Ps sej razumeš sarkazem.
France Rejects Genocide Accusations Against Israel in Gaza,
To accuse the Jewish state of genocide is to cross a moral threshold

kow ::

Kitajski genijalci so ocitno salabajzarji kot vsi ostali. Mr.B, komentar?

Strel455 ::

Mr.B je izjavil:


Še iz ukradenega znajo narediti boljši produkt. Seveda sploh če si imel Kitajce pri razvoju produkta nad katerega si potem prilepil kapitalistične zahodne ideje. Ps sej razumeš sarkazem.


Seveda lahko naredijo iz ukradenega boljši produkt, ker ne rabijo zapravljat ne časa ne denarja za osnoven produkt.
Vse kar imajo vržejo v to, da zadevo izboljšajo za 5% in da se potem tolčejo po prsih.

OutOfTheBox ::

BREAKING: TRUMP considering BAN on Chinese AI "deepseek."

LoL. Zadeva je open source. Duh je že uštel iz svetilke ;((

Kayzon ::

OutOfTheBox je izjavil:

BREAKING: TRUMP considering BAN on Chinese AI "deepseek."

LoL. Zadeva je open source. Duh je že uštel iz svetilke ;((


Kinda butthurt,no?

no comment ::

Strel455 je izjavil:

Seveda lahko naredijo iz ukradenega boljši produkt, ker ne rabijo zapravljat ne časa ne denarja za osnoven produkt.
Vse kar imajo vržejo v to, da zadevo izboljšajo za 5% in da se potem tolčejo po prsih.

Dvomim, da gre to tako.

Sicer bi lahko pustili ameriške miljarderje, da zapravijo baziljone, mi pa čez par dni skopiramo za promil cene.

Strel455 ::

no comment je izjavil:

Dvomim, da gre to tako.

Točno tako gre.

mi pa čez par dni skopiramo za promil cene.

Bi, če bi imeli "neomejne" resurse sponzorirane s strani države. Tako pa naša država ne bi kupila na črnem trgu 50 tisoč H100 kartic + vso ostalo opremo za skupaj 2-3 mrd USD.

Zimonem ::

Nič ne gre to tako. Vem da braniš posiljevaalca sestre ampak nekateri odpremo kak članek.

Strel455 ::

Zimonem je izjavil:

Nič ne gre to tako.

TOČNO tako gre. Kitajski reverse inženiring, aka kraja.

Zgodovina sprememb…

  • spremenilo: Strel455 ()

Zimonem ::

Kakšen vzvratni inžiniring. Kitajska občutno prednjači pri patentih na področju ai. Poleg tega druga orodja, drugčen pristop pri treniranju modela in celo svoj omrežni sklad. Pojma nimaš.

BT52 ::

Jup ^

kow ::

Kvaliteta ni enako kvantiteta (patenti). Zankrat je ocitno, da vodijo Ameri. Gotovo pa jih Kitajci nameravajo ujeti in prehiteti. Samo dvomim, da imajo sanse.

Zgodovina sprememb…

  • spremenil: kow ()

Zimonem ::

Lep izgovor za nekopetentnost. Vodijo pri samovožečih vozilih, prepoznavi obrazov , matematičnih razreševalcih, praktično povsod. Edino na llm področju so bili manj znani. Delno zaradi jezika, delno zaradi hwja. Deepseek Laufa na huawejevih procesorjih za inferenco. Kaj bo ko bodo imeli še svoje za trening bomo pa videli.

111111111111 ::

Mr.B je izjavil:

Ker bo verjetno kar nekaj zgodb ...."vpiši poljubno na temo Kitajcev"... rad rečem pred pragom potem a s prsti na druge...
No nekaj primerov

Hja, Kitajci lažejo, bolj me zanima zakaj se jih je vzelo resno, ko so objavili neverjetne številke? :D

Kdo je tukaj pridobil. V eni temi imamo uporabnika, ki je vzel 100 stranski PDF za sveto knjigo deepseeka.

Zmankuje kritičnega razmišljanja. :D

Kayzon je izjavil:

OutOfTheBox je izjavil:

BREAKING: TRUMP considering BAN on Chinese AI "deepseek."

LoL. Zadeva je open source. Duh je že uštel iz svetilke ;((


Kinda butthurt,no?

Meh...

Deepseek se ne bo mogel izboljšat. Je malo optimizirana različica chatGPT-ja za tiste ki si ne bodo mogli privoščiti boljšega modela bodo pač vzeli deepseek, ki je cenejši.

S čimer ni nič narobe saj ne rabimo za vsako stvar TOP modela, sam to da kitajci lažejo, da je to nek stranski produkt nekega hedge sklada in temu se verjame...

Zimonem je izjavil:

Kakšen vzvratni inžiniring. Kitajska občutno prednjači pri patentih na področju ai. Poleg tega druga orodja, drugčen pristop pri treniranju modela in celo svoj omrežni sklad. Pojma nimaš.

Nimaš pojma. 14 dni nazaj bi dal roko v ogenj, da je ChatGPT najmočnejši model na tržišču, sedaj pa daš roko v ogenj, da so kitajci za 6 miljonov naredili boljši produkt. :D
Če prisloniš uho na vroč šporhet, lahko zavohaš kak si fuknjen.

Zgodovina sprememb…

111111111111 ::

Zimonem je izjavil:

Lep izgovor za nekopetentnost. Vodijo pri samovožečih vozilih, prepoznavi obrazov , matematičnih razreševalcih, praktično povsod. Edino na llm področju so bili manj znani. Delno zaradi jezika, delno zaradi hwja. Deepseek Laufa na huawejevih procesorjih za inferenco. Kaj bo ko bodo imeli še svoje za trening bomo pa videli.

Verjetno bodo rabili samo 100$ in bodo prehiteli vse po spisku. jao bože, katera naivnost.
Če prisloniš uho na vroč šporhet, lahko zavohaš kak si fuknjen.

TheKingZiga ::

Ostajam na GPT.
Tud če je open source, kej več kt 7B noben kle nemore sam lavfat tkoda. +da bi hotu sam doma met skor isto kt GPT good luck. Vsaj 1000gb vram.
Ziga vf

BT52 ::

počaki na destilirane modele Seeka.

Stikalo ::

Pomojem so te LLM tako kot je recimo z Muskovo Teslo. Z AI so dosegli 80% avtomatizacije, za tistih 20% bodo pa scali kri še 20 let. Musk, sicer obljublja da bodo robotaxiji na voljo že 4 leta nazaj, ampak pomojem iz tega ne bo nič vsaj še 10 let.


Te LLM se pa vidi, da je statistika dobra, samo da bo kaj inoviral in ti reševal inžinirske probleme pa ne bo šlo. Dober je za iskanje idej, avtomatizacijo kakšnih odgovorov, iskanje povzetkov, urejanje podatkov itd..

So pa pojem te AI firme naredili precej hypa okoli tega, da pač cene delnic letijo v nebo. Ni pa to nek bav bav, to sedaj dela ogromno podjetij. Glede HW je pa sigurno po mojem menju, da lahko kitajci težavnost s svojim znanjem prepolovijo ali pa zmanjšajo lahko tudi za 10x.

111111111111 ::

Po moje bodo tudi pokrili konkreten del trga, saj večina firm ne rabi top of the top, ampak bo deepseek čisto OK, sam da bo cenejši.
Če prisloniš uho na vroč šporhet, lahko zavohaš kak si fuknjen.

sbawe64 ::

BT52 je izjavil:

počaki na destilirane modele Seeka.

Saj so že zunaj.
Ali preko https://lmstudio.ai
ali Ollama + Docker + open-webui, da ne gledaš grdega terminala, temveč si g33k in uporabljaš ds preko localhosta v Firefoxu.

Musk, sicer obljublja da bodo robotaxiji na voljo že 4 leta nazaj, ampak pomojem iz tega ne bo nič vsaj še 10 let.

Musk stavi na kamere+sw, vsi ostali na senzorje.
Razlog je cena, kamere so poceni, senzorji niso.

Waymo vozi brez voznika, poglej med st novice.
2020 is new 1984
Corona World order

Zgodovina sprememb…

  • spremenilo: sbawe64 ()

sbawe64 ::

Waymo vozi brez voznika, poglej med st novice.


Čeprav brez težav ne gre
https://slo-tech.com/novice/t836924#crta
https://slo-tech.com/novice/t826405#crta
2020 is new 1984
Corona World order

Zgodovina sprememb…

  • spremenilo: sbawe64 ()