» »

kaj pravi chat gpt o deepseek r1

kaj pravi chat gpt o deepseek r1

Zimonem ::

DeepSeek-R1: Vodilni odprtokodni model za napredno sklepanje

DeepSeek-R1 je najnovejši odprtokodni model umetne inteligence, ki ga je razvilo kitajsko podjetje DeepSeek. Ta model je zasnovan za reševanje nalog, ki zahtevajo logično sklepanje, matematično razmišljanje in reševanje problemov v realnem času. Po poročanju Financial Timesa se DeepSeek-R1 po zmogljivosti kosa z vodilnimi modeli ameriških podjetij, kot je OpenAI.

Tehnične značilnosti

DeepSeek-R1 je model z 671 milijardami parametrov, ki uporablja arhitekturo "Mixture-of-Experts" (MoE). Pri vsakem vnosu se aktivira 37 milijard parametrov, kar omogoča učinkovito obdelavo in optimizacijo virov. Model je bil izurjen z uporabo okrepljenega učenja (RL) brez predhodnega nadzorovanega fino uglaševanja, kar mu omogoča razvoj naprednih sposobnosti sklepanja.

Odprtokodnost in dostopnost

V nasprotju z nekaterimi konkurenčnimi modeli je DeepSeek-R1 popolnoma odprtokoden in na voljo pod licenco MIT. To omogoča brezplačno komercialno in akademsko uporabo, kar spodbuja širšo uporabo in nadaljnje raziskave v skupnosti umetne inteligence.

Primerjava z drugimi modeli

DeepSeek-R1 dosega primerljivo zmogljivost z modeli, kot je OpenAI-o1, zlasti na področjih matematike, programiranja in sklepanja. Poleg tega je DeepSeek izdal tudi destilirane različice modela, ki temeljijo na drugih odprtokodnih modelih, kot sta Llama in Qwen, kar omogoča prilagodljivost glede na specifične potrebe uporabnikov.

Vpliv na globalno AI krajino

Uspehi podjetja DeepSeek, vključno z zmanjšanimi stroški izobraževanja in inferenčnih procesov, izzivajo prepričanje, da vrhunska umetna inteligenca zahteva obsežne vire. Ta razvoj poudarja omejitve ameriških ukrepov, namenjenih oviranju napredka Kitajske na področju umetne inteligence, in spodbuja ponovno oceno učinkovitosti takšnih sankcij.

Zaključek

DeepSeek-R1 predstavlja pomemben korak naprej v razvoju odprtokodnih modelov umetne inteligence, ki so sposobni naprednega sklepanja. Njegova odprtokodna narava in zmogljivosti ga postavljajo kot pomembno orodje za raziskovalce in razvijalce po vsem svetu, hkrati pa poudarjajo hitro napredovanje kitajskih podjetij na področju umetne inteligence.

Argonavt ::

To je teorija CGptja o deepseeku. Lahko bi opravičili slo tech sloves tehnološkega foruma in naredili kake primerjalne teste. Deepseek uporabljam šele dober teden in so splosni odgovori kar zadovoljivi.

Danes mi je ze v drugi, tretji iteracijo s precej ad hoc in slabimi prompti spisal solidno kodo v M jeziku za power query (cca 100 vrstic) in dokaj hitro delujoč programček v pyhtonu. Nisem pa delal paralelno v obeh za primerjavo . Po občutku na hitro se mi zdi da je celo hitrejsi in manj halucinira kot CGpt in pride do rezultata v manj iteracijah. Mogoče ne bo treba več colat 20€/mesec.

Zimonem ::

Glede kode ne samo zamenja 50% pol se pa prebijati čez tuja črevca je tudi malo noro. Sploh v Rustu.
Bolj mi je fascinanto
utemeljevanje. Pa da ga lahko laufaš doma.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Nvidiin jezikovni model za zvoke: Fugatto

Oddelek: Novice / Ostale najave
51670 (165) FireSnake
»

Apple vendarle ne bo investiral v OpenAI

Oddelek: Novice / Nakupi / združitve / propadi
132297 (1271) FlyingBee
»

Microsoft je vložil v OpenAI, ker se je bal Googla, niti pa še vedno vleče Gates

Oddelek: Novice / Ostale najave
315916 (3006) Markoff
»

Microsoft in AMD bosta združila moči pri umetni inteligenci

Oddelek: Novice / Znanost in tehnologija
194080 (2371) BT52
»

Nevidne mravljice, brez katerih ni umetne inteligence

Oddelek: Novice / Znanost in tehnologija
116295 (4963) bosmla

Več podobnih tem