» »

Po DeepSeeku tudi Alibaba

Po DeepSeeku tudi Alibaba

Slo-Tech - Danes je svoj veliki model predstavila tudi Alibaba. Qwen2.5-Max, ki je bil natreniran na 20.000 milijardah drobcev informacij (token), je po meritvah ustvarjalcev celo malo boljši od Deepseeka V3, GPT-4o, Llame-3.1 in primerljiv s Claude-3.5-Sonnetom.

Novi model lahko preizkusimo kot klepetalnik, naročniki pa imajo tudi dostop do API prek Alibaba Cloud. Prve verzije Qwen2.5 smo sicer videli že jeseni. Qwen2.5-Max lahko sprejme do 100.000 vhodnih znakov, njegovi odgovori pa so tudi v slovenščini. Qwen2.5 zna odgovarjati na vprašanja, brskati po spletu, ustvarjati slike in videoposnetke.

Alibaba model označuje kot vizualnega agenta, s čimer namiguje na multimodalnost. Osnovan je na verziji Qwen2-VL iz septembra 2024, na voljo pa je v verzijah s 3, 7 in 72 milijardami parametrov. Na voljo je tudi na Githubu.

31 komentarjev

Seljak ::

Alibabin model je po poklicu prodajalec

OutOfTheBox ::

What time to be alive :)

paradajzos ::

:) Kul, bravo Kitajska, stick it to the Trump brown noses!

PS: Pa medo je logo? Dobro trolajo Američane.
Levakarski fake forum.
Moderatorske manipulacije.
Serijsko.

Zgodovina sprememb…

twom ::

paradajzos je izjavil:

Dobro trolajo Američane.
Evropejcev ne rabjo. Kdo so že to (evropejci mislim)...

Bonsai ::

 Evropa

Evropa

Zgodovina sprememb…

  • spremenil: Bonsai ()

paradajzos ::

To je pomembno! :))
Levakarski fake forum.
Moderatorske manipulacije.
Serijsko.

Praskalec ::

paradajzos je izjavil:

:) Kul, bravo Kitajska, stick it to the Trump brown noses!

PS: Pa medo je logo? Dobro trolajo Američane.


Pravzaprav je Kapibara (Capybara) :).

bm1973 ::

No ja, zdaj se je malo pokazalo, kaj je NVidia sploh počela...

Vzela je AI hype, naredila nekaj algoritmov, zgleda v spregi z OpenAI, ki jih je vezala na svoj harver.

Z obljubo v prihodnosti, več našega hardvera omogoča boljši AI. Kar pomeni seveda čakalno vrsto na hardver, zagotovljena naročila in predvsem, najbolj pomembno, rast delnic.

Pol ti pa nekdo napiše boljši algoritem in ti sesuje cel poslovni model, kar se je odrazilo tudi na borzi...

V osnovi je NVidia hadverska firma, ki ravno tako kot AMD, ne more več narediti revolucija na področju GPU. Za nekaj let so to prestavili s pomočjo AI, zdaj pa je očitno tega malo konec...

Lahko se preprosto zgodi, da bo šla po poti Intela, ki že kar nekaj generacij CPU ni naredil nič revolucionarnega...

Pač hardveraši so dosegli fizikalne limite...

Lonsarg ::

Eh, ce se optimizira AI da rab manj hardware to sam pomeni da je se prostor za napredek, da treba se bolj kompleksne algoritme pisat da se hardware porabi.

Ima pa vsaka stvar hype fazo in nato realnost.So Nvidia delnice pac prej ble na hype fazi zdaj pa v realni, se vedno mnogo mnogo visje kot pred AI hardware fokusom.

kow ::

bm1973 - kot ponavadi - zopet bluzi. NVDIA seveda ni samo hw firma. Drugace njihov software stack ne bi bil nic vreden. Pa je ogromen 'moat', kot pravijo.

Mr.B ::

bm1973 je izjavil:

No ja, zdaj se je malo pokazalo, kaj je NVidia sploh počela...

Vzela je AI hype, naredila nekaj algoritmov, zgleda v spregi z OpenAI, ki jih je vezala na svoj harver.

Z obljubo v prihodnosti, več našega hardvera omogoča boljši AI. Kar pomeni seveda čakalno vrsto na hardver, zagotovljena naročila in predvsem, najbolj pomembno, rast delnic.

Pol ti pa nekdo napiše boljši algoritem in ti sesuje cel poslovni model, kar se je odrazilo tudi na borzi...

V osnovi je NVidia hadverska firma, ki ravno tako kot AMD, ne more več narediti revolucija na področju GPU. Za nekaj let so to prestavili s pomočjo AI, zdaj pa je očitno tega malo konec...

Lahko se preprosto zgodi, da bo šla po poti Intela, ki že kar nekaj generacij CPU ni naredil nič revolucionarnega...

Pač hardveraši so dosegli fizikalne limite...

NVidia je DANES tam kjer je je kot posledica software, ki ga je spisala za svoj HW. Daš rešitev, kot celoto. AMD rešitev, no HV je izjemno konkurenčen Nvidia, samo kaj ko morajop delati CUDA emulacije, zato ker so se nekateri navadili zgolj CUDA
France Rejects Genocide Accusations Against Israel in Gaza,
To accuse the Jewish state of genocide is to cross a moral threshold

mtosev ::

Čestitke kitajski.
Core i9 10900X, ASUS Prime X299 Edition 30, 32GB 4x8 3600Mhz G.skill, CM H500M,
ASUS ROG Strix RTX 2080 Super, Samsung 970 PRO, UltraSharp UP3017, Win 11 Pro,
Enermax Platimax 1700W | moj oče darko 1960-2016, moj labradorec max 2002-2013

kamiKaZaA ::

Super za Kitajsko. Čestitke.

dronyx ::

Bonsai je izjavil:

 Evropa

Evropa


Zakaj je pri EU slika zmaja? Tam bi morala biti kvečjemu kakšna čivava, ki veliko laja, kaj drugega pa ne zna.

bm1973 ::

Zimonem ::

Qwen2.5-Max lahko sprejme do 100.000 vhodnih znakov, njegovi odgovori pa so tudi v slovenščini.


O ti sveta preproščina. Kakšnih znakov madona????
Token oz žeton ni enako znakom.

smihael ::

Bonsai je izjavil:

 Evropa

Evropa



Kaj ima Evropa?

Ruski YandexGPT: YandexGPT @ Wikipedia

Francoski Mistral AI: Mistral AI @ Wikipedia

Oba delata spodobno, nista pa presežek. Yandexov model ima dobro integracijo v druge storitve (podobno kot pri Microsoftu in Googlu).

Zgodovina sprememb…

  • spremenil: smihael ()

gus5 ::

Naj cveti sto cvetov, sto šol naj tekmuje med seboj.
(Mao Cetung, 1956)

Zdi se, da kitajski komunisti, oprti na tradicijo konfucionizma, ubrano tečejo na dolge proge. ;)

Randomness ::

Pol ti pa nekdo napiše boljši algoritem in ti sesuje cel poslovni model, kar se je odrazilo tudi na borzi...

Mislim, da to ne bo držalo. S tem se bo potreba po computu kvečjemu povečala, mogoče malo manj za treniranje, toliko bolj pa za inferenco. Sploh če/ko se bo šlo v smer CoT/TTT

Zgodovina sprememb…

FireSnake ::

Bom samo podal povezavo na mojo objavo (ne drži 100% za to objavo a je na isto vižo):
https://slo-tech.com/novice/t837605/p84...
Poglej in se nasmej: vicmaher.si

Mr.B ::

Randomness je izjavil:

Pol ti pa nekdo napiše boljši algoritem in ti sesuje cel poslovni model, kar se je odrazilo tudi na borzi...

Mislim, da to ne bo držalo. S tem se bo potreba po computu kvečjemu povečala, mogoče malo manj za treniranje, toliko bolj pa za inferenco. Sploh če/ko se bo šlo v smer CoT/TTT

Sej razumeš da je na zahodu veliko vsebin generiranih kot AI povzetki in AI halicuniranje, in potem vzameš e vsebine za trening AI-ja. Da večino časa boš porabil, da bo sistem ugotavljal kaj je AI vsebina in AI halucinacija in kaj pravi vir/vsebina.
France Rejects Genocide Accusations Against Israel in Gaza,
To accuse the Jewish state of genocide is to cross a moral threshold

Blazz ::

Randomness je izjavil:

Pol ti pa nekdo napiše boljši algoritem in ti sesuje cel poslovni model, kar se je odrazilo tudi na borzi...

Mislim, da to ne bo držalo. S tem se bo potreba po computu kvečjemu povečala, mogoče malo manj za treniranje, toliko bolj pa za inferenco. Sploh če/ko se bo šlo v smer CoT/TTT


Tako je, in temu se reče Jevons Paradox:

Jevons paradox @ Wikipedia

MikeRotch ::

gus5 je izjavil:

Naj cveti sto cvetov, sto šol naj tekmuje med seboj.
(Mao Cetung, 1956)

Zdi se, da kitajski komunisti, oprti na tradicijo konfucionizma, ubrano tečejo na dolge proge. ;)


Trenutno je stanje bolj tako, da so se kitajski tekači prvih 41km maratona peljali v avtomobliu, skočili ven v zadnjem kilometru in odtekli do cilja.

Pa to ni podcenjevanje dosežkov Deepseeka in Alibabe. Samo realna primerjava. Brez Nvidije, OpenAI, Anthropica itd. danes ne bi imeli Deepseeka.

Mr.B ::

MikeRotch je izjavil:

gus5 je izjavil:

Naj cveti sto cvetov, sto šol naj tekmuje med seboj.
(Mao Cetung, 1956)

Zdi se, da kitajski komunisti, oprti na tradicijo konfucionizma, ubrano tečejo na dolge proge. ;)


Trenutno je stanje bolj tako, da so se kitajski tekači prvih 41km maratona peljali v avtomobliu, skočili ven v zadnjem kilometru in odtekli do cilja.

Pa to ni podcenjevanje dosežkov Deepseeka in Alibabe. Samo realna primerjava. Brez Nvidije, OpenAI, Anthropica itd. danes ne bi imeli Deepseeka.

Samo o tem poračajo predvsem z OpenAI tabora, ker še vedno ne vejo, kako so jih nategnili...
France Rejects Genocide Accusations Against Israel in Gaza,
To accuse the Jewish state of genocide is to cross a moral threshold

OutOfTheBox ::

Pa to ni podcenjevanje dosežkov Deepseeka in Alibabe. Samo realna primerjava. Brez Nvidije, OpenAI, Anthropica itd. danes ne bi imeli Deepseeka.


Kar načeloma ni nič narobe, to se dogaja vsaki dan. Nekdo naredi uporaben produkt, drugi naštudira kako deluje, skopira jedro/osnovo produkta in dela od tam naprej.

Določeni produkti grejo skozi več faz razvoja.

Če gledamo je Prvi "avtomobil" bil narejen v 17 stoletju, je pa daleč od tega kar je naredil Benz in potem Henry Ford in svetlobna leta od sodobnega avtomobila.



Ne vem zakaj bi odkrival toplo vodo, če lahko nadaljuješ delo nekoga.

Zgodovina sprememb…

tetriandoch ::

Bonsai je izjavil:

 Evropa

Evropa



Vse se da, sam rabi Uši še kakšno provizijo. Zaenkrat smo na zeleni poti do bridkega konca. Čez 50 let se bodo med vetrnicami pasle ovce. Večino ljudi bo pa itak pobralo od zelenega prehoda. Drugje se bodo tudi pasle ovce zaradi AI- ja, ki bo pogruntal, da so s človeštvom samo krizi in težave.

Zgodovina sprememb…

OutOfTheBox ::

Čez 50 let se bodo med vetrnicami pasle ovce.


Sej to niti ni tako slabo.

MikeRotch ::

Ne vem zakaj bi odkrival toplo vodo, če lahko nadaljuješ delo nekoga.


Se 100% strinjam. Nisem napisal, da je kaj narobe s tem. Nasprotno, meni se zdi to super. Sploh zato, ker so kitajci dejansko dali ven kodo, za razliko od "Open" AI :)

Drugače en zanimiv video na to temo od Computerphile:

m0LN4r ::

smihael je izjavil:

Bonsai je izjavil:

 Evropa

Evropa



Kaj ima Evropa?

Ruski YandexGPT: YandexGPT @ Wikipedia

Francoski Mistral AI: Mistral AI @ Wikipedia

Oba delata spodobno, nista pa presežek. Yandexov model ima dobro integracijo v druge storitve (podobno kot pri Microsoftu in Googlu).

Rusko ne steje vec

PS:
A nime ze OpenAI kao GPT5 v startnih luknjah?
https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

Zgodovina sprememb…

  • spremenil: m0LN4r ()

Zimonem ::

MikeRotch je izjavil:

gus5 je izjavil:

Naj cveti sto cvetov, sto šol naj tekmuje med seboj.
(Mao Cetung, 1956)

Zdi se, da kitajski komunisti, oprti na tradicijo konfucionizma, ubrano tečejo na dolge proge. ;)


Trenutno je stanje bolj tako, da so se kitajski tekači prvih 41km maratona peljali v avtomobliu, skočili ven v zadnjem kilometru in odtekli do cilja.

Pa to ni podcenjevanje dosežkov Deepseeka in Alibabe. Samo realna primerjava. Brez Nvidije, OpenAI, Anthropica itd. danes ne bi imeli Deepseeka.

Več polresnic in pa halucinacij kot pa uporabnih informacij. Transformerjev so pogruntali pri Googlu. Kateri pretežno niti ne uporablja nvdije ampak imajo svoj Tenzor čip. Openai je pač stvar spravil v obliko klepetulje in stvar populariziral. Pri ostalih vejah ai pa kitajska že nekaj časa prednjači. Probleme imajo edino z izdelavo čipov ker so blokirani pri tsmc. Svoje modele že nekaj časa objavljajo kot odprtokodne. Deepseek je pa potegnil genialno potezo in začel mrežo gradit z majhnim ampak preverjenim virom znanja in na podlagi tega filtriral znanje na spletu. Namesto da bi vse posrkala potem se pa šel fine tuning.

Jazon ::

Članek na Financah z naslovom: Kitajska in ZDA tekmujeta v UI-modelih, Bruselj pa akt za razvoj UI načrtuje za leto 2026
https://www.finance.si/kitajska-in-zda-...

In komentarji na iksu: https://x.com/petrasovdat/status/188466...

Skratka mama EK pravi najprej regulacija in potem razvoj.

Tole spominja na knjigo Pretežno Neškodljiva in Golgafrinčane, ki so se na zelo domiseln način znebili tretjine populacije. Očitno so pristali v Bruslju.