Po DeepSeeku tudi Alibaba

Matej Huš

29. jan 2025 ob 23:16:44

Danes je svoj veliki model predstavila tudi Alibaba. Qwen2.5-Max, ki je bil natreniran na 20.000 milijardah drobcev informacij (token), je po meritvah ustvarjalcev celo malo boljši od Deepseeka V3, GPT-4o, Llame-3.1 in primerljiv s Claude-3.5-Sonnetom.

Novi model lahko preizkusimo kot klepetalnik, naročniki pa imajo tudi dostop do API prek Alibaba Cloud. Prve verzije Qwen2.5 smo sicer videli že jeseni. Qwen2.5-Max lahko sprejme do 100.000 vhodnih znakov, njegovi odgovori pa so tudi v slovenščini. Qwen2.5 zna odgovarjati na vprašanja, brskati po spletu, ustvarjati slike in videoposnetke.

Alibaba model označuje kot vizualnega agenta, s čimer namiguje na multimodalnost. Osnovan je na verziji Qwen2-VL iz septembra 2024, na voljo pa je v verzijah s 3, 7 in 72 milijardami parametrov. Na voljo je tudi na Githubu.