Microsoft razvija veliki jezkovni model MAI-1

Matej Huš

7. maj 2024 ob 07:06:39

Vendarle smo slišali pričakovane vesti iz Redmonda, da Microsoft vendarle razvija lasten veliki jezikovni model. Za zdaj poimenovan MAI-1 bo imel pol bilijona parametrov, s čimer bo konkuriral Googlovemu Geminiju in OpenAI-jevemu ChatGPT-ju četrte generacije. Predstaviti ga utegnejo že ta mesec na konferenci Build. Projekt vodi Mustafa Suleyman iz podjetja Inflection AI, ki ga je Microsoft prevzel marca letos.

Microsoftov poslovni odnos do umetne inteligence je zanimiv. Na pomembnost področja je Bill Gates opozoril že pred leti, podjetje pa je nato investiralo več kot deset milijard dolarjev v OpenAI. Odločitev se jim je izplačala, saj je njihov model GPT-4 med najbolj priljubljenimi na svetu, Microsoft pa ga je smel integrirati v svoj Copilot, Bing in druge izdelke. A vendarle bi bilo nenavadno, če bi Microsoft uporabljal zgolj tuje orodje, sam pa ne bi poizkušal ničesar razviti, razen če je dolgoročni načrt prevzeti OpenAI, kar pa zaradi kompleksne lastniške strukture ni prav verjetno.

Sedaj smo dočakali MAI-1, ki predstavlja prvi Microsoftov veliki jezikovni model. Doslej so se bolj igrali z majhnimi modeli, denimo Phi-3, ki so imeli komajda nekaj milijard parametrov. Za nekatere namene je to dovolj, ne pa za vse. Meta in Mistral sta svoje velike modele zgradila z okoli 70 milijardami parametrov, GPT-4 pa naj bi jih imel kar 1000 milijard. V tej ligi je torej MAI-1. Ob tem ne smemo pozabiti še na druge izlete v umetno inteligenco, ki jih je izvedel Microsoft: Bing, Phi-3, WizardLM, investicija v OpenAI in Mistral.

Za katere naloge bo MAI-1 specializiran, bomo videli ob prvi predstavitvi. Za zdaj moramo verjeti poročilom.