Mistral AI представив флагманську ШІ-модель Large 2 — ForkLog UA
Паризький ШІ-стартап Mistral AI випустив флагманську модель Large 2, яка «значно перевершує попередню версію Large і працює на одному рівні з GPT-4o, Claude 3 Opus і Llama 3 405B».
Large 2 з’явилася через день після випуску корпорацією Meta нової колекції ШІ-моделей, зокрема Llama 3.1 405B з відкритим вихідним кодом.
Покращена нейромережа Mistral AI має контекстне вікно у 128 000 токенів і 123 млрд параметрів — цим терміном описують навички вирішення проблеми. У Llama 3 405B 128 000 токенів і 405 млрд параметрів відповідно.
Порівняння Large 2 з Llama 3 405B і Llama 3 70B за продуктивністю в галузі генерації коду і математики. Джерело: Mistral AI.
У пресрелізі йдеться про прагнення Mistral AI мінімізувати проблеми «галюцинацій». Large 2 навчали бути більш розбірливою у своїх відповідях і не вигадувати правдоподібну інформацію.
Нова ШІ-система Mistral розуміє англійську, французьку, німецьку, іспанську, італійську, португальську, арабську, гінді, російську, китайську, японську та корейську, а також понад 80 мов програмування, включно з Python, Java, C, C++, JavaScript і Bash. Вона видає більш короткі відповіді на відміну від попередніх моделей.
Порівняння Large 2 з Llama 3 405B і Llama 3 70B у багатомовності. Джерело: Mistral.
У червні Mistral AI залучив $640 млн за оцінки в $6 млрд. Заснований колишніми співробітниками Google DeepMind і Meta стартап вважається європейським конкурентом OpenAI.
Нагадаємо, наприкінці травня французька ШІ-компанія випустила Codestral — модель штучного інтелекту для генерації коду.
У лютому Microsoft оголосила про інвестиції в Mistral AI в розмірі $2,1 млрд.