Китайська лабораторія штучного інтелекту DeepSeek представила відкриту версію своєї моделі штучного інтелекту R1 зі здатністю до міркування, яка, за заявою розробників, перевершує ШІ-модель o1 від компанії OpenAI у деяких бенчмарках за низкою ключових показників.
Як повідомляє видання TechCrunch, модель R1 перевершує OpenAI o1 у таких бенчмарках, як AIME, MATH-500 та SWE-bench Verified. Ці тести охоплюють різні галузі, включаючи математичні завдання, програмування та загальну продуктивність моделі. AIME оцінює продуктивність моделей за допомогою інших ШІ-моделей, MATH-500 є набором завдань з математики, а SWE-bench Verified орієнтований на програмування.
Особливістю R1 є її здатність до самоперевірки, що допомагає виключити помилки, характерні для інших моделей. Однак цей підхід потребує більше часу для отримання відповіді від кількох секунд до декількох хвилин. Тим не менш, такі моделі вважаються більш надійними у складних областях, таких як математика, фізика та різні науки.
У DeepSeek заявили, що R1 містить 671 мільярд параметрів, що робить її однією з найбільших моделей у світі. Для зручності користувачів компанія також випустила спрощені версії R1 із обсягом параметрів від 1,5 до 70 мільярдів. При цьому, найкомпактніша версія може працювати навіть на звичайному ноутбуці, тоді як для повного варіанту потрібне потужніше обладнання. Тим не менш, R1 доступна через API компанії за ціною, яка, як стверджується, на 90-95% нижче, ніж OpenAI o1.
Зазначається, що в R1 є і деякі недоліки. Оскільки модель розроблена в Китаї, вона підлягає обов’язковій перевірці з боку регуляторів на відповідність основним соціалістичним цінностям. Наприклад, R1 відмовляється відповідати на питання про події на площі Тяньаньмень або про незалежність Тайваню, що характерно для багатьох китайських ШІ-моделей, які уникають обговорення гострих для Піднебесної політичних тем.
DeepSeek стала першою китайською лабораторією, що вступила в реальну конкуренцію з OpenAI o1, представивши попередній варіант R1 ще в листопаді. Однак за нею пішли й інші гравці, включаючи Alibaba та Kimi, що належить компанії Moonshot AI. На думку дослідника штучного інтелекту з Університету Джорджа Мейсона Діна Балла, це свідчить про те, що китайські ШІ-компанії продовжують залишатися «швидкими послідовниками» в технологічних перегонах:
«Успіх спрощених версій DeepSeek […] показує, що потужні розмірковуючі моделі будуть дедалі доступнішими і зможуть працювати навіть на локальному устаткуванні», — зазначив Бал у своєму пості на X.