Новые open-source модели ИИ за последний месяц: ТОП-7, которые изменили рынок

Апрель 2026 года вошел в историю open-source AI как месяц, когда проприетарные модели перестали быть безусловными лидерами. DeepSeek V4, Qwen 3.6, Gemma 4 audio, GLM-5.1, Kimi K2.6 и другие релизы вышли один за другим, а Reddit-сообщество r/LocalLLaMA назвало этот период «лучшим месяцем за всю историю open-source LLM». Мы собрали все ключевые модели, их бенчмарки, цены и практические рекомендации.

DeepSeek V4: ценовая революция (24 апреля)

Главное событие месяца — релиз DeepSeek V4. Китайская лаборатория выложила сразу две версии под MIT-лицензией: V4-Pro и V4-Flash. А через два дня срезала цены на API еще на 75%. Это второй за два года ценовой шок от DeepSeek.

V4-Pro — 671 миллиард параметров в архитектуре Mixture-of-Experts, из которых активны 37 миллиардов. Ориентирована на сложные рассуждения и кодинг. На бенчмарках coding V4-Pro идет ноздря в ноздрю с Claude Opus 4.6, при этом стоит в десятки раз дешевле. V4-Flash — компактная версия для дешевых развертываний. Обе модели доступны через DeepSeek API, Huawei Ascend и открытые веса.

Qwen 3.6: маленькая модель, большой мозг (21 апреля)

Alibaba выпустила полное семейство Qwen 3.6 за две недели. Главная сенсация — 27-миллиардная dense-модель, которая по агентному кодингу обошла предыдущего флагмана компании Qwen 3.5-397B-A17B, который в 15 раз больше по параметрам.

Цифры на SWE-bench Verified: 77,2% у Qwen 3.6 27B против 76,2% у предшественника. На Terminal-Bench 2.0 — 59,3 против 52,5. И это все в модели, которая запускается на одной RTX 4090 в Q4-квантизации.

Линейка включает Qwen 3.6 27B (плотная, главный прорыв), Qwen 3.6 35B-A3B MoE (3B активных), Qwen 3.6 Plus ($0.50/$3.00 за M токенов) и Qwen 3.6 Max-Preview. Мультимодальность — текст + изображен��я + видео на входе — доступна во всех вариантах.

Gemma 4 audio: голос в открытом доступе (2 апреля)

Google DeepMind выпустила Gemma 4 под Apache 2.0 — четыре модели от 2B до 31B. 31B Dense-версия заняла третье место в Arena AI среди всех open-weight моделей при запуске. Главное новшество — Gemma 4 audio. Это первый случай, когда мультимодальное голосовое понимание доступно под открытой лицензией. До этого работающий voice-LLM был только у OpenAI (Realtime API). Теперь любой может развернуть локальный voice-стек без подписки.

Модель Параметры Активные Контекст VRAM
Gemma 4 E2B 2.3B 2.3B 32K ~4 ГБ
Gemma 4 E4B 4B 4B 32K ~6 ГБ
Gemma 4 26B MoE 26B 4B 256K 8-12 ГБ
Gemma 4 31B Dense 31B 31B 256K 24+ ГБ

GLM-5.1: код уровня Claude за копейки (10 апреля)

Zhipu AI (теперь Z.ai) выпустила GLM-5.1 — обновление флагманской модели. Архитектура MoE с 744 миллиардами параметров, контекстом 200K токенов и максимальным выводом 128K токенов. Модель набрала 1530 Elo в Code Arena — ��ретье место в мире среди всех моделей, сразу после Claude Opus 4.6. Это первая open-weight модель, попавшая в тройку лидеров по коду.

  • SWE-Bench Verified: 77.8% (GLM-5) vs 80.8% (Claude Opus 4.6)
  • Code Arena Elo: 1530 (GLM-5.1) vs 1548 (Claude Opus 4.6) — 94.6% паритета

GLM-5.1 может автономно работать над одной задачей до восьми часов, пересматривая стратегию по ходу. Модель обучалась на Huawei Ascend, а не на NVIDIA, то есть не зависит от экспортных ограничений на чипы — важно для российских разработчиков.

Kimi K2.6: локальный хостинг без компромиссов

Moonshot AI обновила популярную модель K2.5 до версии K2.6. Основные улучшения — coding и tool-use. Модель компактная, одно из самых популярных решений для локального хостинга на 64 ГБ unified memory. При умеренных требованиях к железу показывает результаты, сопоставимые с гораздо более тяжелыми моделями.

Mistral Small 4: универсальный солдат (16 марта)

Французский лидер выпустил модель, которая заменяет три прежних: Magistral (рассуждения), Pixtral (зрение) и Devstral (кодинг). Все объединено в одном чекпоинте — 119B общих / 6.5B активных параметров в MoE архитектуре. Apache 2.0. Контекст 256K токенов. Цена через Mistral API — $0.15 за миллион входных токенов. При самостоятельном хостинге — бесплатно.

Сравнительная таблица всех моделей

Модель Параметры Лицензия Вход $/M Сильные стороны
DeepSeek V4-Pro 671B MoE MIT $0.07 Reasoning, coding, дешевизна
Qwen 3.6 27B 27B dense Apache 2.0 $0.32 Agentic coding, локальный запуск
Gemma 4 31B 31B dense Apache 2.0 $0.13 Мультимодальность, аудио
GLM-5.1 744B MoE MIT $1.40 Кодинг, топ-3 Code Arena
Kimi K2.6 ~100B MoE MIT Tool-use, локальный хостинг
Mistral Small 4 119B MoE Apache 2.0 $0.15 Универсальность, один чекпоинт

Ценовой шок: как open-source ломает экономику AI

Разрыв в ценах между open-source и проприетарными моделями достиг критической точки. DeepSeek V3.2 выдает примерно 90% производительности GPT-5.4 примерно за 1/50 цены. Вопрос «какая модель лучшая» сменился на «какая лучшая для моего бюджета».

Провайдер / Модель Вход $/M Выход $/M Снижение к янв. 2026
DeepSeek V4-Pro $0.07 $1.10 -75%
Qwen 3.6 27B $0.32 $3.25 -40%
Gemma 4 31B $0.13 $0.38 новый релиз
Claude Opus 4.6 $15.00 $75.00 без изменений
GPT-5.4 $5.00 $20.00 без изменений

Пока западные провайдеры держат прайс на флагманских моделях, китайские лаборатории последовательно снижают цены. После январского «DeepSeek-момента», когда стало ясно, что закрытые западные модели не имеют монополии на frontier, гонка пошла на ускорение. И в этой гонке побеждает не тот, у кого модель умнее, а тот, кто может дать 90% качества за 2% цены.

Часто задаваемые вопросы

Какая open-source модель самая мощная для кодинга?

GLM-5.1 от Z.ai — 1530 Elo в Code Arena, третье место в мире. DeepSeek V4-Pro и Qwen 3.6 27B — ближайшие конкуренты в разных ценовых сегментах.

Какую модель можно запустить на обычном ноутбуке?

Gemma 4 E2B (2.3B) и E4B (4B) работают на обычном ноутбуке. Gemma 4 26B MoE — на игровой видеокарте с 12 ГБ VRAM. Qwen 3.6 27B — на RTX 4090 в Q4-квантизации.

Какая модель самая дешевая через API?

DeepSeek V4-Pro — $0.07 на вход / $1.10 на выход за миллион токенов. Qwen Flash — $0.022/$0.22 для массовых операций.

Какую модель выбрать для коммерческого продукта?

Все модели из топа имеют разрешительные лицензии (MIT или Apache 2.0). Для production рекомендуем DeepSeek V4-Flash (скорость) или Qwen 3.6 27B (качество на среднем железе).

В каких моделях есть русский язык?

Gemma 4 поддерживает 140+ языков, включая русский. Qwen 3.6 и DeepSeek V4 также хорошо работают с русскоязычными задачами.

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Прокрутить вверх