Новые open-source модели ИИ за последний месяц: ТОП-7, которые изменили рынок
Апрель 2026 года вошел в историю open-source AI как месяц, когда проприетарные модели перестали быть безусловными лидерами. DeepSeek V4, Qwen 3.6, Gemma 4 audio, GLM-5.1, Kimi K2.6 и другие релизы вышли один за другим, а Reddit-сообщество r/LocalLLaMA назвало этот период «лучшим месяцем за всю историю open-source LLM». Мы собрали все ключевые модели, их бенчмарки, цены и практические рекомендации.
DeepSeek V4: ценовая революция (24 апреля)
Главное событие месяца — релиз DeepSeek V4. Китайская лаборатория выложила сразу две версии под MIT-лицензией: V4-Pro и V4-Flash. А через два дня срезала цены на API еще на 75%. Это второй за два года ценовой шок от DeepSeek.
V4-Pro — 671 миллиард параметров в архитектуре Mixture-of-Experts, из которых активны 37 миллиардов. Ориентирована на сложные рассуждения и кодинг. На бенчмарках coding V4-Pro идет ноздря в ноздрю с Claude Opus 4.6, при этом стоит в десятки раз дешевле. V4-Flash — компактная версия для дешевых развертываний. Обе модели доступны через DeepSeek API, Huawei Ascend и открытые веса.
Qwen 3.6: маленькая модель, большой мозг (21 апреля)
Alibaba выпустила полное семейство Qwen 3.6 за две недели. Главная сенсация — 27-миллиардная dense-модель, которая по агентному кодингу обошла предыдущего флагмана компании Qwen 3.5-397B-A17B, который в 15 раз больше по параметрам.
Цифры на SWE-bench Verified: 77,2% у Qwen 3.6 27B против 76,2% у предшественника. На Terminal-Bench 2.0 — 59,3 против 52,5. И это все в модели, которая запускается на одной RTX 4090 в Q4-квантизации.
Линейка включает Qwen 3.6 27B (плотная, главный прорыв), Qwen 3.6 35B-A3B MoE (3B активных), Qwen 3.6 Plus ($0.50/$3.00 за M токенов) и Qwen 3.6 Max-Preview. Мультимодальность — текст + изображен��я + видео на входе — доступна во всех вариантах.
Gemma 4 audio: голос в открытом доступе (2 апреля)
Google DeepMind выпустила Gemma 4 под Apache 2.0 — четыре модели от 2B до 31B. 31B Dense-версия заняла третье место в Arena AI среди всех open-weight моделей при запуске. Главное новшество — Gemma 4 audio. Это первый случай, когда мультимодальное голосовое понимание доступно под открытой лицензией. До этого работающий voice-LLM был только у OpenAI (Realtime API). Теперь любой может развернуть локальный voice-стек без подписки.
| Модель | Параметры | Активные | Контекст | VRAM |
|---|---|---|---|---|
| Gemma 4 E2B | 2.3B | 2.3B | 32K | ~4 ГБ |
| Gemma 4 E4B | 4B | 4B | 32K | ~6 ГБ |
| Gemma 4 26B MoE | 26B | 4B | 256K | 8-12 ГБ |
| Gemma 4 31B Dense | 31B | 31B | 256K | 24+ ГБ |
GLM-5.1: код уровня Claude за копейки (10 апреля)
Zhipu AI (теперь Z.ai) выпустила GLM-5.1 — обновление флагманской модели. Архитектура MoE с 744 миллиардами параметров, контекстом 200K токенов и максимальным выводом 128K токенов. Модель набрала 1530 Elo в Code Arena — ��ретье место в мире среди всех моделей, сразу после Claude Opus 4.6. Это первая open-weight модель, попавшая в тройку лидеров по коду.
- SWE-Bench Verified: 77.8% (GLM-5) vs 80.8% (Claude Opus 4.6)
- Code Arena Elo: 1530 (GLM-5.1) vs 1548 (Claude Opus 4.6) — 94.6% паритета
GLM-5.1 может автономно работать над одной задачей до восьми часов, пересматривая стратегию по ходу. Модель обучалась на Huawei Ascend, а не на NVIDIA, то есть не зависит от экспортных ограничений на чипы — важно для российских разработчиков.
Kimi K2.6: локальный хостинг без компромиссов
Moonshot AI обновила популярную модель K2.5 до версии K2.6. Основные улучшения — coding и tool-use. Модель компактная, одно из самых популярных решений для локального хостинга на 64 ГБ unified memory. При умеренных требованиях к железу показывает результаты, сопоставимые с гораздо более тяжелыми моделями.
Mistral Small 4: универсальный солдат (16 марта)
Французский лидер выпустил модель, которая заменяет три прежних: Magistral (рассуждения), Pixtral (зрение) и Devstral (кодинг). Все объединено в одном чекпоинте — 119B общих / 6.5B активных параметров в MoE архитектуре. Apache 2.0. Контекст 256K токенов. Цена через Mistral API — $0.15 за миллион входных токенов. При самостоятельном хостинге — бесплатно.
Сравнительная таблица всех моделей
| Модель | Параметры | Лицензия | Вход $/M | Сильные стороны |
|---|---|---|---|---|
| DeepSeek V4-Pro | 671B MoE | MIT | $0.07 | Reasoning, coding, дешевизна |
| Qwen 3.6 27B | 27B dense | Apache 2.0 | $0.32 | Agentic coding, локальный запуск |
| Gemma 4 31B | 31B dense | Apache 2.0 | $0.13 | Мультимодальность, аудио |
| GLM-5.1 | 744B MoE | MIT | $1.40 | Кодинг, топ-3 Code Arena |
| Kimi K2.6 | ~100B MoE | MIT | — | Tool-use, локальный хостинг |
| Mistral Small 4 | 119B MoE | Apache 2.0 | $0.15 | Универсальность, один чекпоинт |
Ценовой шок: как open-source ломает экономику AI
Разрыв в ценах между open-source и проприетарными моделями достиг критической точки. DeepSeek V3.2 выдает примерно 90% производительности GPT-5.4 примерно за 1/50 цены. Вопрос «какая модель лучшая» сменился на «какая лучшая для моего бюджета».
| Провайдер / Модель | Вход $/M | Выход $/M | Снижение к янв. 2026 |
|---|---|---|---|
| DeepSeek V4-Pro | $0.07 | $1.10 | -75% |
| Qwen 3.6 27B | $0.32 | $3.25 | -40% |
| Gemma 4 31B | $0.13 | $0.38 | новый релиз |
| Claude Opus 4.6 | $15.00 | $75.00 | без изменений |
| GPT-5.4 | $5.00 | $20.00 | без изменений |
Пока западные провайдеры держат прайс на флагманских моделях, китайские лаборатории последовательно снижают цены. После январского «DeepSeek-момента», когда стало ясно, что закрытые западные модели не имеют монополии на frontier, гонка пошла на ускорение. И в этой гонке побеждает не тот, у кого модель умнее, а тот, кто может дать 90% качества за 2% цены.
Часто задаваемые вопросы
Какая open-source модель самая мощная для кодинга?
GLM-5.1 от Z.ai — 1530 Elo в Code Arena, третье место в мире. DeepSeek V4-Pro и Qwen 3.6 27B — ближайшие конкуренты в разных ценовых сегментах.
Какую модель можно запустить на обычном ноутбуке?
Gemma 4 E2B (2.3B) и E4B (4B) работают на обычном ноутбуке. Gemma 4 26B MoE — на игровой видеокарте с 12 ГБ VRAM. Qwen 3.6 27B — на RTX 4090 в Q4-квантизации.
Какая модель самая дешевая через API?
DeepSeek V4-Pro — $0.07 на вход / $1.10 на выход за миллион токенов. Qwen Flash — $0.022/$0.22 для массовых операций.
Какую модель выбрать для коммерческого продукта?
Все модели из топа имеют разрешительные лицензии (MIT или Apache 2.0). Для production рекомендуем DeepSeek V4-Flash (скорость) или Qwen 3.6 27B (качество на среднем железе).
В каких моделях есть русский язык?
Gemma 4 поддерживает 140+ языков, включая русский. Qwen 3.6 и DeepSeek V4 также хорошо работают с русскоязычными задачами.
